|
テーマ:☆留学中☆(2576)
カテゴリ:留学情報
授業2:Language Assessment
Week 1 Introduction to Language Assessment and Testing 教科書のチャプターリーディング(1章)。 自己紹介、成績の付け方や授業の進め方の確認。言語テストの特性と種類の紹介。 Week 2 Historical and theoretical background 教科書チャプターリーディング(2章)、論文3本。 基本的なテスティング理論と基本的なテスティングのベースとなる用語を学んだ。例えばテストを作成する際は妥当性(validity)と信頼度(reliability)が非常に重要となる。Validityは測定しようとしている能力が正しく測れているかを指している。Reliabilityは文字通りそのテストがどれほど信頼性があるかどうかを示している。つまり、信頼度の高いテストほど同一人物が同じテストを複数回受けた際に生じるスコアのズレが小さい。この妥当性と信頼度を高めるためにどのような手法が用いられるかクラス内で議論した。 また、summative assessment(総括的評価)と最近教育界でも注目を集めいているformative assessment(形成評価)の違いについても扱った。 Week 3 Assessing listening 教科書のチャプターリーディング(6章)、論文3本。 この週はリスニングの評価に焦点を当ててクラス内で議論した。そもそも聴解とはどうゆうものなのか。脳内でどのようなプロセスを経て理解に辿り着くのか理論的な部分を理解した上で、実際のリスニング問題を解きながら問題のタイプや難易度について議論した。 またビデオを用いた場合理解度にどれほど違いが生じるか調べた論文を読んだ。確かにリスニングといえば、音声だけを聞いて答えるタイプがほとんどで視覚情報がない場合がほとんどである。しかし、実際の英語使用場面では視覚情報を手がかりに理解できるケースも多々ある。むしろ音声だけでやりとりをする場面は非常に限られていて電話による通話くらいではないだろうか。リスニングテストは「音声のみ」という固定観念が染み付いていたが、この授業を通じてその固定観念は見事に打ち砕かれた。今まであまり考えもしなかった視点に触れられるのは非常に心地よい。大いに知的好奇心を刺激された週であった。 Week 4 Assessing speaking 教科書のチャプターリーディング(7章)、論文4本。 日本の社会においてもニーズが一番高まっている分野が英語のスピーキングだ。しかしながら、スピーキングの評価は非常に奥が深く難しい。そもそもコミュニケーションというもの自体が非常に広義で捉えづらい概念である。定義をすることを常に求められる研究との相性が悪いのだ。また、評価においてもどのような基準で評価すべきかが問題となる。東京都が独自のスピーキングテストESAT-Jを導入したが、その評価と入試での扱いをめぐって多くの学者から異論の声が聞かれた。確かに、導入することで授業内でスピーキング機会を確保しようする動きが見込める(このようなテストが及ぼす波及効果をwashbackと呼ぶ)のは事実だが、果たして公平性の観点からはどうだろうか。 授業ではスピーキングの総合評価と分的的評価の2種類を扱い、実際に二つのルーブリックを用いて演習などを行った。自分が受けてきたTOEFLやIELTSのルーブリックも出てきて、自分の英語がこのように評価されていたのかと思うと面白かった。英語を測定される側から測定する側に立つと様々な新しい視点を得ることができた。テストを作る際も両者の視点を忘れないようにしたい。 Week 5 Assessing reading and vocabulary/ grammar 教科書のチャプターリーディング(8章と10章)、論文4本。 この週は課題の読む量が膨大であった。文献を読まなくては授業の内容も入ってこない。この授業の他にも今学期履修している三つの授業の課題もこなさなければならない。寝る時間を削って図書館で勉強をした。この週は読解問題について扱った。読解のプロセスと読解問題の種類を主に学んだ。選択問題、記述問題、英文和訳、サマリー問題など色んな種類の問題があってどれも良い点悪い点がある。テストの目的に沿って問題を設置していくことの重要性を改めて知った。またテスト形式はテスト受験者に大きな影響を及ぼす(washback effect)。例えば英文和訳問題ばかりのテストを出題しているとテスト受験者はテキストの日本語訳ばかり覚えようとしてしまう。テストの妥当性を常に意識して出題問題を作成する必要がある。 Week 6 Assessing writing 教科書のチャプターリーディング(11章)、論文4本。 この週はライティングの評価方法論を中心に学んだ。評価者間で生じる評価のズレ(inter-rater reliability)の問題をクラス内で議論した。ライティングのトピックによって向き不向きが出てくる可能性があることは出題者側は常に念頭に置かなければならないと感じた。ライティングに関してはスピーキングと異なり推敲するチャンスがある。トピックの背景知識などもスコアに影響する可能性がある。主要なライティングテストは背景知識を問わないよう配慮しているようだが、実際には背景知識を全く問わないライティングは不可能らしい。またAIの出現によってライティングの在り方自体が変容しつつある。従来の穴埋め問題や並び替え問題はもはや意味を持たなくなる時が来るかもしれない。 Week 7 NO CLASS (spring break) Week 8 Task-based assessments and testing of language for specific purposes(LSP) 論文5本。 近年注目を集めているTBLTの評価とLSP, EMIに関する評価について学んだ。まずは一般的なproficiency testとLSPの違いについて学んだ。英語力を測定しているのかその分野の知識や技能を測定しているのか曖昧になるのが一番の課題である。CLIL(言語内容統合型学習)は日本でも注目を集めているが、第二言語と内容を同時に教えるのは学習者への認知的負担が大きい。このバランスをどのように取っていくか今後の課題となりそうだ。 Week 9 Alternative Assessment 教科書のチャプターリーディグ(12章)、論文5本。 この週は従来の評価方法とは異なる新たな評価ツールの可能性を探った。まずは継続的に学習者の学習履歴をトラックするportfolioは新たな評価ツールの一つである。Portfolio評価の優れている点は自分で自分の学習履歴を振り返ることができる点である。Portfolioの他にもpeer assessmentの活用方法についてもクラス内で議論した。従来の教室では評価は教師が生徒に下すものという考え方が主流であったが、最近ではその考え方も変わりつつあるようだ。学び方が多様化するにすれて学びの評価方法も多様化していることを肌で感じた。一点刻みで合否が決まる大学入試もそろそろ転換期がきているのかもしれない。 Week 10 Assessing Pragmatics knowledge 教科書のチャプターリーディング(3章、5章)、論文4本。 Pragmatics(語用論)の評価は日本の教育現場では全く進んでいない分野であろう。“Don’t you think that this room is too hot?”は単なるYes/Noの質問ではなく「(部屋が暑いので)窓を開けてくれませんか。/エアコンをつけてくれませんか。」という含蓄がある。そのようなnuanced messagesをテストで測定することは可能かどうかクラスで議論した。 Week 11 & Week 12 Group presentation 2週を使って自分たちが作成したテストを授業内で発表した。30分ほど発表をしてその後にオーディエンスからフィードバックを受けた。そのフィードバックをベースにテストを修正して翌週に最終版のテストを提出した。やはりvalidityとreliabilityのバランスを取るのが非常に難しかった。選択問題にしても程よい難易度のdistractorの設置に苦戦した。 Week 13 Assessment for young learners 教科書のチャプターリーディング(4章)、論文5本。 研究対象者が幼い学習者である場合の配慮事項について学んだ。幼い学習者は中高生に比べて認知能力が備わっておらず集中できるタイムスパンも限られている。文字の大きさや文章の量にも気を配らなければならず気を遣う項目が非常に多い。また、IRBだけでなくinformed consentを保護者からも得なければならず通常の研究に比べて踏まなければならないステップが多いようだ。 Week 14 Social character of language assessment and washback 論文5本。 言語テストの社会的インパクトについてクラス内で議論した。日本でもTOEICや英検が社会全体に与える影響は非常に大きい。TOEICに関して言えばTOEICの点数が会社の昇進の基準に使われたりする。大学でも一定のTOEICスコアを有していれば単位の取得ができる大学も存在する。英検は文部科学省の後援を受けて実施しているテストだが、2級や準2級を有していると中学受験や高校受験で加点されるシステムを採用している学校が非常に多い。とある私立の学校では全生徒に英検のテストを受けさせているほどだ。巷ではTOEICや英検用の塾まで出てきていて、英語塾がビジネスとなりつつある。テストがstakeholdersに与える影響をwashbackと呼ぶ。テストとその波及効果は切っても切り離せない関係にあるのだ。テストデベロッパーはテストが及ぼすであろう影響についても配慮した上でテストを作成しなくてはならない。 Week 15 Future direction 論文5本。 English as a Lingua Francaの時代にテストがどう行われ、評価されるべきか扱った。試験に様々な方言を混ぜるべきだという議論がアカデミアの世界では巻き起こっているそうだが、何を基準にどの方言を取り入れるかその線引きは非常に難しい。また、方言に偏りがあったりするとある受験者に有利(不利)に働く可能性がある。日本ではあまり議論されてこなかった部分であるが、グローバル化している世の中で日本の教育界も検討していかなくてはならないトピックだと思う。 Week 16 Oral Presentation 最終課題として課されていた論文の発表を口頭で行い、お互いにフィードバックをし合った。 言語評価についてこれほど深く学んだのは人生で初めてだったかもしれない。そして週を重ねるごとに今まで自分が経験則と感覚に頼って評価をしてきたかを痛感した。もっと客観的に評価材料を集めて丁寧に評価していく重要性を学んだ気がする。(それを可能にするためにも成績時間の確保とクラス人数の軽減は必須だが) 実際に使われているテストの資料を見ながら欠点や問題点を指摘する機会があり、理論と実践をうまい具合に結びついているコースであった。理論をベースに実際に行われているテストを眺めていくと今までなんとも思っていなかった到達度テストも実はたくさんの問題を孕んでいることがわかった。この講義を通じてクリティカルな視点を養えた気がする。これからは常に問題の意図と全体の構成、制限時間、問題のバラエティは念頭においてテストを作成したいと思う。 有難いことにこの授業でもAをいただくことができた。Aにこだわっていたわけではないが、やはりAを貰えると非常に嬉しいし、セメスター期間の努力が報われた気がする。 春学期だけでもあと2つ授業があるのだが、終わるだろうか。本当簡単な振り返りをするだけでも相当な集中力と時間を消費している。大学院で学ぶ量の多さを改めて思い知らされる。振り返りがいい学びの復習になっているので残りの部分も頑張って記録に残しておきたい。自分用のメモに残しているのでわかりにくい部分があると思うが、あらかじめご了承いただきたい。 それでは今日も良い1日を。 きたろう お気に入りの記事を「いいね!」で応援しよう
最終更新日
2025.01.11 05:20:39
コメント(0) | コメントを書く
[留学情報] カテゴリの最新記事
|
|