ブログ · 2023/06/07

主観的評価と客観的評価の違い | ターンイットイン

The Turnitin Team

Christine Lee

Senior Marketing Writer

主観的評価と客観的評価について、それぞれの違いを理解することは、効果的な試験を設計するうえで欠かせません。学生の学びを正確に測るためにはそれぞれのタイプを深く理解する必要があります。それぞれの評価方法が、特定の分野や学習成果に適した特性をもっています。いつ客観的評価を使うのか、主観的評価に適したタイミングはいつかを理解し、試験の全体的な公正性を高めるためにどのようなリソースが必要かを特定することが、学生の学術的な成長を正確に測るうえで、教員に求められる取り組みです。

主観的評価と客観的評価の具体的な方法について理解し、学生の知識を評価するために、それらの評価を効果的に活用する方法を確認しましょう。

主観的評価とは？

EnglishPost.orgでは、「主観テストでは、正解が複数ある設問や、複数の方法で答えを示せるような設問を用いて、学生のパフォーマンスを質的かつ複合的に評価することを目的とする」と説明されています。主観的評価がよく用いられる理由は、教員が作問にかける時間が比較的短くてすみ、解答を作成する学生の、創造力と批判力を測れるからです。主観的評価には、次のような問題形式が含まれます。

・短答式問題

・小論文形式で解答を示す問題

・用語や概念、重大な出来事を説明する問題

・批判的な考えや、事実に基づいた意見を示す問題

・理論的に起こり得る事態に関する問題

主観的評価が最適な分野は、執筆、読解、芸術・芸術史、哲学、政治学、文学などです。具体的に言うと、討論や批判的思考、芸術形式や政治の解釈、特定の知識を現実世界に当てはめて考えたりすることを奨励する分野です。これらの分野では、長文式の小論文やディベート、解釈、用語や概念、出来事の定義を答える問題、理論的に起こり得る事態を答える問題、ある意見の正当性を論じる問題などを通して学生の知識・理解を評価します。

客観的評価とは？

客観的評価とは、主観的評価に比べて正確性を重視するため、概念や理論に対する学生の解釈の余地がありません。 Edulyticの定義では、客観的評価とは「設問の答えが1つである試験形式」です。
客観的評価は、数学や地理、科学、工学、コンピューターサイエンスなどの分野でよく用いられます。一般的な問題形式としては以下のようなものがあります。

・多肢選択式問題

・正誤問題

・マッチング問題

・空欄補充問題

・与えられた条件下で論理的に正しい選択肢を選ぶ問題

主観的評価と客観的評価の採点方法の違いは？

試験は学生の知識を測定し、評価するものですが、そのためには採点がつきものです。主観的評価と客観的評価が異なるように、採点方法も異なります。

主観的なパフォーマンス評価は、観察者や採点者に依存するため幅広い解釈が可能です。創作活動は主観的評価が適応される好例かもしれません。当然ながら文法や統語法が考えを示すのに欠かせない要素である一方で、創作活動の質は人間の判断に委ねられます。同様に、考えを主張する小論文も、唯一の正解があるわけではなく、どれだけ説得性があるかに基づいて評価されるため、主観的評価の1つです。解答内容に加えて、論理展開や文章スタイルを採点者が評価することもあります。

要するに、主観的評価には複数の正解があり、定性的で、分析的な思考を評価するものなのです。

一方、客観的評価は個人の考えに左右されません。もっとも極端な例としては、マークシートの答案をスキャナで読み取り、フィードバックコメントはなく、正解か不正解かのみを採点する方法です。人間が客観テストを採点し、フィードバックを返すとしても、客観的評価に関しては正解に解釈の余地がありません。別の例としては、正解が疑問の余地なく、1つしかない数学の試験が挙げられますが、やはり、この場合も採点者の意見は無関係です（Jackson, 最終アクセス日2023）。つまり、客観的評価とは、絶対的な一貫性があり、公平で、たいていの場合、定量化できるものです。

とは言え、評価方法とは、主観的評価であれ客観的評価であれ、連続してつながっているものです。

創作活動がほぼ完全に主観で評価されるものであるのに対し、感想文や個人的な考えを示す小論文は、本質的に主観的にはなりますが、上記スペクトラムで表すと中心寄りに位置します。また、分析的小論文は、文法や構造、一次資料・二次資料の使用、引用といった客観的な観点から評価することができるため、中心付近に位置します。客観的評価側の先端はもちろん、数学問題などの多肢選択式問題です。しかし、理論的思考や分析力を示すために証明や定理に関する問題である場合、数学でも中心付近に位置づけられます。証明問題の場合、採点者は学生がどれだけ概念を理解しているか解釈する必要があり、部分点をつける場合もあります。

主観的評価と客観的評価を効果的に行うには？

「主観的」という言葉は、試験や採点に関して言うと、マイナスのイメージがある一方で、「客観的」という言葉は公正さの模範のように捉えられがちです。しかし実際には、主観的評価も客観的評価も、うまく設計し、適切に実施すれば、学びを測定する効果的な手段となります。主観的評価と客観的評価は、信頼性と妥当性を担保できれば、どちらも有効な評価方法です。

学習評価は、学習の測定に一貫性があるときに信頼性があると言えます。信頼できる学習評価では、常に正解があり、学生によって採点がぶれることがないため、信頼できるスコアが提示されます。例えば、認可や資格のために行われる標準テストは、非常に信頼性が高いと考えられています。主観的評価の場合、ルーブリックの活用が信頼性を高めます。

また、出題の意図どおりに測りたいものを測れる試験を、妥当性のある学習評価と言えます。学習評価における妥当性とは、分析的な思考力であろうと、事実的な知識であろうと、学生の理解を正確に測ることを指します。

それぞれの評価タイプに適した分野とは？

看護学生に、鑑別診断と薬品治療についての考えを述べる論文を書かせる教員はいないでしょう。あるいは、英文学の大学院生に、シェイクスピア作品について正誤問題を解かせる教員もいません。適切な知識レベルと学びを評価するために、正しい試験を実施することが非常に重要です。

効果的な試験設計の第一歩は、評価の目的を考え、妥当性を保持することです。

批判的思考力や独創力、あるいはどのように自分の解答にたどりついたのかを測りたい場合、主観的評価が最適です。反対に、学生のもつ事実的な知識を評価したいのであれば、客観的評価の出番です。もちろん、試験には、批判的思考力と知識の幅の両方を測るために、さまざまな問題形式があります。多くの試験では、主観問題と客観問題の両方を組み合わせることで、妥当性を確保しています。

主観的評価は、学んだ理論を特定の状況と関連付けて考える課程に適しています。創造力や批判的思考、課題解決を重視する学問分野では、主観的評価の定性的な一面を重視するでしょう。当てはまる分野としては、次のとおりです。

・人文科学

・教育

・経営

・紛争解決

・デザイン

客観的評価は、絶対的な正解・不正解を中心にカリキュラムが構成される課程でよく使われ、科学がよい例です。具体的な業界水準や、従事者が常に従わなければならないベストプラクティスがある分野では、学生が必要な技術や知識を習得しているかを測るために、客観的評価が有効です。具体的には以下の分野が当てはまります。

・看護

・工学

・金融

・医療

・法律

学習評価の信頼性と妥当性を向上させるには？

学生が学習内容を習得しているかを正確に測るためには、信頼性と妥当性の高い試験を作ることが重要です。設問の信頼性と妥当性を最大化するために、教員は試験の構想を前もって計画しなくてはなりません。その構想に沿うと試験も作成しやすくなるでしょう。また、事前に構想を練ることで、教員は、各設問が、どの学習目標やどの学習内容に対応するのか、また、測定すべき認知レベルにいかに対応しているかを把握することができます。

試験全体の構想を十分に練ったあとで、各設問の作成にかかりましょう。カーネギーメロン大学の試験作成ガイドでは、テスト作成者が客観的な設問を作るために、以下の提案をしています。

・正解が1つしかない問題にする

・質問文に、意図せず正解につながるような文法的な手がかりがないよう気をつけて作成する

・不正解の選択肢も説得力があるものにする

・「すべて当てはまる」「どれも当てはまらない」といった選択肢はできるだけ避ける

・問題文を過度に複雑にしない（二重否定やイディオムを避けるなど）

・単一の概念やアイデアを評価する問題にする

主観的評価は良くないのか？

学習評価や採点について、主観性は避けるべきものと思われがちですが、そうではありません。主観的評価は適切な場所で、適切なタイミングで実施することが重要です。『 Journal of Economic Behavior & Organization』誌に掲載された、メンデスとジャヘディの論文によると「我々の結果は、一般的な主観的測定が、測定対象である変数について、明示的および暗示的な要素の両方の変化を効果的に捉えられることを示している。したがって主観的測定は、概念の定義が広い学問において、客観的測定より適している」ようです。概念知識を示すこと、とくに、独自の意見や考え、解答が複数あるような言説を表現することにおいては、主観的評価が役に立ちます。

しかし、意識的であるかどうかに関わらず、試験作成や採点における「悪」は偏見です。偏見とは、何かに対する不公正な見解のことで、多くの場合、意見や事実への抵抗に基づいています。

主観的評価は偏見の影響を受けやすいため、設問が測定対象と対応しているか（妥当性の保持）を確認すべきです。また、採点の一貫性を保つ（信頼性の保持）ために、ルーブリックを活用すると、採点者の偏見を避けることができます。ほかにも、学生ごとの採点ではなく、設問ごとの採点や、匿名採点を取り入れる方法があります。

Gradescopeのようなデジタル採点ソフトを活用して、試験の信頼性と妥当性を高める方法

主観的評価と客観的評価の効果を左右するのは、信頼性、妥当性、そして偏見です。いつでも、どのような状況でも、可能なかぎり信頼性（一貫性）と妥当性（正確性）を保持し、偏見（公正を欠く見解）をなくすことが重要です。信頼性と妥当性は、試験の設計・実施段階で、学習の期待値に即した設問を作り、公正な学習内容を保証することで保持されますが、採点プロセスにおいて偏見が邪魔をする可能性があります。

信頼性と妥当性のある試験を作成するうえで、重要でありながら見落とされがちなのは、偏見を排して採点する方法です。とくに、教員が膨大な量の試験を採点しなければならない場合、小論文や短答式の問題がすべて同じ方法で評価されるようにするにはどうすれば良いのでしょうか？

1．ルーブリックの活用：信頼性の保持と偏見の排除

試験の合格基準を満たすための具体的な要件を示したルーブリックを活用すると、学生へ明確かつ簡潔な期待値を示し、その要件が満たされているかどうか、あるいはどの程度満たされているかを伝えることができます。また、ルーブリックの活用は、一貫性の向上と採点時間の短縮につながります。

2．設問ごとの採点：信頼の保持と偏見の排除

学生ごとではなく、設問ごとの採点（1つの設問を全員分採点したあと、次の設問に移ること）により、採点基準を一貫し、他の問題の解答から影響を受けることがなくなります（Aldrich, 2017）。

3．匿名採点：偏見の排除

匿名採点は偏見のない採点のための重要な要素です。試験に記された学生名を見えなくすることで、偏見が入り込む余地がなくなります。ソフトウェアを活用したり、答案用紙の氏名記入欄を折り曲げたりすることで、答案の匿名化ができます。

4．項目分析: 妥当性の保持

学習評価データが、採点を学びに変える可能性があります。項目分析、つまり、学生の解答やパターンの正式な調査を通じて、試験が学生の知識を正確に測定しているかを把握することができます。項目分析は、教員が自分の指導についてフィードバックを得るための一手段であり、学習を可視化するものでもあります。

5．多様な学習スタイルの支援：信頼性の保持、妥当性の保持

多様な学習スタイルを支援し、さまざまな学習要素を測定するために、複数の問題形式を用いましょう。多肢選択式試験のような客観的評価は、短時間で幅広い知識を問うことができます。短答式や長文式の問題を含む主観的評価は、学生に考えや思考法の説明を求めることで、深い概念理解をもっているかどうかをテストできます。1つの試験のなかで複数の形式を組み合わせると、信頼性と妥当性の保持につながります。

6．相対評価をやめること：信頼性の保持、妥当性の保持、偏見の排除

相対評価をやめることを検討してみてください（Calsamiglia & Loviglio, 2019）。学生間で点数を比較して成績をつける相対評価は、学生同士が競い合う必要があるという暗黙のメッセージを学生に与えます。中には、不正行為を行う学生もいるかもしれません。研究によると、「相対評価をやめることで、すべての学生に好成績を達成できる機会があるという期待感が生まれる」ことが分かっています（Schinske & Tanner, 2014）。（信頼性の保持、妥当性の保持、偏見の排除）

採点ツールを用いると、教員に次のようなメリットがあります。

・ルーブリックを学習目標や学習成果、認定基準と電子的に紐付けられる

・学生やクラス全体のパフォーマンスについて包括的なレポートを作成できる

・評価データを学生と共有し、学生の自己評価の改善に役立てられる

・どのような評価方法であれ、学生のパフォーマンスについてより深く理解することができる

つまり、Gradescopeのような採点ツールとルーブリックを活用することで、特定の課題や学習成果に関する試験結果について、教員と学生の双方がより明確に理解することができるのです。そこから得られる知見により、教員は指導方法や試験作成、学習評価を改善し、学生は自分自身の学習習慣を強化することができます。

信頼性と妥当性のある試験を作成し、偏見のない採点を実施することは、つねに教員の重要な仕事の1つです。主観的評価であれ客観的評価であれ、すべての試験で学生の学習到達度を正確に測るためには、使えるツールを駆使することがもっとも効果的です。

Gradescope | グレードスコープデジタル採点の学習評価プラットフォーム

【特集ページ】公正な学習評価を実践するためのヒント集