サルタックの教育ブログ

特定非営利活動法人サルタック公式ブログ。教育分野の第一線で活躍するサルタックの理事陣らが最先端の教育研究と最新の教育課題をご紹介。

これからの「エビデンスに基づく教育」の話をしよう(1):「エビデンス」のレベル

エビデンス(科学的根拠)に基づく教育を!昨今、こうしたフレーズを日本においてもよく耳にするようになってきました。記憶を辿ると、2000年頃に東京大学教授の苅谷剛彦氏(現・オックスフォード大学教授)らが教育分野における「エビデンス」の重要性を説き始めた際には、まだ「新しい概念」として受け止める向きが強かったように思います。しかし、

ビッグデータ活用に対する社会的関心の高まり、専門的な知識がなくとも理解しやすい関連書籍の登場(例えば、慶應義塾大学准教授・中室牧子氏の書籍)、実験的手法を使った教育研究の蓄積(及び政策・実務への活用)、行政や教育現場に対するアカウンタビリティ要請の拡大などにより、「エビデンスに基づく教育」という考えは、広く市民権を得てきているように感じます。文部科学省においても、次期の教育振興基本計画(教育振興に関する施策を総合的・計画的に推進するための基本計画)を検討する中で、エビデンスを重視する姿勢を明確に打ち出しています(*)。

 

* 中央教育審議会 教育振興基本計画部会(第8期~)(第18回)
資料1-1 客観的な根拠(エビデンス)を重視した教育政策の推進について(案)

 

かねてより、教育は誰もが「経験者」であることから、個人的な経験に基づく教育(政策)論議が非常に盛んです。また、「歴史教科書」を巡る論争などからも分かるように、学校教育は学習者に特定の思考・行動様式を内面化させる非常に有効なツールとして使えるため、為政者や政治団体等によるイデオロギー闘争の現場になりやすいという特徴も有しています。これが、例えば独裁的な政権などで発現した場合、「健全な民主主義」の醸成とは逆に、権力者による非民主主義的な統治・自己正当化のツールとして(場合によってはダイバーシティを抑圧する形で)学校教育が機能してしまうことは、歴史が物語っているところです。さらに、筆者がシンクタンクの一研究員として関わってきた立場から見ると、日本における教育政策の立案過程では、社会的地位が高い「権威」の発言が、仮に理論的・実証的な裏づけが無い場合でも(必要以上に!?)尊重されることが少なくないように感じます。こうした実態を踏まえると、昨今の客観的なエビデンス重視の動きは、大いに歓迎すべき潮流といえるでしょう。そして実際、私たちサルタックも、エビデンスに基づくアプローチを基本理念の一つとして据えているところです。

 

f:id:sarthakshiksha:20171223155837j:plain

 

しかし同時に、このところ日本で叫ばれている「エビデンスに基づく教育」が、私には矮小化された形で広まり過ぎているように映り、少なからず危惧を覚えているのも事実です。具体的には、①そもそもエビデンスとは何か、ということに対する十分な共通理解がないまま、②信頼性が高い(頑健な因果推論を可能とする)統計手法を使って分析した結果が理想的なエビデンスである、という解釈に基づき、③特定の条件下で導かれた研究結果(エビデンス)を他のケースへ援用できると考えてしまっている、といった傾向があるのではないかと思うのです。このうち③については、前回の畠山勝太の記事で、具体的な問題点とそれに対するアプローチ例が分かりやすく紹介されています。そこで本稿ではまず、①に焦点を当てて「エビデンスとは何か」という点を少し考え、次回以降で改めて別の角度から②、③へ迫っていきたいと思います。

 

f:id:sarthakshiksha:20171223160055j:plain

 

「エビデンス(に基づく教育)とは何か?」そう聞かれたら、皆さんはどう答えるでしょうか。「何らかの調査・分析を通じて得られた定量的なデータ(数字)」といった包括的なイメージから、もう少し詳しく、「記述統計/推測統計」、「相関関係/因果関係」、「横断的研究/縦断的研究」、「観察データ/実験データ」といったキーワード、さらには「ランダム化比較試験(RCT)に基づく分析結果!」といった回答も出てくるかもしれません。いずれの場合も、昨今の議論を見ると、「見せかけの相関ではなく、真の因果を見極めることが重要」→「そのための手段としてランダム化比較実験(RCT)が理想的なアプローチ」→「RCTによって得られたデータが信頼に足るエビデンス」といった考えが、多くの人に共有され始めているのではないでしょうか。これらの技術的な説明とロジックについては、既に各所で丁寧に解説されているところですので、ここでは割愛します。代わって、今回少し見てみたいのは、「エビデンスに基づく教育」発祥の地であり、筆者が現在生活するイギリスを中心に議論されてきた「エビデンスの階層性・レベル(Hierarchy of Evidence/Levels of Evidence)」(以下、まとめてLOE)という考えです。

 

そもそも「エビデンスに基づく教育」という考えは、1990年代のケンブリッジ大学教授・David H Hargreaves氏の講演やオックスフォード大学教授・Philip Davies氏の論文などに端を発するとの見方があります(例えば、元国立教育政策研究所次長・惣脇宏氏の論文)。しかし、さらに歴史を紐解くと、「エビデンスに基づく」アプローチは、教育分野に取り入れられる前から医療分野を中心に展開されてきました。その中で、慎重に議論が重ねられてきたのは、「何をもって有効なエビデンスとするか」「それをどのように活用するか」という問です。つまり、一言で「エビデンス」といっても、具体的な姿は多様であることを念頭に、いったいどのような情報・データが信頼できるエビデンスなのか、それらをどのように使うことで有意義なインプリケーションを導くことができるのか、といったことが検討されてきました。そこから生まれてきた考えの一つが、LOEです。具体例は多岐に渡りますが、例えば以下のような分類が挙げられます。これは、オックスフォード大学の、その名もずばり「エビデンスに基づく医療センター(Centre for Evidence -Based Medicine:CEBM)」が提示している枠組みの一つで、どのようなプロセスを経て導かれた知見がどの程度信頼に足る(質の高い)エビデンスとして見なし得るのか、という点について分かりやすく整理しています(レベル1aが最高、レベル5が最低となります)。

 

f:id:sarthakshiksha:20171223161434j:plain

(出所)Oxford Centre for Evidence-Based Medicineウェブページより一部抜粋・訳

 

また、同じくオックスフォード大学CEBMの別の記事では、LOEをよりシンプルに、直感的に分かりやすく理解できるようにするため、以下のような写真で紹介したりもしています。(逆に分かりづらい気もしますが・・・)

 

f:id:sarthakshiksha:20171223161524j:plain

(出所)CEBMの記事より一部抜粋・加工・訳

 

今回は、各エビデンスに関する技術的な説明は割愛しますが、これらを見ると、RCTの結果は上位レベル、すなわち信頼に足るエビデンスとして活用し得ることが示唆されています。LOEの分類については様々な研究があり、細かな文言や各エビデンスの優位性/劣位性にバラつきが見られますが、RCTを上位レベルに位置づけるという点では基本的に共通しているようです。こうした見解をそのまま受け止めれば、確かにRCTを通じたアプローチを理想形として見なすことは、一つの合理的な選択と言えそうです。

 

しかし、分野を問わず、ある時点・ある場所で「真理」「常識」とされていることも、社会の変化に応じて別の考え方が支配的になる(科学の進歩等によって、それまでの「定説」や「神話」が覆される)ことは、決して珍しくありません。実際、オックスフォード大学による分類も、1998年に初めて提唱されたモデルから、いくつかの改良を経て上記のような内容になり、現在もさらなる検討が続けられています。また、RCTに内在する技術的・倫理的課題についても少なからず指摘されているところです(例えば、分かりやすい日本語の解説として大阪大学大学院准教授・中澤渉氏の論文「教育政策とエビデンス-教育を対象とした社会科学的研究の動向と役割」志水宏吉編『岩波講座 教育変革への展望2社会のなかの教育』)。そのため、将来的にこうしたLOEの定義が変わり、RCTがトップの座を守れなくなる日が来る可能性は、決して否定できません。それでも、少なくとも現在の科学的知見の枠組み(限界)に照らして考えれば、やはりRCTが持つ技術的な優位性(とりわけ観察データに基づく分析より精緻な因果推論を可能とする特性)は、非常に魅力的と言えるでしょう。

 

他方、少し視点を変えてLOEの下層を見てみるとどうでしょうか。「批判的検討を伴わない専門家の発言」、「同じ施策等を経験した人たちのみに関する調査・分析結果」などが並んでいます。これらの危険性については、昨今の日本でもRCTの優位性とセットで論じられることも多いため、「確かにそうだよな」と思う方も多いのではないでしょうか。しかしさらに考えてみたいのは、エビデンスとしての価値を考える際に、果たしてどのような座標軸でそれを評価して「RCTは理想的」「専門家の発言は使えない」と断じるのか、という点です。議論を先取りすると、確かに予め設定した因果関係を確率論の観点から検証し、例えば「費用対効果(特に平均的な効果)」に着目して意思決定を行おうとするのであれば、その通りかもしれません。しかし、エビデンスに基づいて実際に政策形成・実務改善をしていこうと考えた場合、そんなに単純な話ではないはずだ、というのは多くの人が直感的に感じるところではないでしょうか。言い換えれば、低レベルであったデータも非常に重要なエビデンスに、他方でRCTの結果が必ずしも使えないエビデンスになる可能性もあるかもしれません。なぜなら、繰り返しになりますが、何が良い/悪いエビデンスかを決めるための判断基準は、あくまで私たちが人為的・社会的に設定しているからで、その基準・視点を変えてみると、各「エビデンス」の相対的な価値が少なからず変わり得るからです。

 

では、RCTが必ずしも「理想的なエビデンス」ではなく、他方で記述的なデータなどが「重要なエビデンス」になるような判断基準・視点とはいったい何なのか・・・。どうやら、今回は既に書き過ぎたようです。続きは次稿に譲りたいと思いますので、乞うご期待ください!

(荒木啓史)

 

---

関連する外部記事はこちらから。

sarthakshiksha.hatenablog.com

 

---------------------------------------------------------------------------------------------

サルタックは無料メルマガを開始しました。

・本ブログ記事の更新情報

・日本でのイベント情報

・インターンやボランティアの募集告知

などをお送りいたします。

ご興味がある方は下記のリンクよりご連絡ください。

無料メルマガを受け取る | サルタック・ジャパン

 

またサルタックでは常時会員と寄付を受け付けています。

サルタックと共に多くの子どもたちに有意義な教育を届けるパートナーになりませんか。

ご関心がある方は下記のリンクより会員・寄付のオプションについての詳しい説明にお進みください。

私たちにできること | サルタック・ジャパン

---------------------------------------------------------------------------------------------