
教育実験の難しさ
「A授業とB授業のどちらが良いか研究しよう」とあなたが宣言したら(教師が研究する場合は後述)、学者たちから「その『良い』とはどういう事ですか?」という問いが返ってくるだろう。 「良い」とは「市販テストの点数を高くする」事であるか? 「常識に反する結論でも原理を適用する傾向を測定するようなテストで得点が高い」事か? それとも「できない子」をバカにしない傾向が適当なアンケートで示される事か?
「どのような基準(テスト、ウンケート、文学的でなく規格化された行動観察その他)により、良いと判定するか」が明示されなければ、授業の良否を実験で証明する事はできない。
では基準が定まれば、A授業とB授業の良否を示す事は可能であろうか。
例えば教師X氏にA授業をaクラス、B授業をbクラスでしてもらい、授業終
了後調査を行ったところ一定の基準でaクラスのほうが良かったとしよう。これ
からA授業のほうが良かったとしてよいだろうか。
基準の適切さがまず問題だが、それは実験科学上の問題でなく、教育思想の問
題である事が多いからここでは触れない。授業研究の実験科学的部分で最大の問
題は、さまざまな「偏り」の対策である。
例えば「クラス差」「両授業に対するX氏の熱意の差」「生徒が今までに受けて
いた授業と対比しての後光効果の違い」「生徒が今まで受けていた授業のため生
じたラーニングセットの影響」…最後のものの例を1つ示そう。 わが国の理科
授業では「実験のあと結果を解釈してまとめる」タイプの授業が普通であるが、
そのような授業を受けた生徒に「実験結果を予測させ、仮説・現象予測の討論の
あと実験を行い、実験後の解釈をしない」タイプの授業をすると、軌道に乗るま
で一ヶ月以上かかるのが普通である。現象予測を大胆に行い、教師でなく生徒全
員に自己の説をわからせようという態度に生徒が変わるまでに時間を要する。A.
B.授業どちらかが前者のタイプでもう一方が後者の場合、短期間の実験だと偏り
が生ずる。
これらの偏りをことごとく除去、または十分小さくする事が理想であるが、多
くの場合それは不可能であって「A授業が良い、高度に有意…」などといっても
「偏りのためかも知れないから信頼できない」事になってしまう。
では研究計画を切り替えて、現実に1年ないしそれ以上続けて行われている授
業を研究対象としたら良いであろうか。その場合「他の面では全く同じだが、A
授業とB授業の比較で問題になる場所だけ異なる」教師・学級のセットを発見す
る事が事実上不可能だから、実験計画は以下のようなものにならざるを得ない。
「A授業に近い授業をする教師、B授業に近い授業をする教師を複数選び、さ
まざまな授業変数(や環境変数)を測定し、一方では多種のテスト、アンケート、
観察を行い、それらを総合してA授業、B授業の効果を推定する」
まず「近い」(属するといっても同じ)の定義が行動のタームで定義されるなど
客観的かどうか問題だが、最大の難題はやはり統計学のほうにある。1年間の授
業を分析したとしても
@ 各要因(授業変数のうちテスト結果を大きく左右するもの、主要因)がテスト
結果で一次式できくという保証が全く無く,対数できくもの、オール・オア・
ナッシングできくもの、それらの相互効果、があると考えられ、偶然的要因(副
次的要因)の多さとあいまって、いかなれ数学的方法を用いても「キタナイ」
結果になりやすい。
A 因子分析を用いれば、「キタナイ」結果の場合、軸のとり方が問題で再現性が
怪しくなる。 「キレイ」であったとしても、授業変数は無数で、研究者は教
師や生徒の活動の一部(研究者が主観によって重要と考えているもの)を測っ
ているにすぎない(活動全部の記録は事実上不可能)から、真の要因は見逃さ
れ、偶然的な数字をもとに結果の解釈を行う誤りが生じやすい。ふつうは「キ
タナイ」結果だから、偶然的数字の解釈を行う誤りの可能性は一層大きく、解
釈は空中楼閣になりやすい。
B 多元配置法分散分析を用いれば、やはり「キタナイ」上に、5%有意の項がも
しできたとしても、それが意味を持つという判定が難しい。授業変数は無数で、
その1/20は偶然「有意」を示す項目だから、「有意」になりそうな項目もまた
無数である。 あなたの採った項目はあなたの考えによって選んだ項目であり、
無数の授業変数からの無作為抽出になっていないだろうから(項目を先にきめ、
実験計画を立てればよいが、普通それでは「当たらない」から実験後の再整理
となる)数字の上では「有意」でもそれだけの信頼性はない。
C あまりに調査変数が多い上に、実験が長期にわたる一方で、怪しげな結果しか
出ないとすれば「観察対象となった生徒の学習妨害のわりに得るものが少な
い」となり、研究の倫理性が問われる。
授業分析にサンプリングを行えばバラツキが増大するから、結果はさらにキタ
ナイものとなり、どう分析しようにも手のつけられないものになる事が多かろう。
「A授業とB授業の比較」という方法論は、「A法とB法の比較」という物理化学、
生物学などでの方法論はもちろん、「A治療法とB治療法との比較」という医学方
法論よりさらに複雑である。これは科学の階層性によるものであって、マクロな
科学(物理・化学→生物学→医学→心理学→教育学→社会科学の順にマクロにな
ってゆく)、一つの現象にかかわる副次的要因の多い場合は、それだけ主要因の効
果を見出す方法論が複雑化するのはやむを得ない。
以下信頼できる授業研究や他の実験的教育研究の方法を記す。なお実験的教育
研究は基礎心理学研究、実験的授業による研究、現場研究の3つに分けられるが、
教育学の基礎としての心理学実験計画は医学実験計画法*1を準用すればよい事
が多いので省略し、あとの2つについて記す。
「偏りと実験的授業研究」
偏りには「とりのぞくか、十分小さくすべきもの」と「なくすべきでないもの」
がある事に注意しよう。例えば「A授業(10時間)はB授業(6時間)より良い
という某の論文はだめだ。10時間かけたA授業のほうが良いのは当たり前じゃな
いか」という批判をしてはいけない。
A授業を6時間で行ったり、B授業を10時間で行えば,それらはA授業やB
授業と異なった授業になってしまう。どはどういう批判が正しいか?
「A授業が良い」という仮説検定論でなく、「A授業がB授業よりどの位良い か」という区間推定を行い、それが10-6=4、4時間の授業時間差に見合うものである事を明確な教育思想に基づいて述べればよかったのである。現場教師の立場からすれば、当然4時間の追加投入と授業結果改善が天秤にかけられるであろ う。
「クラス差」を打ち消すには、A授業もB授業も両学級でやるクロスオーバー実 験をすれば良い。すなわちa学級に対してA授業・α題材→B授業・β題材、b
学級に対してB授業・α題材→A授業・β題材で行えば良い。「それまでの授業と対比しての後光効果」に対しても、この方法でかなり偏りを減らせるが。偏りがゼロにはならない。
「熱意の差」「偶然的失敗」に対しては、複数の観察者をおく方法*2によって
偏りを減らせるが、偏りがゼロにはならない。「ラーニング・セットの効果」につ
いては、複数の教師の経験を聞き、十分な実験期間を確保すればよかろう。
しかし偏りの種類は数多く、ここで示したものの中にさえ、ゼロでないものがあるとすれば、「偏りがあっても信頼できる実験計画は何か?」という切り札が必要だろう。
まず考えるべきなのは「偏りがテスト結果に及ぼす方向性を評価する事はでき ないか?」ということである。たとえば、「教師の熱意の差のための偏り」は決し
てゼロにならないが、偏りの効果の方向性は明らかである。したがって教師の信念と反対の結論が出れば、この種の偏りは研究の信頼性に影響しない。
偏りがテスト結果に及ぼす方向性を評価する事が困難な場合は、最後の手段と して「複数の例で、それぞれ偏りの種類が同じでない実験を行い、それでも結論 一致」ということを示すようにするほかはない。例えば、クラス差を打ち消すよ うな交叉実験が困難な事情があれば、多くのクラスで実験をやるようにする。
ク ラス相互間にはさまざまな違いがあり、それらのもたらす影響は結論に有利か不 利か不明であるが、それでも結論が一致したとすれば「偶然そうなる確率が低い」 という事で「クラス差」のための偏りの存在は研究の信頼性を損なうものではな くなる。ただし実験が大規模になるほかに、クラス特色の分類すなわち偏りの評 価は必要である。A授業のクラス同士、B授業のクラス同士に他の点での共通点 があると「結果の違いはその共通性のためかも知れない」という事になり結果は ナンセンスに近くなる。この方法は偏りがおおきいままだと結論がでなかったり、 キリイでない結果となるから、偏りを極力減らした上で用いる最後の手段である。
補注 多数の例が有意水準確保のため必要ではないかという議論をここではしていない。有意水準に達しても完全に無作為割付にする事がたいていは困難だから、数字ほどの信頼性はない。また実験が大掛かりで困難になり、また研究のための授業妨害も大きくなる。
偏りがかなり小さいならば、1例づつでも(生物学や医学と同じく)「有意」になったとき、有意水準ほどではないがそれに近い信頼性がある…偏りのため結論が異なってくる可能性は低いという事になる。それに加えて複数例での結果一致という事になれば、確率の合成に似た「確からしさの合成」で信頼性は心理学実験・生物学実験での「有意」と同様に見なしてよいはずだ。 数字にならない可能性である「直観確率」の合成も、結論の確からしさを大きくする事に変わりはない。偏りの評価次第で、複数例が2つづつ、3つづつ…どの位多数にすべきか異なるであろう。
「仮説検定と教育学研究」
仮説検定論が区間推定をすべきときに誤用される例は先に示した。「AとBに差
がある事」を証明したいのか、「AとBの差はどれくらいか」知りたいのかをとり
違える事は、他の科学分野でもおかしやすい誤りである。
補注 前記のように、教育現場から見れば実用的な差があるかどうかが問題である事が多い。
次に問題となるのは、「α(有意水準)=5%として帰無仮説を棄却」という「常識」が教育学でいつでも適当かどうかという事である。「α=5%」という基準は、偶然のため称ずる間違った研究のための被害を一定基準(5%)以下にくいとめるための実用的基準であって、慎重さを特に要求されるときはα=1%とかα=0.1%のような厳しい基準が用いられている。
教育学実験調査ではマクロな科学の通例としてノイズ(副次的要因のための撹乱)が大変大きい。そのため「α=5%」では見逃しの危険率βが近くなり、ネガティブな結果しか出ない大規模実験が多くなって「授業妨害ばかり大きくなって研究が進まない」という点での倫理性が問題になりやすい。しかし一方では「α=10%」とすれば、偶然のための間違い研究が多くなり、そのための混乱・被害が生ずるからやはり倫理性が問題となろう。ではどうするか?
いま、ある実験でP=6%だとしよう。これは5%有意ではないから、普通は例数を増すという手をつかう。例数を増せば5%有意になる可能性がP=6%ならかなりある。しかし教育研究では「例数を増やす」事が容易ではない。実験と観察に1年かかるとか、1年の特定の日に観察・実験を行うことが普通なので、例数を増やすには次年度のクラスや授業を対象にしなければならない。しかし次年度の生徒は、前の年度の生徒と等質ではないから「例数増」とみなせるかどうか疑わしいことが多かろう。
その場合は二元配置法を用いて年次による違いを分離するのが常道であるが、さまざまな理由で二元配置法が使えないえない事もあろう。そのとき、同じ実験ではないことになるが、次年度には例えばP=9%で同様の結果になったとしよう。
そこでα=10%で2つのデーター(P=6%、P=9%)でモノをいっても良いのであろうか? 工学や生物学の常識では「否」であろう。 これにの分野では「例数を増やす」事が比較的容易であるから、偶然のための誤りを減らすために容易な事を実行すべきだと考えられる。 しかし教育学では「偶然のための誤りのための被害」と「例数をふやすための被害」がコンパラブルであるから、場合によっては「この2つのデーターがつづいて得られる確率が低い」が故に[モノをいう]事が正しい事があろう。
各種の被害の大きさは場合により異なるから,それらの被害の検討は具体的に行うしかない。ここでP=6%とP=9%の合成確率は有意水準に達する(計算法は*3)ではないかとの疑問があろうが、2つの実験が独立であっても、同一条件ではないから2つの実験が同一の結論を示すとい
う[推論の合理性、妥当性]すなわち計算にのらない不確定要素が混入するのでPの計算値より確率は大きくなるし、大きくなる度合いは不明である。だからPの合成は避けたほうが良いが、被害の大きさの検討結果によっては確率合成やα=10%の2つのデーターでモノをいう事が許されるであろう。
また仮説検定論のようなプラグマティズム的論法がいつでも正しく、P=6%ならそれだけの信頼性を考える経験論的論法が誤りであるかどうか、教育学では大いに問題となろう。 工学、農学などの分野では仮説検定論が、検査、調査、実験などの論理そのものになっていると考えられる。生物学や医学の大部分でもα=5%という基準を定めるのは、「偶然性のための間違い研究を一定以下に制限して科学を速く進歩させる」ために正当と考えられる。α=5%とは、全国で(全世界で)20名の研究者が同一の実験をしたとき、一人が間違った結論を出し、間違い論文を多分書くという事である。
しかし教育学では、P=6%とか9%というデーターを捨てず、被害の大きさ比べの上採用するほかに、これらのデーターを経験論扱いで採用すべき場合がある。教育現場研究においては、厳密な意味でも実験再現性はない。生徒も教師も環境も社会の進歩に従って変われ、10年前、20年前の実験ともなれば再現できないと誰もが認める事が多かろう。ただし別実験による結論の一致という点での再現性があれば、科学としては成立していて、実験の再現はできなくともよい。「同じ研究は金とヒマさえあれば可能」「実験再現可能」だからこそ、「偶然のための間違い研究を一定以下にくいとめる」ことが要求され、その要求が優先するのである。実験再現ができない場合は「情報を効率よくとりだす」経験論的立場が科学を速く進歩させる、人びとの利益のための唯一の基準となるであろう。
過去のデーターを再整理してP=7%になったら、それだけの信頼性、結論に有利な程度を示す数字として7%を扱って良い。ただし事故の主張・結論は現在のものであるから、間違いのためおこる現在・未来にわたる混乱・被害の可能性は一定以下に抑える事が必要である。したがって教育学実験では次のように考えればよかろう。「他に有力なデーターがあり、それを補強するものとしてP=7%のデーターがあれば、その7%という数字を自己の主張に有利な証拠としてもよい」 ただしその過去のデーターが現在再現可能な実験で得られたものなら、α=5%として仮説検定論を用い、自己の理論の信頼性をよりはっきりさせるのが原則であろう。
多変量解析と現場教育の研究
構造が大変複雑と考えられる一般授業の分析の困難については前記した。授業構造に関する有力な仮説や、授業で重要な変数(テスト・アンケート・観察などの結果に大きな影響を与える変数)がある程度わかっていてはじめて、多元配置法や因子分析が有効なのである。 これは常識に反するようだが、構造が大変複雑という条件に注意してほしい。
補注 多元配置の場合、研究者の主観によって選ばれた授業変数が無数にある変数の中の重要なものをカバーしていない可能性が強い。この方法を採用する研究者は構造仮説をはじめに考えるのを「一種の偏見」として嫌う傾向があるから、一層その可能性が強くなる。だから分析はノイズを分析し、偶然的数字に注目する事になりやすく、結果の再現性がなくなる事が多い。因子分析を用いても同じ原因でノイズの分析に近い結果となりやすく、因子にとんでもない内容を与える危険性が高い。
これらの研究方法でも、実験計画・授業観察・授業分析の前に多数流派の名教師の意見を参考にして観察やテストの種類を選べば、重要な変数とそれによる結果の違いが大きくなり、まともな結果が出る可能性はある。しかしそういう論文は管見に入らないし、またその方法より以下の方法のほうが遥かに能率が良い…つまり少ない労力・授業妨害で研究成果が出る可能性が高い。
「ある程度わかってはじめて有効」とはいっても、通常は「ある程度わかる」ためにこれらの方法を用いるのだから困ってしまう。
この矛盾から逃れる方法は次の通りである。
「小規模の予備実験で要因となる可能性のある変数をできる限り多数記録する(小規模実験だからこそ可能)とともに多次元評価を行い、テスト結果を合理的に説明するような構造仮説群、変数群をえらび、それらに基づいて本実験を計画する」
しかし次のような疑問が出よう。大規模な実験でさえ、なにやら怪しげなもの
しか出てこないのに、小規模実験では何がでてくる? 有意性検定さえできない
少数例から要因と思われるものを抽出しても信用できないし、ましてや「要因」
群に結びつく構造仮説(解釈)の群など、まるで信用できないではないか? そ
の上の本実験など空中楼閣ではなかろうか?
以上の疑問に答えよう。「各テスト・アンケートなどの結果1つ1つを合理的
に説明する構造仮説」すなわち結果の各部分の解釈は複数あるだろう。経験論的
立場にたって、それらの解釈の有利との程度を評価できる(Pを一種の信頼性と
し0.2でも0.3でも良い、時に区間推定)。 これらの解釈群すなわち部分構造仮
説の中で矛盾のないものの集合をつくる。その集合は複数、ときには多数あり得
るが、確率の合成によって有利な解釈の無矛盾集合(1つや2つ不利となるもの
があっても全体として有利なら良い)を選べば、その集合は1つまたは少数とな
るのが普通であろう。その構造仮説=無矛盾の部分構造仮説集合が、すなわち本
実験に必要な有力仮説である。
1つ1つの部分構造仮説は信頼できなくとも、「部分構造仮説のうち有利なもの
ばかりが無矛盾の集合をつくる」という確率は十分低いだろうから、その集合(構
造仮説)はかなり有力であり、それに結びつく変数もかなり有力な「主要因候補」
である。
部分構造仮説が互いに矛盾しないかどうかは断定的にいえることもあるが、そ うでない事もあるから、部分構造仮説の無矛盾集合の確からしさはPの合成とイ
コールでなく、「推論の合理性・妥当性」という数字にならない要素が「確からし さ」の中に混入している。 「推論の合理性・妥当性」などという数字にならぬ
不確定要素をもちこんでも、実験の目的が「有力構造仮説と有力な要因候補ほ選 ぶ」であり、どの構造仮説(部分構造仮説の無矛盾集合)が一番確からしいかが
問題なのではないから一向差し支えない。
以上のように正確な計算はしても大して意味はなく、そもそも計算上のPの数
字の細かいところより、独立性や推論の合理性・妥当性のほうが問題になりやす
いから、Pの計算はランクわけ程度で十分であり、場合によっては目の子算で差
し支えない。 その例は文献4にあり、その研究では1つしか有力仮説が残らな
かったので、本実験なしである程度「モノをいう」事になっている。
計算にのらない確からしさ、すなわち「直観確率」も一定の方法論に従って利
用すれば信頼すべき研究に結びつく。 そもそも論理には「確定的論理」(統計学
者は「決定的論理」と呼ぶが、マルクス主義哲学用語の「決定論」との混同が生じやすい)、
「確率的論理」「直観確率的論理」の三種あるのであって、「直観確率」を「何か
気持ちが悪い」といって除外する事はマクロな科学の研究者にとって自らの手を
縛るものであう。敗戦後、推計学の発展期に「確率的論理」を気持ち悪がる人が
失敗したのと同様である。確率的論理の解説書としてはメインランド「医学統計
の基礎」があり、教育基礎実験はほとんど同一方法が適用できるから、教育研究
をする者の座右におくべき書の1つであろうが、直観確率的論理の解説書は現在
ない。 本稿を読み返せば、いたるところで名を伏せた「直観確率」が登場して
いる事に気づかれるであろう、というより内容の大部分が直観確率的論理の解説
であることに気付かれるであろう。
直観確率を扱う工事の論理も将来の教育学研究に広く用いられるであろうから、
簡単に使用上の注意を記す。基本は「直観確率のだいたいの大きさを見積もる」
「直観確率の大小比較」の組みあわせと「合理的仮定・推論のもとに直観確率を
確率に直井」の組み合わせであって、後者は直観確率を「家庭・推論の合理性・
妥当性」という別の直観確率に変換する事である。変換によって大小を見積もっ
たり、大小を比較すれば良い。必要によって「直観尤度」「直観ベイズ確率」「十
分大きい」「十分小さい」「近傍=十分近い」などを定義(自明であろう)する。
本稿でも無定義、または他の表現で出現しているものがある。
補注 「全共闘…」以下の各論文でも同様である。 数字にはならなくともどちらが大きいか小さいかの客観的判定や、十分大きい・十分小さいの客観的判定…などは可能な場合が少なくない。それが直観確率的論理である。
以上のような予備実験でもまだ授業の総合的かつ量的な分析が不可能ならば、同型と考えられる授業ばかりを比較し問題となる要因を大幅に減らすとか、クラス差測定法など偏りの実体の研究によって偏りの効果を見積もるといった基礎研究を積み重ねてゆけば良いであろう。授業研究以外でも同様な研究方法が使える。
「合理的思弁と実験計画」
教育は大変複雑な構造をもつであろうから、合理的思弁によって仮説を整理し、実験計画に十分深く思弁的な検討を加える必要が多い。
例えばクラス差の研究では、クラス指導と環境の相互関係について深く検討した上で実験計画をたてるのが望ましい。実例として片岡徳雄らによる全生研式クラス指導でどのような生徒ができるか、という実証的研究、心理学的研究*5はだいたいにおいて信頼できる数少ない現場研究であると思われるが、片岡らの結論に反する例外的クラスも少数存在する事について考えてみよう。
全生研式クラス指導(わが国で集団主義教育といえばこれを指す)が管理主義的(官僚主義的)原理を教室に持ち込むものである事を片岡らは指摘している。 しかし、集団主義教育の原理はそれによる実践が管理主義、官僚主義への転落を導くと考える事も合理的であるが、ある場合にはその原理が自主的活動の盛んなクラス、生徒に歓迎されるクラスを形成するものと考える事はデーターから見て更に合理的なのではなかろうか。個人的見聞では両方の場合があるようである。
一定の教室内条件、すなわち教師をリーダーとして1方向に向かうのを生徒の大多数が自明のこととして納得する条件は何かを考えて別の調査を行い、データーを層別すればキレイなデーターとなる可能性が大きいのではなかろうか。
一方「生徒が生徒を指導」に依拠する点では集団主義だが、その指導は教師と独立の多種多様な生徒有志運動を発生させるという形で行われ、「ハイッと返事をしよう」などの多くの一般的徳目に反する自由が事実上公認される方式*6が存在するが、それが自主管理(教師と独立な生徒運動)、複数政党制(正しい事が自明に見える徳目に反する自由)を認める、開かれた社会主義社会の原理とでもいうべきものを(全生研のスターリン式社会の代わりに)クラスに持ち込むものであり、その成功・失敗の条件が全生研方式の成功・失敗の条件と逆である事も容易に推定されるであろう。
補注 横暴な餓鬼大将や番長が支配している学級、学年の場合はその支配をなくす事が教師と大多数生徒の要求であり、教師と活動的生徒が行う実質的独裁が大多数生徒の支持を得て成功するであろうが、それは革命期の独裁と同様合理的であると考えられる。教師と生徒の当面の要求が異なる場合は教師が先頭となる独裁でなく、平衡型社会に似た、極めて教師管理が弱く教師管理下にない多様な生徒運動に支えられたクラスが合理的だと考えられる。以下の2つの章で、そのようなクラスの実際の姿とそれに至る機械的に近い指導法(一連のプログラム授業)とその指導法がどのようにして発見されたかを記す。
独裁を否定すべきだという常識に従い、革命期には独裁が歴史的合理性を持ち人民の支持を得る場合があるという事を考えないから、全生研方式やスターリン式社会主義社会を
100%否定的に見ることになり、結論に合わないクラスは例外として説明を避けたのであろう。 そのような見方は全生研に結集した教師を「成功例があるからその方式を採用した」という「部分的正しさの無制限拡大という合理的誤りをした」人びとと見なさず、権威や流行に従う愚物の集まりとする考え方でもある。それはスターリンを支持したソ連の革命家たちを愚物として軽蔑する考え方でもあろう。
もちろん実験により証明されるまで断定はできないが、そのような可能性十分考えて実験計画を立てるべきであろう。授業でもクラス指導でも「良い」「民主的」「明るい」…などの一元的評価、直観的評価を避け、授業方法、クラス指導方法、学校や学級のおかれた環境などを考えた上で、合理的計画を立て、多次元評価、できるだけ数字や行動のタームで記述できる評価をすべきであろう。
「教師の行う研究と信頼性」
教師が自分の行う授業と別に研究をするなら、すべてが今までの通りだから、ここでは自分の授業を自分が研究する場合を考えよう。
そのような研究には2種類あって、その1つはプログラム授業、仮説実験授業など教師活動が統制された規格化授業での教材研究である。この場合は比較実験のとき、教師の主観による偏りがほとんど問題にならないから、普通の考え方で良い。
教師活動の統制がないという条件下で、授業方式や教材の研究をするとなれば、教師の信念・経験・くせなどのための偏りが結果に混入する事は避けられない。 それでも次のような事はいえるだろう。
@ 肺炎や淋病に対するペニシリンの如く大きな効果があれば、授業方式や教材の改良は無条件に認めて良い。同一テストの得点が平均50点から80点に飛び上ったり、今までは大声や体罰による威嚇がなければ授業が維持できなかったのに管理的発言ゼロで同程度の平均点になったとすれば、改良は認められるであろう。
A そのように顕著ではないが効果はあるという場合、あなたはそれを学会で発表してはいけないが、教師仲間で発表して良いし、またその改良されたと思う授業方式や教材で授業をすべきである。
何か教師を馬鹿にしたように聞こえるが,そうではない。教師は外部研究者と異なり、クラス差その他の偏りを直観的にはかなり知っている。研究をしようという教師ならば、以上の事で並み以上の能力を持つであろうから、得られた効果は@本物の効果、でなければ、A何かの後光効果だと考えられる。そうだとすれば、教師の立場から見て「後光効果でも効果があれば良い」のであるから、真の効果かどうか不明でもねその「改良」授業や「改良」教材を実行すべきだと考えられる。
医学の場合「効かない新薬の追放」が高橋晄正らによって叫ばれているが、医師の場合は後光効果を「無害である事が証明されている安価な偽薬」を使用する事によって自由に利用できるし、現実に利用しているから、高橋らの主張が正当なのである。
教師の場合は後光効果を自由に使えるとはいえないから、後光効果を利用できる方法があれば使ったほうが良いのである。しかし後光効果は一時的であるから、前項までの方法で、ある授業方式や教材の優秀性が証明されたらそちらを採用すべきであろう。
*1 Mainland.D., Elementary Medical Statistics (1963 Saunders) 柏木力訳「医学統計の基礎」1971年、岩波書店
*2 増山明夫「授業研究における統計的認識の基礎」教育心理学研究20、1972
*3 Fisher.RA., Statistical Methods for Research Workers (1950,Oliver &
Boyd)遠藤健児・鍋合清治「研究者のための統計的方法」(1953荘文社)
*4 小泉秀夫・藤岡完治・増山明夫「多次元評価による授業分析概念の同定(2)」
1976年 日本教育方法学会(東京大学)発表
*5 片岡徳雄編「集団主義教育の批判」1975 黎明書房
*6 増山明夫「競争なしに努力する集団」1979 授業科学研究1 仮説社
新唯物論と古典唯物論
理科授業論