エヌ氏の成長・円錐

小胞輸送研究をはじめて18年めの分子神経科学者の日々雑感

異端の統計学ベイズ

今日は昨日に続いて朝から良く晴れている。関東はこういう時に空の広さを感じる。


シャロン・バーチュ・マグレインの「異端の統計学ベイズ」を読む。

異端の統計学 ベイズ

異端の統計学 ベイズ

ベイズ統計学という言葉に接したのは10年くらい前で、共同研究していた部屋の助教ベイズの勉強をしていた。例を見て面白いとは思ったが、そのころは自分と関係があるとは思えなかった。

6年前に統計数理研究所で開かれた研究会で、招待講演者のK大の生物物理の先生が飲み会でも「ベイズは使える」「ベイズは生産性が高いのでどんどん論文が書けるようになった」と言っていた。少したってから共同研究者と話をしていると、一緒にやっていた仕事のモデル化のところをベイズの枠組みで書き直してみると非常に見通しがよくなるということを聞いて、彼の進めたところをわかる範囲で見てみると確かに何をやっているかがよくわかる。ベイズは使えるのか、と思った。

一方で、本業の研究でもデータの統計解析はこの数年で大幅な見直しが行われている。少なくとも自分のいる分野はそれなり以上の雑誌には、きちんと統計解析をやってことを自己申告するcheck listがついていることが増えた。このリストはいかようにも使えるので、業界で一応OKというレベル以上の統計解析ができるようになっていないと投稿さえできない時代に移りつつある。そして先を行っている人たちは機械学習ベイズ推定、あるいは因果推定を使いこなして、生産量を上げつつある(らしい)

大学院で実験手法関係の講義をしているが、この情勢を見て、得たデータを使った統計解析の講義を来年度から追加する予定にしている。ネイマン-ピアソン流の統計学だけなら1回(実験法なので、もちろんどう使うかに徹して講義をする)、ベイズまで教えるなら2回の予定。
 そのための資料として読んだのが、今回の「異端の統計学ベイズ」と「基礎からのベイズ統計学」だ。後者は2回目の読み直しをしているので後日紹介の予定。

「基礎からのベイズ統計学」はもともとW大の心理学科での講義を本にしたもので、お勉強する必要がある(その分実戦的)だが、「異端の統計学ベイズ」は特に予備知識なく、好奇心を持って読み進める。それでも、ベイズ統計学がどこから出てきたのか、なぜ暗黒の時代を経験しなければならなかったのか、この20年で爆発的に復権したのはなぜか、などの疑問を数多くの登場人物とエピソードで明らかにしてくれるので、「ベイズ統計学に親しみが持てるようになる」という意味では良書だと思う。ただし、ベイズを使えるようになるためには「基礎からのベイズ統計学」が同レベルの演習付きのの本はもちろん必要になる。でも何のためにこんな操作をしなければいけないのかがわかっていると演習が楽になるので、効果大だと思う。歴史好きなら読むのはほとんど気にならない。


ベイズの良い点
・概念的にすっきりしている点。特に下記のように枠組みがシンプルということもあるのだろうが、仮説が信頼できるかどうかを直接検定できるのは足元の安心感がある。ただし、これも事前確率についてどのような見方ができるかで意見がわかれるのだろう。

「数学の観点からも哲学の観点からも、ベイズの法則は簡単そのものだった。プラットいわく、「事前に意見を持ち、その意見に情報を加味して更新しない限り、事後の意見を持つことはできない」。だが、信念を厳密に量で表すとなると―これはやっかいだった。」


・一方にデータ(しかもその気になればnを増やせるデータであったり、性質上一回切りの場合もある)があり、一方にいくつものモデルがあり、そのモデルの間の比較をするというのは研究の現場からすると極めて自然である。

「これ(頻度主義=ネイマン-ピアソン流統計学)に対して、ベイズ理論を使うと、社会学者の直観にはるかに近い結果が得られるように思われた。ラフテリーは同僚に「いくつものモデルを比べることが重要なんだ。どれかひとつのモデルとデータとのちょっとした食い違いを探すというのではだめだ」と述べている。研究者たちが本当に知りたいのは、与えられたデータに対して、自分たちが考えたモデルのうちでどれがいちばん正しそうなのかということなのだ。ベイズの理論を使うと、ある安定した形状から別の形状への突然の遷移を研究することができる」

実は以下に書いてある「難しい積分をサンプリングで置き換える」というのが現代的なベイズ推定の肝で、「基礎からのベイズ統計学」で実例にあたって勉強してようやく実感できた。その後で、「異端の統計学ベイズ」を読み返すと、しっかりこのことが書いてあった。

・ゲルファンドとスミスは、・ゲルファンドとスミスは、難しい積分をサンプリングで置き換えるというこの手法が、ベイズ派にとってすばらしい計算ツールになることを見てとった。「統計学入門の講座で学んだもっとも基本的な事柄に立ち戻ることになるんだが、かりに分布や母集団について知りたければ、そこからサンプルを取ることになる。ただし、標本を直接抽出してはいけない」とゲルファンドは言う。画像統計学者や空間統計学者たちが局所モデルをまとめてみていたのに対して、ゲルファンドとスミスは長い鎖を作った方がいいということに気がついた。手法が、ベイズ派にとってすばらしい計算ツールになることを見てとった。「統計学入門の講座で学んだもっとも基本的な事柄に立ち戻ることになるんだが、かりに分布や母集団について知りたければ、そこからサンプルを取ることになる。ただし、標本を直接抽出してはいけない」とゲルファンドは言う。画像統計学者や空間統計学者たちが局所モデルをまとめてみていたのに対して、ゲルファンドとスミスは長い鎖を作った方がいいということに気がついた。

明らかに役には立つのだが、来年度の講義に入れるかどうかは思案しているところ。