エヌ氏の成長・円錐

小胞輸送研究をはじめて18年めの分子神経科学者の日々雑感

無限に深い闇の間を補う方法論

朝、すぐそこの公園に行く。まだほとんど車も通らない時刻だ。夜が明けて30分。緑の濃さを一際増した葉桜の向こうにひどく薄い青の空が広がる。ゆるやかな風に吹かれる。

 

伊庭幸人先生が編集した「ベイズモデリングの世界」を読み始めた。

 

ベイズモデリングの世界

ベイズモデリングの世界

 

 

「過去10年のデータサイエンスでの最大の驚きは、ディープニューラルネットワーク(DNN)とくに敵対的生成ネットワーク(GAN)が高い能力を示すことが示されたことだろう。これが「生成モデルに基づく統計学」としてのベイズ統計の観点からどういう意味をもつは、いまだ未知数である」

伊庭先生がこういうとかなりの説得力がある。モデルの物理的側面と統計的側面の両方を同じに見て取れるのは、お若い頃からの修行の賜物だろう。

 

1章のタイトルが恰好いいので読み返す『平均値から個性へ』

「データのそれぞれは、それ自体では夜空にぽつんぽつんと輝いている星々のようなもので、その間には無限に深い闇がある。そこから何かを引き出すためには、なんからの意味で似たものをまとめて間をおぎなう操作が必要である。それをここではモデリングと呼ぼう。モデリングなしに、法則を引き出したり予測を行うことはできない―という認識から、統計学がはじまる」

ここで具体例をいくつか考えると論旨は明快になる(はずだ)。進化(現生人類とチンパンジーの間にはあまたの霊長類がいたはず)。職人の作る日本刀。あなたに話しかける私。

 

「本書では、明示的なモデリングによってデータに含まれる豊かな情報を取り込んでいく、というタイプの統計科学を紹介したい。― この例でそれまで決まったものとしていた曲線fを確率変数とみなしたように、いままで定数だと考えていたものを確率変数と読み替える、というやり方はさまざまな場面で有効である。たとえば、いま述べるのとはほぼ同じことを、空間的な不均一性でなく、時間的な非定常性について考えることもできる。そのためには、状態空間モデルの形に表現するのが便利である」

 

ふーんと思って読んでいるうちにこんなところにぽんと顔を出す

「今のように確率構造の全体が仮定されている場合には、式(9)を使うと、統計科学の仕事のうち「モデルの推定・評価・利用」の部分の大半が片付いてしまうーこのように、すべての変数の同時確率のモデリングを行って、それにデータを入れれば、式(9)によって自動的に答えが出てくるので、ある意味、「算数」から「代数」に進化したときのような快感がある」

 

「現象を支配するマクロな変数を直接観測し、その間の法則を解明する事が、科学の任務であり、また、工学の主要な手段であるという見方は、いわば熱力学的な世界観と呼べるかもしれない。これに対応するものが「平均値」の統計学だとすると、これからますます重要性を増すと考えられる「科学の島々の間にひろがる世界」に対応するためには、ミクロな情報を安易に捨ててしまわない、よりソフトに構造を捉える統計科学が必要とされるのではないだろうか」

この明快さが(過剰な明快さが)伊庭先生らしい。これは確信犯だし。