以下の文章は,「脳を測る‐改訂 ヒトの脳機能の非侵襲的測定‐」(宮内哲. 心理学評論56(3): 414-454, 2013)に掲載された総説の脚注25の補足として,ブログ 大「脳」洋航海記の原著者viking氏の了解を得て,<http://viking-neurosci.sakura.ne.jp/blog-wp/?s=fmri%E3%81%AE%E7%9C%9F%E5%AE%9F+2>から転載したものです.
脚注25 Poldrackによる批判
Poldrackは, 脳機能イメージングの研究結果(とりわけ3Dの脳の構造画像上に賦活結果を貼り付けた画像:訳者注)が世間一般に出た場合のインパクトの大きさを考慮せずに,peer reviewを経ていない研究結果を安易にマスコミに流す研究者の倫理の問題も指摘している。New York Timesの記事と,Poldrackによる批判については,神経科学に関するブログ「大脳洋航海記」の中の「fMRIの真実」でも詳細に解説されている。閲覧にはユーザ登録が必要だが,現在は新規ユーザ登録はほとんど行われていない。原著者viking氏の好意により,著者のホームページに転載している。
viking | 2008年 7月24日
【脳研究 - reviews】
Neuroimaging.
Growing pains for fMRI (News Focus / Miller G, Science. 2008 Jun
13;320(5882):1412-4)
さて、前回は大御所Logothetisの手によるNature掲載の総説をご紹介しました。今回は、Scienceのnews focusに出た解説記事のご紹介です。著者は担当ライターであるGreg Miller、タイトルはズバリ「fMRIの成長痛」。何やらきな臭いものを感じてしまうタイトルですね。:lase:
Logothetisの総説は、概ねfMRIという手法が古今東西変わらず持ち続ける利点と難点、そして原理的な問題点とその解決策について論じていたように思われます。翻って、今回の解説記事ではfMRIの「今」をわかりやすく、かつ若干センセーショナルに論じているようです。というのは、のっけからすごい話が紹介されているんですね。まずは読んでいきましょう。
Introduction
まずはこの2007年11月11日のNY timesの記事をご覧下さい。Op-edというのは日本で言えば「論説」に当たるもので、「社説」とは違って社外の専門家も加わって署名入りで持論を展開する欄なんだそうです。なのですが・・・その内容が。正確な内容はリンク先の記事を直にご覧いただきたいのですが、筆者はUCLAのIacoboni。何をやったかというと、なんと「今度行われる米大統領選に際してまだ誰に投票するか決めていない有権者20名を集めて、(当時の)有力な候補者たちの写真とビデオを見せながらfMRIで撮る」という実験。そして驚くべきことに、この実験結果には「この米大統領選を左右するほどの有権者の(潜在的な)投票動向が見られた」と言っているのです。
元記事を見ると、さらにびっくり。何か(cognitive
neuroscienceの視点からは)特別な意味を持つとは思えないactivation
mapがずらずらと並んでいる一方で、ひとつひとつにご丁寧に「共和党支持者」「クリントン支持者」「ロムニー支持者」とかcaptionが振ってあるんですよ。:nase: 中には賦活領域の少ない2つのmapを持ってきて「オバマとマケインに好意的に反応している人は少ない」なんてcaptionがついているものもあったり。おまけに、記事の最後には「オバマはもっと演説する時の声のトーンを変えた方がいい」とまで書いてあるし・・・。
これに対して名だたるfMRI業界のPIたちがずらりと署名を並べて猛烈な批判を展開したのがこの11月14日の記事。内容は短いのでリンク先の元記事を読んでいただくとして、Scienceの記事の方では独自インタビュー取材を行っています。そのコメントがすごい。まず、Iacoboniと同じくUCLAの研究者でhuman
neuroimagingではもはや老大家ともいえるPoldrackは「こんなものは科学というよりはもはや占星術だ!」と憤慨の体。:angry: まぁ当然ですよね。
この点について、Scienceがまず紹介しているのはfMRIの急速な発展と、それに伴ってちらほら目に付くようになった世俗的なテーマをとった研究の流布、そしてそれに対する研究者たちの嫌悪感。WUのPetersenはこれを「問題なのは実験するのが実に大変な一方で、絵(activation
map)を手にするのがあまりにも簡単すぎるから」だと言っています。
他方、fMRIは登場してから20年近くが経ち、だんだんと成熟してきつつあるようにも見えます。成熟はイコール限界への接近でもあり、従来手法の限界を超えるための(例えば)voxel pattern
classificationのような手法の開発も進んでいるというのが今日の状況です。これについてPoldrackも「そういう手法は確かにfMRI の世界に革命を起こしつつある」と同意しているようですね。ただ、彼はこうも警告しています。「一方で、人々はfMRIを新しい骨相学だとみなし始めている・・・つまり、ストーリーを物語るだけで科学的な説明はしてくれない、怪しげなものとしてね」。
Neuroimagers gone wild
ところで、件のNY timesのop-edの何に「普通の」研究者たちが嫌悪感を催したかというと、それはfMRI
activation mapの中の特定の領野の活動を見て、ある特定の精神状態を推測してみせるという突拍子もないことをしてみせたからでした。それによれば、「ACCの活動はヒラリー・クリントンに対する複雑な感情を表現していて、amygdalaの活動はミット・ロムニーに対する不安感を反映している」。おいおい。:nase:
もちろん、反論に署名したNYUのPhelpsも指摘している通り「amygdalaが不安感・濃厚な匂い・性的興奮を煽る画像に反応する」のは事実。けれども、いくら何でもミット・ロムニーという単一の候補者に対する何らかの不安感がそのままamygdalaの活動に全部反映されるという結論は、おかしいですよね。
こういう批判に対して、Iacoboniも黙ってはいなかったようです。彼の反論によれば「こんなに悪辣な批判にさらされるとは思わずショックを受けている」「批判の大半は『逆推論』(逆問題推定≒不良設定問題)に関する議論と同じで、意味をなさない」。
その反論に対して、Poldrackの曰くは「それは確かに正しいし、この(ヒト脳機能画像の)分野で誰もが直面する問題でもある。そして、その『逆推論』というのは特にsocial
cognitionやneuroeconomicsといった比較的新しい分野が共通して抱えている問題だ。そういう分野では往々にして、未だにどういう行動がどのような認知プロセスのもとに生じているかという、基礎的なレベルでの研究が発展途上のままだったりする」。その好例としてPoldrackが引き合いに出したのが、7年前のScienceに載ったmoral dilemmaに関するfMRI study。この研究ではいくつかの脳部位がemotionalかつ’rational’な認知プロセスに関連すると結論付けているんですが、彼に言わせると「emotionに関連することになっている領野は、実際にはmemoryやlanguageにも関連するということでよく知られている領野(たぶん PCC)であって」、「そういう批判があることはメディアで紹介される際には無視されてしまう」。
Monkeying around
fMRIの可視化手法の素晴らしさは、いとも簡単に一般大衆を魅了してしまいます。これは囲み記事の中で紹介されている話ですが、学部の授業で学生たちに3種類のfMRIで得られた知見に関するニュース記事(ただし内容はフィクション)を読ませて3つのうちどれが一番説得力があるかを答えさせたという研究があるそうです。どんな記事かというと、1つ目はテキストのみ。2つ目はテキストにfMRIのactivation mapが加わったもの、そして3つ目はテキストにfMRIデータの詳細を示す棒グラフが加わったもの。さてその結果なんですが・・・案の定学生たちから一番多くの支持を集めたのが2番目の記事。そのmapがテキストに書かれている以上の情報を何一つ含んでいなかったのに、です。
一方で、当事者たる神経科学者たちはというとやっぱりその魔力に魅了されてしまっているとこの記事では批判しています。ライターであるMiller に言わせると「fMRIの結果は参加者をMRIスキャナの中に長時間縛り付けておくことで得られたものであり」、「しかも解像度という点でいえばfMRI でneuronひとつひとつを見るというのはあたかも冷戦時代に偵察衛星で人々を監視していたのと同レベルに曖昧でしかない」。
通常のfMRI実験ならば、ひとつのvoxelは数mm立方にもなる。これは何百万ものneuronを含むことになってしまい、あまりにも粗すぎるというわけです。そして、neuronの大半は何百Hzという高い周波数で発火するというのに、肝心のfMRIの時間分解能は低すぎる(何秒にも及ぶ)とも書き立てています。この点について取材を受けたTootellは「そういった特性のせいでfMRIは未だに大ざっぱすぎる脳機能計測手法だとみなされている。fMRIは脳のどこを見たら良いかということを知るには実に良い手段だが、fMRIだけで脳のメカニズム自体に迫れる日が来るとは思えない」と答えています。
Tootellといえば、そういったfMRIの限界を超えるためにfMRIとnhp studyとの併用を行っている数少ない研究者です(筆頭は絶対にLogothetisだと思いますが・・・そしてTootellはむしろfMRI retinotopic mappingの大家としての方が有名な気がするんですが)。で、彼のところのnhp
experimentではヒトのFFAに対応するような領野がnhp temporal
cortexにあるのではないかと推測してsingle unit
recordingをやってみたら、確かにFFAに対応する「らしき」領野では97%のneuronがface-selectiveだったという結果が出たんだそうです。ただ、この結果についてTootellは「確かにfaceではうまくいったけど、PPAに関しては何ともいえない。なぜなら、nhpで対応する領野のpreferenceを見たらplaceではなく’edge’に対してtuningされていたからだ。よって、nhp PPAに関しては(しらみつぶしの実験を強いられるため)かなりの労力を割くハメになるだろう」とも。
そういったnhp-human
combined studyについて、Petersenがコメントすることには「やってみようと思い立った時には、実に素晴らしい手法だと誰もが感じるに違いない・・・けれども難点も多い。まず時間がかかりすぎる(異なる2種の参加者を必要とする上に、nhp
experimentは準備自体に長大な時間を要する)。そして、言語のようなnhpでは調べようのない認知機能を調べるためには使えない」。
There’s a pattern here
というわけで、fMRIにおける’reverse inferences’の問題を解決するにはnhp-human
combined studyもいいけどもうちょい効率のよい方法が求められているわけです。そこに最近提案されているのが機械学習を利用した新しい解析法。当blogでも何度か紹介しているような、multi-voxel
patternをSVMなどの学習アルゴリズムに学習させた上で、decodingを行うようなpatten
classification analysisです。日本では神谷さんの仕事が有名ですし(Kamitani
& Tong, Nat. Neurosci., 2005)、最近では何といってもKayの仕事(Kay et al., Nature, 2008)が脚光を浴びたことで一般にも知られるようになっています。
当blogによくお越しになっている方々であればもはや説明の必要はないものと思いますが、わかりやすい説明が囲み記事の中にあります。つまり、 voxel間でaverageすると一様なデータ同士にしか見えないものが、あえてaverageせずに(例えば)13個のvoxelの賦活パターンの組み合わせとして見比べてみると、’ra’という音を聞いた時と’la’という音を聞いた時とで聴覚野の活動が異なることがわかる・・・というようなものです。
ここでは神谷さんの仕事について少し触れた後で、Raizadaが現在Poldrackと一緒にやっている仕事の話が紹介されていますが、サクッと割愛ということで。ただ、Poldrackがこのpattern classification analysisに寄せる期待は大きいようです。曰く「こういったclassifierがあることで、我々研究者は’reverse
inference’がもたらす危機から救われるかもしれない。例えば、ミット・ロムニーの写真を見せることが不安を煽るなんて馬鹿げた話をする代わりに、他のクモとかヘビとか注射針とか似たような不安や恐怖感を煽る写真によって引き起こされる脳活動と、ミット・ロムニーという人物が有権者の脳の中に引き起こす脳活動とが同じかどうかを調べることができるのではないか」。
An expanding toolbox
こういう新たな手法の開発が進んでいるとはいえ、未だにfMRIはヒトの認知機能と脳活動との関係を調べるという点で多くの制約に悩まされています。これまでの議論を踏まえてUCSDのAron曰くは「結局一番いい方法はツールボックスの中のある一つのツールという立場でfMRIを使うことだ。色々な方法がある中で、なおかつ証拠を持っているという段階で、あくまでも仮説をテストするためだというように」。
そういう問題点を踏まえて、今日では多くの神経科学者がfMRIを単なる賦活を調べるための道具としてだけではなく、機能連絡
(connectivity)を調べるためにも使うようになってきています。もちろん、correlation
analysis, dynamic causal modeling, Granger causality analysisといった方法もあるわけですが、中にはDTIなどの方法で注目している領野同士が物理的に(静的に)つながっているかどうかを調べるというやり方もあったりします。また、あくまでも行動と脳活動との因果関係を調べたいという点では、TMS単体もしくはTMS + fMRIというやり方も大いに試してみる価値のあることだと記事の中では書かれています。
こういった様々な実験手法の融合であったり、また技術の向上などにより、いつの日かfMRIを(も)用いて態度未決定の有権者が誰に投票したいと感じているかを調べられるようになるかもしれません。ただ、その日はあんまり近くなさそうだとMillerは皮肉っています。
・・・なぜなら、ちょうど今現在共和・民主両党の予備選を勝ち抜いて大統領選本選で熾烈な争いを繰り広げているのは、皮肉なことに他でもないNY timesのop-edでfMRIデータをもとに「見込みがない」と判定された2人の候補者、バラク・オバマとジョン・マケインなのですから。:cool:
My comments
ということで、これも真面目に解説していくと結構な長さになりますね。:lase: 前回のLogothetisの総説ほどではないにせよ、内容盛りだくさんだったという印象です。
ところで、この解説記事では従来のfMRIが潜在的に抱える様々な問題を解決する上で一番の方法はmulti-voxel
pattern classification analysisだと主張しています。これは、確かにある程度色々な問題の解決には役立つと思うんですが、はたしてそんなに万能な方法なんでしょうか?
Logothetisの主張を踏まえて考えるに、僕の答えは「半分は否」です。なぜなら、確かにclassifierは解像度や activation
mapの解釈自体に潜む不定性の問題を解決することはできますが、classifierを使おうが使うまいが結局のところneuromodulation
の影響は排除できないからです。大事なのはclassifierを使う以前に、実験課題自体のデザインを工夫しぬいて、arousalや vigilanceの変動を排除することだと思います。
で、例えば2×2×2
factorial designぐらいにすれば複数の実験条件間の差を見られる上に(2×2
factorial design)、arousalを均衡させることができると思うんですよね(最後の×2)。この辺の話は2年前のFristonの総説でも言われていたように思います(文脈はだいぶ違いますが)。要は、もっと考えて実験デザインを工夫しろってことなのでしょう。
ということで、この解説記事自体はLogothetisが皮肉っていた「fMRIをめぐる狂想曲」の実態と当座の問題に対する解決策を提示してはいるんですが、「fMRIの成長痛」自体に対する解決策を提示しているとは言い難いです。次回はそこに触れてみようかと思います。