論文紹介

「新しい情報」を作り出す脳神経機構
Reward inference by primate prefrontal and striatal neurons. Pan X, Fan H, Sawa K, Tsuda I, Tsukada M, Sakagami M. J Neurosci. 2014 Jan 22;34(4):1380-96

玉川大学脳科学研究所 Xiaochuan Pan特別研究員(華東理工大学教授)、Hongwei Fan特別研究員、坂上雅道教授、塚田稔客員教授らは、専修大学澤幸輔教授、北海道大学津田一郎教授らと共同で、推論の神経メカニズムの研究を行い、Journal of Neuroscience誌に発表した。

我々は、刻々と変化していく環境の中で、次に何が起こるのかを予測しながら、行動を行う。この予測を可能にするのは、過去に似たような経験をしたことによる学習の結果である。しかし、時には経験のない状況に遭遇し、その中で何が起こるのか、予測しなければならないこともある。このような場合は、過去の経験は、そのままでは役に立たない。ヒトは、このような時、過去の複数の経験を組み合わせて、新たな状況での予測を行うこともできる。このような機能を、一般に推論と呼ぶ。ヒトは、全く何もないところから、新たな情報を創造することはできない。推論が、新たな情報の創造にも重要な役割を果たしていることは、容易に想像できる。しかし、このような推論機能を、脳がどのように作り出しているのか、いまだほとんどわかっていない。Panらは、ニホンザルに推論課題を訓練し、その課題遂行中の前頭前野と大脳基底核線条体の神経活動を調べることにより、前頭前野と線条体は、異なる推論機能に関わることを、世界で初めて明らかにした。

方法と結果


図1

この実験では、6つの視覚刺激を2つのグループにわけ、まず、それぞれの関係を学習させた(A1、B1、C1からなるグループ(グループ1)とA2、B2、C2のグループ(グループ2))。学習成立後、C1とC2を使ってグループとジュース報酬の関係を教え(図1、教示試行)、次にダブルサッケード課題を使ってA1あるいはA2と報酬との関係を推測させた(図1、ダブルサッケード試行)。ここでは、2-3試行の教示試行と、それに続く7-10試行のダブルサッケード試行を1ブロックとし、ブロック内では、一方の刺激グループは大報酬に関係し、もう一方のグループは小報酬に関係した(ブロックが代われば、刺激-報酬関係も代わった)。サルが大報酬を予測しているか小報酬を予測しているかは、反応時間や正答率によって間接的に知ることができるが、サルは、教示試行での情報をもとに、ダブルサッケードの1試行目から刺激と報酬の関係予測できた。この課題遂行中に、前頭前野外側部と大脳基底核線条体の報酬予測に関係するニューロンの活動を調べたが、ともに、行動同様、報酬を予測する活動を示した。


図2

次に、これまでに経験したことのない新しい刺激を導入し、B1あるいはB2との関係を教えた(B1と連合した新奇刺激をN1、B2と連合した刺激をN2とする)。N1、N2に相当する刺激をそれぞれ100種類以上用意しておき、A1/A2刺激に代えて、教示試行に続くダブルサッケード試行の1試行目から新奇刺激(N1/N2)を導入して、サルの報酬予測と前頭前野/線条体の報酬予測ニューロンの応答を調べた。サルの行動と前頭前野ニューロンの活動は、ダブルサッケードの1試行目から報酬を正しく予測していた(図2左;縦軸はニューロン活動を示しており、黄色と青の線の差が大きいほど、報酬について区別をした応答をしている)が、線条体ニューロンでは、最初の試行では正しい報酬予測を示す活動は見られなかった(図2右)。しかし、線条体ニューロンは、2試行目からは正しく報酬を予測することができた。

結果の解釈と結論


図3

初めて導入された新奇刺激を使っても、サルの行動と前頭前野外側部ニューロンは、1試行目から報酬予測を行うことができた。このことは、サルは、報酬予測に推移的推論機能(N1->B1、B1->C1(報酬)、よってN1->C1(報酬))を使っていることを示しており、前頭前野外側部の神経回路がそれを可能にしていることを示唆している(図3)。一方、大脳基底核線条体は、1試行目に限り報酬予測は、できなかった。このことは、線条体が報酬予測を行うのに推移的推論機能は使えず、他の機能により予測を行っていることを示唆する。これまでの研究から、線条体は比較的単純な強化学習により報酬予測を行っていることが示されており、今回の結果はそれに合致するものである。しかし、線条体でも、たとえば、1試行目にN1が呈示され、2試行目にN2が呈示された場合には、2試行目で有意な報酬予測が確認された。もし、線条体が、経験に基づく報酬予測しかできないとすれば、2試行目で初めて呈示されたN2に基づく報酬予測はできないはずである。この結果は、N1とN2が背反する報酬との関係を持つ場合、一方の情報さえ与えられれば、経験なしに報酬予測ができるという、選言的推論(Xor)機能を線条体は持っていることを示唆する。

今回の実験の結果は、一見同様の報酬予測機能を持つように見える前頭前野外側部と大脳基底核線条体が、報酬予測機能において、異なるメカニズムを持つことを示す結果であり、ヒトの持つ複雑な思考・創造の神経メカニズムを明らかにする第一歩であると考えることが出来よう。

関連論文