--- 第27回 --------------------------------------------------

演者:小林康氏(大阪大学大学院生命機能研究科)

題目:「脚橋被蓋核における報酬予測誤差生成機構」

日時:2006年5月23日(火)14:40−18:00

場所:京都大学基礎物理学研究所K206

概要:中脳の黒質緻密部や腹側被蓋野のドーパミン細胞(DAcell)は報酬で条件付けされた手がかり刺激や報酬に対してphasicなバースト応答をすることによって,大脳基底核などに報酬予測誤差信号を送り,強化学習におけるシナプス可塑性を制御していると考えられています.この報酬予測信号がどうやって生成されるのかということは強化学習理論における最も重要な問題の一つです.DAcell,さまざまな部位から興奮性,抑制性入力を受けていますが,それぞれの入力信号の性質が明らかにされていないために,いまだに報酬予測誤差の計算過程がわかっていません.また、DAcellに対して興奮性入力がなければDAcellはバースト応答をすることが困難であるため,特にDAcellに対する興奮性入力の重要性が浮かび上がってきます.脚橋被蓋核(PPTN)は脳幹のもっとも主要なアセチルコリン性細胞の核で,古くから睡眠覚醒の調節,運動制御,注意や学習と関係が深いと考えられてきました.また,このPPTNDAcellに対して最も強力な入力を供給していることからPPTNからの興奮性入力が,DAcellにおける報酬予測誤差信号の生成に重要な役割を果たしていることが示唆されます.そこで,私たちはサルに手がかり刺激で報酬量を予測させるような視覚誘導性サッカードを行わせ,その時のPPTNのニューロン活動を記録し,報酬予測誤差に対するPPTNのニューロン活動の寄与を調べましたのでお話させていただきたく存じます.

---------------------------------------------------------------

 

恒例になりました「私の研究人生」から:小林さんは企業5年,大学・研究所10年の経歴.松下電器でバイオセンサーの開発,レコーディングシステムの開発に関わっていたときに外山先生のところで薫陶を受けたそうです.

  

外山「松下にいたときは特許はとれたが論文は書けなかったから『落第』,生理研の伊佐さんのところでは『合格』,大阪大学に移って今度の仕事で『優秀』になる,かな?」

 

小林さんが中脳ドーパミンニューロンの強化学習T-D model. Howkの理論を説明.

金子「この理論では2経路からの時間遅れが逆になっている.こういうのは文句は言わないのですか」

外山「誰も信じていないから文句は言わない」

小林さんの発見は,脚橋被蓋核(PPTN)が報酬予測をコードして持続発火をすること,報酬の直前でその活動が減少を始めること,で大変興味深いものです.強化学習の式に対応させるとV(t+1)の項に対応する.

外山「とってみたらこうでした,ではいけない.論文というのは,あたかも,自分にはそのことはわかっていた,というように書かなくてはいけない」

 

ATRの春野さん,初参加.「こんなに面白い会に,これまで出なかったことを後悔している」とのことです.

 

外山「PPTNが学習にessentialであることはどうやってわかる?」

小林「PPTNを壊すと学習が出来なくなります」

外山「そんなもの証明にはならない.どこを壊したって学習は出来なくなる.目をつぶしたって学習は出来ない」

 

外山節にズッコケる聴衆たち.九割方,外山先生が話しています.

 

篠本「PPTNの反応でV(t+1)R(t)に対応している反応を足してみて,それがStriatumの反応につりあえばいいのでは」

外山「川人さんも同じことを言っていた.理論の人の考えはおおざっぱすぎていけない」

今回のアフターセミナーは若い院生がけっこう多く参加して,自分の研究の売りを紹介し,修論発表会のようになりました.

こういう風に若い人も自己アピールをしてください.