人間認知の基盤モデル「ケンタウルス」とは?

システムインテグレーターのTak@と申します。

人間の心を、まるでコンピュータのプログラムのように予測し、再現できる「モデル」が誕生したとしたら、あなたはどう感じますか?まるでSFの世界の話のように聞こえるかもしれませんが、今、認知科学の世界でまさにそんなモデルが現実になりつつあります。

その名も「ケンタウルス」。

この記事では、この画期的なモデルが、私たち自身の「心」をどのように理解し、そして未来の科学にどのような新しい可能性をもたらすのかを、システムインテグレーターである私の視点も交えながら、分かりやすく紐解いていきたいと思います。

従来のAIモデルと一線を画す「ケンタウルス」の汎用性

私たちは日常的に、朝食のシリアルを選ぶような些細なことから、病気の治療法を考えたり、宇宙を探査したりするような複雑な問題まで、実に様々な決断を下しています。

そして、いくつかの例を見るだけで新しいスキルを習得したり、物事の因果関係を推論したり、好奇心を行動の原動力にしたりと、その知性の幅広さには驚かされます。この多様性こそが、私たち人間を人間たらしめているものだと言えるでしょう。

これに対し、現代の多くのAIモデルや認知科学のモデルは、特定の目的のために作られた「特化型」がほとんどです。

例えば、Google DeepMindが開発したAlphaGoは、囲碁の世界では圧倒的な強さを誇りますが、それ以外のことはほとんどできません。認知科学の分野でも、プロスペクト理論のように意思決定の仕組みを深く洞察するモデルはありますが、それがどのように学習し、計画し、探索するのかについては教えてくれません。

しかし、人間の心を全体として理解しようとするならば、こうした「特定の領域に特化した理論」から、様々な領域を横断的に捉える「統一的な理論」へと移行する必要があります。

このような統一的なアプローチの重要性は、古くから認知科学の先駆者たちによって認識されてきました。まさに、「知識を統制するには、認知の統一理論こそが唯一の方法である」と言われてきたのです。

ケンタウルス、汎用的な認知モデルへの挑戦

この大きな目標への一歩として、どんな状況でも人間の行動を予測し、再現できる計算モデルを作るという挑戦が掲げられました。この挑戦に立ち向かうために開発されたのが、人間認知の基盤モデル「ケンタウルス」です。

私は普段、お客様の要望に合わせてシステムを開発していますが、それぞれのシステムが特定の業務に特化しているため、その汎用性の低さに課題を感じることもあります。ケンタウルスのような、一つのモデルで多岐にわたる人間の行動を捉えようとする発想には、システム開発者として非常に共感を覚えます。

ケンタウルスは、データに基づいて設計されました。具体的には、最先端の言語モデル「Llama 3.1 70B」を基盤とし、「Psych-101」という大規模な人間行動データセットでファインチューニング(微調整)することで誕生したのです。

このアプローチにより、言語モデルが持つ膨大な知識を活かしつつ、それを人間の行動に合わせることが可能になりました。

「Psych-101」:人間の心の膨大なデータセット

ケンタウルスがこれほどまでに汎用的な能力を発揮できる背景には、その学習に使われた「Psych-101」というデータセットの存在が欠かせません。このデータセットは、これまでにない規模と多様性を誇ります。

データセットの驚異的な規模と多様性

Psych-101は、160もの異なる心理学実験からのデータを網羅しています。これには、実に6万人以上の参加者が関わり、合計で1,000万回を超える人間の選択行動が記録されています。

これらの実験は、マルチアームバンディット、意思決定、記憶、教師あり学習、マルコフ決定過程など、多岐にわたる認知の領域をカバーしています。

このデータセットの特筆すべき点は、各実験の試行ごとのデータが「自然言語」の形式で記述されていることです。これにより、異なる実験のパラダイム(枠組み)を共通のフォーマットで表現することが可能になり、言語モデルが人間の行動をより深く理解するための土台となりました。

「現在進行形」のデータセット

Psych-101の開発は、今も進行中です。現状では学習と意思決定の領域に重点が置かれていますが、将来的には心理言語学、社会心理学、経済ゲームといったさらに多くの領域や、個人の年齢、性格、社会経済的地位といった「個人差」に関する情報も取り入れていく予定だそうです。

これにより、モデルがより多様な人間の行動や、それぞれの個人に合わせた違いまでも捉えられるようになることを目指しています。

ただし、現時点では「Western, Educated, Industrialized, Rich, and Democratic(WEIRD:西洋の、教育を受けた、産業化された、裕福な、民主的な)」と呼ばれる集団に偏りがあることも認識されており、今後の改善点が残されています。

しかし、この大規模かつ多様なデータセットの存在が、ケンタウルスが人間の行動を驚くほど正確に捉える基盤となっているのは間違いありません。あなたのこれまでの人生の選択が、もしすべてデータとして記録されていたら、どんなパターンが見えるでしょうか?想像するだけで、興味深いと思いませんか?

ケンタウルスの驚くべき予測能力と「心」の再現

ケンタウルスは、単に人間行動を予測するだけでなく、まるで人間の「心」そのものを再現しているかのようです。その能力は、様々な厳密なテストによって実証されました。

未知の状況下での高精度な行動予測

まず、ケンタウルスは、訓練データに含まれていない「未知の参加者」の行動を、既存の認知モデルよりも高い精度で予測できることが示されました。ケンタウルスは、既存の認知モデルと比較して、ほぼ全ての実験で人間行動への適合度が優れているのです。

さらに驚くべきは、ケンタウルスが「訓練データに含まれていない実験」に対してもその能力を発揮する点です。

  • カバーストーリーの変更への対応:たとえば、訓練データにはなかった「魔法のじゅうたん」の物語を使った実験でも、ケンタウルスは人間の行動を見事に捉えました。これは、単にパターンを覚えているだけでなく、タスクの本質を理解していることを示唆しています。
  • タスク構造の変更への対応:2本腕バンディット(2つの選択肢から報酬を得るタスク)の実験は訓練データにありましたが、選択肢を3つに増やした「マギーの農場」という新しいタスクでも、ケンタウルスは人間の行動を正確に予測しました。これは、タスクの基本的な構造が変更されても、その背後にある認知メカニズムを適用できることを意味します。
  • 全く新しい領域への汎化:さらに、論理的思考を問うような、訓練データに全く含まれていなかった新しい認知領域においても、ケンタウルスは人間行動を捉えることに成功しました。これは、特定の領域に縛られない、真の汎用性を示しています。

人間らしい行動の生成と反応時間の予測

ケンタウルスは、過去の行動を考慮に入れた予測だけでなく、「オープンループシミュレーション」という手法で、人間そっくりの行動を自律的に生成することもできます。

これは、モデル自身の反応をフィードバックしながらシミュレーションを行う、より厳しいテストです。このテストでも、ケンタウルスは人間と遜色のないパフォーマンスを見せました。

例えば、不確実性に基づいて探索を行うという、多くの言語モデルには見られない人間特有の行動パターンも再現したのです。

また、特定の個人の行動だけを捉えるのではなく、集団全体が示す多様な行動パターン(例えば、モデルフリー学習とモデルベース学習の混合など)までも再現できることが分かりました。

さらに興味深いことに、ケンタウルスは人間の行動は正確に予測する一方で、人工エージェントの行動予測には苦戦することが示されました。これは、モデルが人間特有の特性を学習している証拠と言えるでしょう。

単なる選択だけでなく、ケンタウルスは人間の反応時間までも予測できます。

これは、行動の背後にある認知プロセス、例えば「どれくらい考えてから行動するか」といった側面までもモデルが捉えていることを示唆しており、R2値(決定係数)で見ても既存の言語モデルや認知モデルを上回る精度でした。

私が開発するAIツールでは、ここまで複雑な人間の行動特性を組み込むのはまだ難しいと感じます。まるで顧客の「心の声」を聞き取って、期待を超えるシステムを提案する時の興奮に似ていますね。

内部表現と神経活動の驚くべき一致

ケンタウルスの驚くべき点は、行動の予測にとどまりません。その「思考プロセス」とも言える内部表現が、人間の脳活動と非常に近い傾向を示すことが明らかになりました。これは、モデルが人間の行動を学習する過程で、結果的に人間の脳が情報を処理する方法と似たような内部構造を獲得したことを意味します。

行動データからの神経アライメント

研究者たちは、ケンタウルスの内部表現が人間の神経活動とどれだけ一致するかを検証するために、2つの分析を行いました。

  1. 二段階タスクにおけるfMRIデータ予測:まず、人間が「二段階タスク」という意思決定課題を行っている際の機能的磁気共鳴画像法(fMRI)データを分析しました。このタスクのカバーストーリーはケンタウルスの訓練データには含まれていませんでしたが、ケンタウルスの内部表現は、Llamaの内部表現と比較して、一貫して人間の神経活動をより正確に予測できることが示されました。これは、大規模な行動データによるファインチューニングが、モデルの内部表現を人間の神経活動に合わせる効果をもたらしたことを示しています。
  2. 文章読解タスクにおけるfMRIデータ予測:次に、人間が簡単な6単語の文章を読んでいる際のfMRIデータを用いて、同様の分析を行いました。この分析の主な目的は、認知実験でファインチューニングした後も、関連性のない設定での神経アライメントが維持されるかを確認することでした。結果として、ケンタウルスはLlamaよりも人間の神経活動との相関が高い傾向を示し、ファインチューニングが神経アライメントに有益であることが示唆されました。

これらの結果は、ケンタウルスが単に「人間のような振る舞い」をするだけでなく、その振る舞いを生成する「内部のメカニズム」もまた、人間の脳の仕組みに近づいている可能性を示唆しています。

これは、AIが私たちの「心」の働きを模倣するだけでなく、ある意味で「理解」しているとさえ言えるかもしれません。もしAIがあなたの思考パターンを読み解けるとしたら、それは便利だと感じますか?それとも少し怖いと感じますか?

「ケンタウルス」が拓く、認知科学の新たな地平

ケンタウルスとPsych-101は、単なる研究ツールを超え、認知科学の未来を大きく変える可能性を秘めています。これらのモデルは、科学的発見をデータ主導で加速させ、人間が認知モデルを開発するプロセスを補助する、強力な手段となるのです。

モデル主導による科学的発見の加速

「A foundation model to predict and capture human cognition」の論文では、ケンタウルスとPsych-101がどのように科学的発見を導くかの具体的な事例が紹介されています。

新しい意思決定戦略の発見

Psych-101のデータは自然言語形式であるため、DeepSeek-R1のような言語ベースの推論モデルで簡単に処理できます。研究者たちは、DeepSeek-R1に多属性意思決定実験における参加者の行動について説明を求めました。

すると、モデルはこれまでの研究では組み合わされることのなかった2つのヒューリスティック(経験則)を組み合わせた新しい意思決定戦略を導き出したのです。このモデルを実装したところ、元の研究で検討されたどの戦略よりも、人間の反応行動を正確に説明できることが判明しました。

科学的後悔最小化によるモデルの改良

DeepSeek-R1が発見したモデルでも、まだケンタウルスの予測精度には及ばない部分がありました。そこで研究者たちは、「科学的後悔最小化(scientific regret minimization)」という手法を用いました。

この手法は、予測モデルを「基準」として、既存のモデルでは捉えきれていないが、原則として予測可能な人間の反応を特定するために使われます。

通常、この手法には大規模な実験固有のデータセットが必要ですが、ケンタウルスを使えば、特定のデータ収集なしにこのプロセスを大きく広げることができました。

ケンタウルスが正確に予測できたものの、DeepSeek-R1が発見したモデルでは捉えられなかった反応を詳しく調べると、参加者がより評価の低い選択肢を選んだケースがあることが分かりました。

このパターンから、2つのヒューリスティック間の切り替えが、当初考えられていたよりも厳密ではない可能性が示唆されました。

そこで、厳密なルールを「2つのヒューリスティックの加重平均」に置き換えたところ、結果として得られたモデルはケンタウルスと同等の予測精度を持ちながら、依然として解釈可能であることが示されました。

私が普段業務でAIモデルを構築する際も、このアプローチがあれば、より少ないデータでモデルの精度を向上できると期待しており、これには私自身、興奮を隠せません。

自動化された認知科学と未来への応用

ケンタウルスは、「自動化された認知科学」の文脈でさらに多くの応用が見込まれています。例えば、実験研究の「in silicoプロトタイピング」に利用できるかもしれません。

これは、どの実験デザインが最も大きな効果量(実験結果の強さ)をもたらすか、必要な参加者の数を減らすにはどうすればよいか、効果の検出力(統計的有意性)を推定するにはどうすればよいか、などをモデルを使って事前にシミュレーションできるということです。

将来的には、ケンタウルスの内部表現をさらに深く分析することで、人間がどのように知識を表現し、情報を処理しているかについての仮説を生成し、それを実際の実験で検証するという研究も可能になるでしょう。これは、認知科学が新しい時代へと突入する、大きな一歩と言えます。

結論

これまで、私たちはケンタウルスという画期的な人間認知の基盤モデルが、どのようにして人間の行動を驚くほど正確に予測し、さらにはその思考プロセスまでも再現しているかを見てきました。

従来のAIが特定のタスクに特化していたのに対し、ケンタウルスは広範な心理学実験のデータセット「Psych-101」を通じて学習することで、未知の状況や全く新しい領域にまでその能力を汎化させることに成功しました。

そして、その内部の仕組みが人間の脳活動と一致するという事実は、まさに人間の思考がデジタルデータとして視覚化され、分析できるような未来を予感させます。それは、かつてSFの中でしか語られなかった領域です。

認知の統一理論の確立は、心理学における長年の目標でした。ケンタウルスは、この目標に向けて大きく前進し、確立された多くのモデルとの競争において、一貫して優れたパフォーマンスを示しました。これは、データ駆動型の汎用認知モデルの発見が、非常に期待される研究の方向性であることを力強く示しています。

この「ケンタウルス」が示す、人間の認知の謎を解き明かす研究の進展は、私たち自身の「心」をより深く理解する手がかりとなるでしょう。あなたは、AIが人間の「心」の奥深くまで入り込む未来に、どのような可能性を見出しますか?

出典:Nature論文

Follow me!

photo by:Matt Jones