人工知能:東大入試からシンギュラリティまで

メディアや他の方がいくつか報告を上げているが、土曜日に『ロボットは東大に入れるか』の講演を聞きに行ったので気づいたことなどをメモしておこう。

人工知能にとっては、センター数学よりも東大二次数学の方が解きやすいことや、図形や文の構造を理解することがどうしようもなく難しいことなど、AIと人間の違いに関するいくつかの側面を興味深く受け取った。

「人間のように思考する」といった曖昧で高すぎる目標ではなく到達度を客観的に評価しやすい入試問題をターゲットに選んだのはよい着眼点だと思う。もし2021年までに、東大入試クラスの読解力や問題処理能力を獲得したならば、技術文書を要約したり、国会答弁を自動生成したり、様々な産業応用が可能になるだろう。

模試の結果はもっと惨憺たる有り様になると思っていたが、センター試験では 387/900、2次試験は(今回は数学のみだが)合格者平均を超えるなど、予想していたより結構できていて感心した。まだまだ合格までの道のりは長いとはいえ、現代文ですらそれなりに点をもぎ取っているのが面白い。

数学

数学は特に興味を引かれた。解けてる。

コンピュータによって自動的に定理を証明する試みは古くから行われてきたが、数学の研究は未だに自動化出来ていない。しかし、いつの日にか人間を遥かに超え、想像もつかないような数学の世界を示してくれることを期待している。

今回の数学は以下のように求めている。

  1. 問題文を言語解析し、論理式(一階述語論理)に変換する
  2. 論理式を書き換えて、数式処理システムが扱える形式に変換
  3. 数式処理システムが、解答を作成し出力。

ほとんどの数学は一階述語論理とよばれる論理式で表現することができる。日本語で書かれた問題を、論理式に変換するのが第一ステップだ。ここだけはまだ半自動で、人の手が介在する。論理式に正確に置き換えることができれば、あとは完全自動でMathematicaのような数式処理システムが限量記号消去法(QE)などを用いてゴリゴリと等価な式に変形し、解答を作成する。

例えば、『すべてのxに対して f(x)=x^2+ax+bが正となるようなa,bの条件を求めよ』という日本語の文章を『  \forall x \left( x^2+ax+b>0 \right) 』という論理式に置きかえて、これをQEによって等価な式に書き換えながら \forall x のような限量記号を消去し、『a^2-4b<0』という答えを見つけ出す。

問題文を論理式に変換できたからといって必ず解ける訳ではない。定式化のやり方によっては、コンピュータで解けないほどの計算量になる場合もあるし、まだ実装が不十分でちゃんと扱えない単元もあるようだ。現在の東大入試ロボットは、微積や数列、代数・幾何などは比較的得意でも、三角関数整数論が苦手だったりまだまだ改善する部分はある。

特徴的な答案

解答は人間の答案とは似ても似つかないが、絶対に計算ミスしないし、正解した時は完全に正しい答案になるのでその大問は満点だ。外れれば0点である。『人工知能』という名のホームランバッターに部分点はない。解答はどんな分野の問題でもすべて同じフォーマットになる。

問題文は次の論理式と等値である。〜論理式〜 この式は実閉体の体系RCFの式であることから、ほげほげの定理により、このしきと等値で量化子を含まないような式を求めることができる。ほげほげの量化子除去アルゴリズムをつかって、上記の式を書き換えた結果が以下の式である。 答えがズドン

文系理系ともに、2大問をこのような解答で満点を取り、1大問は計算量が爆発して解答に辿り着けず、残りは白紙という結果。これでも偏差値60になるが、当たり外れが運次第なので成績は安定しない。

人工知能にとってはセンター数学のほうが難しい

数学ロボットが面白いのは、人間と違って2次試験の方が得意なことだろう。問題文が論理的で簡潔であればあるほど解きやすくなる。人間にとっては東大生の2%しか完答できないような難問であろうとも、問題文が明確でありさえすればあっさり解けたりする。

逆に、センター試験のように問題文が長くなり誘導を付けられると人工知能は苦戦する。途中でちょっと転ぶと後は全滅だし、多数の文の関係を評価する国語力が求められる。そもそもロボットと人間では思考の流れが全く異なるので、人間の思考に沿った誘導は親切どころか撹乱にしかならない。

しかし、結果はなかなかのものだ。例えば数IAなら、全部で4設問あるうちの最初の2つ(方程式・論理・二次関数)は満点を取るなど、上手くフィットすればしっかり解ける。残念ながら第三設問(三角比・平面図形)の途中で躓いたあとはすべて白紙だが、57点を獲得し平均点を超えている。

ちなみに第四設問は『場合の数と確率』で、これはコンピュータにとって相当な国語力が要求されるのか0点である。「カードを取り出してシャフルした後、印をつけ」みたいな多様な文を論理式に変換するプログラムは大変らしい。

国語

次に興味をもったのが国語だ。文章を適切に解釈することはすべての科目に通じる重要な課題だ。「読解力とは何か」という問いにはまだ手がでないので、とりあえずは「点数が解ければよかろうなのだ」の方針で試みているそうだ。

文章を理解していなくとも、単語ベースの手法で傍線部解釈問題をそれなりに選べる事には驚いた。しかし、ダミー選択肢を作る手法としてよく用いられる論理の逆転には瞬殺される。

今回のセンター模試は、小論18点、小説24点、古文20点と振るわなかったようだが、ランダムに選ぶより有意に高い。小説は絶望的かと思いきや結構取った。現代文では、68点をとったこともあるそうだ。

予想よりできているのは喜ばしい。だが、文の構造を理解できるようにならない限りさらなる高みは難しいだろう。センターは適当にお茶を濁せるかもしれないが、2次試験はワードサラダみたいな答案では通用しない。


すこし外れるしうろ覚えだが、『傍線部が指し示すもの』が傍線部のどこに分布しているかみたいな統計データは興味深かった。上のグラフは実際のデータではないが、傍線部の前後にピークを作る。その分布に合わせて重率を掛けて単語をマッチングしていったりすると面白い。

英語

英語の結果が悪いことには驚いた。センター英語は正答率が26%なので、ランダムに選んだのとさほど変わらない。すべての科目の中で一番悪い。解けていると言えるのは、発音・アクセント問題だけだ。

英語が125点くらいまで上がれば全科目の合計が受験生の平均点を超えるし、伸びしろは沢山あるので今後の進展に期待したい。

ただ、東大生のセンター英語の正答率は96%だそうなので、その水準に達するには凄まじい改善が必要だろう。そのレベルに達したならば、Google Translateをはるかに超えるAIが出来ているはずで、逆に言えばGoogle並に何百億と研究費を投じても簡単ではないだろう。

物理

物理シミュレータに放り込んで数値実験という発想は無かった。数学よりも国語力を必要とし、図形解釈もあるので先は長い。文章から状況を復元するのは人工知能にとって非常に難しい問題だ。そして物理の問題には書かれていない常識がたくさんある。


例えば、これは途中で宙返りするジェットコースターの図だが(東大2010)、これが『曲線と円が接している』ではなく、この線がひとつながりの線路であることを認識しなければならない。問題文と図を使った複合的な理解が求められる。

社会(日本史&世界史)

歴史がそれなりに取れるのは予想していたので特に驚きはない。両方共6割弱といったところで、他の教科と比べて悪くはない。ただ、東大を目指すなら9割はほしいので、深い文章理解という壁がまた立ちふさがる。

総評&その他

2次試験でどのくらい悲惨な答案をつくるか期待していたのだが、今回は数学以外はトライしていなようで残念だ。

文章の理解に関しては、まだ目標の1%にも達していない印象を受けたが、人工知能ワトソンも最近まではさんざんだったのでブレイクスルーがあるかもしれない。そして、文章を理解できなくとも、多くの私立大学に合格する成績を叩き出せることは新鮮だった。

人工知能研究はなかなか思うように進まずブームと冬の時代があり、エキスパートマシンや第五世代コンピュータといったある意味では黒歴史のような単語を聞けたのはよかった。最近は、GoogleAppleなどが人工知能研究に膨大な投資を行っており、第三の波が訪れつるあるそうだ。Googleは様々な人工知能を研究しており、例えば自動運転は既に50万キロ走り人間より事故率が低い状況にあるそうで、担当者が「人間は運転に向いていない」と豪語するまでになっているという話など、AIについて明るい展望も聞いた。

未来:人工知能に期待すること

ある決まったフレームの元であっても、問題を理解しそれに対して適切な答えを作ることができる人工知能が生まれたら、それは驚くべき進展だ。そして、それは東大入試ロボットが目指す2021年では恐らく無理だろう。しかし、実現を願って止まない。

クイズ王を下した人工知能ワトソンが医療データの検索支援やヘルプディスク・コールセンターに応用されつつあるように、そのような人工知能は人間がやらなければならない仕事を減らしてくれることだろう。

特に、専門知識が必要で頭を使う必要はあるがクリエイティブでない仕事は、将来、人工知能で一掃しうるだろうし、そうなることを期待する。

そして、クリエイティブさを定義するのは厄介だが、最終的には創造的な仕事を含めたあらゆる仕事を代替できるようになってほしい。既に、人間の脳という機械が宇宙に存在している以上、原理的にはそれを同等の機械をつくることは物理学的に禁止されておらず、おそらくそれを越えたパラメタの機械を作ることも可能だろうし、いつかできてほしい。

人間が有利な領域がどんどん狭くなっていく過程で、「知的」の定義も人間に都合よく書き換えられていくだろうが、最後に残るものを見届けたい。

その時代に旧人類が何をして生きていくかは経済学者なり社会学者に任せるとして、ポスト・ヒューマンないしシンギュラリティが地上に現れる様を私はみたい。人間の領域をはるかに超えた科学、すべての自然科学者を失業させるほどの知の体系を見ることができるのであれば、経済的にいかに不利益を被ろうとも構わない。