本読み

読書記録。1980年生まれ/男

『人口知能はどのようにして「名人」を超えたのか?』

 

本書は、将棋ソフト開発者の著者がどのようにして、「ポナンザ」という将棋ソフトを作りあげていったのかを綴ったもの。将棋ソフトの開発は、今話題の人口知能や機械学習、ディープラーニングという語を抜きには語れないもので、それらは本書でもたびたび登場するキーワードとなっている。

将棋ソフトの開発は古くから行われていたけれど、プロ棋士と伍するほどに強くなったのはこの5,6年と、ごく最近のことである。それまでの将棋ソフトは局面の評価を人間が行っていたのだが、それには限界があったために強くなることが難しかった。著者自身もアマチュアの高段者であり、自分の棋力を持ってすればいい将棋ソフトが作れると考えたが、それでは上手くいかなかったという。

ちなみに局面の評価なんかせずにコンピューターらしくあらゆる局面をしらみつぶしに調べればいいのではないかと思われるかもしれないが、将棋の考えられうる局面はあまりにも膨大でコンピューターを持ってしてもそれは不可能だという。考えられうる局面は10の220乗を超える数になるのである。

なので将棋ソフトに局面を評価をさせるというのは欠かせないのだ。その評価を機械学習させることで近年の将棋ソフトは強くなったのである。この機械自身が学んでいく機械学習には、教師あり学習と強化学習の二つがある。将棋ソフトもはじめはプロ棋士が指した棋譜を教師にして強くなった。その後に、未知の局面からどんどん学習していく強化学習に移っていくという順である。

ディープラーニングはその機会学習の一つに過ぎない。ポナンザが使っていたのはこのディープラーングではなく、ロジスティック回帰という手法だそうだ(ただし、後に、ディープラーニングも使用)。今ではこの機械学習をいかに上手にソフトに行わせるのかがプログラマの仕事になっている。この機械学習での評価がなぜ正しいのかはプログラマ自身にも分からないという。こうした動きを著者は人口知能の「プログラマからの卒業」と呼ぶ。

人口知能の卒業はさらに続き、「科学」からもそして「天才」からも卒業し、終には「人間」からも卒業すると著者は予想する。人工知能を制御できなくなった「人類の運命やいかに?」となるのだが、そこで我々がすべきことは遠い昔から言われていることに還元していくというのが著者の答えだ。「悪いことをしたら罰があたりますよ」というあの文句は、人口知能に対しても当てはまるというのだ。

本書では将棋ソフトの話がメインだが、比較対象として囲碁が何度も言及される。将棋よりもさらに局面数が多い囲碁のソフトがどのように強くなったのかにも触れられているが、こちらはディープラーニングで強くなっている。それも信じられないようなスピードでであり、人口知能の末恐ろしさを感じた。この囲碁でも既に人工知能はプロ棋士を打ち負かしている(アルファ碁vsイ・セドル9段」)。この対戦を振り返る対談の様子が本書の最後に収録されている。その興奮の対談の様子を見ると、囲碁も覚えようかなと思ってしまった。

bookimpressions.hatenablog.com

将棋ソフトが強くなったのはこのボナンザから。そのボナンザと対戦したのが渡辺竜王だ。その模様を描いたのが本書。

bookimpressions.hatenablog.com

棋士たちに将棋ソフトに対する見解をインタビューし、それをまとめたのが本書。