![]() |
2017.09.24 Sunday
AI対AI
AIを使った将棋ソフトを開発した人が書いていた。
今、将棋を強くするための方法は、ある戦術を取った時の判断の変数があって、それをいじることだという。 正しいかどうかはわからないが、角道を空ける、という序盤の手がある。 例えば、その手の価値が90点だったとすると、それを92点に上げるとかいうことだ。 価値が高いほど、手としてはいい、ということになる。 もちろん、現実はもっと複雑だし、考慮するべきことも多いのだと思うが、要は指し手を点数化して、より高い点数を求めて指す、ということだろう。 ある程度AIが完成すると、そこから先はAIがAIを訓練するというフェーズになる。 つまり、AI同志で対局させ、何千回のうち、どっちがたくさん勝ったか?ということだ。 たくさん勝負させるのは、特殊な場合になったりすると間違いが起こるからだろう。 ある程度の数を対戦させると、それらの間違いが減る。 そうやって、強くなっていくらしい。 そういうチューニングの結果、人間に勝ったりするAIが出てきているのだから、プロセスとしては正しいのだろう。 人間なら何千回も対戦すると疲れるし、文句を言うが、コンピューターはそういう仕事には強い。 つまり、AIがAIを鍛えていくということだ。 こんな風になっているから、AIはなぜ強くなったのかという説明を人間はできない。 理屈ではなく、経験という感じだ。 人間もある程度強くなって対戦すると、指し手の説明で「直観的な選択」、ということになる。 それと同じことが、コンピューターでも起こる。 これが今までのAIとは違うところだ。 これまでは理屈で説明できるような状態だったが、機械学習とか深層学習とかいうやつは、人間がそういう指示をしているわけではない。 人間も、コンピューターも、結局は何を考えているかわからないのだ。 ただ、人間は疲れるし、そんなに日夜勉強できない。 でも、コンピューターは電気がある限り、学習を続けることができる。 これが、一部の人たちにとっては恐いことになる。 将棋や碁なら、問題ない。 外交などはややこしいだろう。 ゲーム理論や交渉術、歴史などを学習して、どうやってつき合えば自分たちに有利かを判断する。 こうした方がいい、という結果は出るが、そこに至ったプロセスがわからないと、不安になる。 まあ、人間がやっていても、往々にしてそういうことはあるのだが…。 21世紀はそういうことが出てくる時代になる。 |
![]() |