hidsgo’s diary

56歳独身男(結婚暦なし)の存在していた記録

AlphaGo vs セドル

AlphaGoとセドルの対戦、最高におもしろかったですね。最初にAlphaGoが3連勝。時にプロ棋士の予想しなかった手 (第2局37手目) を放って勝ちきり、その強さを見せつけた。しかし第4局、セドルの鋭い手 (78手目) にAlphaGoは対応できず、コンピューター碁の弱点を露呈。最終局はAlphaGoが序盤ミスを犯しながらも持ち直し最後まで接戦を展開して勝利。AlphaGoが4勝1敗で勝者となったが、大いに盛り上がった5連戦だった。

(上記2手について取り上げた記事)
In Two Moves, AlphaGo and Lee Sedol Redefined the Future | WIRED
Googleが人工知能AlphaGoと世界最強棋士の対局から学んだ2つのこと - GIGAZINE

 

私は週末に他にすることがあって残念ながら1局を最初から最後まで見ることは出来なかったが、時々聞いたレドモンドの解説と局後の記事と併せて、それぞれの対局についてなんとなく様子を把握することができた。

 

最終局後AlphaGoには韓国棋院から名誉9段が授けられ、現在AlphaGoはGo Ratingsで2位にランクされている。1位は中国の柯潔九段。
囲碁AI「AlphaGo」、世界2位にランクアップ - ITmedia ニュース

Go Ratings

 

AlphaGoは今後どうなるのか、DeepMind社は次に何をするのか、気になるところだが、それよりも今回の対戦で囲碁が一気に世間の注目を集めたわけで、これはビジネスチャンスではないですかね、日本棋院様。

なにはともあれ、AlphaGo vs Lee Sedol、世界が熱くなった1週間だった。

[ セドル9段 (右) がサインした対局に使用された碁盤を受け取るデミス・ハサビスCEO。 ]

f:id:hidsgo:20160320012104j:plain


 

以下今回の対戦の主な役者たちについて、勝手なコメントをつけながらネット情報など。

 

李 世乭 (イ・セドル、Lee Sedol)

今回の対局を通じてともかく凄いなと感じたのは、セドルだった。DeepMind社に白羽の矢を立てられてその挑戦を受け、真正面から全力を尽くし戦う (もっとも当初は負けると思ってなかったかもしれないが。) そして3タテ食らったが、相手の打ち方に応じ戦略を変え、ついにはAIの想定外の手を放ち勝利をもぎ取る。

また、今まで彼の名前はよく聞いたもののインタビューなど見たことはなかったが、今回の各対局後の会見で、にこにこしながら率直に自分の気持ちと意見を述べて、感心することしきりだった。

(第4局後) 「たった一局に勝利しただけで、ここまで祝っていただいたのは初めてです。」
http://wired.jp/2016/03/14/alphago-the-forth-round/

(最終局後)「AlphaGoとの対局で、わたしは古い考え方に少し疑問をもったような気がします。またこれから学ぶことが増えましたね」
https://wired.jp/2016/03/16/final-round/

今回破れはしたが、彼が挑戦を引き受けたことと彼の戦いぶりは、世界中から賞賛され歴史に刻まれるだろう。

 

デミス・ハサビス (Demis Hassabis)

今やDeepMind軍団総帥としてすっかり衆目を集める存在となった39歳。ロンドン生まれ。父はギリシア系キプロス人、母は中国系シンガポール人。子供時代にチェスの14歳未満世界2位になった神童。ケンブリッジ大でコンピューター・サイエンス専攻。ゲーム会社Elixir Studio社起業などののち、UCLにて神経科学でPh.D分子生物学者のイタリア人の妻と2人の息子とロンドンに住む。DeepMind Technologies社の設立は2010年。2014年にGoogleに買収され社名が Google DeepMindになる。

DeepMind:AlphaGoをつくった「4億ドルの超知能」はいかにして生まれたのか? « WIRED.jp
The superhero of artificial intelligence: can this genius keep it in check? | Technology | The Guardian

 

デイヴィッド・シルバー (David Silver)

DeepMInd社の中心的プログラマーで、AlphaGoのNature誌論文の筆頭著者。イギリス人。ケンブリッジ大でデミス・ハサビスと出会い友人になる。Elixir-studio社の共同設立者でCTOだった。カナダ・アルバータ大で強化学習 (reinforcement learning) を研究しPh.D

David Silver: The unsung hero at Google DeepMind - Business Insider

[ Nature論文発表後にAlphGoについて語るDavid Silver。 ]

f:id:hidsgo:20160320023518j:plain
The computer that mastered Go - YouTube

 

黄士傑 (Aja Huang)

今回の対戦で、セドルと対面してAlphaGoの着手を碁盤に置いていた人物。「石を置くだけの簡単なお仕事」を行っていたように見えるが、台湾出身で囲碁はアマ6段。台湾師範大学で情報工学の学位。アルバータ大でポスドク囲碁ソフトEricaの作者。DeepMind社でAlphaGo開発に携わる。Nature論文の第2著者。「我が子」の考えた手をイ・セドル相手に打っていたわけだ。

chessprogramming - Shih-Chieh Huang

[ 第2局開始前のAja Huang氏 (左) とイ・セドル。 ]

f:id:hidsgo:20160320030911j:plain

 

マイケル・レドモンド (Michael Redmond)

前回記事参照。日本棋院マイケル・レドモンド9段。5局とも実況解説を担当。5、6時間かかった各対局を通しで着手について解説とするとともに、考慮時間中には聞き手のクリス・ガーロック氏とともにトークを進める。2局目だったか、着手の合間にこんなことを言っていた。「どちらが勝っているか私がはっきり言わないという声が多かったので、今日ははっきり言うようにしています。」

世界中の囲碁をする人もしない人も彼のコメントを頼りに見てた人が多かったわけで、マイケルお疲れ様、と言いたい。対局者と同様に賞賛に値する。

 

クリス・ガーロック (Chris Garlock)

やはり前回記事に記したがアメリカ囲碁協会副会長。ネットを見てみると、多方面に活動しているようだ。

http://www.laborheritage.org/chris-garlocks-biography/

[ 第5局開始前にDavid Silver と第4局について話をする Michael Redmond (右) と Chis Garlock (中)。 ]

f:id:hidsgo:20160320031516j:plain

 

AlphaGo team

[ 最終局後の記者会見にて。左から6人目にDemis Hassabis、その右にDavid Silver、そしてAja Huang。1人おいて昨年10月にAlphaGoと対戦したFan Hui2段の姿が見える。 ]

f:id:hidsgo:20160320031631j:plain

 

DeepMind主要14人のAI科学者

必ずしもAlphaGoチームではないかもしれないが、記事があったのでリンクを貼っておく。

Google DeepMind's top scientists - Business Insider


 

Hardwareについて

今回セドル戦に使用されたAlphaGoは、昨年10月のFan Hui戦に使用されたものと同じものなのかパワーアップされたものなのか、気になっていた。Fan Hui戦に使用されたのは、1202 CPU & 176 GPUだ。

この点についてデミスは、3月11日のツイッターで、Fau Hui戦のものとほぼ同じと言っている。同じことを最終局後の会見 (3月15日) でも述べている。

"In terms of the computer power, we used about the same amount of computer power as we used for the match against Fan Hui."

エコノミスト誌は3月12日の記事で、1920 CPU、280 GPUと書いている。しかしエコノミスト誌がこう書いてる根拠がわからない。ちなみに1920 CPUと280 GPUのAlphaGoマシンというのは、Nature論文で示された分散型AlphaGoの1つ。

ただし、デミスも上記ツイートや別ツイートで述べているように、多少のハードの違いはパフォーマンスにそれほど違いをもたらさない。それはNature論文のAlphaGoのバージョン比較表でも示されている。表は下記Wikipediaの「Hardware」の項に転載されている。

https://en.wikipedia.org/wiki/AlphaGo

(Nature論文は当初はDeepMind社のリンクから読めたが、さすがに今は読めなくなったみたい。)

1202 CPU機が3140 Elo、1920 CPU機が3168 Elo。CPUが6割増えてもレーティングはそれほど向上していないのがわかる。アルゴリズムや学習効果のほうがより重要らしい。


 

AlphaGoチームはロンドンに戻り、数週間かけて今回の対局の解析をするとともに、今後の方針などを検討する。順次また発表があるだろう。

素晴らしい対戦だった。