この度、調和系工学研究室のこれまでの俳句人工知能「AI一茶くん」に関する研究成果、ストーリーを本にまとめる機会をいただきました。

技術的詳細の説明だけではなく、人工知能に興味がある方にも俳句に興味がある方にも読んでいただけるような内容を心がけ執筆しました。

「人工知能が俳句を詠む AI一茶くんの挑戦」はオーム社より7月7日発売予定です。

ここでご紹介する内容は第1章から第8章までですが、この章の後に「おわりに」「付録 AI俳句百句選」なども掲載しています。

人工知能やAI一茶くんについてもっと詳しくお知りになりたい方は、Amazon( https://www.amazon.co.jp/dp/4274227332/ref=cm_sw_r_tw_dp_P76JPBNBF3MXFJFH9DX4 )からもご予約ができますので、ぜひご購入いただきお読みいただけましたら大変うれしく思います。

どうぞよろしくお願いいたします。(川村 秀憲、山下 倫央、横山 想一郎)

[第1章 人工知能が俳句を詠む日]

「人工知能に俳句を詠ませることは出来ますか?」

二〇一七年春、出張中の電車の中だったと思いますが、スマートホンのメッセンジャーを通して知人から問いかけがありました。問いを発した知人は研究者ではなく、意味深な問いというよりふと心に浮かんだちょっとした疑問だったのだと思います。ですがこの問いの中に、長年の人工知能に関する研究分野の中で議論されてきた、多くの未解決課題が凝縮されている気がしてハッとさせられました。

この瞬間から、私たちの果てしない人工知能と俳句の研究が始まりました。

人工知能と俳句の研究を始めるに当たり、考えなければいけないことはたくさんあります。今の人工知能の基礎技術であるディープラーニングでは、例えば人がつくったお手本となるデータを教師データとして、大量の教師データからその判断を学ぶことによって性能を向上させていきます。俳句を生成する人工知能を開発していくためには、お手本となる俳句そのもののデータはもちろんですが、何をテーマにして詠んだ俳句なのか、どのような心情が詠まれているのかなど様々な観点からの大量のデータが必要になります。特に、俳句の善し悪しを学ぶためには、俳句の評価に関する教師データが必要不可欠となります。しかし、古典や現代俳句を含めて俳句そのものはたくさんありますが、人が他の人の詠んだ俳句を読んだ時にどう思うのか、どう評価するのかという大量のデータはほとんどありません。

そこで、研究のはじめの一歩として、データ収集をたくさんの人に協力してもらうことを考えました。毎年十月に札幌で行われているNoMapsというおあつらえ向きのイベントがありました。NoMapsはテクノロジー、クリエイティブ、文化に関するイベントです。ここでデモを公開することによって俳句の「いいね」を集め、市民参加型で人工知能を育ててもらうプロジェクトとして考えたのです。こうして、俳句を生成する人工知能を「AI一茶くん(坊や)」と名付け、二〇一七年夏に研究を開始しました。

ちょうど私たちが一茶くんの開発を進めながら四苦八苦していた頃、NHK(日本放送協会)のディレクターから突然一本の電話がかかってきました。

「超絶 凄ワザ!という番組で人工知能と人類の俳句対決を行います。ついては人類最強チームを準備するので、それを倒せる人工知能を準備してもらえないでしょうか。撮影は三ヶ月後です。」

一茶くんが俳句対決?しかも人類最強チームと三ヶ月後に?私たちがこの突然の申し出にどれほど驚いたかは想像に難くないと思います。

三ヶ月で人類と対決するような俳句を生成する人工知能が開発できるのか。恥をさらす結果になってしまわないのか。非常に悩みましたが、せっかくの大舞台でのオファーです。どこまでできるかは全くわかりませんでしたが、「なんとかなるだろう」と楽観的にオファーをお受けすることにしました。

私たちが挑戦を受けると返答したあと、参考までにその時点での一茶くんで生成した俳句として「かおじまいつきとにげるねばなななな」をお送りしたところ、局内で随分と不安の声があがったそうです。今はもう笑い話ですが。

さて、このような経緯でNHK「超絶 凄ワザ!」での俳句対決が決まりました。対決方法は「写真で一句」の三番勝負。

こうしていよいよ勝負の数週間前になり、事前にお題となる写真が私たちの手元に届きました。お題の写真は、「紅葉」、「花火」、「蛙」の三点でした。これまでに開発した二つの機能を用いて、この三点の写真に合わせて勝負俳句を決めていかなければなりません。しかし、この時点で一茶くんには大きく欠けているものがありました。それは、最終的に勝負に勝てるような素晴らしい一句を選句するという機能です。

ただ、この時に選句の機能が実現できなかったのは決して時間が足りなかったからではありません。そもそも俳句を生成することに比べて、俳句の評価を行うこと、素晴らしい俳句を選句するということが人工知能にとってとても難しいことなのです。一茶くんはコンピュータープログラムなので、一日におよそ百万句を生成することができます。これだけ大量に生成すると、稀だとしても中には素晴らしい俳句も含まれることがあります。コンピューターならではの力技ですが、そのようにして素晴らしい俳句を生成することはできます。

一方で、その中から良い俳句を選ぶためには、人のように俳句を理解できなければなりません。写真と相性の良い俳句を選ぶということで、お題にあった写真を選別するところまではなんとかできましたが、最終的に一句に絞るほど高精度に俳句を評価することはできませんでした。

そこで、最後の勝負句を選ぶために人の手を借りることにしました。そもそも、最終段階で人の手を借りるということは始めから想定していたことでもあります。俳句を生成するということは三ヶ月でなんとかなると思っていましたが、良い俳句を選句するという課題を解決するためには何年もかかって研究する必要がある。それくらい難易度が高いということは、初めからわかっていたことです。

三ヶ月の突貫工事で取り組んできた人工知能による俳句プロジェクトの結果ですが、この時点ではなんとか人類最強チームと勝負ができる、それなりの俳句ができたのではないかと手ごたえを感じていました。この中から議論を重ね、最終的に「花火師や夜の刻刻の勢を見て」、「旅人の国も知らざる紅葉哉」、「又一つ風を尋ねてなく蛙」という三句を勝負の場に持って番組収録に臨むことにしました。

さて、気になる勝負の様子、そして勝負の結果ですが、そちらは後の章で詳しく述べたいと思います。

[第2章 人工知能の歴史と未来]

一九五六年夏、ダートマス大学のジョン・マッカーシー、ハーバード大学のマービン・ミンスキー、IBMのナサニエル・ロチェスター、ベル電話研究所のクロード・シャノンなど著名な研究者がアメリカ合衆国ニューハンプシャー州のダートマスに集まり、重要な会議が行われました。

この会議から、アメリカを中心として人工知能の研究が本格的に立ち上がっていきました。

初期の大きな期待とは裏腹に、より現実的な問題を解くためには当時のコンピューターの性能が不十分であったことや、知識処理の手続き、アルゴリズムに研究が偏っていたことなどから、思うような結果が出なかったのです。研究資金も次々に打ち切られ、多くの期待で始まった第一次人工知能ブームは終わりを迎えました。

少し時が経った一九八〇年代、エキスパートシステムと呼ばれる新しい手法を伴って再び人工知能に注目が集まり、第二次人工知能ブームが訪れました。エキスパートシステムとは、特定領域についての専門家の知識をコンピューターにあらかじめ入力しておき、それを元にコンピューターが人間からの質問に回答するようなシステムです。

しかし、専門家の知識を人工知能が理解できるような形で入力する過程で、人の手に多く頼っていたことから、利用できる範囲や維持のコストに問題があり、あまり実用的なものにはなりませんでした。また、人間であれば前提条件や状況から自然に見出せるような、いわゆる一般常識をどう表現し扱うのかといった問題に対しても適切な解決方法を見出せませんでした。そのため、エキスパートシステムに対する期待も急速にしぼみ、やがて第二次人工知能ブームも終焉を迎えます。

ブームの終焉後、人工知能研究は下火になり研究者の間でひっそりとつづけられました。一方、コンピューターの性能はムーアの法則に従って急激な向上を果たしていきます。加えて、一九九〇年代にはインターネットが普及し始め、データの流通量が爆発的に増大していきます。二〇〇七年のiPhone登場をきっかけとしたスマートホンの普及によりその増加に拍車がかかりました。これらを背景にビッグデータという言葉が生まれ、ビッグデータを用いた機械学習の技術革新が進んでいきます

そして今、まさに第三次人工知能ブームの真っ只中に私たちはいます。画像認識から始まったディープラーニングは、日本語や英語など人間同士のやり取りに使われる言葉をコンピューターで扱う自然言語処理、数値予測、ロボット制御などさまざまな分野で驚くべき成果を達成し始めています。過去二回のブームと決定的に違うのは、研究の発展もさることながら産業応用の対象が大幅に広がっていることです。

コンピューターの発展期にダートマス会議によって人工知能という研究分野が生まれ、今日では「人工知能」という言葉は当たり前に使われるようになりました。ここで一度、「人工知能とは何なのか」について考察してみたいと思います。残念ながら、この問いはこれは私たち人工知能の研究者にとっても歯切れよく答えられない問いです。

これは、知能をどのレベルで捉えるかによって議論が分かれてくる問題です。人が行うような高度な情報処理のレベルで知能を論じる場合もありますし、アリやハチなどが群となって行動する際の超個体的な行動のレベルで知能を論じる場合もあります(大内 et al., 2003)。近年では、粘菌が迷路を解くことができるといった報告もなされています(Nakagaki et al., 2000)。その中で、そもそも統一的な知能の定義やその有無の判定、レベル分けはとても難しいのです。

人と同じように状況を認識し、人と同じような思考過程を経てすべきことを判断することができる人工知能を「強い人工知能」とよびます(Searle, 1980)。人工知能の研究分野では、このような「強い人工知能」をどうやって実現するのかに、多くの研究者が取り組んでいます。

タスクを遂行しているという意味では一見表面上は人の知能が行うことと同等のことを実現しているように見えるものの、実際に行われていることは人の知能とは異なり、手続き化された計算処理に則って情報を処理しているだけです。このような知能を「弱い人工知能」と呼び、「強い人工知能」と区別しています。

ロボット研究者であるハンス・モラベックが、一九八八年の著書『電脳生物たち』(モラベック & 野崎, 1991)の中で、「知能テストやチェッカーでコンピューターに大人並みの能力を発揮させることは比較的簡単だが、知覚や運動性となると、一歳児の能力を与えることさえ困難か、もしくは不可能である」ということを述べています。これは、どういうことでしょうか。

人間の大人にとっても難しいことを上手に行えるのに、子供がいとも簡単に行えることが出来ない、このような状況をモラベックのパラドックスと言います。このパラドックスが指摘しているのは、人間から見て難しいタスクだからと言って必ずしもコンピューターにとっても難しいというわけではないということです。

みなさんは、スタンリー・キューブリック監督、 アーサー・C・クラーク原作の有名な映画『2001年宇宙の旅』をご覧になったことはあるでしょうか。

一九六〇年代にこの映画が製作されたとき、人工知能の研究者として著名なマービン・ミンスキーが映画セットの顧問として参加していたことを筆頭に、徹底的な科学的検証が行われました(マイケル et al., 2018)。二〇〇一年にはこのような「強い人工知能」が実現しているだろうという楽観的な予測に基づいて時代設定が行われました。

一方で、「強い人工知能」、「汎用人工知能」の実現に関しては否定的な意見の研究者もいます。ですが、なぜ実現できないのかという議論においてはあまり明確な根拠が示されているとは言い難く、むしろ今のところ実現できない理由が見当たらないということで楽観的に実現できると考えている人工知能研究者も多くいます。

では、仮に「強い人工知能」、「汎用人工知能」が実現すると何が起こるでしょうか。

もし人間によってひとたび「強い人工知能」や「汎用人工知能」が開発されれば、人工知能は自分自身の設計を自ら改良し、能力を高めることができるので、人間を置いてきぼりにして永遠に自らの能力を高め続けることができるということです。このような未来が訪れたとき、これは私たち人類にとって明るい未来となるのでしょうか。それとも、数多くのSFに描かれるような、人工知能に人類が支配されるディストピアな世界となってしまうのでしょうか。

[第3章 人工知能を実現する技術]

人工知能を実現しようと考えたとき、自然界の中で知的処理を実現しているもの、つまり人間を含めた生物の脳の働きを観察し、それを真似た仕組みをつくるという方法が考えられます(McCulloch & Pitts, 1943)(Rosenblatt, 1957)。ニューラルネットワークはこうした発想のもと、脳の神経細胞の中で起きている現象を単純化してコンピューター上で再現しようとして考案された概念です。

俳句を鑑賞するときに、脳はどのようにして十七音という非常に短い言葉のなかから、詠み手が伝えようとしていた情景についての想像を広げていくのでしょう。そのときに俳句の中のそれぞれの言葉や、俳句が詠まれたときの作者の境遇といった背景知識は、どのような働きをもっているのでしょう。また、俳句を詠もうとしたときに、脳の中ではどのようにして情景を伝えるための言葉選ばれているのでしょう。

正しい答えを集めた教師データをもとにニューラルネットワークの結合重みを修正する過程は「学習」と呼ばれ、計算方法としてはバックプロパゲーション(誤差逆伝播法)と呼ばれる方法がよく使われます。こうして学習されたニューラルネットワークに、教師データと同じ性質を持っているが正解の分からないデータを入力すると、その汎化能力によって正しい答えを出力することが期待されます。

俳句のような文字情報も、数値化の方法を工夫して同じように扱うことができます。「古池や蛙飛びこむ水の音」というような文章があったとき、「古池」「や」「蛙」「飛びこむ」…というように意味のまとまった部分に区切り、それぞれの言葉に番号を一つずつ割りつけます。

「機械学習」とは、コンピューターに明示的な指示を与えるのではなく、コンピューターがこれまでの経験から学ぶことで予測や分類などを解けるようにするという考え方です。

俳句の分類に機械学習を使うことを考えてみたときはどうでしょうか。著名な俳人の詠んだ有名な俳句の例と、俳句の初心者が詠んだ、俳句の経験者から見ると直した方が良い点がある俳句の例をそれぞれたくさん集めます。もしその二つの間に違いがあるとすれば、見分け方をコンピューターに学習させるという方法が考えられます。このような技術が実際に一茶くんの中でも使われています。

機械学習を用いて、俳句のような日本語の文章を生成することも実現できます。初めに、俳句の先頭にはどのような単語が現れるのかを機械学習で予測します。人間が詠んだ俳句の例はたくさん集めることができるので、その先頭に現れる単語を教師データとします。

機械学習で学習する内容は教師データに依存するため、どのようなデータを学習させるのかを注意深く判断しなくてはなりません。機械学習の結果を使って正しく判断するためには、訓練に使った教師データと同じ性質のデータが入力されなければならないのです。

俳句に関しても同様のことがいえます。例えば、明治時代の俳句のデータを訓練に使って著名な作品と初心者の作品を見分けるような機械学習を行うことを考えます。仮に学習の結果としてコンピューターが両者を正確に区別できるようになったとしても、これを使って現代の俳句で同様の区別をすることはおそらくできないでしょう。現代の俳句には、明治時代の俳句には使われていなかった言葉が使われているので、訓練に使ったデータとは大きく異なる性質のデータを予測することになってしまうからです。

ここまでは、何らかのデータが与えられたときに、下すべき判断の正答がすぐにわかるような例をみてきましたが、こうした正答を与えることができる問題ばかりではありません。

このような状況に対応した学習の方法に、機械学習の一種である強化学習があります(Sutton & Barto, 2018)。

強化学習を行う際は、このような知識の活用と探索の二つのバランスを取りながら良い操作方法を学習していくことになります。

強化学習の考え方は、俳句の生成にも無関係ではありません。現在の一茶くんでは、俳句の先頭に現れる単語、先頭の単語が決まったときにその次に現れる単語というように学習を行っています。

俳句全体としてどのような意味を持つのかを踏まえた仕組みにはなっていません。こうした問題を乗り越えるためには、俳句を一句生成し終えた後で、俳句全体を踏まえた何らかの評価をコンピューターで下し、そこで高い評価を得られるような俳句を生成できるように更なる学習を行うという方法が考えられます。

ディープラーニングとは、多くの層からなるニューラルネットワークによって機械学習を行う方法です。

ニューラルネットワークはもともと生物の脳の神経細胞に着想を得たものですが、ディープラーニングはコンピューターが機械学習でさまざまな問題を解決するための方法であり、生物と同じようなやり方を取っているかどうかは重要視されません。

ディープラーニングの可能性が研究者の間で幅広く注目されるようになったきっかけは、ImageNet Large Scale Visual Recognition Challenge (ILSVRC)という画像認識コンテスト(Russakovsky et al., 2015)にディープラーニングを用いたAlexNet(Krizhevsky et al., 2012)が挑戦し、それまでの画像認識の方法を大幅に上回る性能を示したことです。

ディープラーニングを用いたAlexNetが大差をつけて優勝したことは、研究者に大きなインパクトを与えました。

ディープラーニングの躍進は、この時期に揃いつつあった二つの前提条件が満たされたために起こったといわれています(Goodfellow et al., 2016)。一つ目の条件は、ディープラーニングがうまく働くためには機械学習に使える大量のデータが必要だということです。

大量のデータが集められるようになった背景には、コンピューターやインターネットが社会に浸透し、コンピューターが扱える形でさまざまなデータが電子化され、インターネットを通じて集約されるようになったことが挙げられます。

二つ目の条件は、ディープラーニングに使われるニューラルネットワークには非常に多くのニューロンがあり、その計算を実用的な時間で行うには高速なコンピューターが必要になるという点です。

ビデオゲームに使われるGPUは大量生産されているため安価に入手することができ、ディープラーニングが広く活用されるために大きな役割を果たしました。

日本語や英語などの自然言語をコンピューターにより処理する自然言語処理能力は、ディープラーニングによって大きく向上したといわれています。

特に実用性の高い例として機械翻訳が挙げられます。

ディープラーニングを使うと、画像と文章の二つの領域に跨るような課題を学習することも出来ます。

上手く使うことによって、写真からその情景を上手く伝えるような人工知能を作ることも、将来的にはできるのではないかと考えられます。

この他にもディープラーニングと強化学習を組み合わせたDQN(Deep Q-Networks)と呼ばれる方法を使うことで、人工知能がビデオゲームを繰り返しプレイするなかで、ゲームをクリアできるような操作方法を学習するという研究(Mnih et al., 2013)が行われています。

強化学習により、スコアが得られたりゲームをクリアしたりした場合に報酬を与え、ゲームオーバーのときに罰則を与えることで、どのような操作がゲームのクリアにつながるのかを学習することができるのです。

これは人間が明示的な正答例を与えなくても、人工知能が自ら試行錯誤を重ねてよい行動を学習していくといった可能性を表していると言えます。

コンピューターが人間に交じって句会に参加するという最終的な目標を達成するためには、強化学習が挑戦しているような難しい問題を解く必要が出てくるのではないかと考えられます。

[第4章 人工知能と創作]

本書のテーマは人工知能による俳句の創作ですが、機械やコンピューター、人工知能に創作をさせようというアイデアは実は古くからあることはご存じでしょうか。

創作活動は、人が生きていくために直接的に必要なことではありません。知的好奇心や創作意欲は人間が持っている特殊な能力であり、芸術もまた人間だけが行う不思議な行動であると言えます。人はなぜ芸術を創作するのでしょうか。また、それを人工知能に行わせようという試みにどのような意味があるのでしょうか。

人工知能で俳句を生成するという私たちの取り組みは、テレビや新聞など多くのメディアで取り上げていただきました。この試みは人工知能研究者の注目を集めるだけでなく、俳句の専門誌などでも紹介され、さまざまな議論を巻き起こしています。知能とは何か、人とは何かを考えるときの、大事な糸口を含んでいるのではないかと考えます。

アメリカの数学者ノーバート・ウィナーが提唱したサイバネティクスという学問領域(ノーバート et al., 2011)があります。生物と機械との間に情報のやり取り、コントロールの仕組みに関する類似性があることに着目し、生物の神経系機能のみならず機械の自動制御までを扱います。通信工学と制御工学の融合を目指し、心や脳の機能をダイナミックなシステムとして捉えた新しい学問領域であり、サイバネティックスの登場はその後の人工知能研究の発展に大きな影響を与えました。

実はこのサイバネティック・セレンディピティの事例の中の一つに、コンピューターによってHaiku(俳句)を生成するアルゴリズムが紹介されています。一九六八年のイギリスでの展覧会ですでに、日本の俳句とコンピューターアルゴリズムが出会っていたというのはまさに驚きです。

このように、コンピューターを用いた芸術作品生成の取り組みは古くから行われています。仕組みを知らされないまま出来上がった作品だけを鑑賞した場合、人を感心させる素晴らしい作品も中には存在するでしょう。しかし、素晴らしいと感じるような作品を人工知能で実現する仕組みは案外単純であり、人が決めたいくつかのルールや手順、アルゴリズムに従って情報を処理、加工してそれらしいものを出力しているだけとも言えるのです。

本書のテーマは人工知能によって俳句を生成することですが、その人工知能がライフゲームのような単純なルールの上に実現されていたとすると、そこから生まれる作品は人が行う「創作」と同じと言えるでしょうか。それは高度に知的な作業だと言えるでしょうか。これは難しい問いだと思います。では、作品を生み出すアルゴリズムが人に理解できないほど複雑な仕組みだったならばそれを創作とみなしてよいのかどうかというと、こちらも違うような気がします。人工知能による創作とは何であるかという問いは、人が行う創作というものが何であるのかという問いと本質的に同じであると言えるかもしれません。

そもそも創作における作品の価値は、その作品を作り出すプロセスによって変わるものなのか、それとも、作品を作り出すプロセスから切り離されて独立に決まるのか、という疑問が生じます。言い換えると、創作や芸術は人が作るから価値があるのか、それとも人工知能でつくった作品でも同じ価値を認めることができるのかという疑問です。もし、人工知能で生成した芸術作品に人の作品と同じ価値を認められるのならば、作品を作るプロセスである人工知能そのものにも大きな価値を認めるべきではないでしょうか。この先、人工知能の発展に従って多くの場面でこれと類似の問いかけがなされていくのだと思います。

人工知能で文章を生成するという取り組みも、自然言語処理という研究分野で古くから行われています。

では今の人工知能にとって、文脈を理解したさらに高度な文章を生成させることは可能なのでしょうか。

GPT-3に代表されるような、人工知能で何をどんなことまでできるのかといった研究は日々進んでいます。さらに高いレベルで言葉を操るためには単に言葉の語彙を増やすだけではなく、文章生成の目的であるコミュニケーションの前提となる間の価値観や感情、個性、状況などを理解する必要があるはずです。果たしてそれが膨大な文章からなる教師データのみからディープラーニングによって学ぶことができるのか、それとも教師データとなる文章を超えて人の体験や経験を入力とする何らかの方法が必要とされるのか、まだまだわからないことだらけです。

より本格的に人工知能による作品生成を推し進めるプロジェクトに、人工知能研究者である東京大学の松原仁教授が中心となって進めている「きまぐれ人工知能プロジェクト 作家ですのよ」というものがあります(佐藤, 2016)。

このプロジェクトでは、星新一の作品を分析の対象や教師データとして利用し、星新一風のショートショートを人工知能で生成することを試みています。

数多く作られた候補の中から最もそれらしい文章を選定する際に人の力を借りているので、人工知能のみで素晴らしい文章がすぐに生成されるわけではないそうです。きちんと意味が通っていて、それなりの文章であるかどうかを判断することは、現在の人工知能では実現が容易ではありません。なぜなら、意味が通る文章かどうかを判断するには、人と同じように文章の意味や文脈をきちんと理解できなければならないからです。少なくとも今の人工知能の技術では、文章の良し悪しを選定するときには人の力を借りなければなりません。

現在の人工知能がそれ単体で作品を創作することが出来ないとしても、決して人工知能に価値がないわけではありません。むしろどんなに人工知能が進化したとしても、人のための創作活動である以上、人との接点、共同作業は欠かせないように思います。人工知能が自ら作品をつくり、自ら作品を評価して自己完結するようなことには意味はないのです。人にとって価値があるものを作り出すことを創作だとすると、人工知能がどこまで高度化したとしても、人との関わりは必要不可欠なものに思えます。

人工知能で生成した作品に著作権を主張することはできるのでしょうか。

人工知能に思想や感情をもたせることができるかどうかという議論はありますが、現在の人工知能はただのコンピュータープログラムです。一般的には人のような思想や感情を持っているとは解釈されないので、人工知能が生成した作品は著作物ではない、という取り扱いになります。

実は私たちの一茶くんプロジェクトでもすでに1億句以上の新しい俳句をコンピューターで生成し、インターネット上で作品を公開しています。

作品の出来は玉石混合ですが、これだけあると中には良い出来のものも含まれています。コンピューターが生成したものなので「思想又は感情を創作的に表現したもの」とはいえず、著作物とは認められませんが、俳句の研究における何かの役に立てばという気持ちで公開しています。

「第5章 俳句の人工知能的解釈」

俳句は、原則として上五、中七、下五の十七音からなる有季定型の詩であり、世界最短の定型詩と言われています。

季節を表す季語を一つ、感動・詠嘆を表す「や」、「な」、「けり」などの切れ字を一つ含むものが典型的です。俳句は日本で生まれた世界一短い定型句であり、江戸時代から現代までたくさんの作品がつくられています。

俳句における季語の重要性について、人工知能研究の視点から考察してみたいと思います。通常コミュニケーションとは、何か伝えたいことを何らかの手段によって他人に伝えることをさします。言葉を介したコミュニケーションでは、伝えたいことを言葉に変換して他人に伝えます。明確に区別できる有限な言葉の組み合わせで表現するという意味では、俳句はデジタルな情報であるとも言えると思います。デジタルな情報というと、漠然とコンピューターが扱う情報と理解している人が多いと思いますが、デジタルとは飛び飛びの値しかない整数のような数値によって表現される情報のことを意味します。したがって、文字で表現された内容もデジタルな情報であると言えるのです。

つまり、俳句を通したコミュニケーションが成立するためには、世界や自分に関するアナログな情報をデジタル情報に変換するエンコーダと、デジタル情報から世界や他者に関するアナログな情報を復元するデコーダを持つ必要があることになります。

また、俳句では制約された十七音という言葉しか使えないことを考えると、正確さを保ちながらもできるだけ多くの情報を伝えることがとても重要になってきます。

つまり、俳句の作り手、読み手双方が多様な言葉の意味を知っていることはもちろんのこと、双方が互いに言葉の意味を知っていることを知っていることが重要です。

俳句において、歳時記で意味が解説されている季語を用いることを条件とすることにより、お互いが季語の本意本情を理解しているという共有知識が成り立ちます。

このような理由から、わずか十七音で豊かな世界を表現する俳句には季語が必要なのではないでしょうか。

俳句は芸術であり、コミュニケーションの手段でもあります。

見たこと、感じたことを創意工夫して短い言葉で表現し、人に伝えることにその醍醐味があると言えます。

そのための母体として、俳句の世界では「俳句結社」というものがあります。

結社では、結社誌の発刊の他に句会を主催することもあります。

句会を通して単に作品をつくるだけではなく、集まって互いに作品を批評しあい、学び合いながら成長していくことに俳句の面白さや楽しみがあるといえます。

俳句結社の活動や句会の様子を考えてみると、この中で人工知能が人に交じって対等にやり取りすることを目指すこの研究の最終ゴールのハードルがとても高いことがわかると思います。いきなりすべてに取り組むことは難しいですが、一つ一つ人工知能の技術を向上させ、出句、選句、披講、講評などの課題に段階的に取り組んでいくことによって、いつしかそのようなゴールに近づけるのではないかと考えています。

いろいろと俳人の方にお話を伺っていく中で、俳句には「一物仕立ての俳句」と「取り合わせの俳句」という区別があることを知りました。一物仕立てとは内容を一つの物事、季語に集中させ、その状態や動作を詠んだ句です。

一方、取り合わせの俳句とは、ひとつの句の中で二つの物事を取り合わせることで相乗効果を発揮させ読者を感動に導く俳句です。

一茶くんで生成した俳句を多くの俳人の方に見てもらった際、「一茶くんは取り合わせの俳句が得意ですね」というコメントを多くいただきました。一茶くんの仕組み上、現在の人工知能技術では俳句の文脈や内容を人のように解釈することはまだできません。

サイコロのいたずらによって面白い組み合わせが生まれたときに高評価をいただく俳句となることが多いようです。

「第6章 俳句を生成する人工知能、AI一茶くんの仕組み」

一茶くんで俳句を生成する過程は、大きく二つに分けることができます。まず、俳句を構成する単語を一つ一つ選んで順に繋げ、俳句になりそうな単語の並びを生成します。次に、このように生成された単語の並びに対して、有季定型句の条件を満たしているか、意味を成しているかを推定し、こうした条件を満たすものだけを選別します。こうしたことを行うために、一茶くんは言語モデルと呼ばれる人工知能技術を用いています。

言語モデルの学習には、英語や日本語の文章全般といった大まかな括りで集めたデータを用いることが一般的です。形式の整った文章のデータを大量に集めることに重点が置かれ、インターネットに掲載されているニュースやWikipediaの記事の文章などが用いられます。しかし、こうしたところで使われる日本語文と俳句の間には大きな隔たりがあるように思われます。

このため、一茶くんに用いる言語モデルでは、一般的な言語モデルとは異なり日本語の文学作品を教師データとしています。俳句だけでは単語の関係性を十分に教えるだけのデータを揃えることができないため、小説や評論などの文学作品といった、情景描写が重視され俳句と共通点があると思われるデータをまず学習させます。次に、音数の制約や季語といった俳句に固有の特徴を学ばせるため、人間の詠んだ俳句のデータを追加で学習させ微調整を行います。

俳句の中に現れる単語の繋がりを上手く言語モデルに学習させると、俳句の特徴に合わせた単語の並びを生成することができます。こうした文章生成モデルは、GPT(Generative Pre-trained Transformer)やLSTM(Long short-term memory)を用いるものなど、一般的な文章を生成するものがこれまでに多く提案されてきました。一茶くんで俳句を生成するときには、まず、俳句を生成するよう学習した文章生成モデルを用いて、俳句らしい単語の並びをつくりだします。

一茶くんで俳句を扱うときには、俳句に現れうる全ての単語の一覧をあらかじめ用意して、一つひとつの単語に個別の番号を割り当てていきます。これは、俳句を構成する最小の要素を単語とみなし、単語を順番に並べた列で俳句を表現しているともいえます。

一茶くんで俳句を生成する仕組みは、人間が俳句を詠む過程とは大きく異なっています。人間が俳句を詠むときには、何か伝えたい情景などがあり、その情景を限られた言葉の中でうまく伝えられるように選んでいくことが多いのではないでしょうか。一茶くんの言語生成モデルはサイコロを振って単語を選んでいくことを繰り返しており、俳句の中に現れる単語の繋がりを模倣することで、それらしい単語の並びが生成されているに過ぎません。一茶くんで俳句を生成する仕組みのなかには伝えたい情景にあたる情報は存在せず、俳句の題材はサイコロを振ったときにどのような単語が選ばれるのかによって決まるのです。

また一茶くんの文章生成モデルには、文学作品や俳句といった文章の他には一切データが与えられていません。例えば、皆さんが「桜」という言葉を見たとき、ピンク色の桜の花びらや満開に咲いた桜、花が散っていく光景が想起されるかもしれません。ですが一茶くんは、こうした光景を映した画像を学習していません。

これを人間に例えると、自分では桜を全く見たことがない人が他の人から聞いた桜にまつわる話や、桜についてこれまでに詠まれた俳句の字面だけを頼りにして、桜についての俳句を詠もうとしているようなものだと言えます。

一茶くんの文章生成モデルで作る文章は、季語の含まれていないものや、十七音になっていないようなものが多く含まれます。

こうした不完全俳句をできる限りなくし、質の高い俳句だけを最終的に作り出すために、一茶くんでは生成された俳句を評価して条件に合わないものを取り除く処理を行っています。

さらに私たちは、一茶くんで生成された俳句が意味の通るものになっているかどうかを推定することにも挑戦しています。

現在の一茶くんはこのような人工知能技術を応用して俳句を生成し、また生成した俳句を評価して出力することが出来ます。まだまだ人と同じように良い俳句を選ぶということには程遠く、研究しなければならない課題はたくさんありますが、少しずつよい俳句を自動的に選句するための工夫を重ねているところです。

俳人と一茶くんとの対決では、画像やキーワードなどの形でお題が与えられ、そのお題に合わせた俳句を生成してその出来を競うことが多くありました。そのためには、これまで述べてきたような、教師データとして与えた俳句全般の特徴を捉えた俳句を生成するやり方だけでは不十分です。そこでたくさんの俳句をあらかじめ生成しておき、その中からお題に合うものを一茶くんで選ぶ方法をとってきました。

画像からそこに映るものを推定して俳句を選び出す方法としては、これまで二通りの方法を用いてきました。一つは、画像と俳句の相性がどれだけ良いかをディープラーニングで学習して、その結果を使う方法になります。画像と一緒に俳句を人工知能に与えて学習することで、画像と俳句がマッチしている度合いをゼロ%から百%の間で推定させます。

もう一つは、画像認識の技術を応用し、画像から得られた名詞をキーとして俳句を検索する方法です。画像認識は俳句以外でもさまざまな場面でも使われるので、こうした問題を学習するための教師データは既に揃っています。

お題に丁度当てはまる俳句を一茶くんによって一句だけ選ぶということはまだまだ難しい課題です。現在はお題に関係がありそうだと一茶くんで判定したものから、上位数百句ほどを俳句の知識を持った人間が見て、ようやく納得できるものが見つかる程度の精度です。人が自然に行っているように、俳句に描かれている情景を一茶くんに認識させるのはこれからの課題です。

「第7章 AI一茶くんの活動」

俳句による人工知能研究の良いところは、人工知能の専門外の方々に積極的に作品を見てもらい議論を深められることや、お互いにアイデアが触発されるところです。

この章を読んでいただくと、対決のたびに新たな機能が追加されて、より良い俳句を生成、選択する機能が充実していった一茶くんの成長の様子がわかると思います。

「超絶 凄ワザ!」(二〇一八年一月)

第1章で紹介した対決までの経緯を経て、二〇一八年一月、いよいよ一茶くんの対決デビュー戦です。まず対決のルールですが、お題は四季折々の写真になりました。俳句は事前に提出し、作者を伏せて審査委員の先生方に審査してもらうという三本勝負になります。

今回の対決では、お題の画像にマッチすると判断されたリストの約三万句から、最終的に人が勝負の俳句を選び出しました。この対決は人工知能技術で生成された俳句を俳人の詠んだ俳句と比較した場合に、どの程度の質の高さを示すことができるのかを検証する貴重な好機と私たちは捉えました。

しりとり対決(二〇一八年七月)

この対決では、人類チームと一茶くんチームが先手・後手に分かれ、交互に相手の俳句の後ろの二音をいただいて制限時間内にその二音から始まる俳句をつくっていき、審査員が採点した合計得点で勝負を決めるという即吟のしりとりを行いました。

俳句生成に関しては、より現代の感覚に近い俳句を生成するために、学習データを現代俳句四万句に切り替えました。

次に、選者の選句を支援するために俳句評価器を開発し、提示する候補の俳句を特徴ごとに分類・順位付けをして、その結果を選者に提示するという方法を採用しました。

俳句一つひとつの点数を比べると、実は一茶くんチームがつくった「かなしみの片手ひらいて渡り鳥」という十番目の俳句が全体を通しての最高得点である八.五点を得ました。こちらは、審査員に「芸術的・技術的に評価できる、魅力がある」という評価をいただいたことになり、人がつくる俳句と遜色ない俳句を人工知能によって生成できるようになったということを表しています。

兼題対決(二〇一九年三月)

今回の対決では作者を伏せて会場の聴衆に二句を提示し、良いと思う句に挙手してもらって多数決で勝敗を決めるというルールが採用されました。

この対決は「超絶 凄ワザ!」から一年が経っており、この間には学習データの変更や評価機能の追加を行ってきました。今回は一年間の技術開発の結果の試金石として位置づけられる、重要な対決となります。

今回の対戦を通じて、人工知能の研究者ではない俳人の方々も同じ問題意識を持っていることや、人工知能による俳句の生成は、俳句に携わる方々も惹き付ける研究になることが確認でき、とても大きな収穫となりました。

恋の俳句選句大会(二〇一九年六月)

今回は趣旨を変え、一茶くんで生成した俳句から良い句が選択できるかという俳人同士の対決になります。

これまでの対決では、人間の句と一茶くんの句を比べてどちらが良いかという相対的な検証を行ってきました。今回は人間は選句のみを行い、一茶くんで生成した俳句が人間の鑑賞に耐え得る質を持っているのかという絶対的な検証をすることにもなります。

この大会では、一茶くんで生成した俳句を大会参加者に配布し、各々が選んだ俳句でその選句センスを競い合います。

一茶くんで生成した俳句の質に関しては、まだまだ改善の余地はありますが、俳句を嗜む方々が選ぶ際に大きなストレスを感じないレベルにあることも確認できました。人工知能の俳句に関する拒否感を持たれた方もいましたが、俳句に携わる多くの方々が私たちの取り組みに賛同してくれるということを知ることができたのは大きな収穫でした。

AI一茶くん初めての吟行(二〇一九年九月)

二〇一九年九月、石川県加賀市で開催された第二十九回芭蕉祭山中温泉全国俳句大会に参加しました。

一茶くん初の俳句大会への参加となります。

今回の対決では、人手を介さずに画像に適した俳句を選択することが課題となっていました。画像を入力とした自動選句を実現はしましたが、残念ながら私たちの投句した二句は高い評価を得ることができませんでした。

山中温泉全国俳句大会への参加を通じて、画像と俳句の適合度合いの出力する選句機能の精度向上、目的に合わせた学習データの追加・調整手法の導入、大会ルールに臨機応変に対応できる選句機能の導入、といったことが課題として挙がりました。

AI一茶くん初俳句集を出す

毎年三月上旬にアメリカ合衆国テキサス州のオースティンで開催されるSXSW(South by Southwest)というイベントでの日本館で、一茶くん俳句の展示を行いたいという依頼が札幌市経済観光局からありました。

大塚さんには一茶くんで生成した九千句の俳句を渡し、その中から十句を選句していただき、その句に対する選評を作成していただきました。完成した俳句集「AI俳句 AI HAIKU」には、筆書きの日本語の俳句とその選評、英訳された俳句と選評が記載されています。 「超絶 凄ワザ!」での対決やしりとり俳句対局を経て、俳句生成機能だけに絞れば人間に見劣りしない俳句を生成可能になった一茶くん。今回の俳句集の制作は、この時点での成果のまとめという位置付けとなります。

「第8章 人工知能と俳句の未来」

二〇一六年に、米Google傘下のイギリス企業であるDeepMindが開発した囲碁をプレイする人工知能「アルファ碁」(Silver et al., 2016)が韓国のプロ棋士であるイ・セドルと対決し、五戦で四勝をあげたことはまだ記憶に新しいと思います。人工知能の研究において、チェスや将棋、囲碁などのボードゲームは長らく知能を実現するための技術レベルを測る物差しとして使われてきました。

ボードゲームをプレイする人工知能を作る際には、ある場面が自分にとって有利か不利かを表す静的評価関数を用います。最終局面で自分が勝った場合を百点、負けてしまった場合をゼロ点とし、最終的にどちらの局面に繋がっている可能性が高いのかをゲームの途中で評価します。

人工知能の研究では、すべての場面を列挙して先手必勝か後手必勝かが確定したとき、そのゲームが「解けた」と言います。

人間であれ人工知能であれ、正解の手に近づくことができたものが勝者となります。この勝負の世界には人の存在価値といったものは関係ありません。これまでの人工知能の研究ではそのような明確なルールや正解が存在する中で、いかに正しい判断をさせるかに焦点をあててきました。

一方、人工知能研究の対象に俳句を取り上げることは囲碁と比較してどのような違い、意義があるでしょうか。俳句で使われる文字を漢字とひらがなのたかだか一万種類程度と見積もったとすると、これが二十文字分続くと仮定しても、俳句としてあり得る日本語文は十の八十乗程度にすぎません。場合の数は囲碁と比べて大幅に少ないものとなっています。

そもそも俳句というものには絶対的な正解を定義することはできませんし、人間の存在を無視して人工知能に俳句をつくらせたり、評価させたりすること自体がナンセンスなのです。

このようなことを考えると、俳句を対象として人工知能を研究することは、人の価値観や人生観、コミュニケーションを研究することであると言うことができます。

この研究を通して人の知能とは何か、人工知能をどう実現するのか、そしてそれは本質的に人の知能とはどのように違うのかといったことを明らかにしたいと思っています。

一茶くんによって生成された俳句はどのぐらいのレベルなのでしょうか。

俳人の大塚凱さんに一茶くんで生成された俳句の中から優れたものを選句してもらい、批評してもらいました。

この批評のなかで大塚さんはとても興味深い表現をしています。いくつかの俳句の状況を説明する中で、「作中主体」という言葉を使っています。

人がつくった俳句だとしても実体験に基づかない想像上での創作もあり得るはずです。果たしてそのような作品であれば、人が詠んだ俳句でも「作中主体」という言葉を使うことが適切なのか、やはり「作者」という言葉で説明するのが適切であるのかは興味があるところです。

一茶くんで俳句を生成することと比べて、なぜ俳句を評価させることは難しいのでしょうか。

俳句を評価するということは、俳句の言葉の意味、文脈をきちんと理解することが求められます。

膨大な教師データの俳句を学習させるだけのやり方では、本質的に言葉の意味理解を実現することは難しいのです。

人工知能の知識表現において、そこで使われる言葉や記号の意味を現実世界の実体がもつ意味に結び付けられるかどうかという問題を記号接地問題と言います。

今の人工知能の技術に記号接地問題を解決する術はないのでしょうか。私たちはディープラーニングのいくつかの研究事例が、俳句研究における記号接地問題を突破するヒントになるのではないかと思っています。

ディープラーニングがマルチモーダル学習に拡張されることによって、一茶くんも将来的に記号接地問題を乗り越えていける可能性があるのです。

人工知能という言葉は一九五六年にダートマス会議で初めて提案されたということは第2章で紹介しましたが、人工知能の概念を最初に提案したのはイギリスの数学者、アラン・チューリングと言われています。チューリングは人の知能とは何かを深く考察し、現在のコンピュータープログラムの原型となる理論を最初につくりました。

相互作用が知能の本質であり、人間との相互作用の中でコンピューターが人間と同等の振る舞いができれば知能を持っているといって言ってよいのではないかとチューリングは考えました。

これを私たちの俳句研究に置き換えてみると、オンライン開催の句会に一茶くんを参加させ、人工知能と見破られなければ一茶くんは知能を持っているというテストが考えられます。

人工知能による俳句生成の試み、そして俳人による生成された俳句への評価などを説明してきましたが、では、人工知能の技術で作られた一茶くんは人と同じように俳句を詠んでいると言えるのでしょうか。

一茶くんの仕組み上、人に伝えたいことが先にあって言葉を繋いで俳句を生成しているわけではありません。繋がりそうな単語を確率的に選択することで結果的に俳句になった、その中にたまたま素晴らしい俳句だと解釈できるものがあった、というのが正直なところです。

この研究の目指すところは俳句を生成するだけではなく、人工知能に俳句の批評も行わせ、人に交じって句会に参加することです。

今の一茶くんに不足している課題設定を解決していくための手段として、私たちはAI俳句協会を設立しました。AI俳句協会は、インターネットのウェブサイトで展開される人と人工知能との交流の場です。

俳句を通した人と人工知能の相互作用によって、「強い人工知能」の実現の糸口を掴むだけでなく、人の知能そのものへの理解も深めることができると私たちは信じています。AI俳句協会は、そのためのプラットフォームと言えるのです。(終)