[北海道大学調和系工学研究室メールマガジン] harmolab079

2022年9月2日配信

こんにちは。
北海道大学調和系工学研究室（川村秀憲教授、山下倫央准教授、横山想一郎助教）です。

9月になりましたが、皆様いかがお過ごしでしょうか。
残暑が厳しいところもあるようですが、札幌は少し涼しくなってきました。
それでは、本日もどうぞよろしくお願いいたします。

***************************************
◇　本日のTopics　◇
【１】調和系工学研究室WHAT’S NEW
【２】「作ろう, それから, 句を選ぼう　2022年のAI俳句のこれまでとこれから」
【３】ディープラーニング勉強会　
【４】調和系工学研究室関連企業NEWS
【５】人工知能・ディープラーニングNEWS
【６】AI川柳
***************************************

【１】調和系工学研究室WHAT’S NEW

★ 観光情報学会の学会誌「観光と情報」に山下准教授の解説記事が掲載されました

観光情報学会の学会誌「観光と情報」第18巻の特集記事「コロナ後の観光情報学（２）」にて、山下准教授の解説記事が掲載されました。
「作ろう, それから, 句を選ぼう　2022年のAI俳句のこれまでとこれから」と題し、俳句の自動生成について解説しています。
メルマガでは解説記事の全文を2回に分けて紹介させていただきます。

[観光情報学会]

★ 研究室OBである東京高専の山下晃弘准教授がご訪問くださいました

研究室OBである東京工業高等専門学校の山下晃弘准教授がご訪問くださり、本年4月に完成した調和系工学研究室歴代博士学位取得者のネームプレートをご覧いただきました。
現在、本研究室では東京工業高等専門学校から1名の学生をインターンシップで受け入れております。

★ 「調和技研×AIの旗手」に横山助教の対談が掲載されました

北海道大学発AIベンチャーである株式会社調和技研では「調和技研×AIの旗手」と題し、大学教授をはじめとする、AI研究の第一線で活躍する方々と調和技研社員が対談する企画を行っています。
第3回は本研究室の横山助教と研究開発部の小潟（但野）友美氏の対談です。

対談記事は下記にてご覧いただけます。
https://www.chowagiken.co.jp/news/20220831-2/

[株式会社調和技研]

【２】「作ろう, それから, 句を選ぼう　2022年のAI俳句のこれまでとこれから」

観光情報学会の学会誌「観光と情報」第18巻の特集記事「コロナ後の観光情報学（２）」にて掲載されました、山下准教授の解説記事をメルマガでも2回に分けて紹介させていただきます。

「作ろう, それから, 句を選ぼう　2022年のAI俳句のこれまでとこれから」

AI俳句の意義

AI俳句にはどういう意味があるだろうか. 我々は感性や独創性が求められる俳句づくりを通じて, 人工知能が状況を的確に表現できる文書作成の先進的技術の開発につなげられるのではないかと考え, 研究を進めている. まず, AI俳句に取り組む情報工学的な意義を述べる.

人間が俳句を詠むとき, 例えば, きれいな風景を見て感動したときには, 人間の頭の中にその情景とそれに付随する情動が現れる. この情景や情動をそのまま伝えることができず, 俳句として表現するためには17音に圧縮しなければならない. さらにその俳句を他の人が読んだとき, 作者と同じ心情や情景が再現されなければならない. この人間が俳句を生成して, 伝達するプロセスは, 効率的なデータの圧縮（エンコード）と還元（デコード）とみなすことができる. このプロセスを把握することができれば, 季語という共有知識を利用して, 人間の複雑な感情を短い文章で伝えることが可能になり, 文章作成支援や自動文章作成に大きく貢献することができる. 俳句生成の研究にはこのような情報工学的な価値もあるため, 我々はAI俳句研究に取り組んでいる.

さらに, 俳句を詠むということに関しては, 人工知能における重要な二つの問題を含んでおり, 計算機に俳句を詠ませることは容易ではない. ここで, 含まれる二つの問題とは, シンボルグラウンディング問題とフレーム問題である.

例えば,　図１（カエルが中央に写っている画像）に示される水面があり, カエルがいて, 稲の苗があるという画像を見て俳句を作ってくださいというと, 人間なら蛙が真ん中にいるから蛙を詠むかとか, 水面が映っているので水にまつわる言葉を入れつつ俳句を作ろうかと考える. 俳句を生成するためには, 画像から俳句に詠むべき事柄と,　そうではない事柄を区別して抽出して, 適切に言葉を繋げる必要がある. この俳句生成における難しさはフレーム問題とみなすことができる.

さらに, 画像に映っているカエルは小さいカエルなのでケロケロ泣くだろうなとか, 小さいカエルなら夏というより春, 春ならば少し暖かくなってきた頃だなといったことを人間は連想することができるが, カエルに関して「両生類は背骨がある動物で, 水の中でも陸上でもどちらでも生きられる動物, 幼生（オタマジャクシ）はエラ呼吸で変態後は肺呼吸になる」といった辞書的な知識しか持たない計算機に連想結果を出力させることは容易ではない. この俳句生成における難しさは記号接地問題とみなすことができる.

2. AI俳句の行く先

俳句づくりは, 五七五の文字列を作るだけではない. 俳句を作って評価し批評し, それを句会に参加している方々と共有するというスキルが必要になる. 句会では参加者が投句し, 採点して選評するということをしている. そのため, 最終的には人工知能で俳句ができるようになるというのは, こういったタスクを全てこなせるようになったときであろう.

我々は過去の俳句データから深層言語モデルを使って俳句を生成しているが, 過去のデータを学習しているため, 芸術の目指すべき最先端にたどり着けない. 現在の我々は, 千利休の「守破離」の「守」, 良いと評価される過去の俳句を学習してそこから似たようなものを作るという位置にある.

その先の実際に学んだことをベースにいろんなことを試す「破」, さらに既存の型にとらわれなくなる「離」を実践しないと, 人工知能が芸術としての俳句を嗜むというところまではたどり着かない. 人間だと, 最初は五七五の型どおりに俳句づくりをしていたが徐々に五七五では自分の表現したいことが表現できない, 季語による制限があったら表現できないとなり, 例えば種田山頭火の「分け入つても分け入つても青い山」のように破調の句を作り出すことになる. 計算機に「破」「離」をやらせるのはまだ先のことになりそうだが, 我々の目指しているところでもある.

現在, 人間が詠んだ俳句の言葉のつながりを学習し, 言葉をつないで1分間に400句のペースで俳句を作っている. その後, 季語の有無や音数など決まったルールに適合しないものを排除したうえで, 俳句の内容・質について評価し蓄積していっている. これまでに1億2000万句ほど俳句を生成しているが, 俳句の読み手に良いと評価される1句を選ぶことが現在の課題である. 深層言語モデルRoBERTaを用いて, 俳句群から日本語として不自然な句を除去することが可能になってきたが, 人間の感性に近い俳句がまだ選びきれていない. [1]

3. AI俳句の歩み

AI俳句は2017年に始まってから, 生成・選句のプロセスには幾多の修正が加えられ, 生成される俳句の質の向上が見られている. 本章では, その歩みを説明しつつ, 現在のAI俳句のレベル感を説明する. AI俳句のイベント参加や対決は, 2018年1月の俳句対決3番勝負NHK総合「凄ワザ！」に出演させていただいたことから始まっている. それらの経緯や結果は書籍「AI一茶くんの挑戦」[2]に詳しく記載されているため, 本稿では書籍出版後の2021年以降の取り組みを中心に説明する.

3.1. 芭蕉祭山中温泉全国俳句大会吟行句会

2019年9月には石川県加賀市で開催された第29回芭蕉祭山中温泉全国俳句大会に参加し, 句会で選を得られるレベルにあるのかを検証した. 現地で撮影した画像とその画像に合う俳句を投句した. 人間を完全に排した選句プロセスで投句することには不安も大きかったので, 若手俳人の若林哲哉さんに手伝ってもらい, １句は人工知能が選んだものを, もう1句は若林さんに選句してもらった. 人工知能が選んだ句は「二人出て水のつめたき春の川」, 若林さんが「天心に川を引くなり秋の風」. 残念ながら, 2句とも選者からは酷評で選は得られなかった.

2021年の第30回大会に再び参加した. 最新のモデルと過去の入賞データを分析した結果を使って俳句を作り, 最後は人間が選ぶという方式を採用した. また, これまで俳句の生成には, LSTM (Long Short Team Memory)という深層言語モデルを使って俳句を生成していたが[3], Transformerをベースとした言語モデルであるGPT-2を利用した[4]. また, 俳句で重要になるのは季語の選定である. 2015年からの5年間の入選句のデータを分析して, 出現頻度の高い季語29語を抽出した. その29の季語の入った句を100句ずつ集めて2900句を候補とし, 汎用自然言語処理モデルBERTなどを利用して順位付けをおこない, 最終的に人間の選句担当者が2句ずつ選出して計6句を投句した. 投句した結果は, 「戦争を語りつくしてトマト食む」「万緑を破りて風の中にいる」の2句が入選作となった. 初の俳句大会の入選で大きな成果が得られた.

3.2. 恋のAI俳句選句対決in松山

人工知能で俳句を作ることの問題点の１つとして, 良い句が選べないということが挙げられる. 我々が行ってきたAI俳句と俳人との対決では, 深層言語モデルで順序付けして上位数百句程度に絞ることはしていても最後に1句を選ぶのは人間だった. 公表されている俳句集には評価を受けた句しか掲載されてないため, 読者にとって「評価の良くない句」のデータが集まらないので, 教師あり学習の枠組みでは俳句の良し悪しを分類できないという問題があった.

そこで, 俳人が選んだ俳句と選ばなかった俳句のデータを集めるために, マルコボ. コム社と連携して, 2019年6月に「第1回恋のAI俳句選句対決in松山」を開催した. この選句対決の大会では, 大会出場者26名にそれぞれ異なるAI俳句300句を配布する. 配布した各句には, 「恋」に関するキーワード（恋, 初恋, 二人, 嘘, くちびる等の19語）が含まれている. 大会出場者には, 300句から並選30句, 〇特選5句, さらに最も恋の俳句として評価の高い俳句として☆特選1句を選んでもらう. その後, 出場者がそれぞれ選んだ☆特選26句から大会出場者と観覧者の投票で最優秀句を決定して, 最も得票数の多い句を選んだ人を選句王とする.

最優秀句に選ばれたのが「初恋の焚火の跡を通りけり」という句である. 大会後に多くの俳人の方々から高い評価を得ている. この大会の結果, 並選592句, 〇特選130句, ☆特選26句のデータが集められた.

2021年11月に「第2回恋のAI俳句選句対決in松山」を開いた. このときは新しい文章生成モデルと北海道大学の人工知能対応先進的計算機システムを使って生成した1億2千万句から, 逢瀬, くちびる, ぬくもりなど恋のキーワードを含む俳句を抽出して, 大会出場者22名にそれぞれ異なるAI俳句300句を配布する.

この大会の結果, 並選592句, 〇特選110句, ☆特選22句のデータが集められた. 第1回と同様の選句ルールに基づいて選句が行われ, 最終的に最優秀句に選ばれたのは「香水を深めて嘘をつきはじむ」であった. この大会の結果, 並選592句, 〇特選110句, ☆特選26句のデータが集められた.

芭蕉祭山中温泉全国俳句大会と同様に, 第1回の俳句の生成にはLSTMを利用して, 第2回にはGPT-2を利用した. その結果, 第1回, 第2回の両方に参加した大会出場者からは, 300句からの選句をおこなう際, 日本語として意味の通じない句やイメージが想起されない句がかなり減っているという感想を得ることができた. 配布した300句全体として質の向上が俳人の方々の主観的な評価ではあるものの確認された.

3.3.　好書好日でフルーツポンチ村上さんと対決

2021年10月には, お笑い芸人のフルーツポンチ村上健志さんと3句ずつの対決をおこなった[5, 6]. 村上さんは, ＴＢＳテレビのバラエティ番組「プレバト‼」の俳句部門で好成績を修めている実力者である. また, 2021年4月には『フルーツポンチ村上健志の俳句修行』という書籍を出版されている. この対決では, 若手俳人の大塚凱さんがお題を決定し, 村上さんはそのお題に沿って俳句を詠み, AI俳句側はお題に沿って, 若手俳人の生駒大祐さんが選句するという方式で行われた.

＜村上さんの俳句とAI俳句＞

1句目　お題『秋の雨』
　村上さん
　「秋の雨しばらく空っぽの花瓶」
　AI一茶くん
　「駅を出て秋雨の色にまぎれけり」

2句目　お題『消』
　村上さん
　「虫の音の数多に消えるひとつの音」
　AI一茶くん
　「渡り鳥橋の名前の消えてなし」

3句目　お題『のりもの』
　村上さん
　「秋蝶や外から見えるエレベーター」
　AI一茶くん
　「トンネルの中の電車や秋の暮」

これらの俳句の詠み手を伏せてTwitterで公開して, それぞれどちらの句が良いかを各句300～400人に投票してもらい勝敗を決めた. 1句目は約7割の得票数で村上さんが勝ち, 2句目はAI一茶くんが僅差で勝った. 3句目も約7割の得票数で村上さんが勝った. 総合的には, 1対2で敗れてしまったが, 俳人相手に1勝を挙げることができたのは大きな収穫であった.
（「4. AI俳句のこれから」に続く。）

[参考文献]
[1] 花野愛里咲, 横山想一郎, 山下倫央, 川村秀憲 : マスク化言語モデル RoBERTa を用いた俳句の評価, 情報処理学会第84回全国大会, 7ZM-05, ハイブリット (2022)
[2] 川村秀憲，山下倫央，横山想一郎，人工知能が俳句を詠む AI一茶くんの挑戦
発行元オーム社，ISBN 978-4-274-22733-2，発売日 2021年7月7日
[3] 米田航紀, 横山想一郎, 山下倫央, 川村秀憲，深層学習を用いた俳句の生成器および評価器の開発，電子情報通信学会技術研究報告 118(492(AI2018 53-59)(Web)) (2019)
[4] 平田航大, 横山想一郎, 山下倫央, 川村秀憲 : 深層学習による自己回帰モデルを用いた俳句生成器の評価, 情報処理学会第84回全国大会, 4W-05, ハイブリット (2022)
[5] 好書好日，［フルポン村上の俳句修行・番外編　人工知能「AI一茶くん」と三番勝負！，https://book.asahi.com/article/14435129 (2022年4月20日確認)
[6] 好書好日，フルポン村上の俳句修行・番外編　AIが作った俳句の価値は（座談会），
https://book.asahi.com/article/14458321 (2022年4月20日確認)

【３】ディープラーニング勉強会

調和系工学研究室ではディープラーニングの最新の知識共有を目指し、毎週ゼミを実施しています。
担当学生がトップカンファレンスから自分の興味のある論文について発表し、意見交換をしながら進めています。
本研究室HP（ http://harmo-lab.jp/?page_id=1194 ）には過去の発表に使用したスライドも公開していますので、ご興味のある方はぜひそちらもご覧ください。

[紹介論文]
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autonomous Driving from harmonylab
公開URL：https://arxiv.org/abs/2103.10690

論文紹介スライドURL： https://www.slideshare.net/harmonylab/efficient-deep-reinforcement-learning-with-imitative-expert-priors-for-autonomous-driving-252120937

出典：Zhiyu Huang, Jingda Wu, Chen Lv:Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autonomous Driving，IEEE Transactions on Neural Networks and Learning Systems(2022)

概要：深層強化学習(DRL)は人間のような自律走行を実現するための有望な方法であり広く研究されている。しかし、DRLの実際の応用にはサンプル効率の低さと報酬関数の設計の難しさが妨げとなっている。DRLに人間の事前情報を組み込むことで、これらの問題を解消する新しいフレームワークを提案する。2つの都市交通シナリオ(無防備左折、環状交差点)で実験し、既存の手法と比較して最も良い性能を示した。（修士1年　清水雅之）

【４】調和系工学研究室関連企業NEWS

★ J-Startup HOKKAIDO インターンシップマッチング（ゼロスペック株式会社）
★ アジアＤＸ促進事業、マレーシアは５件採択（株式会社サンクレエ）
★ クレスコがサイバー攻撃の兆候を検知分析し対策支援を提供するサービスを開始

【５】人工知能・ディープラーニングNEWS

★ 会話通じてＡＩが認知症診断、精度は９割…慶応大などのチームが開発
★ Stable Diffusion Public Release
★ 画像生成AI「Stable Diffusion」がオープンソース化　商用利用もOK
★ 【JSAI2022】RPGにおける物語自動生成とさまざまな物語の構造解明
★ New algorithm aces university math course questions
★ 画風を学ぶAIイラストサービスが物議　他人の絵を学習させる悪用を懸念
★ AIが網膜を診断し加齢性疾患のリスクを予想
★ 23億枚もの画像で構成された画像生成AI「Stable Diffusion」のデータセットのうち1200万枚がどこから入手した画像かを調査した結果が公開される
★ Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権

【６】AI川柳

調和系工学研究室では、毎日新聞社「仲畑流万能川柳」や第一生命保険「サラリーマン川柳」を学習用の教師データとした「AI川柳」に取り組んでいます。
2020年3月までの1年間「NHK総合ニュースシブ5時」にて、その週の話題のニュースのキーワードをお題に、バーチャルアナウンサー「ニュースのヨミ子」さんが詠んでいたAI川柳も、本研究室が開発した人工知能システムです。
多くの皆さんに楽しんでいただけるよう、2020年6月にAI川柳のTwitterアカウント（ https://twitter.com/ai_senryu ）を開設いたしました。
AIには詠んだ句に対する「良し悪し」の感覚はありません。そのため、人間がどのように感じ、どのような情景を思い浮かべるかにより、AIが詠んだ句に意味が生じてきます。
AIが詠んだ句に共感していただけましたら大変うれしく思います！

★ お題「食欲」（8月22日投稿）
　　　食欲を満足させて元気出す
飼育下では世界最高齢となるコアラが日本にいるそうです。
長寿の秘訣の１つが食欲だとか。食欲が満たされると、元気が出るんですね。

★ お題「防災」（9月1日投稿）
　防災の用意ができて出口あり
　家の防災グッズを確認しようと思います。
　　
【ご寄附のお願い】
人工知能によるイノベーションでより素晴らしい世界を実現することが、私たち調和系工学研究室の使命であると考え日々研究に取り組んでいます。
大学での研究活動には、研究に必要な機器の整備のほかにも、学生の学会への参加や論文投稿など研究費が欠かせません。
私たちの取り組みにご賛同いただけ、応援のご寄附を賜れましたら大変心強く、研究を続けるうえで大きな励みとなります。
どうぞよろしくお願い申し上げます。
調和系工学研究室教授　川村秀憲

[北海道大学奨学寄附金制度について]（本学への寄附金については、税法上の優遇措置の対象となります）
お問い合わせ先：http://harmo-lab.jp/contact

最後までお読みいただき、ありがとうございました。

◇ 次号は、9月16日に配信する予定です。
◇ メールマガジンのバックナンバー
　http://harmo-lab.jp/?page_id=2923

***************************************
調和系工学研究室教員
川村秀憲教授
山下倫央准教授
横山想一郎助教

調和系工学研究室HP
調和系工学研究室FB
川村秀憲教授FB
Twitter 調和系工学研究室AI川柳

▽ ご意見・ご感想はこちらからお願いいたします
▽ 新規登録はこちらからお願いいたします
▽ 配信停止はこちらからお願いいたします
***************************************