2021年5月28日配信
こんにちは。
北海道大学調和系工学研究室(川村秀憲教授、山下倫央准教授、横山想一郎助教)です。
札幌ではライラックが見頃を迎えていますが、皆さまいかがお過ごしでしょうか。
AI俳句に関する本を夏に出版することを本メールマガジンでもすでにご紹介していますが、付録として俳人の大塚凱さんが選句したAI俳句百句選を掲載することが決まっています。
大塚凱さんは、AI一茶くん俳句対決デビュー戦の対戦相手です。
この対戦がきっかけとなり、AI一茶くんの詠んだ句の選句や選評をお願いするなど、数多くの場面でご支援いただいています。
本の最終章の扉では、AI俳句百句選の中からさらに選んでいただいた一句も紹介しています。
本が出版されましたら、句と共にその一句に込められた大塚さんの思いをぜひお伝えしたいと思います!
では、本日もどうぞよろしくお願いいたします。
***************************************
◇ 本日のTopics ◇
【1】調和系工学研究室WHAT’S NEW
【2】こんな本を読んでいます
【3】人工知能が俳句を詠む(仮)
【4】ディープラーニング勉強会
【5】人工知能・ディープラーニングNEWS
【6】今週のAI俳句ランキング
【7】AI川柳
***************************************
【1】調和系工学研究室WHAT’S NEW
★学研「マナビスタ」にてAI一茶くんの作品を取り上げていただきました
学研が運営する子育て・教育情報サイト「マナビスタ」の連載、「学研の俳句おにいさんが解説 読解力が伸びる! 親子で味わう俳句」にて、AI一茶くんの作品を取り上げていただきました。
AI一茶くんの詠んだ2句が紹介されていますので、ご興味のあるかたはぜひご覧ください。
学研「マナビスタ」
[学研の俳句おにいさんが解説 読解力が伸びる! 親子で味わう俳句 第19回]★研究室に関連する企業・ベンチャーのニュース
『調和技研が北大とNTT東日本と共同でAI病理画像解析の研究を開始』
株式会社調和技研は、北海道大学と東日本電信電話株式会社北海道事業部と共同で、脳腫瘍のAI病理画像解析の研究を開始します。
これまでは病理医が顕微鏡で病理組織を観察し、病気を診断していた作業をAIで置き換えられるようにします。
NTT東日本が提供するスマートイノベーションラボの高速かつセキュアな通信環境とAI解析基盤を活用し、3者の知見やデータ、AI技術にて、AI病理画像解析の精度向上を目指します。
5月27日(木)の北海道新聞、日経新聞道内版に取り上げていただきましたが、調和技研が北大、NTT東日本と一緒に脳腫瘍診断のAI化に取り組みます。
社会の役に立てるよう、研究開発を加速させていきたいと思いますので応援をどうぞよろしくお願いいたします。(川村 秀憲)
[スマートイノベーションラボ 北海道を活用し、AI病理画像解析の共同研究を開始] [株式会社調和技研]『AillについてNHK NEWS「おはよう日本」で紹介』
5月27日(木)放送のNHK NEWS「おはよう日本」で「Aill(エール)」を取り上げていただきました。
「Aill」とはAIがチャットを使った会話をアシストし、出逢い~お付き合いまの恋愛の進展をナビゲートするアプリです。
番組では「Aill」でお付き合い始めたカップルへのインタビューなど、利用者の生の声も紹介されています。
「NHK+」にて見逃し配信もされていますので、ご興味のある方はぜひご覧ください。
現在600社を超える企業に導入してもらっていますが、豊嶋さんや松原先生、鳥海先生とともに更にビジネスを拡大するためにがんばりますので応援よろしくお願いいたします。(川村 秀憲)
NHK+
[NHKニュース おはよう日本 5/27(木) 午前7:00-午前7:45](配信期限 :6/3(木) 午前7:45 まで)(ご覧いただくにはログインが必要となります。)
【2】こんな本を読んでいます
★絶対に面白い化学入門 世界史は化学でできている
左巻 健男 (著)
本日ご紹介するのは、化学が人類の歴史にどのように影響を与えてきたかを紹介する、白熱のサイエンスエンターテインメントです。
[感想]
タイトル通りとてもおもしろい本。
学校で習う化学、物理、歴史、地理などはそれぞれバラバラの知識であり、なぜ重要なのかもわからなかったが、本書はそれらを見事に融合し、発見や発明に関わった歴史的人物のエピソードを交えて社会的に与えたインパクトを交えて説明している。
元素の周期表ができるまでとか、古代の水道と疫病、セラミックやガラスの誕生、金属の利用の歴史、合成繊維の化学構造とその応用の歴史など、興味深いテーマごとに理科や社会の垣根を作らずにスケールの大きな話をコンパクトに纏めている。
途中言及もあるが、話題になったジャレド ダイアモンドの『銃・病原菌・鉄』と合わせて読むととてもおもしろい。
中学生や高校生の頃に本書に出会えたら教科書に書かれていることの裏側のリアルなストーリーが感じられてもっと勉強が面白くなっただろうなぁと思う。(川村 秀憲)
【3】人工知能が俳句を詠む(仮)
この度、調和系工学研究室のこれまでの俳句人工知能「AI一茶くん」に関する研究成果、ストーリーを本にまとめる機会をいただきました。
技術的詳細の説明だけではなく、人工知能に興味がある方にも俳句に興味がある方にも読んでいただけるような内容を心がけ執筆しました。
オーム社より7月発売予定ですが、「AI一茶くん」の研究を始めた経緯や人工知能と創作について、人工知能を実現する技術やその未来についてなど、メールマガジンの読者の方にはいち早く内容をご紹介していきたいと思いますので、こちらを読んでいただき、発売を楽しみにしていただけましたら大変うれしく思います。(川村 秀憲、山下 倫央、横山 想一郎)
※第1~5章はHP( http://harmo-lab.jp/?page_id=6305 )で公開しています。まだお読みでない方はぜひそちらもご確認ください。
[第6章 俳句を生成する人工知能、AI一茶くんの仕組み]一茶くんで俳句を生成する過程は、大きく二つに分けることができます。まず、俳句を構成する単語を一つ一つ選んで順に繋げ、俳句になりそうな単語の並びを生成します。次に、このように生成された単語の並びに対して、有季定型句の条件を満たしているか、意味を成しているかを推定し、こうした条件を満たすものだけを選別します。こうしたことを行うために、一茶くんは言語モデルと呼ばれる人工知能技術を用いています。
言語モデルの学習には、英語や日本語の文章全般といった大まかな括りで集めたデータを用いることが一般的です。形式の整った文章のデータを大量に集めることに重点が置かれ、インターネットに掲載されているニュースやWikipediaの記事の文章などが用いられます。しかし、こうしたところで使われる日本語文と俳句の間には大きな隔たりがあるように思われます。
このため、一茶くんに用いる言語モデルでは、一般的な言語モデルとは異なり日本語の文学作品を教師データとしています。俳句だけでは単語の関係性を十分に教えるだけのデータを揃えることができないため、小説や評論などの文学作品といった、情景描写が重視され俳句と共通点があると思われるデータをまず学習させます。次に、音数の制約や季語といった俳句に固有の特徴を学ばせるため、人間の詠んだ俳句のデータを追加で学習させ微調整を行います。
俳句の中に現れる単語の繋がりを上手く言語モデルに学習させると、俳句の特徴に合わせた単語の並びを生成することができます。こうした文章生成モデルは、GPT(Generative Pre-trained Transformer)やLSTM(Long short-term memory)を用いるものなど、一般的な文章を生成するものがこれまでに多く提案されてきました。一茶くんで俳句を生成するときには、まず、俳句を生成するよう学習した文章生成モデルを用いて、俳句らしい単語の並びをつくりだします。
一茶くんで俳句を扱うときには、俳句に現れうる全ての単語の一覧をあらかじめ用意して、一つひとつの単語に個別の番号を割り当てていきます。これは、俳句を構成する最小の要素を単語とみなし、単語を順番に並べた列で俳句を表現しているともいえます。
一茶くんで俳句を生成する仕組みは、人間が俳句を詠む過程とは大きく異なっています。人間が俳句を詠むときには、何か伝えたい情景などがあり、その情景を限られた言葉の中でうまく伝えられるように選んでいくことが多いのではないでしょうか。一茶くんの言語生成モデルはサイコロを振って単語を選んでいくことを繰り返しており、俳句の中に現れる単語の繋がりを模倣することで、それらしい単語の並びが生成されているに過ぎません。一茶くんで俳句を生成する仕組みのなかには伝えたい情景にあたる情報は存在せず、俳句の題材はサイコロを振ったときにどのような単語が選ばれるのかによって決まるのです。
また一茶くんの文章生成モデルには、文学作品や俳句といった文章の他には一切データが与えられていません。例えば、皆さんが「桜」という言葉を見たとき、ピンク色の桜の花びらや満開に咲いた桜、花が散っていく光景が想起されるかもしれません。ですが一茶くんは、こうした光景を映した画像を学習していません。
これを人間に例えると、自分では桜を全く見たことがない人が他の人から聞いた桜にまつわる話や、桜についてこれまでに詠まれた俳句の字面だけを頼りにして、桜についての俳句を詠もうとしているようなものだと言えます。
一茶くんの文章生成モデルで作る文章は、季語の含まれていないものや、十七音になっていないようなものが多く含まれます。
こうした不完全俳句をできる限りなくし、質の高い俳句だけを最終的に作り出すために、一茶くんでは生成された俳句を評価して条件に合わないものを取り除く処理を行っています。
さらに私たちは、一茶くんで生成された俳句が意味の通るものになっているかどうかを推定することにも挑戦しています。
現在の一茶くんはこのような人工知能技術を応用して俳句を生成し、また生成した俳句を評価して出力することが出来ます。まだまだ人と同じように良い俳句を選ぶということには程遠く、研究しなければならない課題はたくさんありますが、少しずつよい俳句を自動的に選句するための工夫を重ねているところです。
俳人と一茶くんとの対決では、画像やキーワードなどの形でお題が与えられ、そのお題に合わせた俳句を生成してその出来を競うことが多くありました。そのためには、これまで述べてきたような、教師データとして与えた俳句全般の特徴を捉えた俳句を生成するやり方だけでは不十分です。そこでたくさんの俳句をあらかじめ生成しておき、その中からお題に合うものを一茶くんで選ぶ方法をとってきました。
画像からそこに映るものを推定して俳句を選び出す方法としては、これまで二通りの方法を用いてきました。一つは、画像と俳句の相性がどれだけ良いかをディープラーニングで学習して、その結果を使う方法になります。画像と一緒に俳句を人工知能に与えて学習することで、画像と俳句がマッチしている度合いをゼロ%から百%の間で推定させます。
もう一つは、画像認識の技術を応用し、画像から得られた名詞をキーとして俳句を検索する方法です。画像認識は俳句以外でもさまざまな場面でも使われるので、こうした問題を学習するための教師データは既に揃っています。
お題に丁度当てはまる俳句を一茶くんによって一句だけ選ぶということはまだまだ難しい課題です。現在はお題に関係がありそうだと一茶くんで判定したものから、上位数百句ほどを俳句の知識を持った人間が見て、ようやく納得できるものが見つかる程度の精度です。人が自然に行っているように、俳句に描かれている情景を一茶くんに認識させるのはこれからの課題です。(「第7章 AI一茶くんの活動」に続く)
【4】ディープラーニング勉強会
調和系工学研究室ではディープラーニングの最新の知識共有を目指し、毎週ゼミを実施しています。
担当学生がトップカンファレンスから自分の興味のある論文について発表し、意見交換をしながら進めています。
本研究室HP( http://harmo-lab.jp/?page_id=1194 )には過去の発表に使用したスライドも公開していますので、ご興味のある方はぜひそちらもご覧ください。
[紹介論文その1]Learning to Resize Images for Computer Vision Tasks
公開URL:https://arxiv.org/pdf/2103.09950v1.pdf
論文紹介スライドURL:https://www.slideshare.net/harmonylab/learning-to-resize-images-for-computer-vision-tasks
出典:Hossein Talebi, and Peyman Milanfar:Learning to Resize Images for Computer Vision Tasks
概要:CNNを用いたタスクにおいて、画像のリサイズと解像度に関する研究・調査は殆ど行われていないが、精度に大きく貢献すると思われる。そこで、新たなリサイザーモデルを提案する。(博士3年 平間 友大)
[紹介論文その2]AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill Assessments
公開URL:https://arxiv.org/abs/2012.01186
出典:Eric Li, Jingyi Su, Hao Sheng, Lawrence Wai : AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill Assessments, arXiv:2012.01186 (2020)
概要 : Multiple-Choice-Question(MCQ)は自動採点が容易であり、受験者のスキル評価に一般的に用いられる。MCQによるスキル評価の課題である正解の推測と不正行為の影響を最小限に抑えるため、意味的に同じ問題を複数作成することが現実的なアプローチとして考えらえる。本論文では、入力されたMCQと同じ意味のMCQを自動生成する手法を提案する。問題文の言い換えと単語置換によって、入力した問題の意味を維持しながら文構造の異なる問題を生成する。提案手法はpre-trained modelを使用し、target domainのデータを必要としない。人間による評価と機械翻訳の自動評価指標によって、提案手法の有効性を示した(博士2年 吉田 拓海)
[紹介論文その3]Intention Nets: Psychology-Inspired User Choice Behavior Modeling for Next-Basket Prediction
公開URL:https://ojs.aaai.org//index.php/AAAI/article/view/6093
出典:Shoujin Wang, Liang Hu, Yan Wang, Quan Z. Sheng, Mehmet Orgun, Longbing Cao : Intention Nets: Psychology-Inspired User Choice Behavior Modeling for Next-Basket Prediction,AAAI-20
概要:心理学の知見を組み込んだ、ユーザ行動の予測モデルであるIntention Netsを提案しています。意図によって行動の継続期間は異なることに着目し、独自のモデルを設計しました。ユーザの次回の購買商品を予測するnext-basket predictionで先行事例よりも優れた精度を達成しています。(博士2年 幡本 昂平)
【5】人工知能・ディープラーニングNEWS
★New system cleans messy data tables automatically
★ハーバード大学のコンピュータサイエンスの授業教材を日本語化したプロジェクト
★Facebook、AIに「忘れさせる」手法を開発–重要な情報に集中して効率化
★教師データ1個で精度90%以上の行動分析AI 富士通が開発、製造業向けに
★Google(グーグル)のGoogle I/Oにて、新しい検索アルゴリズム「MUM(Multitask Unified Mode)」が発表されました。(日本語解説サイト)
★[論文紹介] MLP-Mixer: An all-MLP Architecture for Vision
★自然言語処理を簡単にアプリ実装できる「NLPCloud.io」のプラットフォーム
★AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill Assessments
★Intention Nets: Psychology-Inspired User Choice Behavior Modeling for Next-Basket Prediction
★データの点と点をつなぐ!?GNNを用いた新たな多次元時系列データ分析手法の提案!
★Vision TransformerでGPT-3レベルを作る方法は?
★プログラミングの自動化がついに実現する? AIが生成するコードの課題と可能性
★ツイッター上で拡散した「#東京五輪は中止します」と「#東京五輪の開催を支持します」を比較してみた
★AIの力で、サッカーはもっと“予測可能”になる:DeepMindが考える次世代のスポーツのかたち
★6種類のAIアクセラレーターを集積した評価チップの試作を開始
★クリエイティブAIを提供するRADIUS5、似顔絵を生成するAI「Portrait Drawer」をリリース
【6】今週のAI俳句ランキング
AIが俳句を作る「AI俳句」の普及を目指して、本研究室を事務局として2019年7月に設立されたAI俳句協会のウェブサイトでは、AIが生成した俳句を人が評価して、評価結果を集約したAI俳句ランキング(月間・週間)の集計を行っています。
今週のランキングをご紹介したいと思います。
1位 閻王に睨まれてゐる福笑ひ
2位 牡丹雪近しと思ふ風の音
3位 賀状書く硯の海の青さかな
すべて、本研究室が開発した「AI一茶くん」が詠んだ句になります。
「AI一茶くん」は1日1句投稿していますので、ぜひ俳句協会ウェブサイト(https://aihaiku.org) もご覧ください!
【7】AI川柳
調和系工学研究室では、毎日新聞社「仲畑流万能川柳」や第一生命保険「サラリーマン川柳」を学習用の教師データとした「AI川柳」に取り組んでいます。
2020年3月までの1年間「NHK総合 ニュースシブ5時」で、その週の話題のニュースのキーワードをお題に、バーチャルアナウンサー「ニュースのヨミ子」さんが詠んでいたAI川柳も、本研究室が開発した人工知能システムです。
多くの皆さんに楽しんでいただけるよう、2020年6月にAI川柳のTwitterアカウント( https://twitter.com/ai_senryu )を開設いたしました。
AIの中には詠んだ句の良し悪しはないためそれを良いと思うのは人間の側で、そう思うことで初めてAIの詠んだ句が意味を持つのではないでしょうか。
AIが詠んだ句に共感していただけましたら大変うれしく思います!
★お題「水」(5月18日投稿)
そんなにも水飲むなんて言われても
蛇口から直接水を飲みたがる猫は多いみたいですね
水入れがあるのに毎回要求してくるのは、飼い主の愛を試しているとか?笑
★お題「散歩」(5月19日投稿)
散歩して父と列んだ犬を見る
北海道も緊急事態宣言が発令されましたが、それに伴いテレワークになった方も多いのではないでしょうか
いつもと違い、朝お父さんと散歩しているこを見かけるようになりました!
★お題「同情」(5月20日投稿)
飼い猫に同情しつつ妻を見る
ダイエット中の我が家のネコ
お母さんにはもらえないのがわかっているから、餌入れの近くを通ると訴えてくる・・・
少しあげたい…でも無理なの涙
★お題「雨」(5月24日投稿)
降りだした雨を知らぬか音がする
降ったりやんだりのすっきりしないこの時期
雨に気づいていない愛犬が、散歩の時間だとそわそわアピールしてくる・・・
雨降っているなんて言えない・笑
★お題「こわい顔」(5月26日投稿)
愛犬を叱った猫はこわい顔
イヌがいたずらして叱ったら、怒られてないのにネコが睨みつけてくる・・・
庇ってるの?
そのこわい顔に癒されます・笑
最後までお読みいただき、ありがとうございました。
****************************************
調和系工学研究室教員
川村 秀憲教授
山下 倫央准教授
横山 想一郎助教
****************************************
★ご意見・ご感想はこちらからお願いいたします
★新規登録はこちらからお願いいたします
★配信停止はこちらからお願いいたします
****************************************