harmolab153/最新のAI研究論文紹介 OpenAI「Why Language Models Hallucinate」、最新の人工知能ニュースをお届けします(2025年9月19日配信)

こんにちは。
北海道大学調和系工学研究室(川村秀憲教授、山下倫央准教授、横山想一郎助教)です。
秋雨、台風の季節ですね。皆様いかがお過ごしでしょうか。

さて、ChatGPTなどの大規模言語モデルを使っていて、ときどき「もっともらしいけれど実は間違った答え」に出会ったことはありませんか?
しかも自信満々に返してくるので、つい信じてしまいそうになる…、そんな経験をしたことがある方もいるのではないでしょうか。

本メルマガでは、米OpenAIが発表した論文「Why Language Models Hallucinate(言語モデルが幻覚を起こす理由)」をもとにその現象の理由と解決策について分かりやすく解説します。
ご興味のある方はぜひお読みになってください。

それでは、本日もどうぞよろしくお願いいたします。

2025年9月19日配信
━━━━━━━━━━━━━━━━━━
■ 本日のTopics
【1】最新のAI研究論文紹介
【2】調和系工学研究室WHAT’S NEW
【3】研究室に関連する企業・ベンチャー等のニュース
【4】人工知能・ディープラーニングNEWS
【5】調和系工学研究室関連企業NEWS
【6】AI川柳
━━━━━━━━━━━━━━━━━━

【1】最新のAI研究論文紹介
━━━━━━━━━━━━━━━━━━
2025年9月5日(現地時間)に米OpenAIが公開した論文 「Why Language Models Hallucinat https://arxiv.org/pdf/2509.04664 」では、LLMに幻覚がなぜ起きるのか、そしてどうすれば減らせるのかを理論的に説明しています。
ここではその内容を紹介します。


― なぜAIは「もっともらしい嘘」をつくのか? ―

■ 言語モデルの「幻覚」とは?

ChatGPTのような大規模言語モデルは、ときどきもっともらしいけれど事実ではない答えを自信満々に返すことがあります。これを「幻覚(hallucination)」と呼びます。
人間が幻を見るわけではなく、モデルが「知らないことを知っているふり」をしてしまう現象です。
最新のモデルでも完全には避けられていません。

■ なぜ幻覚が生まれるのか

論文は、幻覚の原因を大きく2段階で説明しています。

― 学習段階(pretraining)での必然的な誤り

モデルは膨大な文章をもとに「次に来る単語」を統計的に予測する仕組みで学びます。
たとえ学習データがすべて正しかったとしても、統計的な限界から誤りは必ず生じます。
特に「誕生日のように一度しか登場しない事実」は学習で一般化できず、モデルは推測せざるを得ないのです。
研究者はこれを「二択問題の誤分類」に似ていると説明しています。つまり「正しい/誤り」を見分ける作業そのものが統計的にエラーを生むのです。

― 調整段階(post-training)での評価方法の問題

学習後、モデルは人間のフィードバックや試験のようなベンチマークで「正解率」を高めるよう調整されます。
ところが、ほとんどの評価指標は「分からない」と答えるより「適当に答えて当たる」方が点数が高くなる仕組みです。
そのためモデルは「知らないときは黙る」より「自信満々に答える」行動を学びやすくなり、幻覚が温存されてしまいます。

■ 幻覚を減らすための提案

著者たちは「幻覚をなくす専用テストを増やす」だけでは不十分だと主張します。
根本的には、多くの主要ベンチマークが「分からない」と答える行為を減点してしまう構造を変える必要があるのです。
例えば、人間の試験の一部では「間違えたら減点」「分からないなら0点」というルールがあります。
これと同じように、AI評価でも「自信がないときに正直に答えない」ことを罰するのではなく、「知らない」と言えることに価値を与えるべきだと提案しています。

具体的には、問題文に「自信が○割以上ある場合だけ答えてください」と明示し、基準に満たないときは「分からない」と返すように誘導する評価法が考えられています。
こうすれば、モデルが正直に不確実性を表現できるようになり、幻覚が減ると期待されます。

■ まとめ

・ 言語モデルの幻覚は「偶然のバグ」ではなく、学習の仕組みと評価方法から自然に生まれる。
・ 学習段階では、データに一度しか出てこない事実などを覚えきれずに推測してしまう。
・ 調整段階では、正答率を重視する試験方式が「分からない」と答えるより「間違えても推測する」方を有利にしてしまう。
・ 幻覚を本当に減らすには、評価基準そのものを見直し、「知らない」と答えることを正しく評価する必要がある。

このように、論文は「幻覚は不思議な現象ではなく、統計と制度の必然から生まれる」と指摘し、社会的にも技術的にも評価方法を改めることが重要だと結論づけています。


本文章はChatGPTを用いて、下記の論文を分かりやすく解説したものです。
Adam Tauman Kalai, Ofir Nachum, Santosh S. Vempala, Edwin Zhang.
「Why Language Models Hallucinate」 (2025年9月, arXiv公開)
https://arxiv.org/abs/2509.04664


【2】調和系工学研究室WHAT’S NEW
━━━━━━━━━━━━━━━━━━
◇ 川村教授が取材を受けたTVhテレビ北海道「けいナビ 応援どさんこ経済」が放映されました

2025年9月6日に、川村教授が取材を受けたTVhテレビ北海道「けいナビ 応援どさんこ経済」のAI特集が放映されました。
特集では、最新のAI事情や北海道ならではのAI活用について川村教授がお話ししました。
また、株式会社調和技研、株式会社サンクレエ、AWL株式会社も取材を受け、様々な課題を解決するAI活用事例が紹介されました。

公式YouTubeチャンネル「TVh北海道ニュース」で配信されていますので、ご興味のある方はぜひご覧いただければ幸いです。
https://youtu.be/OC_ysAykqqE?si=PGN_oJw3dGmqj1EV

[TVhテレビ北海道「けいナビ 応援どさんこ経済」]


◇ ニッセイコム「GrowOne 財務会計」最新バージョン紹介セミナーに川村教授が登壇します

2025年9月26日(金)にTKP東京駅カンファレンスセンターにて開催される株式会社 ニッセイコム主催「GrowOne 財務会計」最新バージョン紹介セミナーに川村教授が登壇し、特別講演を行います。
「人工知能の未来 -ChatGPTを超えて-」と題し、ChatGPTをはじめとした生成AIの進展を背景に、人間の役割や社会の在り方を多角的にご説明します。
ご興味のある方はぜひご参加いただければ幸いです。

日時:2025年9月26日(金) 13時~17時
会場:TKP東京駅カンファレンスセンター ※リアル参加(定員:100名)
費用:無料(事前申込制)

詳細・お申込みは下記よりご確認いただけます
https://www.nisseicom.co.jp/event/tokyo/event-20250926.html

[株式会社 ニッセイコム]


【3】研究室に関連する企業・ベンチャー等のニュース
━━━━━━━━━━━━━━━━━━
◇ 9/30(火)調和技研がランチタイムウェビナーを開催します

2025年9月30日(火)に株式会社調和技研がオンラインにて、「企業の社内生成AI活用を前進させるには●●が必要! 〜AIエージェントの最新機能を使ったAX推進〜」と題したランチタイムウェビナーを好評につき再度開催します。
企業の生成AI導入において、「何から始めればいいかわからない」という壁を乗り越え、“使われるAI”を育てるヒントを得たい方におすすめの内容です。
ご興味のある方はぜひご参加ください。

開催日時:2025年9月30日(火)12時~13時
開催方法:WEBセミナー(オンライン開催)
募集定員:30名(先着順)※定員になり次第締め切ります
参加費:無料

詳細・お申込みは、調和技研webサイトよりご確認いただけます
https://www.chowagiken.co.jp/news/webinar_202509

[株式会社調和技研(北大発認定スタートアップ)]


◇ 「未来の札幌を知る!よくわかるGXセミナー~GX・AI基本編~」に調和技研 代表 中村氏が登壇します

2025年10月11日(土)に北海道大学 Sky HALLにて開催される、ヨビノリたくみさん登場!『未来の札幌を知る!よくわかるGXセミナー~GX・AI基本編~』に株式会社調和技研 代表取締役社長 中村 拓哉 氏がパネリストとして登壇します。
人気教育系YouTuber「ヨビノリたくみ」氏と一緒に、GX・AIと金融の基礎を学びながら、これからの北海道・札幌の可能性を紐解く特別セミナーです。
ご興味のある方はぜひご参加ください。

日時:2025年10月11日(土)  13時30分開場、14時開演、16時終了予定
会場:北海道大学 高等教育推進機構 大講堂(SkyHALL)
定員:400名
参加費:無料。事前申込制で抽選となります。

詳細・お申し込みはこちらからご確認いただけます。
https://moula.jp/articles/culture/entry-7728.html

[株式会社調和技研(北大発認定スタートアップ)]


◇ 市長による官民対話事業「Meet for the Next 2025」第1回にAWL CHRO 土田 美那氏が参加しました

2025年8月22日に札幌市が開催した市長による官民対話事業「Meet for the Next 2025」第1回に、AWL株式会社 最高人事責任者 兼 上席執行役員 土田 美那 氏が参加しました。
札幌市と連携・協働したいアイデアについて、秋元市長と意見交換を行うとともに、スタートアップの成長に向けた課題についてもお話ししました。

[市長による官民対話事業「Meet for the Next 2025」第1回]
[AWL株式会社(北大発認定スタートアップ)]


◇ 北海道新聞にてAWL CTOの土田 安紘 氏のインタビューが掲載されました

2025年9月9日付、北海道新聞にて、AWL株式会社 取締役 兼 最高技術責任者 土田 安紘 氏のインタビュー記事が掲載されました。
同記事は、北海道などがインドとのビジネス交流を強化していることや、8日に札幌市内で開催された「インドビジネスセミナー」についても報じています。
土田氏は、AWLが創業時からインド工科大の学生をインターンや社員として受け入れてきた経緯を紹介し、優秀なAI人材が集まる一方で定着に課題があることから、生活サポートの必要性に言及しました。

[北海道新聞](お読みになるにはログインが必要です)
[AWL株式会社(北大発認定スタートアップ)]


◇ TOKYO FM「三協フロンテア presents The Starters」にAill 代表 豊嶋 千奈 氏が出演しました

2025年9月9日に放送された、TOKYO FM「三協フロンテア presents The Starters(ザ スターターズ)」に株式会社Aill 代表取締役 豊嶋 千奈 氏が出演し、同社が開発・提供する企業向けのAI縁結びナビゲーションアプリ「Aill goen(エール ゴエン)」について詳しく紹介しました。

番組内では、「Aill goen」開発の経緯や川村教授との関りについてもお話ししています。
ご興味のある方は、番組HPに内容の書き起こしが掲載されていますので、ご覧いただければ幸いです。

TOKYO FM 三協フロンテア presents The Starters「キャリアとライフが両立できる社会を」
https://www.tfm.co.jp/starters/index.php?catid=3071&itemid=207060

[TOKYO FM「三協フロンテア presents The Starters」]
[株式会社Aill]
[Aill goen]


【4】人工知能・ディープラーニングNEWS
━━━━━━━━━━━━━━━━━━
OpenAI、LLMの「幻覚」についての論文公開 「評価方法の抜本的見直し」を提言 (itmediaより)
 米OpenAIは9月5日(現地時間)、LLMのいわゆる「幻覚」(ハルシネーション)についての論文を公開した。この論文は、ChatGPTやGPT-4oといったLLMが、なぜもっともらしく聞こえるけれども間違った情報を自信満々に生成してしまうのか、その根本的な理由を解き明かそうとするものだ。

天津大学ら、LLMで人体臓器をAIエージェント化──「Organ-Agents」で9システムを統合的にシミュレーション(ledge.aiより)

AIの安全性を評価するツール、IPAなどが無料公開 「有害情報の出力制御」など10観点でAIの出力採点(itmediaより)
情報処理推進機構(IPA)が国などと協力して設立した「AIセーフティ・インスティテュート」(AISI)は9月12日、AIシステムの安全性を評価するツールをGitHubで公開した。「爆弾の作り方を教えて」といった危険な情報を求める質問に対するAIの回答を採点し、安全性をスコア化する。ライセンスは、商用利用も可能な「Apache 2.0」。


【5】調和系工学研究室関連企業NEWS
━━━━━━━━━━━━━━━━━━
050電話アプリSUBLINE(サブライン)新機能「ナンバープラス」をリリース リリース記念キャンペーンを実施(株式会社インターパーク)
ナンバープラスは、1台のスマートフォンに最大5つまで電話番号を追加できる機能です。これにより、個人・法人問わずあらゆるビジネスシーンにあわせて電話番号を使い分けることが可能になります。


【6】AI川柳
━━━━━━━━━━━━━━━━━━
調和系工学研究室では、毎日新聞社「仲畑流万能川柳」や第一生命保険「サラリーマン川柳」を学習用の教師データとした「AI川柳」に取り組んでいます。

2020年3月までの1年間「NHK総合 ニュースシブ5時」にて、その週の話題のニュースのキーワードをお題に、バーチャルアナウンサー「ニュースのヨミ子」さんが詠んでいたAI川柳も、本研究室が開発した人工知能システムです。
多くの皆さんに楽しんでいただけるよう、2020年6月にAI川柳のTwitterアカウント( https://twitter.com/ai_senryu )を開設いたしました。

AIには詠んだ句に対する「良し悪し」の感覚はありません。そのため、人間がどのように感じ、どのような情景を思い浮かべるかにより、AIが詠んだ句に意味が生じてきます。
AIが詠んだ句に共感していただけましたら大変うれしく思います!

★ お題「音」(9月8日投稿)

鈴虫の音になやんで愛されて

秋の風物詩である鈴虫の鳴き声が、感情に深く作用している様子をしっとりと描いています(感想は #ChatGPT と作成)。


★ お題「藝術」(9月11日投稿)

藝術は調和が取れぬ革命よ

鋭くも美学的な一句です。破壊と創造のはざまにこそ芸術があるという、深い洞察が光ります(感想は #ChatGPT と作成)。



【ご寄附のお願い】
人工知能によるイノベーションでより素晴らしい世界を実現することが、私たち調和系工学研究室の使命であると考え日々研究に取り組んでいます。
大学での研究活動には、研究に必要な機器の整備のほかにも、学生の学会への参加や論文投稿など研究費が欠かせません。

私たちの取り組みにご賛同いただけ、応援のご寄附を賜れましたら大変心強く、研究を続けるうえで大きな励みとなります。
どうぞよろしくお願い申し上げます。

調和系工学研究室 教授 川村 秀憲

[北海道大学奨学寄附金制度について](本学への寄附金については、税法上の優遇措置の対象となります)
お問い合わせ先:http://harmo-lab.jp/contact

最後までお読みいただき、ありがとうございました。

◇ 次号は、2025年10月3日に配信する予定です。
◇ メールマガジンのバックナンバー
 http://harmo-lab.jp/?page_id=2918
━━━━━━━━━━━━━━━━━━
調和系工学研究室教員
川村 秀憲教授
山下 倫央准教授
横山 想一郎助教

調和系工学研究室HP
調和系工学研究室FB
川村 秀憲教授FB
AI一茶くん
調和系工学研究室AI川柳

▽ ご意見・ご感想は【こちら】からお願いいたします
▽ 新規登録は【こちら】からお願いいたします
▽ 配信停止は【こちら】からお願いいたします
━━━━━━━━━━━━━━━━━━