こんにちは。
北海道大学調和系工学研究室(川村秀憲教授、山下倫央准教授、横山想一郎助教)です。
札幌では桜も見頃を過ぎ、新緑の美しい季節が始まりました。皆様はいかがお過ごしでしょうか。
最近、企業や研究分野でのAI Agentの実用化が進んでおり、メディアでよく取り上げられています。そのため、AI Agentという言葉を耳にしたことがある方もいらっしゃるかもしれません。
今回のメルマガでは、AI Agentのしくみについて、調和技研エンジニアブログをもとに詳しく紹介します。
ご興味のある方はぜひお読みになってください。
それでは、本日もどうぞよろしくお願いいたします。
2025年5月9日配信
━━━━━━━━━━━━━━━━━━
■ 本日のTopics
【1】調和技研エンジニアブログ内容紹介
【2】調和系工学研究室WHAT’S NEW
【3】人工知能・ディープラーニングNEWS
【4】調和系工学研究室関連企業NEWS
【5】AI川柳
━━━━━━━━━━━━━━━━━━
【1】調和技研エンジニアブログ内容紹介
━━━━━━━━━━━━━━━━━━
北大発認定スタートアップである株式会社 調和技研は同社webサイトにて、エンジニアによるブログを公開し、AIの最新動向、事例、ノウハウなどを紹介しています。
最近の記事から、内容を要約してご紹介しますので、ご興味のある方はぜひお読みになってください。
*下記の文章はChatGPTを使用して、ブログ記事を分かりやすく要約しています。
◆ AI Agent Vol.3【Agentの学習と評価】(2025年3月27日公開)
本記事は、AI Agentのサーヴェイ論文「 A Survey on Large Language Model based Autonomous Agents 」をもとに、AI Agentの学習方法や評価方法、つまり、AI Agentに知識や経験を獲得させるための方法について説明します。
― はじめに
AI Agentとは「自分で考えて行動するAI」のことです。
たとえば、今のAI(ChatGPTなど)は「質問に答える」といった一つのことには強いですが、一度にいくつものことを計画してこなすのは苦手です。
しかし、AI Agentは違います。人間のように「目的を達成するには、まずこれをやって、その次にこれをして…」と自分で順番を考えて、道具も使いながら行動できるのです。
― AI Agentはどうやって賢くなるの?(学習方法について)
AI(特にChatGPTのような言語モデル)がうまく答えられないときは、専門知識を追加で学ばせる(Fine Tuning)や、質問の仕方を工夫する(Prompt Engineering)といった方法でパワーアップさせます。
しかし、AI Agent(自分で考えて行動するAI)の場合は、それだけでは足りません。
AI Agentをより賢くするためには、どうやって考えたり行動したりするかの「仕組み」を設計することが大事になります。
つまり、「頭がよくなる設計図」を工夫して育てていく、ということです。
- 学習方法1.Without Finetuning
AIに新しい知識を覚えさせるには、「FineTuning」という特別な学習をさせる方法があります。しかし、これは、1. 時間がかかる、2. パソコンのパワーもたくさん必要、3. 元々の知識や柔軟さが失われることもある、という問題があります。
これに対してLLMの登場以降では、LLMのFineTuningを行わずに、「質問の仕方」や「使い方の工夫」で知識をうまく引き出す方法がよく使われています。
つまり、「AIに教え込む」よりも「うまく使う」工夫が大事になってきている、ということです。
- 学習方法2.Prompt Engineering
Prompt Engineering(プロンプト・エンジニアリング)は、AIに「こうしてほしい!」とうまく伝える技(言葉の工夫)のことです。
たとえば、AIが知らないことでも、例を見せたり、専門的な情報を一緒に伝えることで、あたかも知っているかのように答えてくれるようになります。
さらに、問題を順番に考えさせる方法(CoT(Chain of Thought))や、AIに「エージェントの状態はこうだよ」と伝える方法(SocialAGI)、AIが自分の答えを反省する方法(Retroformer)など、いろいろな工夫が開発されています。
- 学習方法3.Mechanism Engineering
AI Agentは、1つだけでなく、複数を組み合わせてチームのように働かせると、よりよい結果が出せることがあります。
Mechanism Engineeringは、エージェント同士の構成を工夫することで能力向上を目指す方法です。
Mechanism Engineeringの具体的な方法には次のものがあります:
・Try and Error(試して修正)→ 評価器を組み込みエージェントの行動を評価します。フィードバックを得ることで、行動の修正を行う方法です。
・Crowd sourcing(みんなで答える)→ 複数のエージェントに同じ問題を解かせて、エージェントがその中から一番いい答えを選びます。
・Experience accumulation(経験をためる)→ エージェントが今までやった仕事の経験をためて、次に活かす方法です。
・Self-driven evolution(自分で成長する)→エージェントの状態を自己修正し、少しずつ賢くなっていく方法です。
― AI Agentの評価方法について
AI Agentが「ちゃんと目的を達成できているか?」を評価する必要があります。
しかし、タスクが複雑で、正しいかどうか判断しにくいことが多いため、いろいろな評価の方法があります。
AI Agentを評価する時には、まず、エージェントにどんな性格や役割を持たせるか=“エージェントをどう設定するか”を決めます。その後、実際にタスクをやらせて、「ちゃんとできたかどうか」を評価します。
エージェントの設定方法には次のものがあります。
・Handcrafting(手作業で設定):エージェントにどんな性格や役割を持たせるか、人が1つずつ決める方法です。自由度は高いですが、扱うエージェントが増えるほどに作成コストがかかります。
・LLM-Generation(AIに作らせる):少しの例を人が作り、それをもとにエージェント自身に役割を考えさせる方法です。作成コストは削減できますが、正確な制御が難しくなります。
・Dataset-Alignment(現実に合わせる):実際の人の属性データ(年齢、性別など)を使って、リアルなエージェントのキャラクターを作る方法です。現実に近いシミュレーションができます。
評価には大きく分けて2つの方法があります。
- 評価方法1.主観的な評価
人が見て判断する方法で、AI Agentがうまく働いているかをチェックするやり方です。
テスト用の答えが決まっていないような難しいタスクでよく使われます。
具体的には次のような方法が考えられます。
・Human Annotation(人の採点):実際に人がAIの答えを見て、「わかりやすいか」「正確か」などの項目で点数をつけます。
・Turing Test(チューリングテスト):AIが出した答えが人間のものかどうかを、見分けられるかどうかで判断します。区別がつかなければ、「このAIは人間並みに自然だ」と評価されます。
最近では、人が採点する代わりにAI(LLM)を使用し評価させる方法も増えています。
たとえば、ChemCrow(AIがやった作業の内容や過程をAIが評価する)、ChatEval(複数のAIが議論して、お互いの答えを評価し合う)といった評価指標が提案されています。
つまり、「人の目」だけでなく、「AIの目」でも評価できるようになってきている、ということです。
- 評価方法2.客観的評価
客観的評価とは、「AIがどれだけうまく働いているか」を数字やルールで測る方法です。
人の感覚に頼る主観的評価とは違い、はっきりした基準で公平にチェックします。
— Metrics(評価のものさし)
AIを評価するための「基準(ものさし)」には、次のものがあります。
・Task success(タスク成功度): AIがやるべきことをちゃんとできたか?成功率や正確さなどで評価します。
・Human similarity(人間っぽさ):AIの発言や行動が、どれくらい人間に近いかを見ます。
・Efficiency(効率):どれくらい早く・少ないやりとりで目的を達成したかを測ります。
— Protocols(評価のやり方)
評価をどう実施するかの方法もいろいろあります。
・Real-world simulation(現実のようなシミュレーション):ゲームや仮想空間でAIに行動させ、実際に使えるかをチェックします。
・Social evaluation(チームでのふるまいを見る):他のAIや人と一緒に話したり作業させて、協調性や社会性を評価します。
・Multi-task evaluation(いろんな仕事をやらせる):たくさんの種類のタスクに挑戦させて、どれだけ幅広く対応できるかを調べます。
つまり、客観的評価では「AIがどれくらい役に立つか」を数字や実験を通して確かめるということです。
― まとめ
AI Agentの構築手法の最新動向をまとめたサーヴェイ論文である「 A Survey on Large Language Model based Autonomous Agents 」を元に AI Agentの学習方法や評価方法について解説しました。
AI Agentの高度化には、LLMの強化だけでなく、設計・学習・評価の多面的なアプローチが重要であることが示されています。
より詳しく知りたい方は、株式会社 調和技研webサイトのブログよりお読みいただけます
https://www.chowagiken.co.jp/blog/aiagent_3_study_evaluation
【2】調和系工学研究室WHAT’S NEW
━━━━━━━━━━━━━━━━━━
◇ 2025年度 第1回北海道生産性セミナーに川村教授が登壇します
2025年5月23日(金)に札幌グランドホテルにて開催される、「2025年度 第1回北海道生産性セミナー」に川村教授が登壇します。
当日は、「人工知能の進化と未来社会 ~ AI技術の最前線と社会実装への挑戦 ~」と題して、AIの仕組みや歴史、具体的なAIの活用事例、技術進化がもたらす社会への影響等についてお話しするとともに、北海道大学でのAI研究の取組や実社会での応用事例についても紹介します。
会員ではない方もお申込みいただけますので、ご興味のある方はぜひご参加いただければ幸いです。
日時:2025年5月23日(金)16時~17時15分
場所:札幌グランドホテル 本館2階
定員:100名(先着順)
参加費:一般5,500円(賛助会員・役員は無料)
詳細及び、お申し込みは下記よりご確認いただけます
https://www.hpc-net.jp/business/seminar/member/2025-2491/
※参加申込み締切日は2025年5月16日(金)
◇ HTB「イチオシ!!」の生成AI特集に川村教授が出演しました
2025年4月28日放送、北海道テレビ放送(HTB)「イチオシ!!」の生成AI特集に川村教授が出演しました。
番組で川村教授は、生成AIの著作権問題や、社会的なルール形成の必要性についてお話ししました。
また、北大発認定スタートアップ企業である株式会社調和技研が開発した「AIWEO for ヘルプデスク」を取り上げていただき、同社の執行役員である高松 一樹 氏が、AI技術による業務効率化の可能性などについてコメントしました。
番組は下記よりご覧いただけます
https://www.htb.co.jp/news/archives_31224.html
・「AIWEO for ヘルプデスク」の紹介(株式会社調和技研 高松氏):5分20秒頃~
・AI技術の社会実装や著作権などの課題について(川村教授):6分50秒頃~
★ 研究室に関連する企業・ベンチャー等のニュース
━━━━━━━━━━━━━━━━━━
◇ 北海道新聞にてAWLを取り上げていただきました
2025年4月22日付、北海道新聞朝刊にて、「北大発認定スタートアップ企業」であり、川村教授が技術顧問を務めるAWL株式会社を取り上げていただきました。
記事では、北海道大学が事業拡大を支援する「北大発認定スタートアップ企業」の取組について取材しています。北海道大学では、研究成果や知的財産を活用した事業展開を後押しすることで、大学の価値向上を目指しています。
[AWL株式会社(北大発認定スタートアップ)]
◇ 「Computer Vision and Pattern Recognition Conference 2025」にてAWL CTOの土田 安紘氏が基調講演を行います
2025年6月11日~15日(現地時間)に、米国テネシー州ナッシュビルで開催される「Computer Vision and Pattern Recognition Conference 2025(以下、CVPR) 」の併設ワークショップである「Domain Generalization: Evolution, Breakthroughs and Future Horizon」にて、AWL株式会社 取締役 最高技術責任者 土田 安紘 氏が基調講演を行います。
今回の開催で42回目を数える「CVPR」は、コンピュータ・ビジョン分野における世界最高峰・最大規模の国際会議のひとつで、画像認識関連技術のトップクラスの研究者や業界リーダーが一同に集う学会です。
土田氏の基調講演は6月12日(現地時間)に予定されています。また、AWL株式会社は、本ワークショップのスポンサーを務めています。
詳細は下記よりご覧いただけます
https://awl.co.jp/news/20250422/
[Computer Vision and Pattern Recognition Conference 2025(CVPR)]
[AWL株式会社(北大発認定スタートアップ)]
◇ 北洋銀行と北海道大学による実践的授業「社会体験ワークショップ」にてAWL CHRO 土田 美那氏が登壇しました
2025年4月22日に、北海道大学で行われた、北洋銀行と北海道大学による社会体験のための実践的授業「社会の認識『社会体験ワークショップ』」にて、AWL株式会社 最高人事責任者 兼 上席執行役員 土田 美那 氏が、ゲスト企業の一社として登壇しました。
当日、土田氏は、「北海道から世界へ:グローバルな視点で事業を展開し、 世界で輝くことを目指す!」をテーマに講演し、学生とディスカッションを行いました。
「社会の認識『社会体験ワークショップ』」の詳細は下記よりご覧いただけます。
https://www.hokuyobank.co.jp/newsrelease/pdf/20250408_075559.pdf
【3】人工知能・ディープラーニングNEWS
━━━━━━━━━━━━━━━━━━
★ 最もコスト効率の高い思考モデル「Gemini 2.5 Flash」提供開始(無料版でも)(itmediaより)
Googleは、思考するAIの軽量版「Gemini 2.5 Flash」を無料ユーザーを含むすべてのGeminiユーザーへの提供を開始した。Google AI StudioとVertex AIのGemini APIでも利用可能だ。
★ OpenAI、o3とo4-miniは「従来モデルよりハルシネーション率が高い」(itmediaより)
米OpenAIが4月16日(現地時間)に新たなAIモデル「o3」と「o4-mini」の公開に合わせて公開したこれらのモデルのSystem Card(PDF)によると、o4-miniのハルシネーション(幻覚)率は、o1およびo3と比較して高いという。
★ 日本発、“IQより愛嬌”なAIモデル「Geppetto」登場 「アラインメント」に着目して開発、その効果は?(itmediaより)
★ Google、イルカの“言語”解読を狙う音響モデル「DolphinGemma」公開──約4億パラメータをPixel 9上でリアルタイム実装(ledge.aiより)
★ OpenAI、「deep research」軽量版リリース 無料ユーザーも利用可能(itmediaより)
OpenAIは、Web検索するAIエージェント「deep research」の軽量版を発表した。これにより有料版の利用上限が引き上げられた。無料ユーザーも月5回まで利用可能だ。
★ Google CloudのAIエージェント戦略の特徴は? 「連携」に動き出した同社の勝算(itmediaより)
★ 第2のDeepSeekショック? オープンな中国LLM「Qwen3」シリーズが破格の性能で話題 最大モデルはOpenAI o1やGemini 2.5 Proに匹敵、たった4BでもGPT-4oレベルに(itmediaより)
中国Alibabaが発表した、大規模言語モデル「Qwen」の最新版となる「Qwen3」シリーズが話題だ。フラッグシップモデルの「Qwen3-235B-A22B」は「DeepSeek-R1」の半分未満のパラメータ数ながら、OpenAIのo1やo3-mini、GoogleのGemini 2.5 Proなど他のトップモデルと並ぶ性能を達成したという。
★ NotebookLM、“AIポッドキャスト”機能が日本語含む50以上の言語に対応 ソースから男女の会話を生成(itmediaより)
米Googleは4月29日(現地時間)、AI採用のドキュメント分析・活用ツール「NotebookLM」の「Audio Overviews」(日本では「音声概要」)が日本語を含む50以上の言語に対応したと発表した。また、出力言語をデフォルト以外に指定できる機能も追加した。
★ ダイハツ、AIアプリを実装できる人材を予備知識ゼロから3カ月で育成、開発人材300人を目指す(IT Leaderより)
ダイハツ工業は、AI人材を「素養人材」(最低限必要なAI基礎知識を持つ人材)、「中核人材」(AIプロジェクトを実装できる人材)、「TOP人材」の3層に分け、段階的に育成している。
★ “複雑な思考ができるAI”、ELYZAが公開 性能は「o1-mini」に匹敵、商用利用も可能 「非リーズニングモデルから開発」(itmediaより)
東大発のAIベンチャーELYZA(東京都文京区)は5月1日、新たなAIモデル「ELYZA-Thinking-1.0-Qwen-32B」を公開した。
★ NotebookLMに情報を投入するのが面倒くさい? そんなあなたにブラウザ拡張(itmediaより)
「情報の整理や把握が爆速になる」と話題のAIメモツール「NotebookLM」。DeNAの南場智子会長が利用しているとして話題になった他、昨今ではワークマンなど企業での導入も進みつつある。4月末には、AIに参照させた情報を日本語音声によるポッドキャスト形式で出力する機能も追加され、さらに利便性を増した。
★ AIはIQ130超え、教育は「人間力」へ舵を切れるか?(第一生命経済研究所websサイトより)
人工知能(AI)は、今やSFの領域を超え、我々の知的活動の領域に急速に浸透し始めている。一部のAIモデルがIQテストにおいて人間を凌駕するスコアを叩き出すという事実は、その進化の加速度を象徴する出来事といえよう。
【4】調和系工学研究室関連企業NEWS
━━━━━━━━━━━━━━━━━━
★ 札幌の高校で生成AIを活用した授業(株式会社インターパーク)
札幌旭丘高校で行われたのはチャットGPTを使った授業です。札幌のIT企業、インターパークの社員を講師役に、数理データサイエンス科の3年生が学びました。
【5】AI川柳
━━━━━━━━━━━━━━━━━━
調和系工学研究室では、毎日新聞社「仲畑流万能川柳」や第一生命保険「サラリーマン川柳」を学習用の教師データとした「AI川柳」に取り組んでいます。
2020年3月までの1年間「NHK総合 ニュースシブ5時」にて、その週の話題のニュースのキーワードをお題に、バーチャルアナウンサー「ニュースのヨミ子」さんが詠んでいたAI川柳も、本研究室が開発した人工知能システムです。
多くの皆さんに楽しんでいただけるよう、2020年6月にAI川柳のTwitterアカウント( https://twitter.com/ai_senryu )を開設いたしました。
AIには詠んだ句に対する「良し悪し」の感覚はありません。そのため、人間がどのように感じ、どのような情景を思い浮かべるかにより、AIが詠んだ句に意味が生じてきます。
AIが詠んだ句に共感していただけましたら大変うれしく思います!
★ お題「春」(4月22日投稿)
暖かい春から雨が降り出した
季節の気まぐれさや心の移ろいを素直に描いた一句(感想は #ChatGPT と作成)。
★ お題「万博」(4月24日投稿)
万博が思い出される風呂上り
風呂上がりのほっとした時間にふと万博の思い出がよみがえる様子(感想は #ChatGPT と作成)
【ご寄附のお願い】
人工知能によるイノベーションでより素晴らしい世界を実現することが、私たち調和系工学研究室の使命であると考え日々研究に取り組んでいます。
大学での研究活動には、研究に必要な機器の整備のほかにも、学生の学会への参加や論文投稿など研究費が欠かせません。
私たちの取り組みにご賛同いただけ、応援のご寄附を賜れましたら大変心強く、研究を続けるうえで大きな励みとなります。
どうぞよろしくお願い申し上げます。
調和系工学研究室 教授 川村 秀憲
[北海道大学奨学寄附金制度について](本学への寄附金については、税法上の優遇措置の対象となります)お問い合わせ先:http://harmo-lab.jp/contact
最後までお読みいただき、ありがとうございました。
◇ 次号は、2025年5月23日に配信する予定です。
◇ メールマガジンのバックナンバー
http://harmo-lab.jp/?page_id=2918
━━━━━━━━━━━━━━━━━━
調和系工学研究室教員
川村 秀憲教授
山下 倫央准教授
横山 想一郎助教
▽調和系工学研究室HP
▽調和系工学研究室FB
▽川村 秀憲教授FB
▽AI一茶くん
▽調和系工学研究室AI川柳
▽ ご意見・ご感想は【こちら】からお願いいたします
▽ 新規登録は【こちら】からお願いいたします
▽ 配信停止は【こちら】からお願いいたします
━━━━━━━━━━━━━━━━━━