第28回 画像の認識・理解シンポジウム (MIRU2025)にて学生が発表しました

2025年7月29日~8月1日に国立京都国際会館にて開催された「第28回 画像の認識・理解シンポジウム (MIRU2025)」に本研究室より、鎌田 理久さん(修士2年)、古田 悠華さん(修士2年)が参加し、研究発表を行いました。

[第28回 画像の認識・理解シンポジウム (MIRU2025)]


◆ 鎌田理久, 横山想一郎, 山下倫央, 川村秀憲: 除雪出動決定支援のための視覚言語モデルによる路面状況の分析

積雪地帯における冬期の道路除雪業務は,道路交通や生活インフラを維持するうえで欠かせない.しかし,除雪出動の判断は気象や道路状況の変化に大きく左右されるため,担当者が下した判断が覆る場合もしばしば発生し,除雪作業員に不確実な出動への備えを強いるだけでなく,担当者にも心理的負荷を与えている.本研究では,この課題に対して視覚言語モデル(VLM)を用いて,定点カメラの連続画像から路面状況の時間的変化を言語的な特徴として抽出する手法を提案する.過去の除雪記録に基づくケーススタディを通じて,本手法が,熟練担当者の判断根拠となる路面の変化(積雪の深化や走行跡の消失など)を的確に言語化できることを示した.この結果は,VLMが気象予報等の事前情報に起因する判断バイアスを補完し,より客観的な状況認識を支援するツールとなりうることを示唆する.

◆ 古田悠華, 横山想一郎, 山下倫央, 川村秀憲 : Text-to-Imageモデルを用いた衣服画像の生成と衣服特徴に基づく再現性評価

本研究は,ユーザの印象やこだわりに基づいて衣服画像を生成可能なデザイン支援システムの構築を最終的な目標とし,その基礎検討としてText-to-Image(T2I)手法の活用と再現性評価の枠組みを提案する.
本稿では,実在する衣服画像から客観的な属性(色,素材,シルエットなど)を抽出し,それに基づくテキストプロンプトを構成して衣服画像を生成する.この生成画像と目標画像との比較を通じて,Text-to-Imageモデルの再現性能および生成安定性を定性的に評価する.その結果,提案手法は多くのケースで高い再現性を示すことが確認されたが,一方でSeed値の設定によって生成結果にばらつきが生じることが判明し,今後の安定性向上が課題として示唆された.

研究内容にご興味がありましたら、お気軽にお問い合わせください。
お問い合わせ: http://harmo-lab.jp/contact