2025年9月14日~18日(現地時間)に米国アラスカ州アンカレッジで開催される国際学会「2025 IEEE International Conference on Image Processing(「IEEE ICIP」)」にて、AWL株式会社の論文が採択されました。
タイトル:
GRID-LOGAT: Grid Based Local and Global Area Transcription for Video Question Answering
著者:
Md Intisar Chowdhury, Kittinun Aukkapinyo, Hiroshi Fujimura(藤村 浩司)*, Joo Ann Woo, Wasu Wasusatein, Fadoua Ghourabi (AWL株式会社) *共同筆頭著者(同等貢献)
概要:
AWLはエッジAIの社会実装を強みとし、本研究では、ローカルデバイス上で動作するVisual Language Model(VLM)による動画理解を対象としています。
本論文では、画像をグリッド線で分割し、局所領域と広域領域の情報を統合的に処理する新手法「GRID-LOGAT」を提案。生成AI時代における画像と言語の融合処理の高度化に貢献します。
GRID-LOGATは、ローカルデバイス上での処理を前提とし、画像にオーバーレイされたグリッド線に基づく詳細分析により、プライバシー保護と高精度な画像認識を両立。クラウド依存を抑えることで、電力消費の低減にも寄与します。
本技術は、店舗・施設における防犯や業務効率化など、現場での実用的な応用を見据えたものであり、AWLが推進する「エッジAIによる社会課題解決」の実現に向けた、技術革新の象徴ともいえる成果です。
詳細はAWL株式会社webサイトよりご確認いただけます
https://awl.co.jp/news/20250820/
[2025 IEEE International Conference on Image Processing]
https://2025.ieeeicip.org/
https://cmsworkshops.com/ICIP2025/view_session.php?SessionID=1057&bare=1
[AWL株式会社(北大発認定スタートアップ)]