2024年7月26日に国際日本文化研究センター(京都市)にて開催された「第136回人文化学とコンピュータ研究発表会」に本研究室より、北野 勇太さん(修士2年)が参加し、研究発表を行いました。
[第136回人文化学とコンピュータ研究発表会]◆ 北野勇太, 横山想一郎, 山下倫央, 川村秀憲, 伊藤孝行: 帝国議会議事速記録のテキストデータ作成に向けたテキスト修正支援ツールの開発
明治憲法下の国会である帝国議会議事速記録をコーパス化するために、国立国会図書館の提供するOCR技術「NDLOCR」を使用し、約90%の精度で画像データからテキストデータの変換が可能となっているが、内容の分析にさらなる精度向上が求められている。
この問題に対して、テキストデータ修正支援システム「ハルニレ」を開発し、NDLOCRの認識対象となった画像データと文字認識の結果であるテキストを同時に表示し、ユーザがNDLOCRの文字認識結果を容易に確認・修正することが可能とした。
本稿では、ハルニレを利用結果からNDLOCRの文字認識の精度やハルニレを用いた誤認識修正の作業効率を算出し、ハルニレがもたらす修正作業の効率化の効果を評価する。
——————————
研究内容にご興味がありましたら、お気軽にお問い合わせください。
お問い合わせ: http://harmo-lab.jp/contact
学会の様子等は、後日メルマガでもご紹介させていただきます。
メルマガの配信をご希望の方は下記よりご登録ください。
http://harmo-lab.jp/mailmagazine