Ameba Ownd

アプリで簡単、無料ホームページ作成

【流 通】TOPPAN 中世ギリシャ語の解読が可能なAI-OCRエンジンを開発

2026.04.28 00:40

TOPPANホールディングスと同社グループのTOPPANは、一般には読み取りが困難とされる中世ギリシャ語の解読が可能なAI-OCRエンジンを開発した。

今後は、TOPPANホールディングスが運営する印刷博物館と協力関係にある、ヴァチカン教皇庁図書館のギリシャ語写本の画像やテキストデータを用い、学習データの蓄積や精度改善を重ねることで、本AI-OCRエンジンの認識精度95%以上の達成を目指す。

古い文書には、歴史的に貴重な史実や地域文化に関する多様な情報が記録されている一方で、その多くは現代人にとって判読が難しい手書き文字で書かれている。これらの内容を正確に読み解き、文化を継承していくことが、日本に限らずグローバルな社会課題となっている。

TOPPANグループは約30年間にわたり、ヴァチカン教皇庁図書館と文化の継承を推進する複数のプロジェクトで協力している。ヴァチカン教皇庁図書館は、所蔵する200万点以上のコレクションの一部を、研究・教育利用の促進を目的としてIIIF(※1)形式の高精細画像で公開している。公開画像は900万枚を超え、現在も継続的に拡充を続けている。

また一部のギリシャ語写本画像には「翻刻(※2)」や「注釈」など付加情報のデータ整備を行っているが、コレクション全体に付加情報を展開するには、中世ギリシャ語の解読ができる専門性の高い人材が長期にわたり作業を行う必要があった。

TOPPANはこれまで、日本全国の貴重な歴史的資料の研究・活用を支援するため、現代人には判読困難な「くずし字」で書かれた古文書の解読に関する取り組みを行ってきた。2015年には、AI画像認識技術を活用して「くずし字」を解読する「くずし字OCR」の研究開発を開始し、その後も様々な研究機関との連携やイベントの開催などに取り組んでいる。また、2021年よりスタートした古文書解読・利活用サービス「ふみのは(R)」や、2023年から開始した、手軽に古文書が解読可能なスマホアプリ「古文書カメラ(R)」を展開している。

このような背景のもと、TOPPANは、これまで「くずし字」の解読で培ったAI-OCRに関する技術や知見から、中世ギリシャ語の解読が可能なAI-OCRエンジンを開発した。


※1 IIIF

(International Image Interoperability Framework)

世界中の図書館・博物館・アーカイブなどでデジタル化された高精細画像を、サイトの枠を超えて相互に利用・共有するための国際的な技術標準・枠組み。この規格に対応することで、異なる機関の画像を一つのビューワ(Miradorなど)で並べて比較や、注釈の追加、高度な比較・分析が容易になり、文化財の活用を促進する

※2 翻刻

古い写本や印刷物に書かれた文章を、現代の楷書体・活字(テキストデータ)に置き換える作業


製品名および会社名などは、各社の商標または登録商標です