全盲の方の強い味方・テキストデータとその課題

本をオーディオで聴く

視覚的な困難を抱えている方がどのように本を読んでいるかというと、いわゆる音声読み上げソフト、点字等を使って耳や手先で書籍を読むのが一般的です。

音声読み上げソフトは、現在皆さんお持ちのスマートフォンにも標準搭載されている身近な機能。ハンディキャップをお持ちでない方はあまり使う機会の無いものですが、町で見かけたことのある方もいらっしゃるのでは。最近ではYoutubeの動画にも使われることが多く、フリーソフトも無数に存在します。

非常に大雑把に読み上げソフトの仕組みを説明すると、テキストデータとして埋め込まれた文字を機械が読み上げてくれるシステム。視覚的に困難を抱えている方だけでなく、健常者にも便利な機能ですが、実は一つの課題が存在します。

紙の本はどうする?

紙の書籍

テキストデータを読み上げるということは、言い換えればデータになっていない文字を読み上げることは出来ないということになります。

最近は書籍の電子版が当たり前になってきましたが、数十年前に販売された古い本や自費出版の書籍など、そのコンテンツがデータとして公開されていない、もしくは残っていないものも、未だ大量に存在します。

点字化されていない本が無数に存在するのは言うまでもありません。

つまり、例えば蔵書数万という巨大な図書館で書籍を無料で閲覧・貸し出しすることが出来るとしても、視覚にハンディキャップを持っている方はその何十分の一ほどの恩恵しか届かないという意味になります。デジタル化や電子化が遍く利益をもたらしてくれる中、不公平な状態と言えます。

電子化+OCR処理で乗り越える

立教大学図書館様

実際にそのままスキャンにご依頼いただいた立教大学様は、まさに同じ様なお悩みをお抱えでした。

100万冊を優に超える蔵書を抱えている同大学の図書館様。ご依頼いただいた時点で全盲の学生さんからテキストデータでの提供を要望されたものの、古い資料にはテキストデータが付与されておらず新たに作成する必要がありました。お馴染み書籍の電子化です。

ただ紙の資料を電子化するだけなら、人員を動員すれば出来ないこともありません。しかしそれでは時間が掛かりますし、ただスキャンしただけの電子書籍は画像データ。肝心の文字のテキストデータがありません。OCR処理ソフトを使用する必要があります。

更に言えば、そのOCR処理も精度は100%ではありません。このままでは学生さんが音声を聴いて意味の通らない文章になってしまう…ということで、生成されたテキストデータについて目視で校正することも重要です。言い換えれば、検索用ではなく正確なテキストデータが欲しいならば校正は必須です。

しかし当然、ここまでテキスト化に時間を費やしてしまうと、日ごろの業務と並行して進めるのは不可能です。上記、すべてそのままスキャンで対応させていただきました。
(詳しくは立教大学様の事例紹介をご覧ください)

このように、若干工数はありますが古書でもテキストデータ化して音声読み上げソフトに対応させることで、ハンディキャップをお持ちの方でも同じようにコンテンツに触れることが出来るのです。

テキストデータの普及を

オーディオブックを聴く女性

民間では電子化やテキスト化が急速に普及していますが、限られた予算や人員の中でやりくりしなければならない行政や教育機関では大変な作業になります。

一方で視覚以外の感覚から情報を得ている方々にとっては大幅な機会損失です。

通常スキャン業者が電子化やテキスト化を語る時はどうしてもコスト削減、利便性という話になりがちですが、こういった公共性が極めて強い部分もあるのです。

コストパフォーマンスで選ばれる高精度OCR処理サービス

  1. 本を裁断せずにスキャニング
  2. 精度99.96%のテキスト化処理を1ページ150円から
  3. 国立研究機関や大学様からの実績多数
  4. 効率化された作業フローで短納期のご相談にも対応可能
OCRのイメージ

詳しく見る

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です