TREVOのスタッフブログ

Blog
2016.02.04.

Adobe Acrobat Pro DCの文字読み取り機能が便利

2016020407
スキャンデータや画像から文字を読み取りテキストに変換するOCRという技術があります。
このOCRという技術自体は、スマホの名刺読み取りアプリ等で知っていたのですが、Adobe Acrobat Pro DCにOCRの技術がある事を知りませんでした。
しかも、読み取った後、見た目を損なわずテキスト化してくれるのも嬉しい機能です。
若干、読み取り間違いがあるので文字校正は必要ですが、便利だったので紹介します。

スキャンデータとPDF変換したデータ

今回スキャンした画像はわざと逆さまに取り込み、Acrobat Pro側で自動で編集してくれるか試してみました。
アクロバットリーダーやchromeのPDF表示でも、テキストが選択出来る様になっています。
スキャンした画像データ
変換したPDFデータ

画像データの読み込みから編集まで

1.画像をAcrobat Proに読み込み

2016020404

2.ツールの「PDFを編集」をクリック

「PDFを編集」で画像の向きや角度を調整してくれます。

2016020405
この状態だと、画像の向きや角度の調整、テキストもバラバラの状態で選択は出来ますが、完全ではありません。
「スキャン補正」をする事で、文章として読み取れるようになります。

スキャン補正

1.ツールの「スキャン補正」を選択し、画面を表示させます。

2016020406

2.上部メニューの二段目にある「テキスト認識」の「このファイル内」をクリックします。
2016020401

3.メニュー三段目が表示され「テキスト認識」ボタンが表示されるのでクリック
2016020402

4.これで、テキストをまとめて選択できるようになります。
2016020403

まとめ

数年前にソースネクスト社の「いきなりPDF to Data 」を購入して利用していましたが、Acrobat Proでも出来たなんて知りませんでした。
正直、photoshopやillustrator等のソフトは、アップデートされる度に新機能で遊んでみたりはするのですが、正直Acrobat Proは見向きもしていませんでした。
PDFの編集ソフトぐらいにしかみていなかったので面白いですね。

エクセルやワード形式への変換も対応しているみたいなので、後日試してみたいと思います。