スタッフブログ
スキャンデータや画像から文字を読み取りテキストに変換するOCRという技術があります。
このOCRという技術自体は、スマホの名刺読み取りアプリ等で知っていたのですが、Adobe Acrobat Pro DCにOCRの技術がある事を知りませんでした。
しかも、読み取った後、見た目を損なわずテキスト化してくれるのも嬉しい機能です。
若干、読み取り間違いがあるので文字校正は必要ですが、便利だったので紹介します。
目次
スキャンデータとPDF変換したデータ
今回スキャンした画像はわざと逆さまに取り込み、Acrobat Pro側で自動で編集してくれるか試してみました。
アクロバットリーダーやchromeのPDF表示でも、テキストが選択出来る様になっています。
・スキャンした画像データ
・変換したPDFデータ
画像データの読み込みから編集まで
1.画像をAcrobat Proに読み込み
2.ツールの「PDFを編集」をクリック
「PDFを編集」で画像の向きや角度を調整してくれます。
この状態だと、画像の向きや角度の調整、テキストもバラバラの状態で選択は出来ますが、完全ではありません。
「スキャン補正」をする事で、文章として読み取れるようになります。
スキャン補正
1.ツールの「スキャン補正」を選択し、画面を表示させます。
2.上部メニューの二段目にある「テキスト認識」の「このファイル内」をクリックします。
3.メニュー三段目が表示され「テキスト認識」ボタンが表示されるのでクリック
4.これで、テキストをまとめて選択できるようになります。
まとめ
数年前にソースネクスト社の「いきなりPDF to Data 」を購入して利用していましたが、Acrobat Proでも出来たなんて知りませんでした。
正直、photoshopやillustrator等のソフトは、アップデートされる度に新機能で遊んでみたりはするのですが、正直Acrobat Proは見向きもしていませんでした。
PDFの編集ソフトぐらいにしかみていなかったので面白いですね。
エクセルやワード形式への変換も対応しているみたいなので、後日試してみたいと思います。
関連の記事
- 板浪雅樹
- 板浪雅樹