ホームページ制作 大阪 | 目標を実現するweb制作会社、株式会社トレボ
TREVO(トレボ)

TREVOのスタッフブログ

Blog
2016.02.04.

Adobe Acrobat Pro DCの文字読み取り機能が便利

2016020407

スキャンデータや画像から文字を読み取りテキストに変換するOCRという技術があります。
このOCRという技術自体は、スマホの名刺読み取りアプリ等で知っていたのですが、Adobe Acrobat Pro DCにOCRの技術がある事を知りませんでした。
しかも、読み取った後、見た目を損なわずテキスト化してくれるのも嬉しい機能です。
若干、読み取り間違いがあるので文字校正は必要ですが、便利だったので紹介します。

スキャンデータとPDF変換したデータ

今回スキャンした画像はわざと逆さまに取り込み、Acrobat Pro側で自動で編集してくれるか試してみました。
アクロバットリーダーやchromeのPDF表示でも、テキストが選択出来る様になっています。
スキャンした画像データ
変換したPDFデータ

画像データの読み込みから編集まで

1.画像をAcrobat Proに読み込み

2016020404

2.ツールの「PDFを編集」をクリック

「PDFを編集」で画像の向きや角度を調整してくれます。

2016020405
この状態だと、画像の向きや角度の調整、テキストもバラバラの状態で選択は出来ますが、完全ではありません。
「スキャン補正」をする事で、文章として読み取れるようになります。

スキャン補正

1.ツールの「スキャン補正」を選択し、画面を表示させます。

2016020406

2.上部メニューの二段目にある「テキスト認識」の「このファイル内」をクリックします。
2016020401

3.メニュー三段目が表示され「テキスト認識」ボタンが表示されるのでクリック
2016020402

4.これで、テキストをまとめて選択できるようになります。
2016020403

まとめ

数年前にソースネクスト社の「いきなりPDF to Data 」を購入して利用していましたが、Acrobat Proでも出来たなんて知りませんでした。
正直、photoshopやillustrator等のソフトは、アップデートされる度に新機能で遊んでみたりはするのですが、正直Acrobat Proは見向きもしていませんでした。
PDFの編集ソフトぐらいにしかみていなかったので面白いですね。

エクセルやワード形式への変換も対応しているみたいなので、後日試してみたいと思います。


ホームページ制作 大阪 | 目標を実現するweb制作会社