pdfを文字認識させないようにするには?非表示情報の削除方法セキュリティのかけ方も紹介

PDFはOCR処理を施すことにより文字認識が可能になります。
今回ご紹介する内容は、OCR処理を施したPDFの文字認識を削除、無効化する方法です。
併せて、非表示情報を削除する方法もお伝えするので、ぜひ目を通してください。

なおOCR処理の方法は以下のページで詳しくご紹介しています。
気になる方はまず下記ページをご覧になってください。

pdfを文字認識させないようにする

pdfを文字認識させない

「編集されたくない」「コピペされたくない」など、PDFの文字認識を無効にしたいシーンもあるでしょう。
ここでは、PDFの自動OCRを無効化する方法や、PDFのテキスト情報を削除する方法などをご紹介します。

PDFの自動OCRを無効化する方法

ここでは、Adobe Acrobatを使用します。
Adobe Acrobatに実装されている自動OCRは、任意でオンオフを切り替えられるため、必要に応じて設定しましょう。
自動OCRを無効化するには、[ツール/PDFを編集]を選択してください。
右側に展開しているパネルから、[テキストを認識]のチェックボックスをオフにしましょう。
これにより、自動OCRが機能するのを回避できます。
なお、再度自動OCRを使用したいときには、逆の操作をするだけです。
[テキストを認識]のチェックボックスをオンにすれば、スキャンした文書の文字をユーザーが編集できます。

PDFのテキスト情報を削除する方法

PDF上からテキスト情報を削除するのは難しいため、一度画像に変換して再度PDF化するとOCR処理されていないPDFを作成できます。
たとえば、下記のようなツールを使えば簡単に文字認識ができないPDFの作成が可能です。

│I love PDF│PDF→JPEG

使い方ですが、まず上記のサイトへアクセスし、トップページからPDFファイルを選択してください。
直接、ファイルを所定の領域へドラッグしても大丈夫です。
画面右側に出てくる「JPGに変換」をクリックし、飛び先のページでJPEGファイルをダウンロードします。
次に下記のページから、上記と同じ操作でJPEGをPDFに変換します。

│I love PDF│JPEG→PDF

変換したPDFファイルをダウンロードすれば完了です。
I LOVE PDF以外にも似たようなサービスは多々あります。
基本的にどれも無料で利用でき、使用方法も大差ありません。
使いやすそうなサービスを選んで利用してみましょう。

透明テキスト(非表示情報)を削除・編集する

透明テキスト(非表示情報)を削除・編集
透明テキストは、一部もしくはすべてを削除したい場合など、ケースによって方法がやや異なります。
ここでは、透明テキストの一部やすべてを削除する方法、編集する方法などを解説しましょう。

一部を削除する方法

Acrobatを使用して、非表示情報を削除する方法をご紹介します。
まずは、Acrobatを起動し、[ツール/墨消し]を選びましょう。
[編集]から[テキストと画像を墨消し]を選んでください。
[非表示情報をすべて削除]を選択します。
「非表示のデータおよびメタデータが~」といった注意文が表示されるため、目を通しておきましょう。
削除を実行するには、ダイアログ内の[ここをクリック]をクリックします。

削除する項目にチェックが入っていることを確認のうえ、[削除]→[OK]と進みましょう。
あとは、ファイルを上書き保存、または名前を付けて保存すれば完了です。
この作業により情報は完全に削除されるため、間違いがないかしっかり確認のうえ実行しましょう。

非表示情報をすべて削除する方法

次に非表示情報をすべて削除する方法を解説します。
Acrobatを起動し、[ツール/墨消し]を選択しましょう。
[編集]から[テキストと画像を墨消し]を選んでください。
[非表示情報をすべて削除]を選ぶと、ダイアログボックスが展開します。
[OK]をクリックし、ファイル名や場所を指定、必要に応じてファイルを保存します。

この作業により、メタデータやスクリプト、埋め込まれた検索用インデックスなどの情報が削除されます。
ドキュメントから機密情報を完全に削除できるため、PDF公開時に情報が流出する心配がありません。

透明テキストの編集方法

透明テキストをAdobe Acrobatで編集する場合は、「TouchUpテキストツール」を使用します。
Acrobat X以降のバージョンを使用するのなら、「文書テキストを編集」を用いることで、透明テキストの編集が可能です。
[編集]→[テキスト追加]と進み、必要に応じて文字の追加を行いましょう。
ツールを用いた透明テキストの編集については、以下のページでより詳しく説明しています。

>透明テキスト付きPDFの編集方法、活用術を徹底解説します!

PDFにセキュリティをかけ編集・改変できなくする

PDFにセキュリティをかけ編集・改変できなくする

取引先等に改変されたくないという理由でテキスト情報の削除・編集を考えているのであれば、テキスト情報を消さずに改変できなくする方法があります。
Acrobatで対象となるPDFを開き、[文書のプロパティ]を開いてください。
[セキュリティ]→[パスワードによるセキュリティ]を選択します。
[文書の印刷及び編集を制限。これらの権限設定を変更するにはパスワードが必要]にチェックを入れましょう。
[変更を許可]→[許可しない]と進み、[権限パスワードの変更]でパスワードを設定後[OK]をクリックします。
再度パスワードを入力して[OK]をクリックし、[文書のプロパティ]→[OK]と進めば完了です。
これにより、PDFの編集ができなくなりました。

なお、[テキスト、画像、およびその他の内容のコピーを有効にする]にチェックを入れていないと、テキストのコピーができなくなるため注意が必要です。
また、印刷を許可しないを選んでしまうと、印刷もできなくなってしまうため注意しましょう。

pdfを文字認識させないようにする方法まとめ

PDFの自動OCR無効化やテキスト情報の削除などにより、PDFの文字認識ができなくなるよう処理できます。
どれも難しい方法ではないため、PDFを文字認識させたくないときには、ぜひ試してみてはいかがでしょうか。

また、本記事では透明テキストの削除や編集方法、セキュリティをかける方法についても解説しました。
これらの方法も、必要に応じて実践してみましょう。