目次一覧
状態:-
閲覧数:2,725
投稿日:2016-08-05
更新日:2020-12-03
最初に結論 / PDFからテキストを抽出する方法A / PDFからテキストを抽出する方法B
PDFからテキストを抽出する方法C
PDFからテキストを抽出する方法C
最初に結論 / PDFからテキストを抽出する方法A / PDFからテキストを抽出する方法B
最初に結論
全てのPDFファイルに対して、効果がある方法はありません
PDF作成方法に応じて、テキスト抽出方法は異なります。
例えば「『画像保存したテキスト』をPDF化したファイル」からは、OCRで読み取るしかありません。
※画像ファイルからテキスト抽出することと同じ処理が必要です。
PDFからテキストを抽出する方法A
PDFを「Chromeブラウザ」で「印刷」選択後、保存
「テキストをコピーできないPDF」を、「Chromeブラウザ」の「印刷」経由で「保存」すると、「テキストコピー」出来るようになることがあります。
手順1.ダウンロード
「テキストをコピーできないPDF」をダウンロードします。
手順2.「Google Chrome」で開く
手順3.Chromeへドラッグ&ドロップ
1でダウンロードした「テキストコピーできないPDF」を、2で開いた「Google Chrome」へドラッグ&ドロップします。
つまり、Chrome でPDFを開きます。
手順4.「Google Chrome」でPDFを保存
・画面内の適当な場所で右クリックします。
・「印刷」選択
・画面が切り替わります。
・「保存」ボタンを押します。
手順5.保存したPDFを開く
保存したPDFを再度、Chromeへドラッグ&ドロップすると、何時の間にか「テキストコピー」できるようになっています。
PDFからテキストを抽出する方法B
オンラインサービスを利用します
閲覧可能なPDFからパスワードを削除する無料のオンラインサービス「FreeMyPDF」を利用
PDFからテキストを抽出する方法C
PDFからテキストを抽出する方法C
無料オンラインサービス
「『画像保存したテキスト』をPDF化したファイル」から、オンラインでOCRで読み取り、テキスト化します
Free Online OCR - convert PDF to Word, Images to text, JPEG to Word
Google Chrome でダウンロード再開 / ハンバーガーメニューよりダウンロードをクリック
「Chromeのユーザー1」を削除。ブックマークを復活させるためには、「Bookmarks.bak」を「Bookmarks」へリネーム後、「Profile 1」フォルダへ上書き配置