PDFからテキストを抽出
PDFをアップロードすると、テキストをプレーンな.txtファイルでダウンロードできます — 全ページでも、選択したページだけでも。レイアウトはスペースで近似されます。
スキャンしたPDFのテキストが空になるのはなぜですか?
スキャンPDFに含まれるのは文字の画像であり、実際のテキストではないため、OCR(本ツールは非対応)なしでは抽出できません。選択可能な本物のテキストを含むPDFで機能します。
レイアウトは保持されますか?
改行や列の間隔が近似されるため、表やリストは読みやすいまま保たれます。ページは改ページ文字で区切られます。