PDFからテキストを抽出

PDFをアップロードすると、テキストをプレーンな.txtファイルでダウンロードできます — 全ページでも、選択したページだけでも。レイアウトはスペースで近似されます。

スキャンしたPDFのテキストが空になるのはなぜですか?

スキャンPDFに含まれるのは文字の画像であり、実際のテキストではないため、OCR(本ツールは非対応)なしでは抽出できません。選択可能な本物のテキストを含むPDFで機能します。

レイアウトは保持されますか?

改行や列の間隔が近似されるため、表やリストは読みやすいまま保たれます。ページは改ページ文字で区切られます。