从 PDF 中提取文字

上传 PDF,将其文字下载为纯文本 .txt 文件 — 可以是全部页面,也可以只选部分页面。排版会用空格近似还原。

为什么我的扫描版 PDF 提取出来是空的?

扫描版 PDF 里的文字其实是图片,并非真正的文本,不做 OCR 就无法提取(此工具不含 OCR)。它适用于包含可选中文本的 PDF。

会保留排版吗?

换行和列间距会近似还原,让表格和列表保持可读。页与页之间用换页符分隔。