PDF에서 텍스트 추출
PDF를 업로드하면 텍스트를 일반 .txt 파일로 다운로드할 수 있어요 — 전체 페이지 또는 선택한 페이지만요. 레이아웃은 간격으로 근사됩니다.
스캔한 PDF의 텍스트가 왜 비어 있나요?
스캔한 PDF에는 실제 텍스트가 아니라 텍스트의 이미지가 담겨 있어서, OCR 없이는 추출할 것이 없어요(이 도구는 OCR을 하지 않습니다). 실제로 선택 가능한 텍스트가 있는 PDF에서 작동해요.
레이아웃이 유지되나요?
줄 바꿈과 열 간격이 근사되어 표와 목록을 읽을 수 있게 유지됩니다. 페이지는 폼 피드 문자로 구분돼요.