Question 1

스캔한 PDF의 텍스트가 왜 비어 있나요?

Accepted Answer

스캔한 PDF에는 실제 텍스트가 아니라 텍스트의 이미지가 담겨 있어서, OCR 없이는 추출할 것이 없어요(이 도구는 OCR을 하지 않습니다). 실제로 선택 가능한 텍스트가 있는 PDF에서 작동해요.

Question 2

레이아웃이 유지되나요?

Accepted Answer

줄 바꿈과 열 간격이 근사되어 표와 목록을 읽을 수 있게 유지됩니다. 페이지는 폼 피드 문자로 구분돼요.

PDF에서 텍스트 추출

스캔한 PDF의 텍스트가 왜 비어 있나요?