PDF파일에서 글자가 엉뚱하게 인식되거나, 쉼표나 마침표 같은 기호가 이상하게 나올 때 당황하신 적 있으신가요?

특히 스캔본을 활용한 문서 작업 시 이런 OCR 오인식 문제는 자주 발생하게 되는데요.

오늘은 PDF 오인식 문제를 최소화하고, 생긴 오류를 쉽게 수정하는 방법을 소개해드릴게요.

 

1. 깨끗하게 스캔하는 것이 가장 중요해요!

 

OCR 인식 정확도를 높이려면 스캔 해상도와 문서 선명도가 매우 중요합니다.

 

  • 권장 해상도 300dpi 이상
  • 흐릿하거나 배경에 노이즈가 많은 경우, 인식 정확도가 크게 떨어질 수 있어요.
  • 종이에 잉크 번짐이나 구김이 있다면 OCR 결과도 왜곡될 수 있습니다.

 

작은 해상도 차이로도 인식 결과가 확연히 달라질 수 있으니, 최대한 깨끗하게 스캔해 주세요!

 

2. 오인식된 부분은 "바꾸기"로 손쉽게 수정하기

스캔은 잘 되었는데요 불구하고 일부 기호나 문자가 잘못 인식될 수 있어요.

예를 들어 다음과 같은 문제가 발생 할 수 있습니다.

쉼표(,)가 마침표로(.)로 인식됨

숫자 1이 소문자 ㅣ(엘)로 인식됨

대문자 O와 숫자 0이 혼동됨

 

이럴 땐 파인리더 PDF에서 "바꾸기"기능을 활용해 보세요.

 

 

상단의 [편집] - [바꾸기]

찾을 내용에 오인식 된 기호나 문자를 입력하고, (더 정확하게 하고 싶다면 해당 문자를 복사후 붙여넣어주세요) 바꿀 내용에 바꾸고 싶은 기호나 문자를 입력합니다. 그리고 모두 바꾸기를 클릭합니다.

.

 

블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,