PDF파일이란?


PDF파일은 문서 포맷 중 하나입니다. PDF파일로 문서를 저장하면 어떤 기기, 어떤 운영체제에서든지 작성자가 만든 파일 형태 그대로 파일을 볼 수 있습니다. 

 









PDF파일을 사용하나요? 


아시다시피 PDF 파일 포맷이 출시된 시기는 그리 길지 않습니다. 하지만 PDF 파일이 선보인 이후부터 기업 및 기관 뿐만 아니라 개인 사용자까지 PDF문서 사용이 기하 급수적으로 늘었다고 해도 과언이 아닌데요, PDF파일을 사용하는 가장 주된 목적은 문서에 대한 신뢰도가 높고 파일 공유가 쉬우며, 전자문서로 보관이 가장 적합하기 때문입니다.    








PDF파일은 문서의 보안이 가능하고, 호환성이 뛰어나 어떤 환경에서 PDF파일을 보더라도 원본 형태 그대로 볼 수 있기 때문에 문서에 대한 정확성을 보장합니다. 언제 어디서 누가 어떤 기기, 어떤 운영체제에서 PDF문서를 보더라도 작성자가 만든 동일한 형태로 볼 수 있습니다. 








또한 PDF파일은 텍스트, 그림, 오디오 등 모든 소스파일을 그대로 저장 및 유지하거나, 암호로 보호할 수 있습니다. 뿐만 아니라 파일 용량도 조정할 수 있기 때문에 문서 보안 및 보관 솔루션으로 가장 많이 사용되는 파일이라고도 할 수 있습니다







특히 국제표준화기구(ISO)에서 PDF/A 포맷을전자문서의 표준 포맷으로 지정하였습니다. 따라서 수많은 기업과 공공 기관에서 문서 보관 시 더 이상 보관을 위한 공간(장소)이 필요하고, 관리가 어려운 종이 문서로 보관하지 않고 PDF파일로 보관을 하고 있습니다.









PDF파일에 OCR이 필요한가요? 

 






단순한 PDF뷰어 프로그램은 스캐너로 만든 PDF파일을 처리할 수 없습니다. 







1. 책, 종이 문서를 스캔해서 만든 PDF 파일이나 

2. 카메라로 찍은 사진을 PDF로 만들어서 보관한 경우 

3. JPG, PNG등 이미지 파일을 PDF로 만든 경우 

4. 파워포인트 등에서 PDF 생성 시 텍스트 레이어가 포함되지 않은 경우



등등의 PDF파일은, 원본과 동일한 형태로 읽을 수는 있지만 원하는 내용을 검색할 수 없고,텍스트를 드래그해서 복사할 수도 없는 불편한 점이 있는데요. '전자문서' 로서 해야할 역할을 해내지 못한다고 보면 되겠죠?      



ABBYY사에서 500개 이상의 중대형 기업을 대상으로 설문조사 한 결과, 81% 이상이 이런 PDF 파일을 작업할 때 어려움을 느꼈다는 대답을 했다고 합니다. OCR(광학문자인식)으로 이런 부분들은 해결할 수 있는데요~ OCR 프로그램으로 이미지 속 텍스트를 인식하고, 이미지 PDF 파일에 새로운 텍스트 레이어를 포함시킬 수 있습니다.  








OCR 프로그램(ABBYY FineReader 12)을 사용해서 문서를 스캔하면, 

단순 스캔이미지파일이 아니라 검색 가능한 PDF로 저장할 수 있습니다.

쉽게 말해 스캔문서의 모든 내용을 PDF 뷰어에서 검색할 수 있을 뿐만 아니라 

북마크, 하이퍼링크 유지 및 기타 PDF 포맷의 장점을 그대로 모두 사용할 수 있습니다.

 


특히 디지털 문서의 장기 보관용으로 쓰이는 PDF/A 포맷으로 저장할 경우, 사용자가 수 시간(몇 년? 몇 십년? 아니면 그 이상이 될 수도 있겠죠~^^)이 흐른 후 문서를 열 때 보관 당시와 똑같은 모양을 유지할 수 있으며, 문서의 모든 내용을 복사하여 재 사용하거나 특정 정보를 재빠르게 찾는데 사용될 수 있습니다. 


개인도 OCR 프로그램만 있다면 너무 쉽고 간편하게 종이문서를 디지털화 할 수 있고 전자 문서(국제표준기관에서 인정한^^)로 보관할 수 있습니다.  







ABBYY FineReader 12로는 어떤 PDF 작업을 할 수 있나요? 


OCR프로그램 ABBYY FineReader 12(애비 파인리더 12) 를 사용하면 여러분도 전문가 못지 않게 OCR을 사용해 PDF 작업을 할 수 있는데요. 그러면 제가 실제로 작업했던 문서들을 보여드릴게요~  






카메라로 촬영한 사진 OCR

  



1. 스마트폰, 디지털 카메라로 문서를 촬영 





2. ABBYY FineReader 12 실행, 프레임 조정(자동 감지 가능 또는 수동으로 조정)





3. ABBYY FineReader 12로 경사, 기울기 보정 및 OCR 문자인식 




4. 어떤 PDF 뷰어에서도 전체 텍스트 검색 가능 






스캔문서 OCR 및 이미지 보정

  



1. 종이 문서를 스캔해서 만든 PDF파일을




2. ABBYY FineReader로 OCR 하여 텍스트 레이어를 추가하고 





3. 이미지 보정까지 완료하여 깨끗하고 검색과 드래그가 가능한 PDF파일로 변환 가능. 






흐릿하고 스캔 품질이 좋지 않은 이미지를 



마치 오피스 문서에서 작성한것처럼 이미지 품질을 높일 수 있습니다.  





원하는대로 자유롭게 PDF 압축  







ABBYY FineReader 12는 다양한 PDF 압축 옵션을 제공합니다. 

원할 경우 압축 없이 최상 품질로 PDF를 저장하거나, 공유 목적으로 PDF용량을 대폭 줄일 수도 있습니다.

 또한 이미지의 균형을 유지하며 압축하는 MRC라는 기능도 제공합니다. 







똑같은 PDF 파일을 FineReader에서 제공하는 4가지의 옵션을 사용하여 압축해보았습니다~ 

크기가 각각 달라지는걸 보실 수 있죠? 필요한 상황에 따라 자유자재로 PDF파일을 압축해보세요. 




다양한 PDF 저장 옵션   





또 ABBYY FineReader 12에서는 다양한 PDF 저장모드를 지원하는데요 


원본 이미지입니다. 잘봐주세요~ 




↑'페이지 이미지 밑에 텍스트' 로 저장한 PDF 파일 

원본과 동일하게 보이죠? 하지만~ 



짠~ 텍스트 레이어가 보이지 않게 추가된 상태입니다.(hidden text) 

모든 PDF 뷰어에서 텍스트 드래그, 복사, 검색이 가능합니다. 




↑'페이지 이미지 위에 텍스트' 로 저장한 PDF파일 

원본과 비슷하게 보이지만, 텍스트를 보시면 좀 다른걸 알 수 있는데요.

 (문서의 그림파일은 그대로 두고, 인식된 텍스트가 이미지 위로 저장됨) 

PDF에서 보여지는 폰트를 바꾸는 것도 가능하고,

모바일 태블릿 등 기기에서 확대를 해도 텍스트가 깨지지 않겠죠~?  






PDF파일의 장점 및 PDF파일을 사용하는 이유 부터, PDF파일과 OCR의 결합으로 얻을 수 있는 장점까지 한번 알아보았는데요~ 혹시 궁금하신 점이 있다면 댓글로 문의주세요~ 


소개된 ABBYY FineReader 12 OCR 프로그램은 레티아 홈페이지에서 셰어 버전 (30일 무료)을 다운로드 받으실 수 있으니, 필요로 하시는 분들께서는 꼭 한번 테스트해보시기 바랍니다. 



레티아 홈페이지 ABBYY FineReader 12 소개 및 시험판 다운로드 바로가기



감사합니다. 





저작자 표시 비영리 동일 조건 변경 허락
신고
블로그 이미지

OCR 전문기업 레티아 OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.