ABBYY 개발자 인터뷰 1탄


ABBYY PDF Transformer+ 

Arab Awakening: Bringing a New Language to PDF Transformer+         















by Maksin Pikhenko, 

ABBYY Head of PDF Tools Development Group  





"제가 가장 보람을 느끼는 경험 중 하나는 제가 개발자로서 'ABBYY' R&D센터에서 아랍어 연구에 관계하고 있다는 점입니다. "


저는 ABBYY의 R&D 센터에서 ABBYY PDF Transformer+ 의 아랍어 PDF문서를 편집, 협업 등을 할 수 있게 처리하는 작업을 맡았습니다. 

이는 사실 쉬운일은 아니었습니다. PDF소프트웨어가 올바르게 동작하고, 사용자들이 PDF문서를 쉽게 작업할 수 있으려면 한 언어의 모든 규칙을 이해하는 것이 필요합니다. 예를 들면, 한 단어에 한 글자를 변경하는 것은 문장 자체를 비 문법적으로 만들기 때문에 전체 문장을 변경해야 하니다. 여기에 추가로 아랍어에서는 대부분의 글자들이 단어 내에 세가지 방법으로 위치할 수 있으므로 각기 다른 위치에 대한 변경도 필요합니다. 


처음에는 이런 미묘한 차이에 대한 중요성을 몰랐습니다. 

(현재의 ABBYY의 OCR 엔진은 아랍어 인식에서 높은 정확도를 보이는 것으로 유명합니다.^^)









오른쪽에서 왼쪽으로 읽는 언어에서의 '커서' 제어가 미치는 영향을 포함하면서 새롭게 아랍어에 적용하려면 이러한 미묘한 점들을 배우는 것이 필요했습니다. 이런 맥락에서, 입력 키를 저장해놓지 않으면 백스페이스키와 같이 아주 간단하게 보이는 것들도 예측할 수 없는 움직임을 만들어 낼 수 있습니다. 



추측하셨겠지만 저는 아랍어를 공부하고 있습니다. 단순히 소프트웨 코드를 위한 아랍어 텍스트 편집이 필요한 것이 아니라, 아랍어를 쓰고 읽는 사람들의 사고방식을 배우는 것이 필요하기 때문입니다. 





이런 모든 점을 감안할 때 아랍어로 잘 작동하는 PDF소프트웨어를 찾는다는 것이 드물다는건 절대 놀라운 일이 아닙니다우리의 앞으로의 주요 목표는 ABBYY PDF Transformer+가 Microsoft Word 처럼 잘 동작하게 하는 것입니다. 우리는 현재 버전에서 이미 아랍어 편집 기능에 대한 성공을 얻었습니다. 그리고 더 많은 것을 성취할 수 있다는 사실을 알고 있습니다. 


저는 ABBYY R&D 연구센터에서 일을 하면서 세상에서 가장 수학적으로 구조화된 언어를 배울 수 있었습니다. 이것은 정말 멋진일입니다!! 





ABBYY 개발자 인터뷰는 계속됩니다 

기대해주세요 ^^ 


- 레티아 드림 



    






What is ABBYY PDF Transformer+ ?


 시험판 다운로드 및 사용리뷰 보러가기 








블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,

[종이문서검색 가능한 PDF파일로 보관하기]



요즘 ABBYY PDF Transformer+에 대해서 다양한 리뷰를 알려드리고 있는

 레티아 이주임입니다 ^^ 벌써 다섯번째 리뷰인데요~ 


종이문서를 스캔해서 검색 가능한 PDF파일로 변환하는 방법에 대해서 알아보겠습니다. 





이 문서를 스캔해볼건데요~ 






위 그림과 같은 원리로

이미지는 그대로 두고 인식된 텍스트가 이미지 아래로 들어가게 됩니다. 


겉으로 볼땐 똑같은 스캔 이미지 인데, 

ABBYY PDF Transformer+로 스캔하면

 

검색 및 텍스트 복사가 가능한 PDF파일이 되는거죠! (중요^_^) 






ABBYY PDF Transformer+ 실행 후 <스캔> 을 누른 화면입니다. 


텍스트 인식/ 비틀린 텍스트라인 교정 / 페이지 방향 교정 등 

다양한 스캔 옵션을 제공합니다. 






문서를 스캔해볼게요~ 




 



스캔이 완료되었습니다! 



스캔 후 곧바로 텍스트 검색, 복사가 가능합니다. 

마우스로 텍스트를 드래그한 채 캡처해보았습니다. 





더 좋은 기능은, 이 파일을 워드파일로도 바꿀 수 있는데요 




 



ABBYY PDF Transformer+를 사용하여, 

이미지를 스캔해서 PDF파일로 만들고, 워드파일로까지 변환해보았습니다! 






앗 그리고, 많은 분들이 엑셀 변환에 대해서도 물어보시는데요~ ^^


물론 가능합니다.


위 그림처럼 표 형식이 있는 PDF 파일을 열어보았어요 

위 빨간 동그라미 속 <다음으로 변환> 메뉴에서 '엑셀' 만 선택해 주시면 됩니다. 







변환 결과입니다.

잘 인식된 것을 확인할 수 있습니다. 와우!! 







문서언어는 기본적으로 <한국어 및 영어>로 설정되어있는데요


일본어, 중국어 등을 인식하시려면 

<변환 설정> 으로 들어가셔서 <문서언어>에서 설정해주시면 됩니다. 




ABBYY PDF Transformer+는 

한글 영어 중국어 일본어를 포함하여 


전세계 189개 주요언어를 모두 인식할 수 있습니다. 


놀라우시죠..?! 


또한 여러개의 언어를 조합하여 인식할 수도 있습니다. 


예를들어, 원본 PDF문서에 영어+중국어+프랑스어 가 섞여 있다면, 

문서언어를 3가지를 선택하여 인식할 수 있습니다! wow !!! 






여러분도 지금 바로 이 프로그램을 사용해보실 수 있답니다! 




ABBYY PDF Transformer+ 무료 시험판은 

ABBYY 공식 한국 파트너인 레티아 홈페이지에서 받으실 수 있습니다. 


아래 아이콘 또는 링크를 클릭하세요. 



ABBYY PDF Transformer+ 시험판은


레티아 홈페이지에서 받으실 수 있습니다.


바로가기 


감사합니다. 







블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,