[ReTIA] 직장인 문서관리 고민 해결 2탄! 




먼저 아래의 3가지 질문에 해당되시는 지 확인해보세요! 


1. 매일 정기적으로 문서 작업을 하고 계신가요? 

2. OCR 기술 또는 PDF 기술에 대해 들어본 적 있으신가요? 

3. 소프트웨어로 문서 작업을 처리하는 데 두려움이 없으신가요? 





ABBYY 파인리더가 극적으로 생산성을 높일 수 있는 세 가지 방법을 소개합니다. 




1. 문서를 디지털화 하라! 


아무리 세계가 점점 디지털화 되고 있다고 하더라도 종이문서는 여전히 사무실 환경에서 필수적으로 사용되고 있습니다. 

여러분의 책상에 종이 문서가 계속 늘어날 수 록 여러분은 어떤 혜택을 얻으실 수 있나요? 

종이 더미가 많아 질수록, 필요한 것을 찾기는 점점 더 어려워지고 우리는 더 많은 시간을 낭비해야 합니다. 


해결방법은 간단하고 명확합니다! 


ABBYY 파인리더로 종이 문서를 스캔하고, 검색 가능한 PDF파일로 변경할 수 있습니다. 


결과: 복잡한 책상은 깔끔하게 정리되고:) 컴퓨터 상의 간단한 검색 기능으로 문서와 정보를 찾을 수 있습니다. 




 2. 타이핑을 멈춰라! 


정보는 어디에나 있습니다. 흥미로운 무언가가 우리를 언제 놀라게 할지 우리는 알 수 없습니다! 


출퇴근을 하는 동안 읽고 있는 잡지에, 또는 오래된 책에서 우리는 갖고 싶은 정보를 만날 수 있습니다. 

이렇게 발견한 정보를 저장하거나, 다시 사용하고 싶을 때 우리들 대부분은 스마트폰으로 사진을 찍고, 다시 타이핑을 시작합니다.

이런일들을 여러분은 시간 낭비라고 생각하시나요? 단호하게 말하자면 시간낭비가 확실합니다! 


ABBYY 파인리더는 사진을 찍었거나, 문서를 스캔했어도 즉각적인 처리가 가능합니다. ABBYY 파인리더는 사진 속 텍스트도 즉시 복사 & 붙여넣기 (Copy & Paste)가 가능합니다. 말 그대로 몇 초내에 이미지를 텍스트로 바꿔줍니다. 



결과: 다시 타이핑을 하는 수고로움 대신, 다른 일에 시간을 투자할 수 있으며, 정보를 수 초내에 모을 수 있고 즉각적으로 다시 사용할 수 있게 됩니다! 




3. 문서를 정리하라! 



문서를 디지털화 하는 것은 좋은 시작이지만 항상 충분하지는 않습니다. 대부분의 문서들은 일회성이 아닌 먼 훗날 다시 한번 사용할 일이 분명 있을 수 있습니다! 여러분도 경험해보셔서 아시죠? 


스캐너는 TIFF, JPG, PDF를 만들 수 있지만 단지 원본 문서의 이미지 즉 사진일 뿐입니다. 그래서 완벽한 검색 시스템이 없다면 필요한 문서를 찾을 수 없습니다. 


ABBYY 파인리더는 이런 스캔본이나, 사진을 바로 검색이 가능한 PDF 문서로 만들 수 있고, 메타데이터를 추가하거나 이미지 품질을 높이고 파일 사이즈를 줄이는 등의 작업을 할 수 있습니다! 



결과: 문서들이 디지털 아카이브에 들어갈 준비를 마칠 수 있습니다! 쉽게 문서를 찾고, 복원할 수 있으며 소중한 저장 공간도 절약할 수 있습니다! 





사용자를 위한 쉬운 인터페이스.

세계적인 수상 경력을 자랑하는 세계 최고의 지능형 문자인식 프로그램. 





ABBYY 파인리더 12, 지금 레티아에서 만나보세요. 





바로가기 





블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,



ABBYY의 기술로 버마어를 읽다! 



안녕하세요, 레티아 이주임입니다.

OCR 문자인식 기술에 조금이라도 관심있으신 분들이라면,굉장히 흥미로울만한 이야기를 들고 왔습니다 :)


여러분 도대체 ABBYY 파인리더는 어떻게 '이미지' 를 '텍스트' 로 인식하는 지 궁금하셨죠? 


이미지의 텍스트를 읽어내기 위해 어떤 개발 과정이 필요한 지, 아래 내용을 보시면 좀 더 쉽게 이해가 되실거에요! ABBYY의 새로운 버마어 인식 프로젝트를 소개합니다!  


 

( *참고 : ABBYY 파인리더는 현재 버마어 인식을 지원하지 않습니다. 

아래 내용은 ABBYY의 버마어 OCR 인식 프로젝트를 소개하는 것이며 향후 OCR패키지프로그램에서도 새로운 인식언어가 추가될 수 있습니다. ) 






동남아시아에 위치한 미얀마 연방공화국은 이전에 버마로 알려져있던 나라입니다. 버마는 1962년부터 2010년까지 군사 정권에 의해 통치되었지만, 지난 5년 간은 다른 나라들과 무역, 문화 링크를 구축하면서 외부 세계에 개발되었습니다. 



버마언어는 많은 방언을 포함하지만, 공식 문헌과 인쇄 매체에 사용되는 코어 알파벳을 공유합니다. 이 공유 알파벳은 33개의 자음과 12 보조 문자를 가지고 있습니다. 지역 방언들은 이외에 다른 글자들도 사용하며, 전체 글자의 수는 코어 알파벳의 약 3배입니다. 



다행히 ABBYY의 작업은 가장 대중적인 미얀마의 세가지 폰트를 최소 10포인트 이상의 크기로 인쇄된 텍스트를 인쇄 하는 것이었습니다. 텍스트 이미지들은 최소 300dpi 이상되는 그레이(회색조), 흑백 또는 칼라 이미지를 선택하였습니다. 





 


위 그림은 전형적인 버마어 텍스트의 모습입니다! 


이 프로젝트의 예비 단계에서 ABBYY는 OCR 정확도 75% , 최소 샘플에 대한 정확도 94% 의 인식률을 달성할 수 있었습니다. 


버마 텍스트는 각 자음이 기본 모음의 소리를 전달하는 소위 "알파실너버리(alphasyllabray)" 입니다. 다른 모음 소리는 특수한 문자들과 자음의 위,아래,전,후 또는 주위에 있는 발음 구별 부호를 사용하여 표현합니다. 흥미로운 사실은, 과거의 텍스트들이 야자수 잎에 씌어졌고 이것들은 직선 자국에 의해 쉽게 손상되기 때문에 대부분의 글자들은 '반원형' 으로 이루어져 있습니다. 


또한 버마어는 '톤' 이 있는 언어입니다. 높은 톤, 낮은 톤, 끽 소리가 나는 주요 세가지 톤과 억지모음 소리와 떨어지는 두 가지의 보조 톤이 있습니다.





버마어의 톤들도 글을 쓸 때 표현되어야 하기 때문에 버마어 텍스트들은 두가지의 발음기호를 주 글자의 위,아래에 효과적으로 배치하고 있습니다. 이런 두 계층 발음 기호 체계는 OCR 소프트웨어에 심각한 문제를 야기합니다! 문자의 일부 조합은 새로운 캐릭터를 형성하기 위해 함께 융합할 수 있어 상황은 더 복잡해집니다. 



OCR 작업에 대해 가장 대중적인 방식으로 설명하자면, OCR은 다음과 같은 처리를 합니다.  


OCR 소프트웨어가 이미지를 수신하면 먼저 이미지를 흑백으로 변화하고 왜곡을 보정합니다. 다음으로 문서에서 '텍스트' '그림' '표' 등 서로 다른 종류들에 대한 영역을 검출합니다. '텍스트' 영역은 다시 라인으로 나뉘어 지고, 라인은 다시 단어로, 단어는 글자 단위로 쪼개어집니다. 각 글자들이 인식된 후 문서의 아래 위로 재조립됩니다.



이미지 프로세싱 및 인식 영역 검출은 버마어도 다른 대부분의 언어와 동일하게 처리가 되지만, 버마어의 라인 검출은 다양한 발음기호 때문에 짧은 라인을 식별할 수 있도록 OCR 프로그램을 훈련하는 것이 어려워, 까다로운 작업일 수 밖에 없습니다. 



ABBYY의 알고리즘은 텍스트 라인을 특정 짓는 몇 가지 특성들을 사용하며, 이 특성 중 하나가 바로 '가상의' 베이스라인입니다. 

이 베이스 라인 위에 모든 다른 특성값들이 존재하게 됩니다. OCR 프로그램은 개별 문자에 대한 설득력 있는 가설을 생성하기 위해 베이스 라인의 위치를 알아야 합니다. 






OCR 프로그램은 베이스 라인들을 검출하기 위해 통계 데이터를 사용합니다.

필요한 통계를 수집하기 위해 문자들을 구성하는 검은 점으로 생성되는 히스토그램의 피크들을 찾습니다. 유럽어 알파벳에 대한 히스토그램에는, 베이스 라인 및 소문자의 높이에 대응하는 세 개의 선명하게 보이는 피크가 있습니다. 


그러나 버마어에는, 라인의 정상적인 폭 밖에 있는 여러가지 발음기호들 대문에 히스토그램상에 통계적으로 의미있는 추가적인 피크들이 생깁니다. 이런 이유로, 유럽어 텍스트를 대상으로 만들어진 ABBYY의 알고리즘은 버마어 텍스트 라인의 중요한 파라미터를 식별하는 데 실패할 수 밖에 없었습니다. 






위 그림을 보면 OCR 프로그램이 제대로 처음 두 개의 베이스 라인을 검출하지만, 세번째는 검출하는 데 실패한 것을 보실 수 있습니다. 



버마어 텍스트를 정상적으로 인식하려면, 라인 검출 알고리즘의 수정이 필요했습니다. 

라인이 검출되면, 단어와 단어 사이, 글자와 글자 사이의 간격을 찾고 시작할 수 있습니다! 이제 수평 히스토그램을 사용하여 큰 간격은 단어 사이의 공간으로, 작은 간격은 글자 사이의 공백으로 해석할 수 있습니다. 버마어 텍스트에서 간격을 검출하는것은 문제가 거의 없었습니다. 반면 타이어(Thai language)는 거의 간격이 없기 때문에 문제가 있기도 했습니다. (ABBYY의 OCR 기술은 태국어 또한 인식 가능합니다!) 


라인들이 작은 단위로 분리되면 이것들은 다시 독립적은 문자들로 구분합니다. 다시 히스토그램에서 글자 간격에 대응하는 피크들을 찾습니다. 간격들 중 일부는 확실하게 찾아지는 반면, 다른 것들은 여러 시행 착오에 의해 검증되어야 합니다. 




위 그림은 영어 단어에 대한 히스토그램입니다! 버마어 문서의 무수히 많은 반원형 글자들은 간격 검출이 어렵게 만드는 'False' 피크들을 많이 만들지만, 버마어에도 히스토그램 방식은 잘 동작합니다. :) 






이제 각 개별 문자들, 즉 그래핌(grapheme)을 인식합니다. 그래핌은 한 문자의 그래픽적인 표현이지만 유럽어에서 1대1로 대응되지는 않습니다. 한 그래핌이 한 개 이상의 글자에 대응이 될 수도 있고, (예를 들어 대문자 'C' 와 소문자 'c' 는 하나의 그래핌입니다.) 한 글자가 여러 그래핌으로 표현될 수도 있습니다. (예를 들어 'a'는 서로 다른 폰트의 그래핌으로 표현될 수 있습니다)





그래핌의 표준 목록은 없습니다. 

그래서 ABBYY는 각 그래핌에 대한 모든 가능한 글자들을 구체화할 수 있도록 수동으로 만들어 냅니다. 그래핌은 단어 후보가 생성된 이후의 단계에서 문자로 변환됩니다! 







앞서 언급한 바와 같이 버마어 텍스트에는 많은 발음기호 문자들이 있고, 그 중 많은 글자가 주요 글자와 융합되어 새로운 글자를 만들 수 있습니다.  발음기호 표시가 글자와 물리적으로 분리된 경우, 먼저 문자를 인식하고 다음으로 발음 기호를, 그 다음으로 인식결과를 결합하여 그래핌을 얻습니다. 발음기호 표시와 글자가 개별 단위를 형성한다면 전체를 인식합니다. 


융합 글자들은 버마어 문자 체계에서 아주 흔해서 ABBYY 는 3,500개의 새로운 그래핌을 인식하도록 OCR 기술을 훈련해야만 했습니다! 


그래핌을 인식한 후 ABBYY는 그것을 유니코드 문자들로 번역하고 단어들을 만들어야 합니다. 이 과정은 유럽어에서는 아주 간단해서 한 글자씩 인식을 해서 유니코드로 변경하면 됩니다. 그러나 버마어의 융합 글자들은 특별한 처리를 해줘야 합니다. 



Windows가 글자들을 합하기 위해 버마어 글자들이 키보드로부터 입력되어야 하는 특정한 순서가 있습니다. 어떤 글자들은 Windows가 음절의 시작 부분에 입력할 수 있도록 다른 모든 글자들이 타이핑 된 후에 타이핑되어야 합니다. 




예를 들어 텍스트 편집기에서 이 단어를 입력할 때, 사용자는 다음의 순서로 문자를 입력해야 합니다. 






ABBYY는 이런 타이핑 룰을 따르기 위해서 특별한 보정 모듈을 추가했습니다. 모든 텍스트가 인식되면 모듈이 다시 인식 결과를 읽어서 글자 순서가 맞는지를 검사합니다. 버마어는 잘 구조화된 언어이며, 이러한 검사를 수행할 수 있는 충분한 형식적인 규칙이 있습니다. 


단히 버마어 텍스트를 OCR로 인식할 때 ABBYY의 OCR 기술이 직면한 주요 문제들을 간단하게 설명했습니다. ABBYY는 이 프로젝트의 97% 인식 정확도를 만들어내면서 완료하는데 4개월이 걸렸습니다 (고객의 요구사항은 최소 94% 의 정확도) 향후 더 많은 버마어 폰트들이 추가 될 예정입니다! 




 





레티아 블로그를 방문해주셔서 감사합니다! 레티아 블로그에서만 보실 수 있는 다양한 OCR 이야기, 앞으로도 많은 관심부탁 드립니다. 



더 많은 OCR 솔루션이 궁금하시다면? 


> 레티아 홈페이지 바로가기 


> 세계 최고의 OCR 프로그램 'ABBYY 파인리더' 무료 시험판 사용해보기 





블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,


OCR 제대로 활용하기. 

ABBYY FineReader 활용 사례. 

타이핑이 어려운 외국어, 문자인식 기능으로 손쉽게 텍스트화! 


OCR 솔루션 전문기업 레티아에서 만날 수 있는 문자인식 프로그램 

'ABBYY FineReader' 활용사례를 알아보려고 합니다. 





FineReader (파인리더)는 한글,영어,중국어,일본어를 포함하여 

전세계 190개의 언어를 인식할 수 있습니다. 


외국어로 된 문서 변환이 필요하신가요? 


한국에서 사용하는 키보드로는 입력이 불가한 아랍어, 태국어, 히브리어 등의 외국어 문서도 

클릭 한번으로 쉽게 '텍스트' 로 변환할 수 있습니다. 



실생활에서도 유용한데요, 한번 어떻게 활용 가능한지 볼까요? 





ABBYY 직원들이 한국에 올때 자주 러시아 초콜렛을 선물로 주는데요~ 

(러시아 초콜렛 엄청 맛있어요..) 




초콜릿 상자 뒷면입니다. 

만약 이 내용이 정말 중요한 내용이라 '번역' 을 해야한다면.. 

러시아어로 써있는데, 제가 러시아어를 하나도 모른다면.. 


어떻게 해야 할까요? 


바로 지금이 ABBYY FineReader 를 사용할 타.이.밍!! 



스마트폰 카메라로 사진을 찍은 후 바로 

OCR프로그램 ABBYY FineReader 12를 실행했습니다!  







가장 중요한 인식언어 설정! 

러시아어를 인식해야하므로, '러시아' 어를 선택해주세요


(인식언어 기본설정은 '한국어 및 영어'로 되어 있답니다`) 







왼쪽은 원본 사진이 뜨구요~ 

오른쪽은 파인리더가 인식한 텍스트가 뜨는 창입니다.

 

사진 속의 러시아어들이 곧바로 텍스트가 되었는데요. 


오른쪽 화면의 텍스트를 복사해볼게요. 

번역기는 만인의 번역기! :) 구글 번역기를 사용해볼게요~~ 







파인리더가 인식한 텍스트를 복사해서, 

구글 번역기에 붙여넣기 해보았습니다. 


이 텍스트들은 성분을 뜻하는 거였군요. 

칼로리, 유통기한까지 확인할 수 있으니 유용한 정보습득이네요 :) 







다른 영역의 인식된 텍스트도 복사해보겠습니다. 







마찬가지로 구글 번역기에 붙여 넣기를 해봤는데요~ 


번역이 잘 되는 걸 보니

ABBYY FineReade가 제대로 텍스트를 인식한 것 같습니다!



이렇게 OCR프로그램을 활용해서 

간편하게 사진 속 글자를 텍스트로 바꿔보았습니다! 


OCR 이 없었더라면, 전 알지도 못하는 러시아어를 

일일이 찾을 수 밖에 없었겠죠 T_T 







전세계 190개 언어를 인식할 수 있는 OCR 프로그램 

ABBYY FineReader 12 !!


여러분도 지금 바로 사용해보세요.




카메라로 촬영한 사진 문서변환 리뷰 바로가기 ---> 클릭 



더 많은 기능 보러가기 ->>> 클릭 


국내 유일 무료 OCR 서비스 : ROSE 문서인식 서비스 바로가기 ->>> 클릭  




ABBYY FineReader 12 30일 시험판 다운로드 ->>>  클릭 




블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,


스마트폰 카메라를 휴대용 스캐너 대용으로 활용해보자. 





안녕하세요, ABBYY 공식파트너 레티아입니다. 

저희 레티아에서 OCR 프로그램 ABBYY FineReader 의 다양한 기능을 소개해드리고 있는데요, 




카메라로 촬영한 사진을 


문서로 변환 가능! 




디지털 카메라 또는 스마트폰 카메라로 촬영한 사진을 

Word 문서로 변환할 수 있다는 사실 알고 계셨나요? 



ABBYY FineReader 12는 카메라로 촬영한 사진도 텍스트를 추출하여 

편집 가능한 문서로 변환이 가능한데요. 


촬영 시, 아주 작은 차이로도 좀 더 정확한 결과물을 얻을 수 있습니다. 


정확한 OCR 인식을 위해선, 제대로 '찍는' 것이 중요합니다. 

촬영 팁을 먼저 알려드릴게요~ 








* 촬영 시 기본 주의사항 


- 원하는 문서의 모든 내용을 화면에 꽉차게 찍기, 모서리가 잘리지 않았는지 확인하세요. 


- 손떨림 주의! 부들부들 떨면 글자도 떨어요~ 


- 이미지가 흐릿하진 않은 지 확인! 초점 조절 실패로 이미지가 흐릿하진 않은지 확인하세요, 

육안으로 보기에도 어떤 글자인지 알 수 있어야 OCR프로그램도 알 수 있어요~ 




* 촬영 시 아래의 기본적인 사항만 주의해주시면 훌륭하게 변환된 문서를 얻으실 수 있습니다 :) 






빛번짐 주의! 

광택이 있는 용지를 촬영할 때는 플래시를 OFF. 

문서에 그림자가 생겨서 텍스트를 가리지 않게 해주세요~ 





화이트밸런스를 맞춰주시면 더 좋아요~ 


 



충분한 빛(조명) 이 있는지 확인하면서 촬영해주세요~ 

너무 어두운 사진은 OCR에 부적합 합니다~ 




* 디카로 문서를 촬영할 때, 어떤 기능을  가진 디카가 좋을까요? 


- 500만 화소 이상 

- 플래시모드 비활성화 가능

- 광학 줌

- 손떨림 방지 기능

- 자동 초점 빔 또는 수동 초점 빔

- 수동조리개 제어 또는 조리개 우선 모드 



- 프레임에 문서 전체를 맞추고 촬영하세요~ (화면에 문서를 꽉차게!) 

- 문서 중앙에 초점을 맞춰주세요~





기본적인 사항만 유의해서 촬영한다면 OCR 인식률을 더 높일 수 있습니다. 





내손안에 카메라가 휴대용 스캐너로! 


항상 들고 다닐 수 없는 스캐너! 당장 급하게 문서 변환이 필요하더라도 이제 당황하지 마세요! 

휴대폰 카메라, 디지털 카메라로 촬영한 사진도 OCR 인식이 가능합니다! 







무료 OCR 서비스 이용하러 가기 ->>> 클릭 


ABBYY FineReader 12 시험판 다운로드 ->>>  클릭 






ABBYY FineReader 12 로 손쉽게 문서화 가능. 

좀 더 자세한, 사진을 문서로 변환 리뷰 바로가기 ---> 클릭 


더 많은 기능 보러가기 ->>> 클릭 




감사합니다.



블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,

OCR이란? 

쉽고 단순한 OCR 프로그램 사용법 + 실생활에서도 유용한 OCR 활용팁을 소개합니다. 



스마트폰 카메라로 촬영한 사진입니다. 





대표적인 OCR 프로그램 ABBYY FineReader 프로그램을 실행 후, 위에서 찍은 사진이미지를 불러왔습니다. 

이미지를 불러옴과 동시에 문자인식(OCR)을 실행합니다. (옵션에서 설정 해제도 가능합니다.) 






인식 시간은 약 3초정도 걸렸습니다. 

촬영한 사진과 동일하게 줄바꿈도 되어 있고, 인식도 잘 되었네요. 

(왼쪽 화면에는 원본 사진이, 오른쪽 화면에는 인식된 텍스트 창이 뜹니다.)



초록색 네모칸을 보시는 것과 같이 '텍스트' 영역만 자동으로 판단해서

 띄어쓰기까지 동일하게 문자인식을 합니다.

이렇게 문자인식된 결과는 클릭 한번으로 Microsoft word, excel, PDF파일 등으로 저장할 수 있습니다. 


 



이번엔 이 종이문서를 문서화 해볼텐데요 

한 장 정도면 어떻게든 타이핑 하겠는데, 이런 문서가 몇십장 (또는 몇백장) 된다면 정말 힘들겠죠. 


이 때가 바로 OCR 프로그램을 사용할 타이밍! 

마찬가지로 ABBYY FineReader (파인리더) 를 실행합니다. 






왼쪽화면이 스캔한 이미지이고, 오른쪽 화면이 텍스트로 변환된 결과물입니다. 

그냥 보기에도 똑같은데요 ㅎㅎ 


문서 형식 그대로, 가장 유사한 폰트로 변환해주며 표도 변환 가능합니다.

(센스있게 표 색깔까지 동일하게 변환되었네요!) 








텍스트로 변환된 결과를 확대해봤습니다! 

ABBYY 파인리더 아주 똑똑하죠? 

스캔 후 문서를 인식하는 시간은 3~5초 정도 걸렸습니다. (PC 사양마다 다를 수 있음) 



오타는 제일 상단 머릿글이 있었구요 (텍스트가 아닌 그림으로 인식되었음)

그 외는 오타 없이 깔끔하게 인식이 잘 되었네요. 


문서의 해상도, 구조에 따라 인식률(오타율)이 있을 수 있지만, 

ABBYY 파인리더는 정말 높은 인식률을 자랑합니다! 

시험판으로 가지고 계신 문서를 먼저 테스트해보실 수 있습니다. 

 






양면으로 스캔된 이미지도 자동으로 분할하고, 인식할 수 있는데요~ 





양면  스캔 이미지를 자동으로 2페이지로 변환하고, 

기울어진 이미지도 마치 처음부터 똑바르게 스캔된 것 처럼 

자동으로 보정되었습니다! 


 

 


(전) 기울게 스캔된 이미지 




(후) ABBYY FineReader (파인리더) 자동 보정 이미지 





페이지 방향을 자동으로 검색해서 거꾸로 스캔되어도, 이미지가 반대로 되어 있어도 자동으로 인식하고 변환할 수 있습니다.

책과 같이 양면으로 인쇄되어있는 경우 '맞붙은 페이지 분할' 기능으로 자동으로 2페이지로 나뉘어 인식할 수 있습니다. 




기본적은 FineReader 프로그램의 특징을 알아봤습니다.

지금 알아본 기능 외에도 다양하고 편리한 기능들이 많이 있는데요~ 


 자세한 내용은 아래 링크에서 확인하실 수 있습니다. 




제품 기능 소개 및 시험판 바로가기 




블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,



안녕하세요! 레티아입니다~

직장인 문서관리 고민! 이렇게 해결해보세요 1탄입니다 ^_^; 




여러분 모두 문서작업 많이 하시죠? 

문서와 함께 하는 일상이 너무나 익숙한 시대인것 같아요 :) 

또 사용하는 문서의 종류도 굉장히 다양한데요~ 

하드카피 형식의 문서부터 디지털 이미지(스캔 또는 사진)문서,

PDF 파일까지 두루두루 다양하게 사용하고 있는데요, 


그런데, 

혹시 문서 작업에 소요되는 시간을 낭비하고 계시진 않나요? 



예를 들어, 

문서의 내용을 다시 활용하기 위해 타이핑을 하거나, 표를 다시 만들고 계시진 않나요?

사실 이런 작업 모두 불필요한 작업이라고 할 수 있습니다. ㅠㅠ! 

문서 작성에 쓰이는 불필요한 시간을 최소화하는 방법은 분명 있습니다~! 오늘 그 방법에 대해서 알아보려고 하는데요. 


여러가지 문서와 포맷들이 단일 형식으로 잘 정돈된 서재에 차곡 차곡 저장되어 있다고 생각해보세요 :) 

필요한 문서는 즉각적으로 찾을 수 있고 다양한 파일 포맷은 하나의 포맷으로 저장되어 있다고 상상해보세요! 


생각만해도 속이 시원하지 않나요? :)




OCR 소프트웨어 ABBYY FineReader는 이러한 작업을 빠르고 효율적으로 수행할 수 있습니다. 

여러분은 전달 받은 문서를 모두 ABBYY FineReader 를 사용하여 PDF파일로 생성하기만 하면 됩니다.  

ABBYY FineReader가 문서 전체를 인식해서 모든 단어와 각종 일련번호 등을 검색하고 찾을 수 있도록 만들어줍니다! 







스캐너로 스캔한 이미지, 디지털 카메라로 촬영한 이미지 모두 가능합니다. 

(*자동급지장치가 있는 스캐너를 사용하면, 자동으로 문서를 차례대로 스캔하기 때문에 더 편리하겠죠?)


 

(* ABBYY FineReader 기업용 버전은 

폴더 속 파일을 순차적으로 변환하는 '자동화 기능'도 제공합니다. )




스캐너가 있으신가요? 

ABBYY FineReader 는 스캐너 인터페이스와 호환되므로, FineReader에서 곧바로 스캔을 하고 이미지를 보정할 수 있습니다. 

이미 스캔된 이미지 파일이 있는 경우에는, 이미지파일을 모두 선택해 한번에 불러 올 수도 있습니다. 스캔하자마자 곧바로 Word 또는 검색 가능한 PDF파일로 생성이 가능합니다. 







스캐너가 없으신가요? 

괜찮습니다. !! 

위 화면 처럼 

라로 깨끗하게 촬영한 이미지도 문자인식이 가능합니다! 










스캔 문서를 엑셀로 열어 데이터를 분석하고 싶으신가요? 

ABBYY FineReader 12를 열고 필요한 표(table)를 클릭한 후 <복사> 기능을 선택해보세요. 

선택하신다음, 클립보드에서 엑셀로 옮기기만 하면 됩니다!! 





ABBYY FineReader 12는 문서 처리에 써야하는 시간과 노력을 드라마틱하게 줄일 수 있습니다. 

수고로운 타이핑 작업, 비효율적인 검색, 색인 작업을 없애주며 ABBYY FineReader 12를 열고 클릭 몇번만 하면 모든 작업을 간단하게 사용할 수 있습니다. 





사용자를 위한 쉬운 인터페이스.

세계적인 수상경력을 자랑하는 지능형 문자인식 프로그램. 







ABBYY FineReader 12, 지금 레티아에서 만나보세요. 




바로가기 




 

블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,


ABBYY 개발자 인터뷰 4탄



ABBYY PDF Transformer+ 

The Loyal User : A Testing Engineer 

















by llia lsaev, 

ABBYY Testing Engineer



"나는 제품 출시할 때 까지 면도를 하지 않을거야 :)  




새로운 소프트웨어 제품을 테스트하는 직원들은 회사의 어떤 직원들보다 충성심이 강하다고 얘기할 수 있습니다. 


왜냐하면 개발 기간 내내 버그, 오류, 검은화면과 프리즈들을 마주쳐야 하기 때문에 우리는 직업에 대한 충성심이 필요합니다 :) 다른 사람들보다도 집중적으로 제품을 다루는 것이 필요하며, 출시하고, 설치하고, 버그를 리포트하고, 리포트된 버그를 종료하는 일을 매주 수백번 하게 되어 우리의 충성심도 매일 테스트 되고 있습니다. 






테스트 엔지니어가 가장 중요하게 생각할 것은 테스터와 개발자가 긴밀한 협력 작업을 해야한다는 것을 기억하는 것입니다. 테스터와 개발자 사이에는 많은 서로간의 교류가 필요하며, 페이스를 유지하기 위해서 제품에 대한 충성심을 가지는 것도 중요합니다. 




테스터와 개발자간의 지속적인 대화가 협력의 사이클을 만들어 냅니다. 그리고 정말 좋은 개발자는 테스터에게 작성한 것을 확인하도록 해서 이런 사이클의 속도를 높이는 데 일조를 합니다. 추가로, 자동화 테스터 과정이 이런 프로세스를 짧게 만든다고 말하는 사람들도 분명 있을 겁니다. ABBYY 제품은 실제 사람이 사용할 것이라는 것을 기억해야 합니다. 그래서 실제 사람의 눈으로 소프트웨어를 직접 보는 것이 중요합니다. 




마지막으로 테스터는 유머감각이 필요합니다!! 

한번은 ABBYY PDF Transformer+ 제품 작업을 할 때 동료들에게 사진을 보며 이렇게 말했습니다. "나는 제품 출시할때까지 면도를 하지 않을 거야" 그러나 PDF 파일 포맷은 매우 복잡하기 때문에 작업을 마칠 때까지는 제 생각보다 훨씬 오랜 시간이 걸렸습니다. 제품이 출시 할때쯤 제 턱수염은 정말 많이 자라있었죠! 







ABBYY 개발자 인터뷰는 계속됩니다 

기대해주세요 ^^ 


- 레티아 드림 



    






What is ABBYY PDF Transformer+ ?


 시험판 다운로드 및 사용 리뷰 보러가기 










블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,


ABBYY 개발자 인터뷰 3탄


ABBYY PDF Transformer+ 

Who's at Fault When a PDF Problem Pops UP?        













by llia lsaev

ABBYY Testing Engineer



"제가 자신있게 말할 수 있는 건, ABBYY팀은 사용자 중심적인 소프트웨어를 위해 힘쓰고 있다는 사실입니다"



PDF파일의 문제가 있는 경우 PDF 솔루션의 사용자들은 PDF 소프트웨어의 잘못이라고 거의 자동으로 생각하게 됩니다. 

반대로 개발자들은 보통 PDF파일이 잘못된 것이라고 생각합니다.그럼 테스터에게 같은 질문을 하면 어떻게 답변할까요? 

아마 '파일? 혹은 소프트웨어? 50대 50' 이라고 말할겁니다. 




왜 50 대 50 이라고 답변할까요? 


저와 같이 PDF솔루션을 반복적으로 테스트하는 테스터들은 PDF포맷이 정말 복잡해서 PDF 파일 자체가 잘못될 확률이 크다는 점을 알게됩니다. 그러나 반면 버그의 가능성도 있고, 사용자의 사용 오류에 의한 문제일수도 있다는 것도 알 수 있습니다. 소프트웨어로 PDF파일을 생성할 때 부터 잘못 만들어졌을 수도 있고,혹은 PDF파일의 복잡성 때문에 사용자가 작업을 준비할때 잘못된 셋팅을 선택할 가능성도 있습니다. 



예를 들어, 오른쪽에서 왼쪽으로 써 나가는 아랍어와 같은 언어를 선택하고 이것을 다시 왼쪽에서 오른쪽으로 가도록 재설정하는 것을 잊어버리게 되면 PDF 파일은 잘못 만들어질 수 있습니다. 이 모든 것들은 PDF 파일에 이상이 없더라도 파일을 받은 사람이 파일을 열고 작업할 때 문제가 발생할 수 있다는 것을 의미합니다.






이런 상황에서 사용자는 위와 같이 확인할 수 가 있습니다. 

Adobe Acrobat Pro로 문제가 되는 PDF파일을 열고 텍스트를 복사하여 워드나, 메모장에 붙여넣기를 해보면 텍스트가 네모 박스 또는 이상한 모양의 글자처럼 보여질 경우 이것은 소프트웨어의 잘못이 아니고 PDF 텍스트 레이어가 손상된 것입니다. 


이런 점을 염두에 두었을 때, 저는 ABBYY팀은 정말 사용자 중심적인 소프트웨어 개발에 힘쓰고 있다고 자랑스럽게 말할 수 있습니다. 

ABBYY PDF Transformer+는 PDF 파일의 텍스트레이어가 손상된 경우에도 다시 정확하게 텍스트를 추출할 수 있습니다. 


저희는 이런 기술 발전에 힘쓰고 있습니다. 














ABBYY 개발자 인터뷰는 계속됩니다 

기대해주세요 ^^ 


- 레티아 드림






What is ABBYY PDF Transformer+ ?


 시험판 다운로드 및 사용 리뷰 보러가기 




블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,



ABBYY OCR SDK 샘플 프로젝트 4탄 - 문서 자동 분류 



글로벌 점유율 및 성능 1위 OCR 전문 벤더 ABBYY 의 OCR 엔진 'ABBYY FineReader Engine 11' 본격 탐구! 샘플프로젝트 시리즈 4탄입니다. 


저희 레티아에서 시리즈로 'ABBYY FineReader Engine 11'의 샘플 프로젝트에 대해 소개해드리고 있는데요, 이 엔진은 설치 즉시 다양한 동작을 확인할 수 있는 샘플 프로젝트를 제공합니다! 개발자 분들께서는 이 샘플 프로젝트를 꼭 확인하셔서 OCR API를 활용하시는데 도움을 되기를 바랍니다! 





지난 포스팅에서 다룬 내용 


1탄 - 프로세싱 프로파일 바로가기

2탄 - 멀티코어 프로세싱 바로가기

3탄 - PDF Export 프로파일 바로가기 





이번 4탄에서는 문서분류(Classification) 기능에 대해 알아볼텐데요,

아마 많은 분들께서 궁금해하셨던 내용이 아닐까 싶습니다. 



(↑ ABBYY FineReader Engine 11 (SDK) 문서 분류 기능 ) 




ABBYY FineReader Engine 11이 이미지 문서분류에 어떻게 사용될 수 있는지 설명할텐데요, 

FineReader Engine을 활용하면 이미지 배치에 대한 분류작업을 할 수 있습니다. 

선 트레이닝된 분류 모델(Pretrained Classification Model) 은 다음 언어에 적용됩니다. 


영어 / 한국어/ 중국어 / 일본어 / 프랑스어 / 독일어 / 이탈리아어 / 포르투갈어 / 스페인어 / 러시아어 




어떻게 동작하는 지, 동작 방식에 대해 알아보겠습니다. 


선트레이닝된 분류기 (Pretrained Classifier)를 이용해서 문서를 분류하려면 


1. 분류할 이미지의 폴더를 선택합니다.

2. 인식 언어를 설정합니다. *classified document windows 에서 언어리스트를 볼 수 있습니다. 

3. Classification 버튼을 클릭합니다. 










문서 분류를 위해서 FineReader Engine 을 트레이닝 하려면 


1. 분류를 원하는 모든 타입의 이미지가 포함된 데이터베이스를 생성합니다. 

데이터베이스 생성은 Help 파일의 “Classifying Documents “를 참고 하시기 바랍니다. 

이미지를 문서 타입으로 명명된 폴더들에 모으고 모든 폴더를 하나의 폴더에 넣습니다. 

2. 문서의 언어를 선택합니다.  

3. “Train” 버튼을 클릭합니다.

4. “다이얼로그 박스에서 폴더 위치를 지정합니다. 

5. 분류 클래스의 목록을 확인하고 “Training”을 클릭합니다.  

6. 분류 트레이닝이 끝나면 문서를 새로 만들어진 분류기(Classifier)로 분류 할 수 있습니다. “User –trained classified”를 선택한 후 “Classification”을 클릭합니다.  





↑ 유튜브 동영상 바로가기 : https://youtu.be/ZsTYhmeBBgU


이미지 문서 분류 사용에 관한 자세한 내용은 동영상으로도 확인하실 수 있습니다^^  









A comprehensive OCR SDK for software developers.


More value for your software solution!!! 


시험판 신청 및 제품 소개 바로가기 

 







블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,


ABBYY OCR SDK 샘플 프로젝트 3탄 - PDF Export 프로파일 



글로벌 점유율 및 성능 1위 OCR 전문 벤더 ABBYY 의 OCR 엔진 'ABBYY FineReader Engine 11' 본격탐구! 샘플프로젝트 시리즈 3탄입니다. 


OCR 엔진하면 어렵게 생각하시는 개발자님들이 많으실텐데요. ABBYY의 OCR 엔진은 설치 후 즉시 동작을 확인할 수 있는 쉽고 간단한 샘플프로젝트를 다양하게 제공하고 있습니다. 이 샘플프로젝트를 통해서 개발자분들께서  OCR엔진(ABBYY FineReader Engine)에 대해 좀 더 쉽게 이해하실 수 있습니다. ^^


레티아에서 알려드는 샘플 프로젝트 놓치지 마세요~ 





지난 포스팅 

1탄 - 프로세싱 프로파일 바로가기

2탄 - 멀티코어 프로세싱 바로가기





3탄 포스팅은 바로 <PDF Export 프로파일>입니다.


이 샘플프로젝트는 OCR 엔진으로 인식 후, PDF 포맷으로 저장할 때 

PDF Export 프로파일을 사용하면 어떤 장점이 있는지 보여줍니다. 


이 샘플은 특정 폴더의 이미지들을 처리한 뒤 

그 결과를 일부 파라미터가 최적화된 PDF포맷으로 저장합니다. 


(예 : 품질이 가장 좋은 파일, 가장 빠른 속도로 생성된 파일, 

파일 사이즈가 가장 작은 파일 및 모든 파라미터가 균형이 잡혔을 때 생성되는 파일 등) 



각 파일의 사이즈와 각각의 처리 속도를 비교하고, 비교 결과는 다이어그램으로 표시됩니다. 







동작하는 방식은 크게 아래의 단계로 나눠집니다. 


1. 인식할 이미지 폴더를 선택합니다.


2. 인식할 이미지의 인식언어를 선택합니다. 


3. PDF 포맷 저장의 파라미터 설정합니다. 

 

- Text export mode  :

 페이지 이미지 위에 텍스트, 

페이지 이미지 밑에 텍스트,

 이미지만 저장, 텍스트만 저장 등을 선택할 수 있습니다. 


- Colority : 

원본 이미지의 색상을 유지 또는 그레이로 저장 선택할 수 있습니다. 


- 그림 해상도 : 

원하는 해상도를 설정할 수 있습니다. 


-  압축 여부 : 

ABBYY OCR 엔진이 지원하는 고품질 MRC 압축 사용 여부를 선택할 수 있습니다. 


- PDF/A 준수 :

 PDF, PDF/A-1a, PDF/A-1b 포맷을 지원합니다. 


5. 이제 Start 버튼을 눌러 작업을 실행합니다. 


5. <파일생성시간 비교 다이어그램> 아래 각각의 저장 시나리오와 결과 밑의 

'open file' 을 눌러 결과파일을 볼 수 있습니다. 






↑유튜브 동영상 바로가기 : https://youtu.be/Ke1QhbB3-JY


좀 더 자세하게 보고싶으시다면, 데모 동영상으로 확인해보세요 ^^ 









A comprehensive OCR SDK for software developers.


More value for your software solution!!! 


시험판 신청 및 제품 소개 바로가기 

 






 

블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,