IT/PC 정보

이미지의 글씨를 텍스트로 추출하자!

네스터TV 2019. 12. 10.
반응형


오늘의 정보 포스팅!
텍스트 추출하는 방법에 대해 알려드리려고해요!
일명 OCR 이라고 하는데 들어는 보셨나요?

OCR = Oprical Character Recognition

OCR 이란 광학식 문자판독이라는 건데
스캔된 이미지나, PDF 같은 형태의 수정이 불가능한
글씨를 분석하여 수정이 가능한 텍스트나 워드 형태의 파일로 결과물을 만들어 주는것이랍니다!

여러일들을 하다보면 이미지 또는 PDF 형태의 파일이나 문서를 텍스트로 변환해야하는 경우가
발생하고는 하는데요. 물론 일일히 타이핑 해서 키보드 자판을 두드릴 수도 있지만.
시간이 많이 걸리고 너무 번거로운 일이라서
바로바로 텍스트로 변환되어서 사용할 수 있으면 매우 편리하겠죠?


이 OCR이라는건 조금만 검색해보셔도 여러 프로그램들이 존재하는데요
당연히 무료로 변환해주면 더 좋겠죠?
이 기능을 구글에서도 지원해주고 있다는 사실 알고 계셨나요?

 

우선 구글 드라이브로 가서 텍스트 추출이 필요한 이미지나 PDF를 등록해보도록 해보죠!

https://drive.google.com/drive/my-drive

 

Google 드라이브 - 모든 파일을 한 곳에서

하나의 계정으로 모든 Google 서비스를 Google 드라이브로 이동하려면 로그인하세요.

accounts.google.com

위 구글 드라이브에 접속하여 본인 계정으로 로그인하고 텍스트 추출이 필요한 파일을
업로드하여 보세요.

전 위와같이 테스트.jpg 파일과 테스트.pdf 파일 두가지를 등록해두었어요!
이미지나 pdf 모두 잘 변환 되는 모습을 보여드려야하니까요^^

 

자 위와같이 추출하고자 하는 파일에서 마우스 오른쪽 버튼을 누르시면 위와같은
메뉴가 나타나고 google문서로 열어주도록 할께요

파일 - 마우스오른쪽버튼 - 연결앱 - google 문서

이걸로 변환 끝!

당황하셨나요? 그런데 진짜 끝이에요
결과물 보도록 할께요!

위 사진은 PDF  파일을 구글문서로 불러 온  모습입니다.
PDF 리더 로는 텍스트 추출이나 변환이 불가한 PDF 파일이 정상적으로 텍스트로
변환되어 선택도 되고 수정도 가능한 모습으로 변경되었습니다.

위 이미지는 JPG 이미지 파일의 써져있던 글씨가 텍스트로 변환된 모습입니다.
윗쪽이 본래 이미지이고 밑에 드래그로 선택한 택스트가
이미지에서 글씨만 추출된 텍스트 입니다.

굉장히 간단하지 않나요? ​

구글문서를 통한 텍스트 추출은 거의 완벽하다고 무방할 정도의 인식율을 보여 주었어요
변환속도도 다른 도구들에 비하면 빠른편이고, 퀄리티 또한 큰 이상없이
원하는 결과물을 내어주니 일일히 타이핑 하는것보단 훨씬 좋네요^^

그리고 이 외에도  텍스트 추출 프로그램이나 방법 등이 더 있지만 
궂이 비교글을 작성하지 않은 건
이것 저것 써보면서 스트레스 받는것보다 가장 이상적으로 결과물을 내어주는
거 하나만 알고 계셔도 충분히 도움이 되실 것이라 판단했답니다

글씨를 추출하고 싶을땐 이 방법을 꼭 사용해보세요!

와드한번 박고 가즈아!!!!!

반응형

댓글

💲 추천 글