도서관 시민프로젝트 공유서재

플랫폼 소개

AI OCR(Optical Character Recognition, 광학 문자 인식)은 인공지능과 머신러닝 기술을 결합하여 이미지나 문서에서 텍스트를 인식하고 추출하는 혁신적인 기술입니다.

이 기술은 특히 고문헌과 같은 역사적 기록을 디지털화하고 보존하는 데 큰 역할을 하고 있습니다.

AI OCR은 기존의 OCR 기술을 뛰어넘는 정확성과 효율성을 제공하며, 다양한 산업 분야와 연구 분야에서 폭넓게 활용되고 있습니다.

고문헌에 대한 AI OCR의 학습 프로세스 다음과 같은 주요 단계로 구성됩니다:

1이미지 획득

디지털화할 고문헌과 고신문을 수집합니다.
2데이터 선별 및 AI OCR 인식

수집된 이미지에서 텍스트 데이터를 선별하고, AI 기반 OCR 기술을 사용하여 문자를 인식합니다. 이 단계에서는 이미지 전처리(노이즈 제거, 명암 조정, 기울기 보정 등)를 통해 이미지 품질을 향상시킵니다.
3검수 및 딥러닝 학습

인식된 텍스트 데이터를 검수하여 오류를 수정하고, 이를 딥러닝 모델 학습에 활용합니다. 검수 과정에서 수집된 피드백을 통해 AI 모델의 정확성을 지속적으로 개선합니다.
4신규 모델링 후 재인식

검수와 학습을 통해 개선된 모델을 사용하여 원본 이미지에서 텍스트를 다시 인식합니다. 이로 인해 인식 정확도가 향상됩니다.