공유서재 도서관 시민프로젝트

옛 문헌 디지털화 플랫폼: 시민의 손길로 되살리는 과거의 기록

도서관 시민프로젝트는 1895년부터 1930년 사이에 발행된 옛 문헌들을 디지털화하여 현대에 되살리는 것을 목표로 합니다.

AI 기반 OCR(Optical Character Recognition) 기술을 활용하여 고서의 텍스트를 1차적으로 추출하고, 일반 시민들이 참여하여 추출된 텍스트를 교정하는 과정에 함께합니다.

이 프로젝트는 역사적 기록의 보존과 접근성을 향상시키며, 시민 참여를 통해 정확성을 높이는 혁신적인 방법을 제시 합니다.

대상자료

도서관 시민프로젝트를 통해 디지털화하는 대상 자료의 기준은 아래와 같습니다.

  • 국립중앙도서관 단행본 중 원문 구축된 자료
  • 1895년부터 1930년까지 발행된 자료
  • 저작권이 해결된 외부공개자료
  • 한국어, 중국어, 일본어 자료

주요 특징

  • AI OCR 기술 활용

    AI OCR 기술은 다양한 문자과 문서 레이아웃을 처리하여 높은 정확도로 텍스트를 추출합니다.

    특히, 손상되거나 희귀한 고서의 텍스트를 디지털화하는 데 유용합니다.

  • 시민 참여 기반 교정

    시민들은 공유서재에 접속하여 각 페이지별로 AI가 추출한 텍스트를 읽고 교정할 수 있습니다.

    이 과정은 쉽고 직관적으로 설계되어 있어 누구나 참여할 수 있습니다.

    시민들의 교정 활동은 텍스트의 정확성을 높이는 데 큰 기여를 합니다.

  • 역사적 기록의 보존과 접근성 향상

    디지털화된 텍스트는 연구자, 교육자, 학생, 그리고 역사에 관심 있는 일반인 모두에게 쉽게 접근 가능하게 됩니다.

    이를 통해 소중한 역사적 기록을 보존하고, 다양한 분야에서 활용할 수 있는 기회를 제공합니다.

기대효과

  • 국립중앙도서관 단행본 중 원문 구축된 자료

    시민들의 참여로 AI OCR의 한계를 극복하고, 정확한 텍스트 기록을 제공합니다.

  • 역사 연구 지원

    시민들의 참여로 AI OCR의 한계를 극복하고, 정확한 텍스트 기록을 제공합니다.

  • 국립중앙도서관 단행본 중 원문 구축된 자료

    시민들의 참여로 AI OCR의 한계를 극복하고, 정확한 텍스트 기록을 제공합니다.

도서관 시민프로젝트는 과거의 기록을 미래로 이어주는 중요한 다리 역할을 합니다. 시민 여러분의 작은 참여가 소중한 역사적 자산을 보존하고, 후세에 전하는 큰 힘이 됩니다.

함께 역사적 기록을 지켜나가는 여정에 동참해 주세요.