국가서지를 활용한 주제명 자동 분류 적용방안 연구
| KOS 유형 | 분류체계 |
|---|---|
| 관련 KOS | 주제명 자동 분류 |
| 수요기관 | 국립중앙도서관(문화체육관광부) |
| 공고기관 | 조달청 서울지방조달청 |
| 사업목적 | KOS 활용 |
| 사업년도 | 2022 |
| 사업기간 | 5개월 |
| 사업예산 | 70,000천원 |
| 사업ID | RFP-1-252 |
사업개요
사업명
국가서지를 활용한 주제명 자동 분류 적용방안 연구
사업 세부목적
ㅇ 목차, 서지, 주제명, 원문 등 국립중앙도서관에서 그간 구축해 온 방대한 원천 데이터를 활용하여 자동 분류 알고리즘을 설계하고 이를 검증함으로써 적용 가능성과 개선방안 제시
사업기간 및 예산
- 사업기간 : 계약체결일로부터 5개월
- 소요예산 : 70,000천원
사업내용
과업 내용
ㅇ 국가서지를 활용한 주제명 자동 분류 적용방안 연구
ㅇ 목차, 서지, 주제명, 원문 등 국립중앙도서관에서 구축한 원천 데이터를 활용하여 자동 분류 알고리즘을 설계하고 검증하여 적용 가능성과 개선방안 제시
수행 방법
ㅇ 자동 분류 관련 이론 및 기존 사례(알고리즘) 분석
· 자동 분류 이론 및 기존 기계학습 알고리즘 조사
· 국내․외 도서관 및 관련 분야에서 자동 분류 적용 사례 분석
· 기존 연구 결과로 제시한 알고리즘 포함
ㅇ 학습 데이터 현황 분석
· 국립중앙도서관에서 보유한 단행본 서지 및 목차 약 47만건
· 해당 서지데이터에 부여된 주제명표목 약 100만건(중복 포함)
· 서지․목차 구축 현황, 주제명 부여 현황, 서지-목차-주제명 데이터 간 연관성 등
ㅇ 국가서지 기반 자동 분류 알고리즘 설계 및 검증
· 자동 분류(주제명 추천) 알고리즘 설계 및 학습
· 알고리즘 평가 방법론 및 절차 정의
· 기존 부여된 주제명과 자동 부여된 주제명 간의 일치성 분석
· 비일치 데이터를 대상으로 비일치 패턴 분석 및 자동 부여된 주제명의 실무자 평가
ㅇ 자동 분류 도입 가능성 평가 및 최적화 방안 제안
· 실제 업무에서 자동 분류의 도입 가능성과 기존 데이터 활용 가능성 평가
· 알고리즘 최적화를 위한 개선방안 제언
주요 산출물
ㅇ 문헌의 자동 분류를 위한 인공지능 기반 주제명 추천 알고리즘
ㅇ 알고리즘 성능 평가 결과 및 개선방안
ㅇ 수작업 중심의 목록 구축 업무를 자동화․지능화하기 위한 실용적인 주제어 추천 도구
(위 사업내용은 AI 요약과 연구팀 담당자의 검토를 거쳐 작성하였음)
관련정보
1. KOS 메타정보
- 현행 KOS: 대한민국 국가서지 LOD
대한민국 국가서지
- 관련KOS(국내): 주제명 자동 분류
2. 결과보고서
- 국가서지를 활용한 주제명 자동분류 적용방안 연구
3. 관련 RFP
- (없음)
분류정보
| BRM | G003 | 문화체육관광>문화예술 |
|---|---|---|
| KDC | 024 | 수서, 정리 및 보존 |
| DDC | 025 | Operations of libraries and archives |
| ILC | ytcx | indexes; indices; bibliographies; catalogues |