국가서지를 활용한 주제명 자동 분류 적용방안 연구

KOS, 우리 모두의 메타 지식
둘러보기로 가기 검색하러 가기
국가서지를 활용한 주제명 자동 분류 적용방안 연구
KOS 유형분류체계
관련 KOS주제명 자동 분류
수요기관국립중앙도서관(문화체육관광부)
공고기관조달청 서울지방조달청
사업목적KOS 활용
사업년도2022
사업기간5개월
사업예산70,000천원
사업IDRFP-1-252

사업개요

사업명

국가서지를 활용한 주제명 자동 분류 적용방안 연구
(Automatic Classification of Subject Headings using National Bibliography)

사업 세부목적

ㅇ 목차, 서지, 주제명, 원문 등 국립중앙도서관에서 그간 구축해 온 방대한 원천 데이터를 활용하여 자동 분류 알고리즘을 설계하고 이를 검증함으로써 적용 가능성과 개선방안 제시

사업기간 및 예산

- 사업기간 : 계약체결일로부터 5개월

- 소요예산 : 70,000천원

사업내용

과업 내용

ㅇ 국가서지를 활용한 주제명 자동 분류 적용방안 연구

ㅇ 목차, 서지, 주제명, 원문 등 국립중앙도서관에서 구축한 원천 데이터를 활용하여 자동 분류 알고리즘을 설계하고 검증하여 적용 가능성과 개선방안 제시

수행 방법

ㅇ 자동 분류 관련 이론 및 기존 사례(알고리즘) 분석

· 자동 분류 이론 및 기존 기계학습 알고리즘 조사

· 국내․외 도서관 및 관련 분야에서 자동 분류 적용 사례 분석

· 기존 연구 결과로 제시한 알고리즘 포함

ㅇ 학습 데이터 현황 분석

· 국립중앙도서관에서 보유한 단행본 서지 및 목차 약 47만건

· 해당 서지데이터에 부여된 주제명표목 약 100만건(중복 포함)

· 서지․목차 구축 현황, 주제명 부여 현황, 서지-목차-주제명 데이터 간 연관성 등

ㅇ 국가서지 기반 자동 분류 알고리즘 설계 및 검증

· 자동 분류(주제명 추천) 알고리즘 설계 및 학습

· 알고리즘 평가 방법론 및 절차 정의

· 기존 부여된 주제명과 자동 부여된 주제명 간의 일치성 분석

· 비일치 데이터를 대상으로 비일치 패턴 분석 및 자동 부여된 주제명의 실무자 평가

ㅇ 자동 분류 도입 가능성 평가 및 최적화 방안 제안

· 실제 업무에서 자동 분류의 도입 가능성과 기존 데이터 활용 가능성 평가

· 알고리즘 최적화를 위한 개선방안 제언

주요 산출물

ㅇ 문헌의 자동 분류를 위한 인공지능 기반 주제명 추천 알고리즘

ㅇ 알고리즘 성능 평가 결과 및 개선방안

ㅇ 수작업 중심의 목록 구축 업무를 자동화․지능화하기 위한 실용적인 주제어 추천 도구


(위 사업내용은 AI 요약과 연구팀 담당자의 검토를 거쳐 작성하였음)

관련정보

1. KOS 메타정보

- 현행 KOS: 대한민국 국가서지 LOD
대한민국 국가서지 - 관련KOS(국내): 주제명 자동 분류

2. 결과보고서

- 국가서지를 활용한 주제명 자동분류 적용방안 연구

3. 관련 RFP

- (없음)

분류정보

BRM G003 문화체육관광>문화예술
KDC 024 수서, 정리 및 보존
DDC 025 Operations of libraries and archives
ILC ytcx indexes; indices; bibliographies; catalogues

외부링크