RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      도메인 특화 질의응답 시스템 : 할루시네이션 저감을 중심으로 한 지역 생물다양성 연구 사례 = A Domain-Specific Question-Answering System : A Case Study on Regional Biodiversity with Hallucination Reduction

      한글로보기

      https://www.riss.kr/link?id=T17371181

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract) kakao i 다국어 번역

      국문초록

      최근 대규모 언어 모델(LLM)은 자연어 처리 분야에서 혁신적인 성능을 보여주고 있으나, 사실 관계의 정확성이 엄격히 요구되는 생물학 및 환경 보존과 같은 전문 도메인에서는 지식의 부재나 학습 데이터의 편향으로 인한 환각현상(Hallucination)이 치명적인 한계로 지적되고 있다.
      본 연구는 이러한 문제를 해결하기 위해 국립생물자원관(National Institute of Biological Resources)에서 구축한 25,593종의 국가 생물 종 목록과 약 970,000개의 구조화된 지식 데이터를 활용하여, 검증된 지식에 기반한 도메인 특화 질의응답 시스템인 BioChat을 제안한다. 본 논문의 핵심적 기여는 검색 증강 생성(RAG) 파이프라인의 고질적인 문제인 거짓 양성(False Positive) 문맥 주입을 효과적으로 제어하기 위한 통계적 재순위화 기반 동적 라우팅(Dynamic Routing) 메커니즘의 설계 및 구현에 있다. 기존의 Naive RAG 시스템은 벡터 유사도에만 의존하여 관련성이 낮은 정보까지 생성 과정에 포함시키는 경향이 있으며, 이는 부정확한 답변 생성의 원인이 된다. 이를 개선하기 위해 본 연구는 Bi-Encoder 기반의 1차 검색 후, Cross-Encoder 구조의 재순위화를 통해 산출된 유사도 점수 분포를 정밀하게 분석하였다. 특히, 최적의 임계값(Threshold) 설정 알고리즘을 통해 질의의 성격에 따라 RAG 경로 또는 LLM의 내부 일반 지식을 활용하는 Fallback 경로로 실시간 분기하는 구조를 구축함으로써 시스템의 답변 신뢰성을 획기적으로 향상시켰다. 제안하는 BioChat 시스템의 성능 검증을 위해 1. 임베딩 모델의 최적성, 2. 라우팅 전략의 유효성, 3. 최신 오픈소스 생성 LLM(Qwen2, Gemma-2 등)의 도메인 적합성을 체계적으로 평가하였다. 400개의 수동 구축 벤치마크 데이터셋을 활용한 실험 결과, 제안된 재순위화 기반 라우팅 전략은 Naive RAG 대비 사실 정확도(Factual Accuracy)를 47.9%에서 71.3%로 약 23.4%p 향상시켰으며, 환각율은 34.0%에서 24.4%로 유의미하게 감소시키는 성과를 거두었다. 아울러 한국어 특화 임베딩 모델(Ko-SROBERTA)이 범용 모델 대비 약 4.6배 높은 MRR(Mean Reciprocal Rank)을 기록함을 확인하여 도메인 특화 시스템 구축 시 임베딩 최적화의 필수성을 입증하였다. 결론적으로 본 연구는 재순위화 기반의 정밀 라우팅 메커니즘이 RAG 시스템의 신뢰성을 결정짓는 핵심 아키텍처임을 정량적으로 증명하였다. 구축된 BioChat은 생물다양성 정보에 대한 국민적 접근성을 높이고 증거 기반의 환경 정책 수립을 지원하는 신뢰할 수 있는 인프라로서의 가치를 지닌다. 또한, 본 연구에서 제시한 프레임워크와 평가 방법론은 의료, 법률 등 고도의 정확성이 요구되는 타 전문 분야의 도메인 특화 LLM 구축을 위한 실전적인 청사진을 제공한다는 점에서 학술적·실용적 의의가 크다.
      번역하기

      국문초록 최근 대규모 언어 모델(LLM)은 자연어 처리 분야에서 혁신적인 성능을 보여주고 있으나, 사실 관계의 정확성이 엄격히 요구되는 생물학 및 환경 보존과 같은 전문 도메인에서는 ...

      국문초록

      최근 대규모 언어 모델(LLM)은 자연어 처리 분야에서 혁신적인 성능을 보여주고 있으나, 사실 관계의 정확성이 엄격히 요구되는 생물학 및 환경 보존과 같은 전문 도메인에서는 지식의 부재나 학습 데이터의 편향으로 인한 환각현상(Hallucination)이 치명적인 한계로 지적되고 있다.
      본 연구는 이러한 문제를 해결하기 위해 국립생물자원관(National Institute of Biological Resources)에서 구축한 25,593종의 국가 생물 종 목록과 약 970,000개의 구조화된 지식 데이터를 활용하여, 검증된 지식에 기반한 도메인 특화 질의응답 시스템인 BioChat을 제안한다. 본 논문의 핵심적 기여는 검색 증강 생성(RAG) 파이프라인의 고질적인 문제인 거짓 양성(False Positive) 문맥 주입을 효과적으로 제어하기 위한 통계적 재순위화 기반 동적 라우팅(Dynamic Routing) 메커니즘의 설계 및 구현에 있다. 기존의 Naive RAG 시스템은 벡터 유사도에만 의존하여 관련성이 낮은 정보까지 생성 과정에 포함시키는 경향이 있으며, 이는 부정확한 답변 생성의 원인이 된다. 이를 개선하기 위해 본 연구는 Bi-Encoder 기반의 1차 검색 후, Cross-Encoder 구조의 재순위화를 통해 산출된 유사도 점수 분포를 정밀하게 분석하였다. 특히, 최적의 임계값(Threshold) 설정 알고리즘을 통해 질의의 성격에 따라 RAG 경로 또는 LLM의 내부 일반 지식을 활용하는 Fallback 경로로 실시간 분기하는 구조를 구축함으로써 시스템의 답변 신뢰성을 획기적으로 향상시켰다. 제안하는 BioChat 시스템의 성능 검증을 위해 1. 임베딩 모델의 최적성, 2. 라우팅 전략의 유효성, 3. 최신 오픈소스 생성 LLM(Qwen2, Gemma-2 등)의 도메인 적합성을 체계적으로 평가하였다. 400개의 수동 구축 벤치마크 데이터셋을 활용한 실험 결과, 제안된 재순위화 기반 라우팅 전략은 Naive RAG 대비 사실 정확도(Factual Accuracy)를 47.9%에서 71.3%로 약 23.4%p 향상시켰으며, 환각율은 34.0%에서 24.4%로 유의미하게 감소시키는 성과를 거두었다. 아울러 한국어 특화 임베딩 모델(Ko-SROBERTA)이 범용 모델 대비 약 4.6배 높은 MRR(Mean Reciprocal Rank)을 기록함을 확인하여 도메인 특화 시스템 구축 시 임베딩 최적화의 필수성을 입증하였다. 결론적으로 본 연구는 재순위화 기반의 정밀 라우팅 메커니즘이 RAG 시스템의 신뢰성을 결정짓는 핵심 아키텍처임을 정량적으로 증명하였다. 구축된 BioChat은 생물다양성 정보에 대한 국민적 접근성을 높이고 증거 기반의 환경 정책 수립을 지원하는 신뢰할 수 있는 인프라로서의 가치를 지닌다. 또한, 본 연구에서 제시한 프레임워크와 평가 방법론은 의료, 법률 등 고도의 정확성이 요구되는 타 전문 분야의 도메인 특화 LLM 구축을 위한 실전적인 청사진을 제공한다는 점에서 학술적·실용적 의의가 크다.

      더보기

      목차 (Table of Contents)

      • 목 차
      • 국문초록 ⅰ
      • 목 차ⅲ
      • 표 목 차ⅵ
      • 그림목차 ⅶ
      • 목 차
      • 국문초록 ⅰ
      • 목 차ⅲ
      • 표 목 차ⅵ
      • 그림목차 ⅶ
      • 부록목차 ⅷ
      • 제1장 서론 1
      • 1.1 연구 배경 및 필요성 1
      • 1.2 문제 정의: 도메인 특화 LLM의 신뢰성 한계 4
      • 1.3 연구목표 및 연구질문7
      • 1.3.1 연구목표 7
      • 1.3.2 연구질문 9
      • 1.4 연구의 범위와 한계 11
      • 1.4.1. 연구의 범위 11
      • 1.4.2 연구의 한계13
      • 1.5 연구의 기여 및 논문 구성 16
      • 1.5.1 연구의 주요 기여16
      • 1.5.2 논문의 구성 17
      • 제2장 이론적 배경 및 관련 연구20
      • 2.1 대규모 언어모델과 지식 기반 Q/A의 발전 20
      • 2.2 검색-증강-생성 : Retrieval-Augmented Generation 구조 개요22
      • 2.3 임베딩 모델과 도메인 적응 학습 24
      • 2.4 재순위화와 라우팅 전략26
      • 2.5 환각 정의 및 측정 방법28
      • 2.6 생물다양성 정보학 분야의 AI 응용 현황 29
      • 2.7 기존 연구의 한계와 본 연구의 차별성 30
      • 제3장 데이터 및 지식베이스 구축 32
      • 3.1 생물정보 분석을 위한 검증된 생물다양성 데이터셋 구축32
      • 3.2 데이터 정제 및 전처리 과정 33
      • 3.3 지식베이스 스키마 설계 및 데이터 명세34
      • 3.4 벡터 임베딩용 문서 단위(Chunking, Metadata) 구성 35
      • 3.5 평가용 데이터셋 및 주석 프로토콜 37
      • 3.6 데이터 품질 검증 및 통계 요약 39
      • 제4장 시스템 설계 및 실험 환경41
      • 4.1 전체 아키텍처 개요 41
      • 4.2 임베딩 모델 선택 및 평가 44
      • 4.3 검색 및 벡터 인덱싱 구조 46
      • 4.4 재순위화 기반 라우팅 구조 설계 48
      • 4.5 프롬프트 템플릿(RAG/Fallback) 구성 49
      • 4.6 시스템 구현 환경 및 기술 스택 50
      • 제5장 실험 및 성능 평가51
      • 5.1 실험 설정 및 지표 51
      • 5.1.1 실험 파라미터 및 테스트셋 51
      • 5.1.2 평가 지표 52
      • 5.1.2.1 검색 성능 지표 52
      • 5.1.2.2 생성 성능 및 신뢰성 지표53
      • 5.2 RQ1 : 임베딩 모델 비교 실험 55
      • 5.2.1 비교 모델 선정55
      • 5.2.2 실험 결과 및 분석56
      • 5.2.3 한계점 및 시사점 57
      • 5.3 RQ2: 라우팅 임계값 최적화 및 ROC 분석 58
      • 5.3.1 재순위화 점수 분포 및 최적 임계값 도출 58
      • 5.3.2 라우팅 전략 간 분류 성능 비교60
      • 5.3.3 최종 답변 품질 및 환각 억제 효과 62
      • 5.4 RQ3: LLM별 생성 품질 및 환각률 비교64
      • 5.5 Case-Study 및 오류 분석 66
      • 5.5.1 재순위화 기반 라우팅의 성공적 분기 및 응답사례 66
      • 5.5.2 유형1 : 임계값 경계 데이터의 라우팅 오류 및 기술적 한계67
      • 5.5.3 유형2 : 문맥 주입 후 생성 모델의 의미론적 맥락 일탈67
      • 5.6 결과 요약 및 시사점 68
      • 5.6.1 실험 결과 요약 68
      • 5.6.2 학문적 및 실무적 시사점69
      • 제6장 고찰 및 제언70
      • 6.1 종합적 결과 해석 및 의의 70
      • 6.2 기술적 확장성 및 고도화 논의71
      • 6.3 사회적 및 실무적 파급 효과 72
      • 6.4 연구의 한계점 73
      • 제7장 결과 및 기여74
      • 7.1 연구 요약74
      • 7.2 주요 연구 결과75
      • 7.3 연구의 기여 76
      • 7.4 향후 연구 과제77
      • 7.5 맺음말·79
      • 참고문헌80
      • Abstract 86
      • 부 록89
      • 감사의글 116
      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼