생성적 상호 참조 해결을 통한 대화형 쿼리 재작성 개선 = Improving Conversational Query Rewriting through Generative Coreference Resolution|RISS 상세보기

국문 초록 (Abstract)

대화형 검색은 다중 턴 대화에서 현재 턴의 쿼리의 문맥적 의미를 이해하여 관련된 정보를 검색하는 방법이다. 대화형 검색에서 대화형 쿼리 재작성이란 대화형 검색 시스템에서 사용자의 모호하거나 불완전한 질의를 대화 문맥을 기반으로 해석하여 완전한 쿼리로 변환하는 기술이다. 이를 통해 대화 과정에서 발생하는 질의 내 생략, 상호 참조 등의 문제를 해결하고, 대화형 검색의 성능을 향상시킬 수 있다. 기존 대화형 쿼리 재작성의 접근 방식은 주로 사전 학습된 언어 모델을 사람이 쓴 쿼리를 사용해 파인 튜닝하거나, 대형 언어 모델을 프롬프트하여 현재 턴 쿼리의 생략과 모호성을 해결한다. 그러나 본 논문의 실험 결과에 따르면 기존의 방법들은 여전히 완전한 상호 참조 해결에 어려움을 겪는다.
따라서 본 연구는 초기 재작성 쿼리에서 모호한 상호 참조 구절을 감지하고, 이를 구체화된 개체로 변환하여 검색 성능을 향상시키는 것을 목표로 한다. 구체적으로, 본 연구는 1) 쿼리 내 모호한 상호 참조 구절을 감지할 수 있는 모델의 훈련 가능성, 2) 감지된 상호 참조 구절을 실체로 구체화할 수 있는 모델의 훈련 가능성을 탐구한다. 각 질문에 답하기 위해 Detector와 Decoder라는 두 구성 요소를 고안하고, 실험을 통해 파인 튜닝된 각 모델이 질문 내의 다양한 형태의 모호한 상호 참조 구절을 식별하고 이를 구체적인 표현으로 재구성하는 것이 가능함을 보인다. 따라서 본 논문에서는 가벼운 생성 모델을 통해 상호 참조를 해결함으로써 대화형 검색 성능을 향상시키는 새로운 프레임워크를 제안한다.

번역하기

대화형 검색은 다중 턴 대화에서 현재 턴의 쿼리의 문맥적 의미를 이해하여 관련된 정보를 검색하는 방법이다. 대화형 검색에서 대화형 쿼리 재작성이란 대화형 검색 시스템에서 사용자의 ...

다국어 초록 (Multilingual Abstract)

Conversational search enables retrieval of relevant passages for a current turn query by understanding the contextual meaning in a multi-turn dialogue. In conversational search, Conversational Query Reformulation enables utilization of ad-hoc retrievers by transforming context-dependent queries into self-contained forms. Existing approaches primarily fine-tune pre-trained language models using human-rewritten queries as labels or prompt large language models (LLMs) to address ambiguity inherent in the current turn query, such as ellipsis and coreference. However, our preliminary experimental results indicate that existing models continue to face challenges with coreference resolution. This paper addresses two main research questions: 1) Can a model be trained to distinguish anaphoric mentions that need further clarification? And 2) Can a model be trained to clarify detected coreference mentions into more specified phrases? To investigate these questions, we devised two main components – the detector and the decoder. Our experiments demonstrated that our fine-tuned detector could identify diverse anaphoric phrases within questions, while our fine-tuned decoder could successfully clarify them, ultimately enabling effective coreference resolution for query rewriting. Therefore, we present a novel paradigm, Coreference Aware Conversational Query Reformulation, utilizing these main components.

번역하기

목차 (Table of Contents)

제 1 장 서론 1
1.1 연구 배경 1
제 2 장 관련 연구 6
2.1 대화형 검색 6

제 1 장 서론 1
1.1 연구 배경 1
제 2 장 관련 연구 6
2.1 대화형 검색 6
2.2 대화형 쿼리 재작성 7
2.2.1 지도 학습 기반의 대화형 쿼리 재작성 8
2.2.1 LLM을 활용한 대화형 쿼리 재작성 9
2.2.1 이전 쿼리 재작성 모델들의 한계 10
제 3 장 생성적 상호 참조 해결을 통한 대화형 쿼리 재작성 개선 방법 11
3.1 문제 정의 11
3.2 학습 데이터 생성 13
3.3 Detector 학습 18
3.4 Decoder 학습 18
3.5 질의 수정 18
제 4 장 실험 결과 및 분석 19
4.1 실험 데이터 19
4.2 실험의 평가 방법 19
4.3 비교 기준 모델 20
4.4 구현 세부사항 20
4.5 주요 실험 결과 21
4.6 구성 요소 분석 실험 결과 25
4.7 정적 분석 26
4.8 CorefQR의 성능 및 효율성 분석 28
제 5 장 결론 30
참고문헌 31
Abstract 35

상세검색

RISS 보유자료

상세검색

해외전자자료

생성적 상호 참조 해결을 통한 대화형 쿼리 재작성 개선 = Improving Conversational Query Rewriting through Generative Coreference Resolution

부가정보

분석정보

이 자료와 함께 이용한 RISS 자료

나만을 위한 추천자료