대화형 검색은 다중 턴 대화에서 현재 턴의 쿼리의 문맥적 의미를 이해하여 관련된 정보를 검색하는 방법이다. 대화형 검색에서 대화형 쿼리 재작성이란 대화형 검색 시스템에서 사용자의 ...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
대화형 검색은 다중 턴 대화에서 현재 턴의 쿼리의 문맥적 의미를 이해하여 관련된 정보를 검색하는 방법이다. 대화형 검색에서 대화형 쿼리 재작성이란 대화형 검색 시스템에서 사용자의 ...
대화형 검색은 다중 턴 대화에서 현재 턴의 쿼리의 문맥적 의미를 이해하여 관련된 정보를 검색하는 방법이다. 대화형 검색에서 대화형 쿼리 재작성이란 대화형 검색 시스템에서 사용자의 모호하거나 불완전한 질의를 대화 문맥을 기반으로 해석하여 완전한 쿼리로 변환하는 기술이다. 이를 통해 대화 과정에서 발생하는 질의 내 생략, 상호 참조 등의 문제를 해결하고, 대화형 검색의 성능을 향상시킬 수 있다. 기존 대화형 쿼리 재작성의 접근 방식은 주로 사전 학습된 언어 모델을 사람이 쓴 쿼리를 사용해 파인 튜닝하거나, 대형 언어 모델을 프롬프트하여 현재 턴 쿼리의 생략과 모호성을 해결한다. 그러나 본 논문의 실험 결과에 따르면 기존의 방법들은 여전히 완전한 상호 참조 해결에 어려움을 겪는다.
따라서 본 연구는 초기 재작성 쿼리에서 모호한 상호 참조 구절을 감지하고, 이를 구체화된 개체로 변환하여 검색 성능을 향상시키는 것을 목표로 한다. 구체적으로, 본 연구는 1) 쿼리 내 모호한 상호 참조 구절을 감지할 수 있는 모델의 훈련 가능성, 2) 감지된 상호 참조 구절을 실체로 구체화할 수 있는 모델의 훈련 가능성을 탐구한다. 각 질문에 답하기 위해 Detector와 Decoder라는 두 구성 요소를 고안하고, 실험을 통해 파인 튜닝된 각 모델이 질문 내의 다양한 형태의 모호한 상호 참조 구절을 식별하고 이를 구체적인 표현으로 재구성하는 것이 가능함을 보인다. 따라서 본 논문에서는 가벼운 생성 모델을 통해 상호 참조를 해결함으로써 대화형 검색 성능을 향상시키는 새로운 프레임워크를 제안한다.
다국어 초록 (Multilingual Abstract)
Conversational search enables retrieval of relevant passages for a current turn query by understanding the contextual meaning in a multi-turn dialogue. In conversational search, Conversational Query Reformulation enables utilization of ad-hoc retrieve...
Conversational search enables retrieval of relevant passages for a current turn query by understanding the contextual meaning in a multi-turn dialogue. In conversational search, Conversational Query Reformulation enables utilization of ad-hoc retrievers by transforming context-dependent queries into self-contained forms. Existing approaches primarily fine-tune pre-trained language models using human-rewritten queries as labels or prompt large language models (LLMs) to address ambiguity inherent in the current turn query, such as ellipsis and coreference. However, our preliminary experimental results indicate that existing models continue to face challenges with coreference resolution. This paper addresses two main research questions: 1) Can a model be trained to distinguish anaphoric mentions that need further clarification? And 2) Can a model be trained to clarify detected coreference mentions into more specified phrases? To investigate these questions, we devised two main components – the detector and the decoder. Our experiments demonstrated that our fine-tuned detector could identify diverse anaphoric phrases within questions, while our fine-tuned decoder could successfully clarify them, ultimately enabling effective coreference resolution for query rewriting. Therefore, we present a novel paradigm, Coreference Aware Conversational Query Reformulation, utilizing these main components.
목차 (Table of Contents)