지식 집약형 응용에서 벡터 데이터베이스로부터의 정보 검색은 핵심적인 요소이다. 그러나 기존의 검색 방법인 코사인 유사도 및 HNSW(Hierarchical Navigable Small World)는 검색 정확도 및 효율성 측...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
지식 집약형 응용에서 벡터 데이터베이스로부터의 정보 검색은 핵심적인 요소이다. 그러나 기존의 검색 방법인 코사인 유사도 및 HNSW(Hierarchical Navigable Small World)는 검색 정확도 및 효율성 측...
지식 집약형 응용에서 벡터 데이터베이스로부터의 정보 검색은 핵심적인 요소이다. 그러나 기존의 검색 방법인 코사인 유사도 및 HNSW(Hierarchical Navigable Small World)는 검색 정확도 및 효율성 측면에서 한계를 가진다. 이러한 한계를 극복하기 위해, 본 연구는 계층적 어텐션 기반 검색 모델과 다양체 분석에 기반한 엔티티 관계 그래프를 제안하여 RAG(Retrieval-Augmented Generation) 시스템의 성능을 향상시키고자 한다. 제안된 방법은 심층 어텐션 메커니즘과 위상적으로 구성된 엔티티 관계를 활용하여 검색 성능과 생성 품질 모두에서 유의미한 향상을 달성한다. 포괄적인 실험을 통해, 제안된 모델은 리콜, 정밀도, F1 스코어 등 주요 지표에서 기존 검색 기법을 지속적으로 능가함을 입증하였다. 또한, RAGAS 평가 프레임워크를 통한 다운스트림 평가 결과, 제안한 검색 기법은 생성 응답의 사실성, 관련성 및 문맥 포괄성 측면에서 품질 향상에 기여함을 확인하였다. 본 연구는 적응형이며 문맥 인식적이고 계산 효율적인 RAG 시스템 구축을 위한 새로운 방향을 제시한다.
다국어 초록 (Multilingual Abstract)
Information retrieval from vector databases is a critical component of knowledge-intensive applications. However, traditional retrieval methods such as cosine similarity and Hierarchical Navigable Small World (HNSW) have limitations on retrieval accur...
Information retrieval from vector databases is a critical component of knowledge-intensive applications. However, traditional retrieval methods such as cosine similarity and Hierarchical Navigable Small World (HNSW) have limitations on retrieval accuracy and efficiency. To address these limitations, this study proposes a hierarchical attentional retrieval model and a manifold-analysis-based entity relation graph to improve the performance of retrieval-augmented generation (RAG) systems. The proposed approach utilizes deep attention mechanisms and topologically structured entity relations to achieve significant improvements in retrieval performance and downstream generative quality. Through comprehensive experiments, we demonstrate that the proposed approach consistently outperforms traditional retrieval model baselines across key metrics such as recall, precision, and F1 score. The downstream evaluation using the RAGAS framework confirms that our retrieval enhancements improved generation quality in terms of answer faithfulness, relevance and contextual coverage.
This work opens new avenues for building adaptive, context-aware, and computationally efficient RAG systems.
목차 (Table of Contents)