검색 증강 질문 응답은 검색된 구절에 생성 조건을 부여하여 사실성을 향상시키 지만, 작은 언어 모델의 경우 상위 k개의 구절을 프롬프트에 연결하면 입력 길이가 크게 증가하고 효과적인 ...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=T17369930
전주 : 전북대학교 대학원, 2026
학위논문(석사) -- 전북대학교 대학원 , 전자.정보공학부(컴퓨터공학) , 2026. 2
2026
한국어
전북특별자치도
iv, 45 p. ; 26 cm
지도교수: 송현제
I804:45011-000000063661
0
상세조회0
다운로드검색 증강 질문 응답은 검색된 구절에 생성 조건을 부여하여 사실성을 향상시키 지만, 작은 언어 모델의 경우 상위 k개의 구절을 프롬프트에 연결하면 입력 길이가 크게 증가하고 효과적인 ...
검색 증강 질문 응답은 검색된 구절에 생성 조건을 부여하여 사실성을 향상시키 지만, 작은 언어 모델의 경우 상위 k개의 구절을 프롬프트에 연결하면 입력 길이가 크게 증가하고 효과적인 지식 통합이 복잡해집니다. 본 논문에서는 검색된 구절을 압축 잠재 벡터로 요약하고, 검색 조건 잔차를 즉시 확장하지 않고 고정된 기본 언어 모델에 주입하는 ContextSide-HyperLoRA를 제안합니다. 질문과 검색된 구절이 주어지면, 우리는 기본 모델의 임베딩(또는 숨겨진 상태) 을 사용하여 각 텍스트를 고정 차원 벡터로 인코딩하고, 선택적으로 통로 벡터에 대한 자기 주의를 통해 다중 홉 혼합을 적용하며, 소프트맥스 가중 풀링을 통해 단일 문맥 벡터를 구축합니다. 여기서 각 통로 벡터의 평균 활성화로부터 가중치 가 도출됩니다. 문맥 벡터는 선택적으로 질문 벡터와 연결되고 작은 2계층 MLP 오토인코더에 의해 압축되어 MSE 재구성 목표로 훈련된 zctx를 얻습니다. 각 FFN(MLP) 계층에 대해 하이퍼네트워크는 zctx를 소비하고, 저순위 행렬 쌍 (A, B)을 생성하여 토큰 은닉 상태에 대한 LoRA 스타일의 잔여 업데이트를 생성합니다. 잔여 행렬은 학습 가능한 계층별 시그모이드 게이트와 전역 스케일을 통해 FFN 출력에 추가됩니다. 이 메커니즘은 포워드 훅을 통해 구현되어 모든 기본 매개변수를 동결하면서 다양한 Transformer LM에 드롭인 적용이 가능합니 다. 훈련은 응답-토큰 교차 엔트로피와 재구성 손실(및 선택적 게이트 정규화)을 사용하여 오토인코더, 하이퍼네트워크 및 게이트만을 최적화합니다. 우리는 자연 질문, TriviaQA, HotpotQA, PopQA를 LLaMA 및 Qwen 기본 모델과 비교하여 무맥락 기준선, LoRA 미세 조정 및 GenPoE와 비교합니다. 결과 는 ContextSide-HyperLoRA가 질문 전용 프롬프트(ctx=0 사용)에서도 EM/F1 을 지속적으로 개선함을 보여주며, 검색 지식이 명시적인 프롬프트 증강이 아닌 잠재적 매개변수 조건화를 통해 효과적으로 통합될 수 있음을 보여줍니다
목차 (Table of Contents)