본 논문은 온디바이스 환경에 적합한 경량 이미지 캡셔닝 모델의 환각 문제를 완화하기 위해, 초기 캡션 기반 이미지 재생성과 시각 정합성 비교를 활용한 자기 정제 프레임워크를 제안한다...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A109886362
2025
Korean
569
학술저널
1186-1188(3쪽)
0
상세조회0
다운로드본 논문은 온디바이스 환경에 적합한 경량 이미지 캡셔닝 모델의 환각 문제를 완화하기 위해, 초기 캡션 기반 이미지 재생성과 시각 정합성 비교를 활용한 자기 정제 프레임워크를 제안한다...
본 논문은 온디바이스 환경에 적합한 경량 이미지 캡셔닝 모델의 환각 문제를 완화하기 위해, 초기 캡션 기반 이미지 재생성과 시각 정합성 비교를 활용한 자기 정제 프레임워크를 제안한다. 학습 없이 소형 모델만으로 구현된 본 파이프라인은 객체 존재, 속성, 위치 기반 보상과 다양한 하이퍼파라미터 실험을 포함한다. 그 결과, 정합성 중심으로 재정의한 CHAIR 지표에서 유의미한 환각 감소와 품질 향상이 확인되었다.
조건부 Diffusion 모델 기반 뇌 MRI 생성: 뇌 연령 예측 정확도에 미치는 영향 분석
다양한 이미지 스케줄러를 적용한 Graph Diffusion Transformer 모델의 생성 성능 향상 및 비교
ArcFace 기반 손실 함수를 활용한 최적화 기반 메타러닝에 관한 연구