http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
디퓨전 모델로 생성된 이미지의 프롬프트 예측을 위한 앙상블 모델 연구
박채희(Chaehee Park),양미경(Migyeong Yang),김지원(Jiwon Kim),김민지(Minji Kim),조민한(Minhan Cho),전효림(Hyolim Jeon),김은(Eun Kim),한진영(Jinyoung Han) 한국방송·미디어공학회 2023 한국방송공학회 학술발표대회 논문집 Vol.2023 No.6
텍스트 기반 이미지 생성 (text-to-image) 모델의 발전에 따라 프롬프트 (prompt) 엔지니어링이라는 새로운 분야가 대두되었다. 이는 모델 결과물의 품질이 프롬프트를 얼마나 잘 사용했는지에 의해 결정되기 때문에 사용자가 원하는 고품질의 이미지를 생성할 수 있는 구체적이고 명확한 프롬프트를 작성하는 것의 중요성으로부터 비롯되었다. 이에 따라 프롬프트 분석 연구가 진행되어 왔으며, 이 과정의 일환으로 생성된 이미지에서 프롬프트를 예측하는 방법도 제안되었다. 이에 따라 본 논문에서는 이미지로부터 프롬프트를 예측 (image-to-prompt)하는 작업을 수행하는 앙상블 모델을 제안한다. 실험 결과로 이미지 캡션을 생성하는 단일 모델보다 평균 0.1381 을 향상시키며 제안된 모델의 성능을 검증했다.