http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
이종성(Jongsung Lee),이의진(Yeejin Lee) 한국방송·미디어공학회 2021 한국방송공학회 학술발표대회 논문집 Vol.2021 No.6
최근 가상현실 및 증강 현실에 대한 관심도가 높아지면서, 깊이 추정, 객체 인식, 영상 분할 등의 다양한 컴퓨터 비전 알고리즘을 360° 영상에 적용하는 연구가 활발히 진행되고 있다. 이 중, 다수의 RGB 카메라를 활용하여 3 차원 정보를 추출하는 깊이 추정 기술은 보다 나은 몰입감을 제공하기 위한 핵심 기술이다. 그러나 깊이 추정 알고리즘의 객관적 성능 평가를 위한 정제된 360° 영상 데이터셋은 극히 부족하며, 이로 인하여 관련 분야 연구에 한계가 있다. 따라서 본 논문에서는 객관적인 알고리즘 성능 평가가 가능하며, 정제된 360° 동영상 데이터셋을 제안하고, 추후 다양한 360° 영상 응용 알고리즘 개발에 활용하고자 한다.
세그먼테이션과 스타일 변환을 활용한 영상 재구성 시스템
방연준(Bang, Yeonjun),이의진(Lee, Yeejin),박주형(Park, Juhyeong),강병근(Kang, Byeongkeun) 한국방송·미디어공학회 2021 한국방송공학회 학술발표대회 논문집 Vol.2021 No.6
기존 영상 콘텐츠에 새로운 물체를 삽입하는 등의 영상 재구성 기술은 새로운 게임, 가상현실, 증강현실 콘텐츠를 생성하거나 인공신경망 학습을 위한 데이터 증대를 위해 사용될 수 있다. 하지만, 기존 기술은 컴퓨터 그래픽스, 사람에 의한 수동적인 영상 편집에 의존하고 있어 금전적/시간적 비용이 높다. 이에 본 연구에서는 인공지능 신경망을 활용하여 낮은 비용으로 영상을 재구성하는 기술을 소개하고자 한다. 제안하는 방법은 기존 콘텐츠와 삽입하고자 하는 객체를 포함하는 영상이 주어졌을 때, 객체 세그먼테이션 네트워크를 활용하여 입력 영상에서 객체를 분리하고, 스타일 변환 네트워크를 활용하여 입력 영상을 스타일 변환한 후, 사용자 입력과 두 네트워크의 결과를 활용하여 기존 콘텐츠에 새로운 객체를 삽입하는 것이다. 실험에서는 기존 콘텐츠는 온라인 영상을 활용하였으며 삽입 객체를 포함한 영상은 ImageNet 영상 분류 데이터 세트를 활용하였다. 실험을 통해 제안한 방법을 활용하면 기존 콘텐츠와 잘 어우러지게끔 객체를 삽입할 수 있음을 보인다.
김현석(Hyeonseok Kim),이의진(Yeejin Lee) 한국방송·미디어공학회 2022 한국방송공학회 학술발표대회 논문집 Vol.2022 No.11
자율주행 자동차 개발 연구가 활발히 진행됨에 따라 객체 검출기의 성능이 중요하게 되었다. 딥러닝 기술의 발전하면서 객체 검출기의 성능도 큰 발전을 이루었다. 그에 따라 도로 위 차량 검출기의 성능도 발전하고 있으나 평상시 낮 도로상황에서 잘 동작하던 모델은 안개가 끼거나 밤 상황이 되면 제대로 동작하지 못하는 문제를 가지고 있다. 이유는 딥러닝 모델이 학습할 때 사용한 데이터셋의 정보에 따라 특정 도메인에 편향된 특성을 학습하기 때문이다. 따라서, 본 논문에서는 객체 검출 신경망에 도메인 판별기를 적용하여 이와 같은 도메인 이동 문제를 극복하는 모델을 제안한다. 모델의 성능을 Cityscapes 데이터셋과 Foggy Cityscapes 데이터셋을 사용하여 평가한 결과, 기존의 특정 도메인에서 학습한 모델보다 제안하는 모델의 검출 성능이 개선된다는 것을 확인하였다.
적대적 생성 신경망을 활용한 과다 노출 영상 복원 방법
김태하(Taeha Kim),양성엽(Seongyeop Yang),강병근(Byeongkeun Kang),이의진(Yeejin Lee) 한국방송·미디어공학회 2021 한국방송공학회 학술발표대회 논문집 Vol.2021 No.6
본 논문에서는 과다 노출된 영상을 영상 간 변환(Image-to-Image Translation)을 위해 설계된 적대적 생성 신경망(Generative Adversarial Network)을 활용하여 복원하는 연구를 수행한다. 과다 노출 복원을 위한 기존의 연구에서 과다 노출 영역 판별, 밝기 회복, 색상 보정 과정을 거치는데, 영상 내 과다 노출 영역을 판별하는 과정에서 임의로 결정하는 파라미터에 의해 복원된 영상 결과가 달라지는 한계점을 극복하기 위해 종단간(End-to-End) 신경망을 학습시켜 과다 노출 영역을 별도의 파라미터 선택과 분할된 과정 없이 한 번에 복원하는 방법을 제안한다. 영상 간 변환 신경망 학습에 필요한 과다 노출 여부로 도메인이 분할된 데이터셋은 게임 소프트웨어를 활용하여 만들어 사용하였다. 본 연구에서는 신경망이 생성한 영상이 실제로 과다 노출 영역을 탐지하여 복원하는 것을 확인하였다. 그리고 과다 노출 영역을 탐지하여 복원하는 과정을 학습 단계별로 확인함으로써 신경망이 실제로 과다 노출 복원 과정을 학습함을 보였다.
강범진(Beom-jin Kang),육찬기(Chan-gi Yook),이진영(Jin-yeong Lee),오혜빈(Hye-been Oh),이의진(Yeejin Lee) 한국방송·미디어공학회 2022 한국방송공학회 학술발표대회 논문집 Vol.2022 No.11
본 논문에서는 화장품의 효율적 구매를 위한 화장품 성분표를 분석하고 정보를 전달하는 기능의 시스템을 제안한다. 이 시스템에서는 화장품 성분표에 최적화시킨 OCR (Optical Character Recognition) 모델을 사용해 화장품 성분표를 촬영한 영상에서 인식한 문자 데이터를 추출한다. 이 문자 데이터를 통해 얻은 화장품 성분이 사용자 피부 유형에 적합한지 구축된 데이터베이스와의 비교를 통해 소비자에게 최종 전달된다. 200개의 화장품 성분표 영상을 사용해 제안하는 화장품 성분표 분석 모델의 성능을 평가한 결과 80.348%의 정확도를 보였다.