http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
무인 자율주행을 위한 스테레오 카메라 설계 및 장애물 검출 기법
정병희(Byunghee Jung),정성훈(Sunghoon Jung),김민환(Minhwan Kim) 한국멀티미디어학회 2009 한국멀티미디어학회 학술발표논문집 Vol.2009 No.2
최근 중노동 및 인명사고 경감, 물류의 원활한 흐름, 재고관리의 정밀도 향상 등을 목적으로 하는 자동화 차고들이 점차 증가함에 따라 제품을 이송하기 위한 무인 이송장지(AGV)에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 무인 이송장치의 안전한 자율주행을 위한 스테레오 비전 기반의 장애물 검출 시스템을 제안한다. 제안한 시스템은 무인 이송 장치의 전방 3m 에서 10m 사이에 나타나는 장애물을 검출하기 위하여 스테레오 카메라 시스템을 설계하고, 스테레오 비전 기법과 카메라 캘리브레이션을 이용하여 장애물의 위치와 크기를 측정함으로써 무인 이송장치의 자율주행에 도움을 줄 수 있는 시스템이 될 것이다.
스톡 비디오 아카이브에서의 검색 지능화 인터페이스 구현
정병희(Byunghee Jung),박완(Wan, Park),신봉승(Bongseung Shin),최대훈(Daehoon Choi),김용수(Yongsu Kim),김정현(Junghyun Kim) 한국방송·미디어공학회 2024 한국방송미디어공학회 학술발표대회 논문집 Vol.2024 No.6
방대한 분량의 콘텐츠 홍수 속에서 원하는 소재를 찾기 위해 콘텐츠 내용을 검색할 수 있는 효과적인 방법이 지원되는 것은 창작을 자유롭게 하고, 콘텐츠 활용도를 높이기 위해 매우 중요하다. 영상 창작의 과정은 창작의 의도를 시청자들에게 효과적으로 전달하기 위해 적절한 영상 부분을 선택해야 하는 반복적인 시간 소요 작업을 필요로 한다. 따라서 시간의 흐름에 따른 내용을 일일이 확인하지 않고 영상의 브라우징 방법이나, 다양한 부가 정보를 활용하여 원하는 부분을 검색해 내는 인터페이스에 관한 방법이 연구되었다. 본 논문에서는 검색 지능화 시스템이 제공하는 검색에서 검색 대상과 검색 시간을 줄이고, 영상 내에서도 원하는 부분 지점을 손쉽게 찾아가는 검색 과정을 효과적으로 지원하는 사용자 인터페이스 방법을 제안한다. 제안하는 인터페이스는 영상의 특성을 고려하여 장면 단위로 영상을 구조화하고, 타임라인에 정보를 매핑하여 모든 정보를 하나의 사용자 인터페이스에서 확인하는 영상 브라우징 방법을 사용하였다. 본 논문에서 구현한 직관적인 인터페이스로 창작자는 여러 번 클릭 하지 않고, 한 사용자 인터페이스 화면에서 클립 내의 원하는 부분까지 손쉽게 찾아갈 수 있다.
온톨로지 기반의 의미 연관성을 이용한 효과적인 방송 정보 검색 방법
정병희(Byunghee Jung),김항규(Hang-kyu Kim),박창섭(Chang-sup Park),오연희(Yeonhee Oh),박성춘(Sungchoon Park),이윤준(Yoonjoon Lee) 한국방송·미디어공학회 2008 한국방송공학회 학술발표대회 논문집 Vol.2008 No.-
방송된 프로그램의 VOD 서비스는 웹 및 다양한 매체를 통해 중요한 정보 서비스가 되고 있다. 기존의 멀티미디어 검색은 파일명이나 메타데이터를 바탕으로 직접 검색하는 정적인 검색 방법이었다. 본 논문에서는 이런 정적인 검색 방법에서 벗어나 의미적으로 연관된 비디오를 동적으로 검색하여 풍부한 검색 결과를 보여주는 방법을 제안하고, 이를 수행하는 프로토타입 시스템을 설계, 구현함으로써 제안한 방법의 타당성을 보인다. 제안하는 방법은 온톨로지를 이용하여 특정 도메인상에서 사용자가 관심을 가지는 정보의 연관성을 표시하고, 이를 검색과정에 적용한다. 검색 결과는 의미적으로 연관된 정보를 보여줄 뿐 아니라, 연관 카테고리를 바탕으로 관련된 정보를 정리하여 보여줌으로써 사용자는 풍부한 검색 결과 가운데에서 원하는 정보를 쉽고 빠르게 접근할 수 있다. 예를 들면, ‘고혈압’이라는 검색어를 사용자가 입력하면, 고혈압에 관련된 방송 프로그램 뿐 아니라, ‘고혈압’에 좋은 음식이나 그 음식의 효능, 효과, 요리법 등 방송을 통해 볼 수 있는 관련 정보들을 한번에 검색할 수 있다.
방송영상에서의 등장인물 검색을 위한 고속 얼굴 인식 시스템
정병희(Byunghee Jung),하명환(Myunghwan Ha),김희정(Heejung Kim),박현선(Hyunsun Park),이흔진(Heunjin Lee),김희율(Whoiyul Kim) 한국정보과학회 2003 한국정보과학회 학술발표논문집 Vol.30 No.2Ⅱ
방송 프로그램이나 영화와 같은 동영상을 인터넷에서 검색하는 서비스가 활성화됨에 따라 특정 인물이 등장하는 부분을 검색하는 기능은 일반 사용자나 프로그램을 만드는 제작자 모두에게 필요한 기능이 되었다. 등장인물 중심의 검색을 위해서는 해당 인물의 얼굴 검출 및 인식 기능이 필수적이며, 특히 방송영상의 특성에 적합하고 등장인물 검색 서비스에 적용 가능한 얼굴 검출 및 인식 기술이 요구된다. 이를 위해 본 논문에서는 고속 얼굴 인식 시스템을 제안하고, 실시간 수행이 가능한 얼굴 검출 및 인식 알고리즘을 제안하다. 제안한 얼굴 검출 및 인식 알고리즘은 DCT 기법을 전처리 단계로 투어 계산량을 최소화하면서도 특징값의 정보량은 유지하는 방법을 사용한다. 본 논문에서는 제안하는 알고리즘이 기존 방법에 비해 우수한 성능을 보이며, 실제 방송 영상을 구현된 시스템에 적용하여 시간과 검출률/인식률 측면에서 우수한 결과를 나타냄을 보인다.
라이선스 관리 측면을 고려한 방송콘텐츠 서비스 개방형 아키텍처
정병희(Byunghee Jung),김희정(Heejung Kim),박성춘(Sungchoon Park) 한국방송·미디어공학회 2010 한국방송공학회 학술발표대회 논문집 Vol.2010 No.7
IP기반 미디어 서비스는 대규모 사용자를 확보할 수 있고, 사용자 규모에 따른 수익을 올릴 수 있기 때문에 방송사에서는 중요 서비스의 하나로 인식하고 있다. 사용자의 지속적이고 빠르게 변화하는 새로운 서비스에 대한 요구사항들을 만족시키기 위해서 방송사는 보유하고 있는 관련 시스템들을 항시 새로운 서비스에 유연하게 대처할 수 있도록 해야 한다. 본 논문에서는 IP기반 미디어 서비스에 유연하게 대응할 수 있는 체계화된 방송콘텐츠 서비스 개방형 아키텍처 (OASIS: Open Architecture for Systematic IP-based Services)를 제안한다. ‘OASIS’는 제작 시스템에서 자동으로 콘텐츠(예. 에센스와 메타데이터)를 수집하고 다양한 서비스에 맞게 수집된 콘텐츠를 제공할 수 있는 체계적이고 유연한 아키텍처이다. 더불어 OASIS는 방송콘텐츠 저작권 확보 여부를 확인할 수 있도록 하였기 때문에 최근 중요시되고 있는 저작권이 확보된 콘텐츠를 서비스할 수 있다. 제안하는 아키텍처는 시스템들 간에 콘텐츠를 교환할 때 표준화된 메타데이터와 ID를 사용하여 교환하게 함으로써 서비스 할 콘텐츠를 자동으로 시스템화하여 수집할 수 있다. KBS는 2년간의 작업을 거쳐 방송콘텐츠를 공유하는 데 필요한 메타데이터와 ID의 표준화 작업을 수행하였으며, 이를 기반으로 체계적으로 자동화된 수집 체계를 고안하였다. 다양한 서비스에 유연하게 콘텐츠를 제공하기 위한 측면으로는 openAPI(Application Programming Interface)를 활용하여, 서비스의 요구에 맞는 콘텐츠 내용을 제공할 수 있도록 하였다. 마지막으로 라이선스 관리 측면으로는 방송 콘텐츠 제작 시 수집할 수 있는 계약 정보 및 서비스 유통 가능 범위를 체계화함으로써, 제작 시에 저작권 정보를 수집하고, 해당 콘텐츠와 연동하여 서비스 가능여부를 확인할 수 있도록 하였다. 제안한 아키텍처를 활용하여 다양한 서비스의 요구에 대응할 수 있는 콘텐츠 서비스 시스템을 구축할 수 있다.
김형준,정병희,김회율,Kim Hyoung-Joon,Jung Byunghee,Kim Whoi-Yul 대한전자공학회 2005 電子工學會論文誌-SP (Signal processing) Vol.42 No.6
본 논문에서는 입력된 얼굴 영상으로부터 구한 DCT 계수에 대해 LDA를 적용하는 DCT/LDA를 이용한 얼굴 인식 방법을 제안한다. 제안된 방법은 적은 수의 DCT 계수를 이용하여 입력 영상을 저차원으로 표현함으로써 특징 공간의 차수보다 트레이닝 데이터의 수가 적은 경우 발생하는 LDA의 SSS 문제를 해결한다. DCT는 기저 벡터가 일정하며 PCA와 유사한 에너지 압축 효율을 가지기 때문에 제안된 방법은 기존의 PCA/LDA 방법보다 학습 속도는 빠르면서 실제 얼굴인식 시스템에 적용이 가능한 정도의 얼굴 인식율을 기대할 수 있다. 실험을 통해 제안된 방법이 PCA/LDA 방법과 유사한 얼굴 인식 성능을 보이면서 약 13,000배 빠르게 학습되는 것을 확인하였고, 기존의 Block-DCT/LDA 방법과 유사하거나 향상된 인식 결과를 확인하였다. This paper proposes a method to recognize a face using DCT/LDA where LDA is applied to DCT coefficients of an input face image. In the proposed method, SSS problem of LDA due to less number of training data than the size of feature space can be avoided by expressing an input image in low dimensional space using DCT coefficients. In terms of the recognition rate, both the proposed method and the PCA/LDA method have shown almost equal performance while the training time of the proposed method is much shorter than the other. This is because DCT has the fixed number of basis vectors while the property of energy compaction rate is similar to that of PCA. Although depending on the number of coefficients employed for the recognition, the experimental results show that the performance of the proposed method in terms of recognition rate is very comparable to PCA/LDA method and other DCT/LDA methods, and it can be trained 13,000 times faster than PCA/LDA method.
최대훈(Daehoon Choi),전성규(Seonggyu Jeon),정병희(Byunghee Jung),이만규(Mankyu Lee),김창원(Changwon Kim) 한국방송·미디어공학회 2016 한국방송공학회 학술발표대회 논문집 Vol.2016 No.6
TV 시청 도중 세컨드 디바이스로 멀티태스킹하는 시청패턴과 더불어 방송과 시청자가 상호작용하는 양방향 서비스 요구사항의 증대에 따라 KBS는 시청자 참여 서비스를 위한 티벗 서비스 플랫폼을 개발하였다. 티벗서비스 플랫폼은 모바일에 특화된 시청자 방송 참여 서비스 플랫폼을 지향한다. 이러한 티벗 서비스 플랫폼 개발 결과의 핵심은 ‘손쉬운 시청자 참여 서비스 적용 프로그램 확대’가 가능하다는 점이다. 본 논문에서는 시청자 참여 서비스 플랫폼인 티벗이 더욱 강화된 참여 서비스를 위해 사용자와 제작자의 요구를 반영하여 개선한 기능을 제안한다. 제안한 기능은 시청자와 소통하는 최근 제작 트렌드에 맞추어 TV 프로그램 제작에의 활용성과 시청자의 편의성을 개선시켰다. 또한, 개선된 기능을 적용한 방송 프로그램 사례에 대해 살펴본다.