http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
효율적인 모델 학습을 위한 심층 특징의 평균값을 활용한 의미 있는 비디오 프레임 추출 기법
윤혁(Yoon, Hyeok),김영기(Kim, Young-Gi),한지형(Han, Ji-Hyeong) 한국방송·미디어공학회 2021 한국방송공학회 학술발표대회 논문집 Vol.2021 No.6
최근 정보통신의 발달과 함께 인터넷에 접속하는 사용자 수와 그에 따른 비디오 데이터의 전송량이 늘어나는 추세이다. 이렇게 늘어나는 많은 비디오 데이터를 관리하고 분석하기 위해서 최근에는 딥 러닝 기법을 많이 활용하게 된다. 일반적으로 비디오 데이터에 딥 러닝 모델을 학습할 때 컴퓨터 자원의 한계로 인해 전체 비디오 프레임에서 균등한 간격 또는 무작위로 프레임을 선택하는 방법을 많이 사용한다. 하지만 학습에 사용되는 비디오 데이터는 항상 시간 축에 따라 같은 문맥을 담고 있는 Trimmed 비디오라고 가정할 수가 없다. 만약 같지 않은 문맥을 지닌 Untrimmed 비디오에서 균등한 간격 또는 무작위로 프레임을 선택해서 사용하게 된다면 비디오의 범주와 관련이 없는 프레임이 샘플링 될 가능성이 있기 때문에 모델의 학습 및 최적화에 전혀 도움이 되지 않는다. 이를 해결하기 위해 우리는 각 비디오 프레임에서 심층 특징을 추출하여 평균값을 계산하고 이와 각 추출된 심층 특징들과 코사인 유사도를 계산해서 얻은 유사도 점수를 바탕으로 Untrimmed 비디오에서 의미 있는 비디오 프레임을 추출하는 기법을 제안한다. 그리고 Untrimmed 비디오로 구성된 데이터셋으로 유명한 ActivityNet 데이터셋에 대해서 대표적인 2가지 프레임 샘플링 방식(균등한 간격, 무작위)과 비교하여 우리가 제안하는 기법이 Untrimmed 비디오에서 효과적으로 비디오의 범주에 해당하는 의미 있는 프레임 추출이 가능함을 보일 것이다. 우리가 실험에 사용한 코드는 https://github.com/titania7777/VideoFrameSampler에서 확인할 수 있다.
불확실한 환경에서의 이미지 분류 성능 향상을 위한 Mix Channel Split 데이터 증강 기법
윤혁(Hyeok Yoon),강수한(Soohan Kang),한지형(Ji-Hyeong Han) Korean Institute of Information Scientists and Eng 2020 정보과학회논문지 Vol.47 No.6
We propose a new data augmentation method that works by separating the RGB channels of an image to improve image classification ability in uncertain environments. Many data augmentation methods, using technique such as flipping and cropping, have been used to improve the image classification ability of models. while these data augmentation methods have been effective in improving image classification, they have unperformed in uncertain conditions. To solve this problem, we propose the ChannelSplit that separates and reassembles the RGB channels of an image, along with the Mix ChannelSplit, that adopts the concept of MixUp[1,2] to express more diversity. In this paper, the proposed ChannelSplit and Mix ChannelSplit are called ChannelAug because they only utilize channels and do not perform any other image operations. Also, we compare ChannelAug to other image augmentation methods to prove it enhances robustness and uncertainty measures on image classification.
Improving Program Efficiency of 3D NAND Cell Structure Based on Artificial Neural Network
Kyeongrae Cho(조경래),Hyeok Yun(윤혁),Hyundong Jang(장현동),Kihoon Nam(남기훈),Chanyang Park(박찬양),Jun-Sik Yoon(윤준식),Hyun-Chul Choi(최현철),Rock-Hyun Baek(백록현) 대한전자공학회 2021 대한전자공학회 학술대회 Vol.2021 No.6
3D NAND Flash cell structures were optimized to improve program efficiency using fully-calibrated TCAD and machine learning (ML) techniques. Program efficiency is determined by the number of charges trapped in the charge trap nitride (CTN) layer at the given program voltage step. Usually, a higher and constant Incremental Step Pulse Programming (ISPP) slope is suitable for various program voltage levels. Using a neural network, we trained a forward model of the relationship between NAND electrical characteristics and structure parameters, then designed a backward model to optimize NAND Flash cell structure having excellent program efficiency. Finally, we validated the optimized NAND structure with TCAD simulation and compared it with hardware reference data.