http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
양진환 ( Jin-hwan Yang ),김성식 ( Sung-sik Kim ),최혁순 ( Hyuk-soon Choi ),문남미 ( Nammee Moon ) 한국정보처리학회 2023 한국정보처리학회 학술대회논문집 Vol.30 No.2
현재 국내외 CCTV 구축량 증가로 사생활 침해와 높은 설치 비용등이 문제점으로 제기되고 있다. 따라서 본 연구는 Early Fusion을 적용한 위급상황 음향 분류 모델을 제안한다. 음향 데이터에 STFT(Short Time Fourier Transform), Spectrogram, Mel-Spectrogram을 적용해 특징 벡터를 추출하고 3차원으로 Early Fusion하여 ResNet, DenseNet, EfficientNetV2으로 학습한다. 실험 결과 Early Fusion 방법이 가장 좋은 결과를 보였고 DenseNet, EfficientNetV2가 Accuracy, F1-Score 모두 0.972의 성능을 보였다.
양진환(Jin-Hwan Yang),김성식(Sung-Sik Kim),최혁순(Hyuk-Soon Choi),문남미(Nammee Moon) 한국HCI학회 2024 한국HCI학회 학술대회 Vol.2024 No.1
본 연구는 반려가구의 원활한 반려동물 건강관리를 위해 반려견 울음소리 탐지모델을 제작한다. 모델 제작을 위해 STFT(Short Time Fourier Transform), Spectrogram, Mel-Spectrogram 을 Early Fusion 하여 이미지화 하고 Sliding Window 를 적용해 증강한다. 또한 모델의 성능 향상을 위해 SSP(Sound Signal Processing) 기반 Compressor, Distortion, Noise Gate 증강법을 제안하고 성능을 비교한다. 비교 실험 결과 Compressor 와 Distortion 이 성능 향상을 보였고 Noise Gate 는 성능 약화를 보였다. Compressor 와 Distortion 을 적용한 모델은 F1 Score 0.898, Accuracy 0.897, 모든 증강법을 적용한 모델은 F1 Score 0.899, Accuracy 0.899 의 성능을 보였다.
RoBERTa 기반 데이터 증강을 통한 국내 학술 논문 분야 분류 연구
김성식 ( Sung-sik Kim ),양진환 ( Jin-hwan Yang ),최혁순 ( Hyuk-soon Choi ),문남미 ( Nammee Moon ) 한국정보처리학회 2023 한국정보처리학회 학술대회논문집 Vol.30 No.2
현재 대부분의 국내 학술 데이터 베이스는 개별 학술지 논문의 주제를 파악하는 표준화된 정보를 거의 제공하지 않고 있다. 본 연구에서는 논문의 제목만을 활용하여 학술 논문의 분야를 자동으로 분류하는 방법을 제안한다. 이를 위해 한국어로 사전 훈련된 KLUE-RoBERTa 모델을 사용하며, Back Translation 과 Chat-GPT 를 활용한 데이터 증강을 통해 모델의 성능을 향상한다. 연구 결과, Back Translation 과 Chat-GPT 를 사용하여 증강한 모델이 원본 데이터를 학습한 모델보다 약 11%의 성능 향상을 보였다.