http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
윤상혁 ( Sanghyeuk Yoon ),전다윤 ( Dayun Jeon ),박능수 ( Neungsoo Park ) 한국정보처리학회 2021 한국정보처리학회 학술대회논문집 Vol.28 No.1
APU(Accelerated Processing Unit)는 CPU와 GPU가 통합되어있는 프로세서이며 같은 메모리 공간을 사용한다. CPU와 GPU가 분리되어있는 기존 이종 컴퓨팅 환경에서는 GPU가 작업을 처리하기 위해 CPU에서 GPU로 메모리 복사가 이루어졌지만, APU는 같은 메모리 공간을 사용하므로 메모리 복사 없이 가상주소 할당으로 같은 물리 주소에 접근할 수 있으며 이를 Zero Copy라 한다. Zero Copy 성능을 테스트하기 위해 희소행렬 연산을 사용하였으며 기존 메모리 복사대비 크기가 큰 데이터는 약 4.67배, 크기가 작은 데이터는 약 6.27배 빨랐다.
다중커널 중첩기법을 이용한 GPGPU 기반 병렬 MFCC
윤상혁(SangHyeuk Yoon),박능수(Neungsoo Park) 대한전기학회 2020 전기학회논문지 Vol.69 No.9
Recently, machine learning applications using audio data are increasing. MFCC is widely used as a feature extraction technique to utilize audio data. It takes a long execution time to compute MFCC with a large amount of audio data. Also, a fast MFCC computation method is necessary for real-time inference. In this study, a GPU-based parallel MFCC using a multi-kernel overlap is proposed to fast compute MFCC. The proposed GPGPU-based parallel MFCC is 434 times faster than CPU-based MFCC. When processing 800 audio data, the proposed GPU-based MFCC using multi-kernel overlap was 2.87 times faster than the previous GPU-based MFCC. Besides, in case processing a long single streaming audio data, the proposed one achieved 1.3 times speed-up compared with the previous one.
윤상혁 ( Sanghyeuk Yoon ),전다윤 ( Dayun Jeon ),박능수 ( Neungsoo Park ) 한국정보처리학회 2021 한국정보처리학회 학술대회논문집 Vol.28 No.2
사람은 표정, 음성, 말 등을 통해 감정을 표출한다. 본 논문에서는 화자의 음성데이터만을 사용하여 감정을 분류하는 방법을 제안한다. 멜 스펙트로그램(Mel-Spectrogram)을 이용하여 음성데이터를 시간에 따른 주파수 영역으로 변화한다. 멜 스펙트로그램으로 변환된 데이터를 CNN을 이용하여 특징 벡터화한 후 Bi-Directional LSTM을 이용하여 화자의 발화 시간 동안 변화되는 감정을 분석한다. 마지막으로 완전 연결 네트워크를 통해 전체 감정을 분류한다. 감정은 Anger, Excitement, Fear, Happiness, Sadness, Neutral로, 총 6가지로 분류하였으며 데이터베이스로는 상명대 연구팀에서 구축한 한국어 음성 감정 데이터베이스를 사용하였다. 실험 결과 논문에서 제안한 CNN-LSTM 모델의 정확도는 88.89%로 측정되었다.
전다윤(Dayun Jeon),윤상혁(SangHyeuk Yoon),박능수(Neungsoo Park),류훈(H Ryu) 대한전기학회 2021 대한전기학회 학술대회 논문집 Vol.2021 No.10
희소행렬 연산(Sparse Matrix Vector Multiplication, 이하 SpMV)은 공학 연산에서 많이 사용된다. 희소행렬 연산을 가속하기 위해 GPU를 사용한 많은 알고리즘이 제안되었다. 널리 사용되는 희소행렬 연산은 유효한 값의 행, 열, 값 정보만 따로 저장하는 CSR을 이용해 행을 한 Thread마다 분배해 각 병렬적으로 연산하는 CSR-Vector 알고리즘 있다. CSR-Vector는 행을 정적으로 스레드에 할당 하여 비효율 적이다. 이를 개선하기 위하여 행의 작업을 동적 스케줄링 기법을 적용한 Light SpMV 알고리즘이 있다. Light SpMV의 경우도 GPU 스레드 그룹 간의 불균형이 존재하여 이를 정적인 부분과 동적인 부분을 나눈 Fast CSR SpMV 알고리즘을 제안한다. 9종류의 Matrix로 실험한 결과 Fast CSR SpMV 처리 시간은 Light SpMV 대비 약 31% 감소하였고 GFLOPS는 약 1.5배 증가하였다.