RISS 검색 - 국내학술지논문

1
skip-thought 벡터를 이용한 한국어 의미 표현

신창욱(Chang-Uk Shin),차정원(Jeong-Won Cha) 한국정보과학회 2017 한국정보과학회 학술발표논문집 Vol.2017 No.06
- 원문보기
2
범주 불균형 분류 문제를 위한 동적 비용 민감 학습

신창욱(Chang-Uk Shin),차정원(Jeong-Won Cha) 한국정보과학회 2019 한국정보과학회 학술발표논문집 Vol.2019 No.6
- 원문보기
3
멀티태스크 학습을 이용한 대화 상태 추적 시스템

신창욱(Chang-Uk Shin),장두성(Du-Seong Chang),차정원(Jeong-Won Cha) 한국정보과학회 2020 한국정보과학회 학술발표논문집 Vol.2020 No.7
- 원문보기
4
CRFs를 이용한 구문분석기의 오류 분석 및 자질 추천

신창욱(Chang-Uk Shin),차정원(Jeong-Won Cha) 한국정보과학회 2015 한국정보과학회 학술발표논문집 Vol.2015 No.12
- 원문보기
5
동적 가중치 부여 다중 비용 함수를 이용한 범주 불균형 데이터 분류

신창욱(Chang-Uk Shin),권오욱(Oh-Woog Kwon),차정원(Jeong-Won Cha) 한국정보과학회 2019 한국정보과학회 학술발표논문집 Vol.2019 No.6
- 원문보기
6
Dynamic Memory Network를 이용한 End-to-End 레스토랑 예약 대화 시스템

신창욱(Chang-Uk Shin),차정원(Jeong-Won Cha) 한국정보과학회 2017 한국정보과학회 학술발표논문집 Vol.2017 No.12
- 원문보기
7
Khann2 : 경험기반 고효율 한국어 품사태깅 도구

신창욱(Chang-Uk Shin),박성재(Seong-Jae Park),차정원(Jeong-Won Cha) 한국정보과학회 2015 한국정보과학회 학술발표논문집 Vol.2015 No.6
- 원문보기
8
범주 불균형 분류 문제를 위한 동적 비용 민감 학습 방법

신창욱(Chang-Uk Shin),오진영(Jinyoung Oh),차정원(Jeong-Won Cha) 한국정보과학회 2020 정보과학회 컴퓨팅의 실제 논문지 Vol.26 No.4
- 원문보기
- 복사/대출신청
학습 데이터셋 내 분류 범주 불균형은 그 데이터셋으로 학습된 분류 모형에 편향을 야기한다. 본 연구에서는 주어진 범주 불균형 데이터셋을 이용해 분류 모형을 학습하는 두 가지 새로운 비용 민감학습 방법을 제안한다. 첫 번째 비용 민감 학습 방법은 학습 코퍼스 내 범주별 발생 빈도와 디리클레 분포를 이용한다. 동적 가중치 부여 방법이라 명명한 이 방법은 디리클레 분포에서 표본을 추출하여 모델학습의 가중치로써 사용한다. 두 번째 방법은 학습 코퍼스 내 범주별 발생 빈도로 정답 표현을 변경하여 비용 민감 학습을 수행한다. 이 방법은 퍼지 정답 표현이라 명명하였다. 대화에서 발화의 감정과 화행을 분류하는 문제에 제안 방법을 적용하였을 때, MAP(Macro Average Precision) 기준 화행 약 1.1~2.2%p, 감정 약 0.9~3.6%p 가량의 성능 향상을 얻을 수 있었다. 실험 결과를 통해, 제안 방법이 범주 불균형 데이터셋의 학습에 효과적임을 확인하였다. Classification category imbalance in training dataset causes bias in the classification model. In this paper, we propose two new cost-sensitive training methods for training classification models using a given category imbalanced dataset. The first proposed method uses the occurrence rate by category in the dataset and the Dirichlet distribution. This method, called the dynamic weighting method, takes a sample from the distribution and uses that as the weight of the loss function. The second proposed method performs training by changing the expression of the answer by the occurrence rate of each category in the training corpus. This method is called fuzzy answer representation. When applying the proposed method to classify emotions and speech acts in the dialogue, the performance improvement of approximately 1.1-2.2%p for speech act classification and 0.9-3.6%p for emotion based on MAP(Macro Average Precision) was obtained. The experimental results showed that the proposed method is effective for training the category imbalanced dataset.
9
한국어 의미 분석을 위한 세종의미망 확장

박태호(Tae-Ho Park),신창욱(Chang-Uk Shin),박성재(Seong-Jae Park),박다솔(Da-Sol Park),신영태(Young-Tae Shin),차정원(Jeong-Won Cha) 한국정보과학회 2016 한국정보과학회 학술발표논문집 Vol.2016 No.12
- 원문보기
10
Rough Set을 이용한 형태소 품사 태깅 코퍼스 오류 정량화

박태호(Tae-Ho Park),박다솔(Da-Sol Park),신창욱(Chang-Uk Shin),박성재(Seong-Jae Park),차정원(Jeong-Won Cha) 한국정보과학회 2016 한국정보과학회 학술발표논문집 Vol.2016 No.6
- 원문보기

상세검색

RISS 보유자료

상세검색

해외전자자료

연관 검색어 추천