http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
소수 클래스 데이터 증강을 통한 BERT기반의 유형 분류 모델 성능 개선
김정우 ( Jeong-woo Kim ),장광호 ( Kwangho Jang ),이용태 ( Yong Tae Lee ),박원주 ( Won-joo Park ) 한국정보처리학회 2020 한국정보처리학회 학술대회논문집 Vol.27 No.2
자연어처리 분야에서 딥러닝 기반의 분류 모델은 획기적인 성능을 보여주고 있다. 특히 2018 년 발표된 구글의 BERT 는 다양한 태스크에서 높은 성능을 보여준다. 본 논문에서는 이러한 BERT 가 클래스 불균형이 심한 데이터에 대해 어느 정도 성능을 보여주는지 확인하고 이를 해결하는 방법으로 EDA 를 선택해 성능을 개선하고자 한다. BERT 에 알맞게 적용하기 위해 다양한 방법으로 EDA를 구현했고 이에 대한 성능을 평가하였다.
효과적인 초동 수사를 위한 지도/준지도 학습 기반의 범죄 사건 정보 예측 및 용의자 후보군 특정 기술 연구
백명선(Myung-Sun Baek),박원주(Wonjoo Park),지종호(Jong Ho Jhee),신현정(Hyunjung Shin),장광호(Kwangho Jang),이용태(Yong-Tae Lee) 한국통신학회 2021 한국통신학회 학술대회논문집 Vol.2021 No.6
범죄사건 접수 초기에 신속하고 효과적으로 해당 범죄에 대응하기 위해서는 발생한 범죄 유형 및 용의자 후보군 대한 정보를 현장 파견 요원 및 수사관들에게 제공하는 것이 매우 효과적인 방법이다. 본 논문에서는 지도학습 기반의 인공지능 기술을 활용하여 접수된 범죄의 유형을 예측하는 기술을 설계한다. 설계된 기술은 범죄사건 접수 데이터인 텍스트 기반의 범죄사건 개요 정보를 활용하여 해당 범죄가 21 종의 중분류 기반 범죄유형 중 어느 유형에 해당하는지 예측하여 정보를 제공한다. 또한 준지도학습 기반의 범죄사건에 대한 유력한 용의자 후보군 특정 기술을 설계한다. 용의자 후보군 특정을 위해, 기존에 누적된 여러 종류의 치안데이터가 활용된다. 상기 이종의 데이터를 활용하여 사건과 인물 사이의 관계를 기반으로 하는 다계층 네트워크를 생성한 후, 신규 사건의 용의자/사건관련자 등을 준지도학습기반의 기계학습기법으로 예측한다. 이를 통하여 설계된 기술은 사건의 위험수준을 초기에 인지하여 신속한 초동대응방법을 도출하고, 유력한 용의자 후보군을 특정하는 것에 주요한 참고 자료로 활용될 수 있다.