http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
Naive Bayes 와 SVM 을 이용한 트위터 데이터의 긍정/부정 의견 자동분류 결과 분석
조희련 ( Heeryon Cho ),김성국 ( Songkuk Kim ) 한국정보처리학회 2012 한국정보처리학회 학술대회논문집 Vol.19 No.1
나꼼수 비키니 시위’에 대한 긍정적(지지), 부정적(비판) 의견을 담은 트위터 데이터를, 단어의 출현에 주목하여 Naïve Bayes (NB)와 Support Vector Machine (SVM)을 적용하여 자동분류 한 결과, NB가 75.98%로, 73.65%인 SVM 보다 약간 더 나은 성능을 보였다. 본 실험을 통해, 기계학습을 이용한 대중의견(opinion) 자동분류 시스템을 실용화할 때의 고려사항에 대해 살펴 본다.
다양한 차원 축소 기법을 적용한 문서 군집화 성능 비교
조희련 ( Heeryon Cho ) 한국정보처리학회 2018 한국정보처리학회 학술대회논문집 Vol.25 No.1
문서 군집화 성능을 높이기 위한 한 방법으로 차원 축소를 적용한 문서 벡터로 군집화를 실시하는 방법이 있다. 본 발표에서는 특이값 분해(SVD), 커 널 주성분 분석 (Kernel PCA), Doc2Vec 등의 차원 죽소 기법을, K-평균 군집화(K-means clustering), 계층적 병합 군집화(hierarchical agglomerative clustering), 스펙트럼 군집화(spectral clustering)에 적용하고, 그 성능을 비교해 본다.
조희련 ( Heeryon Cho ),최상현 ( Sang-hyun Choi ) 한국정보처리학회 2015 한국정보처리학회 학술대회논문집 Vol.22 No.1
본 연구에서는 네이버 영화평을 학습데이터로 사용하여 영화평 감성분류에 필요한 감성사전을 자동으로 구축하는 방법에 대해 제안한다. 이 때 학습데이터의 분량과 긍정/부정 영화평의 비율을 달리하여 네 가지의 학습데이터를 마련하고, 각 경우에 대하여 감성사전과 나이브베이즈(이하, NB) 분류기를 구축한 후, 이 둘의 성능을 비교했다. 네 종류의 학습데이터로 구축한 감성사전과 NB 분류기를 이용하여 영화평 감성 자동분류 성능을 비교한 결과, 네 경우의 평균 균형정확도는 감성사전이 78.2%, NB 분류기가 66.1%였다.
KoBERT, 나이브 베이즈, 로지스틱 회귀의 한국어 쓰기 답안지 점수 구간 예측 성능 비교
조희련 ( Heeryon Cho ),임현열 ( Hyeonyeol Im ),차준우 ( Junwoo Cha ),이유미 ( Yumi Yi ) 한국정보처리학회 2021 한국정보처리학회 학술대회논문집 Vol.28 No.1
한국어 심층학습 언어모델인 KoBERT와, 확률적 기계학습 분류기인 나이브 베이즈와 로지스틱 회귀를 이용하여 유학생이 작성한 한국어 쓰기 답안지의 점수 구간을 예측하는 실험을 진행하였다. 네가지 주제(‘직업’, ‘행복’, ‘경제’, ‘성공’)를 다룬 답안지와 점수 레이블(A, B, C, D)로 쌍을 이룬 학습데이터 총 304건으로 다양한 자동분류 모델을 구축하여 7-겹 교차검증을 시행한 결과 KoBERT가 나이브 베이즈나 로지스틱 회귀보다 약간 우세한 성능을 보였다.
일본과 중국의 대학 AI 교양 교육 현황 분석 및 제언 -AI 리터러시 교양 교육 중심으로
박광영 ( Park Kwang Young ),권성호 ( Quan Cheng-hao ),조희련 ( Cho Heeryon ) 중앙대학교 인문콘텐츠연구소 2021 인공지능인문학연구 Vol.7 No.-
인공지능(AI)과 소통하고 AI를 활용할 줄 아는 소양을 미래의 ‘교양’으로 받아들이고자 하는 움직임이 이는 가운데, 교양 교육을 담당하고 있는 우리나라 대학도 AI 교양 교육 프로그램의 도입을 논의하고 있다. 그렇다면 우리의 인접 국가인 일본과 중국은 어떨까. 우리는 4차 산업혁명이라는 변혁의 시기를 똑같이 겪고 있는 일본과 중국이 대학 AI 교양 교육을 어떻게 준비하고 있는지를 조사하고 그 결과를 여기서 보고한다. 두 나라의 대학 AI 교양 교육 현황을 요약하면 다음과 같다. 일본은 ‘수리·데이터 사이언스 교육 강화 거점 컨소시엄’을 만들어 ‘AI 리터러시 표준 커리큘럼’을 개발하였고, ‘도입’, ‘기초’, ‘소양’, ‘선택’의 네 단계로 정의된 이 커리큘럼에서 AI 기술을 다양한 시각에서 이해하기 위한 소양을 정의하고 있다. 중국은 대학 AI 교양 교육 개발에 초점을 맞추고 있지는 않으나, 대학에서의 ‘AI+X’ 복합형 전공 모델의 구축과 다양한 학과와의 융합을 통해 다양한 전공이 AI 기술과 접점을 갖도록 유도하고 있다. 두 나라 대학 모두 아직 명시적으로 ‘AI 교양 교육’을 도입하지는 않았지만, 전교생을 대상으로 열려 있는 AI 관련 과목이 존재하기에 이들을 본 논문에서 소개한다. Nowadays a strong consensus is forming that the knowledge of how to use and communicate with AI should be included in the college liberal arts education. Meanwhile, South Korean universities are in the midst of discussing ways to introduce AI-related liberal arts program in their curriculum. This prompted us to explore the university situations in our neighboring countries, namely, Japan and China. We investigate how Japan and China are preparing university AI-related liberal arts education program and report the results in this paper. The current status of AI liberal arts education in the two countries can be summarized as follows. Japan has established a ‘Consortium for Strengthening Mathematical and Data Science Education’ and developed an ‘AI Literacy Standard Curriculum’. China is encouraging diverse majors to incorporate the knowledge of AI technology through ‘AI+X’ convergence model. Both countries have not yet explicitly established the AI liberal arts program per se, but are offering several AI-related courses such as ‘Introduction to AI’ to all university students. South Korean government and universities can take reference from Japan’s standard AI literacy curriculum and China’s ‘AI+X’ convergence model.