http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
장현애 ( Hyeon Ae Jang ),정희진 ( Hee Jin Jeong ),이은지 ( Eun Ji Lee ),최다은 ( Da Eun Choi ),박혁주 ( Hyeok Ju Park ),송양의 ( Yang-eui Song ),이용규 ( Yong Kyu Lee ) 한국정보처리학회 2017 한국정보처리학회 학술대회논문집 Vol.24 No.2
소규모 전자상거래 업체에서 데이터베이스를 사용하여 고객 물류 정보를 관리하지 못하고 파일로 관리한다. 파일로 관리되는 데이터는 자료 형식의 차이로 업체 간 데이터를 주고받기 어려운 문제가 있다. 이러한 문제를 해결하기 위해서 파일로 관리되는 고객 물류 데이터를 하나의 시스템으로 통합하여 관리할 수 있는 체계가 필요하다. 본 논문에서는 JSON을 이용한 고객 물류 관리 시스템을 제안하여 통합 문제를 해결하고자 한다. 본 시스템은 각 고객 물류 데이터의 데이터 구조를 분석하여 통합 데이터베이스를 위한 스키마를 생성하고, 새로운 스키마에 맞게 기존 데이터를 전처리 과정을 거쳐 통합 데이터베이스에 저장하여 관리한다. 제안된 시스템을 사용하면 파일로 입력된 데이터가 자동으로 통합 데이터베이스로 저장되어, 업체별로 관리되는 데이터를 통합하여 관리할 수 있다.
Word2Vec을 이용한 웹 문서 클러스터링 시스템 구현
이현석 ( Hyun Seok Yi ),안성훈 ( Sung Hun Ahn ),이용환 ( Yong Hwan Lee ),천명재 ( Myung Jae Cheon ),박혁주 ( Hyeok Ju Park ),박미화 ( Mee Hwa Park ),이용규 ( Yong Kyu Lee ) 한국정보처리학회 2016 한국정보처리학회 학술대회논문집 Vol.23 No.2
웹 문서 추천 시스템에서는 유사한 내용의 문서임에도 불구하고 URL이 달라서 다른 문서로 인식하여 사용자에게 추천하는 데이터 희소성 문제가 있다. 여기서 기존 연구들은 이 문제에 대한 해결 방법으로 TF-IDF를 이용하였으나 비용 및 시간의 한계가 있으며 유의어 분류 문제가 있다. 본 논문에서는 Word2Vec을 이용한 웹문서 학습 시스템을 통해 문제를 해결한다. 제안 시스템은 언론사의 뉴스를 수집하고 이를 정형화된 형식으로 분석하여 가공하는 전처리 과정을 거친 후 Word2Vec 학습을 통해 문서 벡터를 생성하고 이를 K-Means 클러스터링으로 유사 문서군으로 분류한다. 이 시스템을 이용하면 데이터 희소성 문제를 해결할 뿐만 아니라 연산량이 TF-IDF에 비해 줄어들고 유의어 분류 시 유사도가 높아지는 강점이 있다.