http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
데이터셋 유형 분류를 통한 클래스 불균형 해소 방법 및 분류 알고리즘 추천
김정훈,곽기영,Kim, Jeonghun,Kwahk, Kee-Young 한국지능정보시스템학회 2022 지능정보연구 Vol.28 No.3
AI(Artificial Intelligence)를 다양한 산업에서 접목하기 위해 알고리즘 선택에 대한 관심이 증가하고 있다. 알고리즘 선택은 대부분 데이터 과학자의 경험에 의해 결정되는 경우가 많다. 하지만 경험이 부족한 데이터 과학자의 경우 데이터셋 특성 기반의 메타학습(meta learning) 을 통해 알고리즘을 선택한다. 기존의 알고리즘 추천은 선정 과정이 블랙박스이기 때문에 어떠한 근거에 의해 도출되는지 알 수 없었다. 이에 따라 본 연구에서는 k-평균 군집분석을 활용하여 데이터셋 특성에 따라 유형을 나누고 적합한 분류 알고리즘과 클래스 불균형 해소 방법을 탐색한다. 본 연구 결과 네 가지 유형을 도출하였으며 데이터셋 유형에 따라 적합한 클래스 불균형 해소 방법과 분류 알고리즘을 추천하였다.
VOC 데이터 내의 정형 속성과 텍스트마이닝으로 도출된 비정형 속성을 결합한 고객만족도 예측모형 개발
김정훈(Jeonghun Kim),권오병(Ohbyung Kwon) 한국경영학회 2015 한국경영학회 통합학술발표논문집 Vol.2015 No.08
VOC(Voice of Customer)는 특정 제품이나 서비스에 대한 조사가 아니라 고객의 의견 및 요구를 직접 알 수 있는 중요한 자원이다. 즉, VOC 정보를 활용하면 고객 대응 속도 향상 등 고객 만족도와 경영 성과를 제고할 수 있다. 하지만 VOC 내에 고객 불만 진술 등 다양한 비정형 데이터가 존재함에도 불구하고 분쟁 시 참고자료로만 활용하는 등 분석에 직접적으로 활용하지 않았다. 따라서 본 연구의 목적은 VOC 비정형 자료에 대한 텍스트마이닝을 통해서 획득되는 속성과 VOC 정형 자료를 결합하면 업무처리의 소요시간 등 고객 만족도를 예측하는 정확도가 개선되는지를 검증하는 것이다. 더 나아가 고객의 만족도를 예측하는 모형을 개발하고자 한다. 이를 위해 실제 기업 VOC 자료를 활용하고 C4.5 등 판별 알고리즘을 통해 그 성능을 실증 분석하였다. 또한 실제 VOC 자료의 활용에서 발생하는 공백 자료의 처리 등 분석 상의 이슈들을 제안하고자 한다. VOC(Voice of Custome r) is an important res ource in management that can directly know not only customer feedback but also specific product or service. In other words, if you use VOC information you can be improve customer responsiveness, customer satisfaction and business results. VOC has unstructured data such as customer complaints that is utilizing resources but it used when disputes. So purpose of this study is improve customer satisfaction by combined unstructured attribute from textmining with structure attribute in VOC. For this study, We use real data in company and C4.5 classification algorithm. Also suggest blank data preprocessing issue.
김정훈(Jeonghun Kim),이지영(Jiyeong Lee),류종식(Jongsik Ryu) 대한지질학회 2021 대한지질학회 학술대회 Vol.2021 No.10
수영강은 4개 행정구역 내 다양한 산업시설 및 주거지역을 흐르는 강으로 오염에 취약하다. 현재 수영강 하상퇴적물에 대한 연구는 많이 진행되었으나, 수질에 대한 연구는 거의 미비한 실정이다. 이에 수영강 수질에 영향을 주는 요인을 확인하고자 계절별(여름과 겨울) 총 16개 시료를 채취하여 주원소 및 미량원소를 분석하였다. 여름철 상류(초기 4개 지점)를 제외한 모든 시료의 주원소는 해수의 영향을 반영하였지만, 중금속은 다른 요인에 영향을 받음을 확인하였다. 특히, 3개 구간에서 중금속 농도변화가 심하게 나타났으며 이는 지류, 하수처리장, 매립하천, 지표유출에 의한 도로분진 등에 의한 것으로 판단된다. 이번 연구결과에서 제시한 수영강 내 높은 중금속 함량은 결국 해양생태계 축적을 통한 인체위해성까지 유발할 수 있는 영향인자로 작용할 수 있어 구체적인 오염원인자에 대한 추가연구가 요구된다.