http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
유은지 ( Eun Ji Yu ),김정철 ( Jung Chul Kim ),이춘열 ( Choon Youl Lee ),김남규 ( Nam Gyu Kim ) 한국정보시스템학회 2012 情報시스템硏究 Vol.21 No.3
The increasing interest in big data analysis using various data mining techniques indicates that many commercial data mining tools now need to be equipped with fundamental text analysis modules. The most essential prerequisite for accurate analysis of text documents is an understanding of the exact semantics of each term in a document. The main difficulties in understanding the exact semantics of terms are mainly attributable to homonym and synonym problems, which is a traditional problem in the natural language processing field. Some major text mining tools provide a thesaurus to solve these problems, but a thesaurus cannot be used to resolve complex synonym problems. Furthermore, the use of a thesaurus is irrelevant to the issue of homonym problems and hence cannot solve them. In this paper, we propose a semantic text mining methodology that uses ontologies to improve the quality of text mining results by resolving the semantic ambiguity caused by homonym and synonym problems. We evaluate the practical applicability of the proposed methodology by performing a classification analysis to predict customer churn using real transactional data and Q&A articles from the "S" online shopping mall in Korea. The experiments revealed that the prediction model produced by our proposed semantic text mining method outperformed the model produced by traditional text mining in terms of prediction accuracy such as the response, captured response, and lift.
유은지(Eun-Ji Yu),김주덕(Ju-Duck Kim) 한국화장품미용학회 2014 한국화장품미용학회지 Vol.4 No.2
The purpose of this study was to examine awareness and use of medicinal herb cosmetics among female consumers, their general attitude to cosmetics, needs for medicinal herb cosmetics and opinions on their competitiveness. Its basically meant to step up the expansion of the medicinal herb cosmetic market among every consumer group and to provide some efficient marketing information. The subjects in this study were 411 female consumers who resided in and around Seoul. They were in their 20s through 50s. After a survey was conducted for 20 days from March 25 to April 14, 2014, the collected data were analyzed. The findings of the study were as follows: As the findings of the study show, the majority was aware of medicinal herb cosmetics or had experience of using these cosmetics. The findings signify that there is a growing demand for medicinal herb cosmetics. As the use of these cosmetics is more prevailing among women, there will be a bright future for the medicinal herb cosmetic market both in our country and in the world if scientific evidence is offered about the effects of the cosmetics.
사용자의 국가 R&D 정보 이용 접근성 향상을 위한 큐레이션 서비스 : 이슈로 보는 R&D 사례를 중심으로
유은지(Eun-ji Yu),최광남(Kwang-Nam Choi),황유나(Youna Hwang) 한국콘텐츠학회 2020 한국콘텐츠학회논문지 Vol.20 No.9
국가 R&D 데이터는 기초과학 연구부터 산업화 부분까지 전 분야에 대한 정보를 포괄하고 있지만 전문적인 용어로 표현되며 이로 인해 대중의 이용에는 어려움이 있다. 이에 NTIS 는 국가 R&D 데이터를 이용한 데이터 큐레이션 서비스를 개발하여 국가적인 현안과 사회적 이슈에 대해 국가 R&D 정보를 선별하여 제공하고 있다. 이에 본 연구에서는 NTIS 의 데이터 큐레이션 서비스인 이슈로 보는 R&D 서비스 분석을 통해 국가 R&D 정보를 이용한 데이터 큐레이션 서비스 구축 방안을 제안하고자 하며 이 서비스가 국가 R&D 정보에 대한 사용자의 접근성 향상에 미친 영항도 분석하였다. 이슈로 보는 R&D 서비스는 뉴스기사에서 추출한 이슈와 관련된 국가 R&D 과제, 성과, 주요 연구기관 등을 매핑하여 정리, 제공한다. 패키징에 이용된 데이터는 모두 오픈되어 있고 관련 자료는 보고서 형식으로 정리돠어 PDF 파일로 제공된다. 또한 해당 프로세스를 자동화 하여 관리자 뿐 만 아니라 NTIS 이용자라면 누구나 개인적인 이슈패키징을 가능하게 하였다. 이 밖에 Special Issue 코너를 개설하며 주요 현안에 대한 사용자의 접근,이용 편의성을 높였고 코너 개설 이후 접속자의 페이지뷰가 증가한 것으로 나타났다. National R & D data covers information in all fields from basic science research to industrialization, but it is expressed in technical terms, which make it difficult for the public to use. Accordingly, NTIS developed and launched the data curation service ‘R&D issue service’, which selects national R&D information on national and social issues and provides them to the public. Therefore, this study aims to analyze the effect of a data curation service on NTIS users’ access to R&D data and suggest how to develop the curation service. The R&D issue service extracts issue from the news article and provide related national R&D projects, achievements and major research institute. All raw data used for the service are open to the public, organized in a report format and provided as PDF files. In addition, automative process is developed for all NTIS users to make individual issue packaging like administrator. The results show that ‘R&D issue service‘ launching increases users’ access and convenience to R&D data related to major issues, and the number of page views of users increased after the service was opened.
국가 현안 주제 선정을 위한 데이터 분석 기반 하이브리드 방법론
홍진성 ( Jin Sung Hong ),최희석 ( Hee Seok Choi ),한희준 ( Hee Jun Han ),김재수 ( Jae Soo Kim ),유은지 ( Eun Ji Yu ),임소라 ( So Ra Lim ),김남규 ( Nam Gyu Kim ) (주)엘지씨엔에스(구 LGCNS 엔트루정보기술연구소) 2014 Entrue Journal of Information Technology Vol.13 No.1
국가적 차원의 현안에 대한 주제 선정은 선정된 주제로부터 유관 부서의 어젠다(Agenda)가 도출될 뿐 아니라, 가까운 미래와 먼 미래의 국가 경쟁력을 좌우할 수 있는 R&D 투자의 초석을 마련한다는 측면에서 그 중요성이 인정된다. 소수의 전문가에 의해 Top-Down 방식으로 수행되어 온 기존의 현안 선정 방식은 복잡한 사회의 급변하는 이슈를 적절하게 반영하기 어렵다는 한계를 갖는다. 이러한 한계를 극복하기 위해 데이터 분석을 활용한 국가 현안 도출 시도가 다수 이루어지고 있지만, 데이터 분석에 전적으로 의존하는 방법론은 추출된 이슈가 과연 중요한 현안인지 아니면 단순한 가십성 이슈인지 구분하지 못한다는 한계를 갖는다. 본 논문에서는 이러한 한계를 극복하기 위해, 전문가가 선정한 기준 현안에 텍스트 분석을 통해 새롭게 추출된 이슈들을 보완하는 통합 키워드 추출 방법론을 제안하였다. 또한 실험을 통해 정부에서 발표한 기준 자료에 명시된 국가 현안과 뉴스, 칼럼, 정책자료, 토론자료의 분석 결과로 도출된 추가 이슈 키워드를 통합하는 과정을 보임으로써, 제안 방법론의 실무 적용 가능성을 살펴보았다. At the national level, the selection of pending national issue theme is very important not only for deriving the core agenda for each of selected topic, but also for presenting the direction of the R&D investment, which will influence the national com-petitiveness in the near and distant future. However, the conventional top-down method for selecting pending national issues have some limitations that it can`t properly reflect the current issues of the complex society. To overcome these limitations, we propose a hybrid form of extracting and integrating issue keywords. At first, we extract seed keywords from the standard source data. And then, additional issue keywords are extracted from the results of a topic analysis that is conducted on policy reports, news, columns, and discussion documents. By showing the process of applying the proposed methodology to 11,000 real documents, the practical applicability of the proposed methodology is examined.