        시가 나오야 문학 속의 전쟁의 표상

        최석재(Choi, Sukjae) 한국외국어대학교 외국문학연구소 2017 외국문학연구 Vol.- No.65

        시가 나오야는 창작에 뜻을 둔 시절부터 군제도와 군대, 전쟁에 대하여 확실한 생각을 갖고 있었으며, 일찍부터 인간생명의 소중함을 깨닫고 있었다. 그가 살고 있는 시대를 배경으로 그때에 일어났던 비인간적인 전쟁의 아픔과 상처를 삽 화처럼 간결하면서도 직선적으로 표출시키고 있다. 시가는 1918년 가을, 메이지 천황의 탄생일과 같은 「11월 3일 오후의 일」이라는 제목의 작품을 만든다. 「11월 3일 오후의 일」과 「잿빛달」은 시가가 각각 그 당시에 직접 경험한 것들을 작품화한 것이고, 「야마가타」는 젊은 날에 있었던 잊지 못할 일을 되돌이켜 본 것이다. 「잿빛달」은 소년직공의 위태롭게서있는 애처로운 모습에서, 선동적인 반전소설의 경직성을 뛰어넘어 전쟁의 참상을 고발하고 있다. 또한 「야마가타」에서는 천황에게 전쟁의 책임이 있다고 생각하지 않고, 소수의 어리석은 자들이 천황제를 악용한 것이라고 말하고 있다. 그는 개인의 생명은 함부로 다룰 수 없는 소중한 것임을, 어떠한 경우에도 지켜져야 하는 것임을 잊지 않도록 강조하고 있다. 시가에게 있어서 최대의 쇼크는인간의 생명이 폭압적 권력에 의해 부조리하게 짓밟혀지는 것이었다. 끝내 시가 는 믿지 못할 나약하고 무지한 인간이 아니라, 신에게 ‘전쟁은 커다란 죄악’이라며 하루라도 빨리 이 세계에서 전쟁을 거두어 달라고 부르짖는다. Since he was a literary figure and realized the importance of human life, Shiga Naoya had definite ideas about war and the military. In the fall of 1918, he wrote a work set on the anniversary of the birth of the Meiji Emperor, entitled 「The afternoon of November 3」. 「The grey moon」 transcends the rigidity of the anti-war novel with a pathetic picture of a boy standing precariously, accusing the war of horrors. In 「Yamagata」he says that the Emperor is not responsible for the war, but rather a few abusers of the imperial system. Through these three works, he emphasized that the personal life of the individual is priceless and therefore must be preserved. In the end, the individual is not a weak and ignorant human being, but one who appeals to God to eliminate war from the earth, because “War is a great sin.”

      • KCI등재

        주관적 웰빙 상태 측정을 위한 비정형 데이터의 상황기반 긍부정성 분석 방법

        최석재(Sukjae Choi),송영은(Yeongeun Song),권오병(Ohbyung Kwon) 한국지능정보시스템학회 2016 지능정보연구 Vol.22 No.1

        의료IT 서비스의 유망 분야인 정신건강 증진을 위한 주관적 웰빙 서비스(subjective well-being service) 구현의 핵심은 개인의 주관적 웰빙 상태를 정확하고 무구속적이며 비용 효율적으로 측정하는 것인데 이를 위해 보편적으로 사용되는 설문지에 의한 자기보고나 신체부착형 센서 기반의 측정 방법론은 정확성은 뛰어나나 비용효율성과 무구속성에 취약하다. 비용효율성과 무구속성을 보강하기 위한 온라인 텍스트 기반의 측정 방법은 사전에 준비된 감정어 어휘만을 사용함으로써 상황에 따라 감정어로 볼 수 있는 이른바 상황적 긍부정성(contextual polarity)을 고려하지 못하여 측정 정확도가 낮다. 한편 기존의 상황적 긍부정성을 활용한 감성분석으로는 주관적 웰빙 상태인 맥락에서의 감성분석을 할 수 있는 감정어휘사전이나 온톨로지가 구축되어 있지 않다. 더구나 온톨로지 구축도 매우 노력이 소요되는 작업이다. 따라서 본 연구의 목적은 온라인상에 사용자의 의견이 표출된 비정형 텍스트로부터 주관적 웰빙과 관련한 상황감정어를 추출하고, 이를 근거로 상황적 긍부정성 파악의 정확도를 개선하는 방법을 제안하는 것이다. 기본 절차는 다음과 같다. 먼저 일반 감정어휘사전을 준비한다. 본 연구에서는 가장 대표적인 디지털 감정어휘사전인 SentiWordNet을 사용하였다. 둘째, 정신건강지수를 동적으로 추정하는데 필요한 비정형 자료인 Corpora를 온라인 서베이로 확보하였다. 셋째, Corpora로부터 세 가지 종류의 자원을 확보하였다. 넷째, 자원을 입력변수로 하고 특정 정신건강 상태의 지수값을 종속변수로 하는 추론 모형을 구축하고 추론 규칙을 추출하였다. 마지막으로, 추론 규칙으로 정신건강 상태를 추론하였다. 본 연구는 감정을 분석함에 있어, 기존의 연구들과 달리 상황적 감정어를 적용하여 특정 도메인에 따라 다양한 감정 어휘를 파악할 수 있다는 점에서 독창성이 있다. Measuring an individual’s subjective wellbeing in an accurate, unobtrusive, and cost-effective manner is a core success factor of the wellbeing support system, which is a type of medical IT service. However, measurements with a self-report questionnaire and wearable sensors are cost-intensive and obtrusive when the wellbeing support system should be running in real-time, despite being very accurate. Recently, reasoning the state of subjective wellbeing with conventional sentiment analysis and unstructured data has been proposed as an alternative to resolve the drawbacks of the self-report questionnaire and wearable sensors. However, this approach does not consider contextual polarity, which results in lower measurement accuracy. Moreover, there is no sentimental word net or ontology for the subjective wellbeing area. Hence, this paper proposes a method to extract keywords and their contextual polarity representing the subjective wellbeing state from the unstructured text in online websites in order to improve the reasoning accuracy of the sentiment analysis. The proposed method is as follows. First, a set of general sentimental words is proposed. SentiWordNet was adopted; this is the most widely used dictionary and contains about 100,000 words such as nouns, verbs, adjectives, and adverbs with polarities from -1.0 (extremely negative) to 1.0 (extremely positive). Second, corpora on subjective wellbeing (SWB corpora) were obtained by crawling online text. A survey was conducted to prepare a learning dataset that includes an individual’s opinion and the level of self-report wellness, such as stress and depression. The participants were asked to respond with their feelings about online news on two topics. Next, three data sources were extracted from the SWB corpora: demographic information, psychographic information, and the structural characteristics of the text (e.g., the number of words used in the text, simple statistics on the special characters used). These were considered to adjust the level of a specific SWB. Finally, a set of reasoning rules was generated for each wellbeing factor to estimate the SWB of an individual based on the text written by the individual. The experimental results suggested that using contextual polarity for each SWB factor (e.g., stress, depression) significantly improved the estimation accuracy compared to conventional sentiment analysis methods incorporating SentiWordNet. Even though literature is available on Korean sentiment analysis, such studies only used only a limited set of sentimental words. Due to the small number of words, many sentences are overlooked and ignored when estimating the level of sentiment. However, the proposed method can identify multiple sentiment-neutral words as sentiment words in the context of a specific SWB factor. The results also suggest that a specific type of senti-word dictionary containing contextual polarity needs to be constructed along with a dictionary based on common sense such as SenticNet. These efforts will enrich and enlarge the application area of sentic computing. The study is helpful to practitioners and managers of wellness services in that a couple of characteristics of unstructured text have been identified for improving SWB. Consistent with the literature, the results showed that the gender and age affect the SWB state when the individual is exposed to an identical queue from the online text. In addition, the length of the textual response and usage pattern of special characters were found to indicate the individual’s SWB. These imply that better SWB measurement should involve collecting the textual structure and the individual’s demographic conditions. In the future, the proposed method should be improved by automated identification of the contextual polarity in order to enlarge the vocabulary in a cost-effective manner.

      • KCI우수등재

        빅데이터 분석을 위한 한국어 SentiWordNet 개발 방안 연구

        최석재(Sukjae Choi),권오병(Ohbyung Kwon) 한국전자거래학회 2014 한국전자거래학회지 Vol.19 No.4

        빅데이터 내에 존재하는 감정 정보를 추출하여 사용자들이 특정 대상에 대하여 갖고 있는 인식이 어떠한지를 파악하고자 하는 노력이 활발히 이루어지고 있다. 상품, 영화, 그리고 사회적 이슈 등에 대한 문장을 분석하여 사람들이 해당 주제에 어떠한 견해를 가지고 있는지를 분석하고 측정하여 구체적인 선호도를 알아내는 것이다. 문장에서 드러나는 감정 정도를 얻기 위해서는 감정어휘의 목록과 정도값을 제시할 수 있는 감정어휘사전이 필요하므로 본 연구에서는 감정어휘를 발견하는 방법과 이들의 정도값을 결정하는 문제를 다룬다. 기본적인 방법은 기초 감정어휘의 목록 수집과 이들의 정도값은 선행연구 결과와 직접 설문 방식을 이용하고, 확장된 목록의 수집과 정도값은 사전의 표제어 설명부(glosses)를 이용해 추론하는 것이다. 그 결과 발견된 감정어휘는 전형성을 띠고 있는 기본형 감정어휘, 기본형 감정어휘의 gloss에 사용된 확장형 1단계 1층위 감정어휘, 비 감정어휘 중 gloss에 기본형 또는 확장형 감정어휘를 가지고 있는 확장형 2단계 1층위 감정어휘, gloss의 gloss에 기본형 또는 확장형 감정어휘가 사용된 확장형 2단계 2층위 감정어휘의 네 종류로 나뉜다. 그리고 확장형 감정어휘의 정도값은 기본형 감정어휘의 정도값을 기초로 문형의 가중치와 강조승수를 적용하여 얻었다. 실험 결과 AND, OR 문형은 내포된 어휘의 감정 정도값을 평균 내는 가중치를, Multiply 문형은 정도 부사어의 종류에 따라 1.2~1.5의 가중치를 갖는 것으로 파악되었다. 또한 NOT 문형은 사용된 어휘의 감정 정도를 일정 정도로 낮추어 역전시키는 것으로 추정된다. 또한 확장형 어휘에 적용되는 강조승수는 1층위에서 2, 2층위에서 3을 갖는 것으로 예상된다. Efforts to identify user’s recognition which exists in the big data are being conducted actively. They try to measure scores of people’s view about products, movies and social issues by analyzing statements raised on Internet bulletin boards or SNS. So this study deals with the problem of determining how to find the emotional vocabulary and the degree of these values. The survey methods are using the results of previous studies for the basic emotional vocabulary and degree, and inferring from the dictionary’s glosses for the extended emotional vocabulary. The results were found to have the 4 emotional words lists (vocabularies) as basic emotional list, extended 1 stratum 1 level list from basic vocabulary’s glosses, extended 2 stratum 1 level list from glosses of non-emotional words, and extended 2 stratum 2 level list from glosses’ glosses. And we obtained the emotional degrees by applying the weight of the sentences and the emphasis multiplier values on the basis of basic emotional list. Experimental results have been identified as AND and OR sentence having a weight of average degree of included words. And MULTIPLY sentence having 1.2 to 1.5 weight depending on the type of adverb. It is also assumed that NOT sentence having a certain degree by reducing and reversing the original word’s emotional degree. It is also considered that emphasis multiplier values have 2 for 1 stratum and 3 for 2 stratum.

      • KCI등재

        지자체 사이버 공간 안전을 위한 금융사기 탐지 텍스트 마이닝 방법

        최석재(Sukjae Choi),이중원(Jungwon Lee),권오병(Ohbyung Kwon) 한국지능정보시스템학회 2017 지능정보연구 Vol.23 No.3

        최근 SNS는 개인의 의사소통뿐 아니라 마케팅의 중요한 채널로도 자리매김하고 있다. 그러나 사이버 범죄 역시 정보와 통신 기술의 발달에 따라 진화하여 불법 광고가 SNS에 다량으로 배포되고 있다. 그 결과 개인정보를 빼앗기거나 금전적인 손해가 빈번하게 일어난다. 본 연구에서는 SNS로 전달되는 홍보글인 비정형 데이터를 분석하여 어떤 글이 금융사기(예: 불법 대부업 및 불법 방문판매)와 관련된 글인지를 분석하는 방법론을 제안하였다. 불법 홍보글 학습 데이터를 만드는 과정과, 데이터의 특성을 고려하여 입력 데이터를 구성하는 방안, 그리고 판별 알고리즘의 선택과 추출할 정보 대상의 선정 등이 프레임워크의 주요 구성 요소이다. 본 연구의 방법은 실제로 모 지방자치단체의 금융사기 방지 프로그램의 파일럿 테스트에 활용되었으며, 실제 데이터를 가지고 분석한 결과 금융사기 글을 판정하는 정확도가 사람들에 의하여 판정하는 것이나 키워드 추출법(Term Frequency), MLE 등에 비하여 월등함을 검증하였다. Recently, SNS has become an important channel for marketing as well as personal communication. However, cybercrime has also evolved with the development of information and communication technology, and illegal advertising is distributed to SNS in large quantity. As a result, personal information is lost and even monetary damages occur more frequently. In this study, we propose a method to analyze which sentences and documents, which have been sent to the SNS, are related to financial fraud. First of all, as a conceptual framework, we developed a matrix of conceptual characteristics of cybercriminality on SNS and emergency management. We also suggested emergency management process which consists of Pre-Cybercriminality (e.g. risk identification) and Post-Cybercriminality steps. Among those we focused on risk identification in this paper. The main process consists of data collection, preprocessing and analysis. First, we selected two words ‘daechul(loan)’ and ‘sachae(private loan)’ as seed words and collected data with this word from SNS such as twitter. The collected data are given to the two researchers to decide whether they are related to the cybercriminality, particularly financial fraud, or not. Then we selected some of them as keywords if the vocabularies are related to the nominals and symbols. With the selected keywords, we searched and collected data from web materials such as twitter, news, blog, and more than 820,000 articles collected. The collected articles were refined through preprocessing and made into learning data. The preprocessing process is divided into performing morphological analysis step, removing stop words step, and selecting valid part-of-speech step. In the morphological analysis step, a complex sentence is transformed into some morpheme units to enable mechanical analysis. In the removing stop words step, non-lexical elements such as numbers, punctuation marks, and double spaces are removed from the text. In the step of selecting valid part-of-speech, only two kinds of nouns and symbols are considered. Since nouns could refer to things, the intent of message is expressed better than the other part-of-speech. Moreover, the more illegal the text is, the more frequently symbols are used. The selected data is given ‘legal’ or ‘illegal’. To make the selected data as learning data through the preprocessing process, it is necessary to classify whether each data is legitimate or not. The processed data is then converted into Corpus type and Document-Term Matrix. Finally, the two types of ‘legal’ and ‘illegal’ files were mixed and randomly divided into learning data set and test data set. In this study, we set the learning data as 70% and the test data as 30%. SVM was used as the discrimination algorithm. Since SVM requires gamma and cost values as the main parameters, we set gamma as 0.5 and cost as 10, based on the optimal value function. The cost is set higher than general cases. To show the feasibility of the idea proposed in this paper, we compared the proposed method with MLE (Maximum Likelihood Estimation), Term Frequency, and Collective Intelligence method. Overall accuracy and was used as the metric. As a result, the overall accuracy of the proposed method was 92.41% of illegal loan advertisement and 77.75% of illegal visit sales, which is apparently superior to that of the Term Frequency, MLE, etc. Hence, the result suggests that the proposed method is valid and usable practically. In this paper, we propose a framework for crisis management caused by abnormalities of unstructured data sources such as SNS. We hope this study will contribute to the academia by identifying what to consider when applying the SVM-like discrimination algorithm to text analysis. Moreover, the study will also contribute to the practitioners in the field of brand management and opinion mining.

      • KCI우수등재

        온라인 뉴스 제목 분석을 통한 특정 장소 이벤트 성과 예측을 위한 형태소 분석 방법

        최석재(Sukjae Choi),이재웅(Jaewoong Lee),권오병(Ohbyung Kwon) 한국전자거래학회 2016 한국전자거래학회지 Vol.21 No.1

        공개된 데이터인 온라인 뉴스 기사 중 상당수는 도시와 같은 특정 장소에서 발생하는 이벤트에 관련된 사실과 의견을 담고 있어 독자의 의사 결정에 영향을 끼친다. 따라서 대량의 인터넷 뉴스 기사를 분석하면 향후 사람들이 특정 이벤트에 대하여 어떠한 선택을 할지 예상할 수 있을 것이다. 이에 본 연구는 온라인 뉴스 기사 제목을 형태소 분석하여 특정 장소에서 이루어질 이벤트의 성과를 사전에 예측하는 방법을 제안하고자 한다. 기사 제목은 기사의 가장 핵심적인 내용을 담고 있어 본문보다 사실과 의견이 더 정확하게 발현될 뿐 아니라, 모바일 환경에서는 기사 본문보다 더 큰 영향력을 가지기 때문에 이벤트의 성과 예측에 효과적인 자료이다. 이에 인터넷 뉴스 기사의 제목을 수집하여 학습 데이터와 평가 데이터로 구분하고, 학습 데이터에서 유의한 극성을 보이는 형태소를 추출하여 전체 기사의 제목을 감성 분석하였다. 여기에 뉴스기사가 갖는 특성이 반영될 수 있도록 기사 검색량과 기사 산출량 정보를 변인에 추가하여 이벤트 성과를 예측하는 알고리즘을 수립하였다. 그 결과 70.6%의 성공률로 성과를 예측하여 다른 비교 대상 분석 방법과 분명한 차이를 보였다. 도출된 이벤트 성과 예측 정보는 이벤트를 준비하는 기관 및 업체에서 예상 수요량을 결정할 때 도움을 줄 수 있을 것이다. Online news on the Internet, as published open data, contain facts or opinions about a specific affair and hence influences considerably on the decisions of the general publics who are interested in a particular issue. Therefore, we can predict the people’s choices related with the issue by analyzing a large number of related internet news. This study aims to propose a text analysis method to predict the outcomes of events that take place in a specific place. We used topics of the news articles because the topics contains more essential text than the news articles. Moreover, when it comes to mobile environment, people tend to rely more on the news topics before clicking into the news articles. We collected the titles of news articles and divided them into the learning and evaluation data set. Morphemes are extracted and their polarity values are identified with the learning data. Then we analyzed the sensitivity of the entire articles. As a result, the prediction success rate was 70.6% and it showed a clear difference with other analytical methods to compare. Derived prediction information will be helpful in determining the expected demand of goods when preparing the event.

      • KCI등재

      • 형태소 단위의 뉴스 제목 분석을 통해 추출된 긍부 정성 기반의 특정 장소 이벤트 성과 예측방법 연구

        이재웅(Lee, Jae Woong),최석재(Choi Sukjae),권오병(Kwon Ohbyung) 한국IT서비스학회 2015 한국IT서비스학회 학술대회 논문집 Vol.2015 No.추계

        공개된 데이터인 인터넷 뉴스 기사는 대개 특정 사안에 대해 관점을 가지고 있는 글로서 일반 대중의 의사 결정에 적지 않은 영향을 끼친다. 따라서 대량의 인터넷 뉴스 기사를 분석하면 향후사람들이 특정 사안에 대하여 어떠한 선택을 하게 될 지를 예상할 수 있다. 본 연구에서는 인터넷 뉴스 기사의 일부분인 제목만을 데이터 마이닝하여 특정 장소에서 이루어지는 이벤트의 성과를 예측할 수 있는 방안을 제시하고자 한다. 기사 제목은 제한된 어휘로 가장 핵심적인 내용을 담고 있을 뿐만 아니라, 모바일 환경에서는 기사 본문보다 더 큰 영향력을 가진다. 수집된 인터넷 기사 제목은 학습 데이터와 평가 데이터로 구분하고, 학습 데이터에서 극성을 보이는 형태소를 추출하여 전체 기사의 제목을 감성 분석하였다. 여기에 뉴스 기사가 갖는 특성이 반영될 수 있도록 기사검색량과 기사 산출량 정보를 변인에 추가하여 이벤트 성과를 예측하는 알고리즘을 수립하였다.

      • KCI등재

        존대등분 계산법과 사례기반추론을 활용한 상황 인식형 모바일 인터페이스 시스템

        권오병(Kwon Ohbyung),최석재(Choi Sukjae),박태환(Park Tae Hwan) 한국지능정보시스템학회 2007 지능정보연구 Vol.13 No.3

        모바일 서비스의 수용성에는 사용자 인터페이스가 중요한 요소이다. 특히 모바일 인터페이스에서 청자(listner)인 인간에게 화자(speaker)인 기계가 어떻게 시의적절한 대화를 하는가는 수용성에 중요한 요소임에도 불구하고 아직까지 이에 대한 본격적인 연구가 진행되지 못했다. 따라서 본 연구의 목적은 사용자의 상황을 인식한 존대등분 계산법을 제안하여 이에 근거한 시의적절한 대화를 지원하는 상황 인식형 모바일 인터페이스를 설계하도록 하는 것이다. 다만 존대등분 계산은 문화별 및 언어별로 차이가 날 수 있으므로 한국어를 대상으로 계산법을 제안하려고 한다. 유비쿼터스 환경과 같은 분산 환경에서 사생활 정보를 보호하면서 사례기반 추론을 수행하기 위해 기존의 Minkowski aggregation 방법을 수정한 Nested Minkowski aggregation 방법을 사용하였다. 또한 본 방법론의 사용가능성을 증명하기 위하여 드라마 사례를 가지고 시뮬레이션 기반의 성능 비교를 수행하였다. User interface has been regarded as a crucial issue to increase the acceptance of mobile services. In special, even though to what extent the machine as speaker communicates with human as listener in a timely and polite manner is important, fundamental studies to come up with these issues have been very rare. Hence, the purpose of this paper is to propose a methodology of estimating politeness level in a certain context-aware setting and then to design a context-aware system for polite mobile interface. We will focus on Korean language for the polite level estimation simply because the polite interface would highly depend on cultural and linguistic characteristics. Nested Minkowski aggregation model, which amends Minkowski aggregation model, is adopted as a privacy-preserving similarity evaluation for case retrieval under distributed computing environment such as ubiquitous computing environment. To show the feasibility of the methodology proposed in this paper, simulation-based experiment with drama cases has performed to show the performance of the methodology proposed in this paper.

      • 사회 이슈와 과학기술 연계분석을 위한 비정형 데이터 기반의 토픽간 유사도 측정방법

        진윤선(Jin, YoonSun),최석재(Choi, SukJae),하미향(Ha, MiHyang),권오병(Kwon, Ohbyung) 한국IT서비스학회 2016 한국IT서비스학회 학술대회 논문집 Vol.2016 No.춘계

        국가 R&D 방향이 모방형에서 혁신주도형으로 전환됨에 따라 신기술에 대한 신속한 기회포착 및 선점의 중요성이 부각되고 있다. 이 때문에 신기술 검색을 도와주는 공공서비스는 주로 특허, 논문, 무역정보에 대한 키워드 기반 검색을 제공하고 기술개발 사업 기획,운영 및 평가 등 전주기적 연계를 위한 지적 인프라 구축 및 고부가가치 창출에 기여하고 있다. 그러나 기존의 공공서비스는 전문가들에 의하여 작성되는 하향식(top-down) 사전 형성(pre-modeled) 검색 서비스로, 사용자들이 과학기술 토픽에 대한 이해가 상당해야 사용이 가능하다. 더구나 과학기술 연구토픽의 다양성이 심화되는 상황에서 실시간으로 등장하는 연구토픽을 포착하여 사회 이슈와 연결하는 검색 제공이 어렵다. 따라서 본 연구의 목표는사회 이슈 관련 키워드 생성 및 과학기술 이슈에 대해 상향식(bottom-up)으로 키워드를 생성하고 이들을 사회 이슈와 연결하는 비정형데이터 분석 방법론을 제안하는 것이다. 이를위해 인터넷 상에 공개된 비정형 데이터(뉴스, 문서, SNS, 블로그 등)를 수집 및 분석하여 사회적 이슈에서 제공하는 키워드 중심의 과학기술 이슈를 매칭 분석하고자 한다.

      • 지능형 챗봇 구현을 위한 실시간 사용자 프로파일 추론 모델링

        진윤선(Jin, Yoonsun),최석재(Choi, Sukjae),권오병(Kwon, Ohbyung) 한국IT서비스학회 2018 한국IT서비스학회 학술대회 논문집 Vol.2018 No.-

        현재 사용되고 있는 사용자 프로파일 추론 기법은 대부분 전체 대화문의 수집이 끝난 상태에서 추론하는 기법을 사용한다. 그러나 이는 적시에 필요한 서비스를 제공하지 못하게 하는 단점이 있다. 사용자에게 필요한 서비스를 즉시 제공하려면 짧은 대화문을 통해서도 지속적으로 사용자의 프로파일을 추론할 수 있어야 한다. 따라서 본 연구에서는 실시간으로 사용자의 프로파일을 추론하는 기법을 제안한다. 사용자가 작성한 문장을 DTM으로 구성하되, 지속적으로 업데이트하여 정보를 추가함으로써 대화가 진행될수록 DTM의 정보 량을 늘리는 기법이다. 본 연구에서는 이 방법의 효율성을 파악하기 위하여 어미만을 변인으로 선정하여 기존의 방법과 비교를 하였다. 이 기법은 즉각적인 추론을 가능하게하여 실시간 맞춤 서비스를 제공하는 지능형 챗봇을 구현하는데 목적을 두고 있다.

