RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
          펼치기
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        자연어처리의 교육적 활용 연구동향 분석

        진성희 한국교육정보미디어학회 2022 교육정보미디어연구 Vol.28 No.2

        The purpose of this study is to explore the users, purposes, and educational effects of natural language processing (NLP) by analyzing research trends using NLP, a representative AI technology, in education. Text mining techniques and systematic literature review methods were applied to explore research trends. The literature to apply the text mining technique was 44 papers published in KCI journals over the past 10 years (2012-2021), containing similar keywords to “natural language processing,” including the word “education” in the abstract. As a result of topic modeling using text mining techniques, four research topics were classified on the educational use of NLP, followed by intelligent teaching & learning support, exploring the educational use of NLP, Korean language learning support, and descriptive-type evaluation automation. As for the topic trend by period, intelligent teaching & learning support and descriptive-type evaluation automation research were conducted in the 1st (2012-2015) and 2nd (2016-2018) periods, and exploring the educational use of NLP and Korean language learning support emerged as a new topic in the 3rd (2019-2021). Among the papers subject to text mining technique analysis, a systematic literature review was conducted on 25 papers that specifically reported on the analysis criteria with a high probability of topic allocation in topic modeling. The analysis contents were the first author's affiliation, academic field, school level, and research method, focusing on the subject of use, purpose of use, and educational effect of NLP. As a result of the analysis, learners (80%), instructors (28%), and institutions (20%) were the subjects of NLP, and the purpose of use was intelligent learning support (44%), instructional communication (20%), Korean language learning support (16%), descriptive-type evaluation automation (16%), and learning success and failure prediction (4%). In the early period, research was conducted by IT engineers to develop technologies or systems for educational use of NLP, and recently, many studies were conducted by (subject-matter) educators to analyze the effects of developing tools and applying them to actual classes. Accordingly, there were many studies conducted with the development research method (68%), and the educational effects were analyzed in terms of effectiveness (28%), usability (24%), satisfaction (16%), efficiency (4%), and functionality (24%). Based on the research results, implications and future studies were proposed. 인공지능 기술이 발전하면서 교육의 다양한 맥락에서 인공지능 기술을 적용하려는 시도들이 이루어지고 있다. 이 연구에서는 대표적인 인공지능 기술인 자연어처리를 교육에 활용한 연구동향을 분석함으로써 자연어처리 기술의 교육적 활용주체, 활용목적, 교육적 효과 등에 대해 탐색하고자 하였다. 연구동향을 탐색하기 위한 방법으로는 텍스트 마이닝 기법과 체계적 문헌고찰 방법을 적용하였다. 텍스트 마이닝 기법을 적용하기 위한 문헌은 지난 10년간(2012년∼2021년) KCI 등재(후보)지에 게재된 논문에서 키워드 중 자연어처리를 포함한 유사 핵심어를 포함하면서 초록에 “교육”이라는 단어를 포함한 논문 중 한국어를 대상으로 자연어처리 기술을 교육적으로 활용한 논문 44편을 분석 대상으로 하였다. 텍스트 마이닝 기법에 의한 토픽모델링 결과, 자연어처리의 교육적 활용 연구주제는 4개로 분류되었고 지능형 교수학습지원, 자연어처리 기술의 교육적 활용 탐색, 한국어 학습지원, 서술형 평가 자동화 순으로 수행 논문의 비율이 높게 나타났다. 시기별 주제 트렌드와 관련하여 1기(2012년∼2015년)와 2기(2016년∼2018년)에는 지능형 교수학습지원과 서술형 평가 자동화 연구가 이루어졌고 3기(2019년∼2021년)에 자연어처리 기술의 교육적 활용 탐색과 한국어 학습지원 연구가 새로운 주제로 등장하였다. 텍스트 마이닝 기법 분석 대상의 논문 중 토픽모델링에서 토픽할당 확률이 높으면서 분석기준에 대해 구체적으로 보고한 논문 25편을 대상으로 체계적 문헌고찰을 수행하였다. 분석내용은 자연어처리 기술의 활용주체, 활용목적, 교육적 효과를 중심으로 첫 번째 저자 소속, 학문분야, 학교급, 연구방법이었다. 분석결과 자연어처리 기술의 활용주체는 학습자(80%), 교수자(28%), 기관(20%) 순으로 나타났고, 활용목적은 지능형 학습지원(44%), 교수적 대화(20%), 한국어 학습지원(16%), 서술형 평가 자동화(16%), 학습성공 및 실패 예측(4%)으로 나타났다. 시기적으로 초기에는 IT공학자에 의해 자연어처리 기술을 교육적으로 활용하기 위한 기술이나 시스템을 개발하는 연구가 수행되었고 최근에는 (교과)교육학자들에 의해 관련 도구를 개발하고 실제 수업에 적용함으로써 그 효과를 분석하는 연구들이 수행되었다. 대부분의 연구는 개발연구방법(68%)으로 수행되었고 그 효과는 효과성(28%), 사용성(24%), 만족도(16%), 효율성(4%), 기능성(24%)측면에서 분석되었다. 연구결과에 기반하여 시사점과 추후연구에 대해 제안하였다.

      • KCI등재

        뉴스 기사의 자연어처리

        박대민(Daemin Park) 한국언론학회 2016 커뮤니케이션 이론 Vol.12 No.1

        뉴스 기사가 빅데이터화함에 따라 뉴스 분석에서 컴퓨터 보조 질적 자료분석 소프트웨어의 사용이나 컴퓨터 이용 내용분석, 의미연결망분석 등의 활용이 늘어나면서 그 과정에서 자연어처리를 이용하는 경우도 증가하고 있다. 하지만 일반적으로 언론학에서 자연어처리는 하나의 블랙박스로 간주되어 방법론적 절차에 대한 엄밀한 검토가 부족하다. 또한 다양한 주제에 대한 높은 수준의 논증을 담은 뉴스 담론분석을 위해서는 단어 중심의 구문분석에 초점을 둔 형식 언어학적 접근이 아니라, 개체명과 문장 수준에서 관계를 부여하고 가중치를 계산하는 데 필요한 자연어처리가 필요하다. 이에 따라 이 연구에서는 뉴스에 대한 컴퓨터 이용 내용분석을 위하여 개체명, 특히 정보원과 문장 수준의 분석에 초점을 둔 뉴스 빅데이터 분석시스템인〈뉴스소스 베타〉를 소개한다.〈뉴스소스 베타〉는 정보원 중심의 개체명 인식과 이에 따른 문장 다중분류, 저널리즘 관행에 따른 최소한의 부분 구문 분석을 바탕으로 하는 의미중의성 해소와 대용어 해소, 군집화를 통한 중복기사와 중복 문장의 제거, 저널리즘 가치에 따라 정의된 뉴스 정보원 연결망 분석 알고리즘을 통한 가중치 부여를 특징으로 한다. 이 연구는〈뉴스소스 베타〉의 자연어처리 알고리즘을 설명하고, 분석사례를 소개한 뒤, 뉴스 자연어 처리 성능을 개선하기 위해 필요한 점들에 대해 제언한다. The use of natural language processing(NLP) to analyze news articles has increased gradually for computerized content analysis, computer assisted qualitative data analysis software, and semantic network analysis. However, the methodology of NLP has been considered as a black box in communication studies and not closely verified yet. This study argues that the level of analysis to perform discourse analysis of news articles should be named entities or sentences, not words. ‘NewsSource beta’, a news big data analytics system, has functions of NLP including not only morphological analysis and partial parsing, but also sentence boundary disambiguation, named entity recognition, classification of news articles and sentences, and semantic analysis such as word sense disambiguation and coreference resolution. Clustering and ranking algorithm by journalistic values like criticism, is adopted as well. This study explains NLP algorithm of ‘NewsSource beta’ and shows pilot analysis, and discuss how to improve NLP performance of news articles.

      • KCI등재

        질의 생성을 이용한 자연어 인터페이스

        한용진(Yong-Jin Han),박세영(Se Young Park) 한국정보과학회 2012 정보과학회논문지 : 소프트웨어 및 응용 Vol.39 No.12

        기존의 자연어 인터페이스에 대한 연구는 학습 데이터 및 입력 표현에 대한 구문 분석 결과에 의존해 왔다. 이러한 접근은 시스템이 처리할 수 있는 자연어 표현과 주어진 분야의 의미 표현이 일치하지 않는 원인이 되기도 한다. 이러한 문제를 해결하기 위해 본 논문은 주어진 분야의 의미 표현들을 생성하고 각 의미 표현(meaning representation)에 대응하는 적어도 하나의 자연어 표현을 생성하는 방법을 제안한다. 사용자의 입력 표현은 미리 생성된 자연어 표현과 비교함으로써 가장 적합한 의미 표현에 맵핑된다. 미국의 지리 정보 온톨로지에 대한 질의응답 시스템에 적용한 결과 제안한 방법은 기존 연구들에 비해 향상된 결과를 보였다. Current studies on a natural language interface rely on train data and syntactic parsing for an input sentence. These dependencies cause the discordance between expressions covered by a system and meaning representations of the given domain. This paper proposes a method to generate at least one expression corresponding to a meaningful meaning representation. The proposed method chooses the most appropriate meaning representation by using the generated expressions. The experiment results on question answering for U.S. geography ontology showed that the proposed method outperforms methods of previous studies.

      • KCI등재

        세종전자사전 활용을 위한 자연어 생성적 접근

        조은경(Jo Eun-kyoung) 한글학회 2016 한글 Vol.- No.311

        세종전자사전(이하 세종사전)은 한 어휘 항목이 형태 정보, 의미 정보, 통사 정보를 가지고 여러 어휘들의 관계가 기입된 통합 어휘부이며 여러 하위 범주 사전으로 구성된 대규모 지식 베이스이다. 세종사전은 다양한 응용을 지향한 산출물임에도 불구하고 사전의 내용에 대한 연구와 자연어 처리에서의 단방향 접근에 치우쳐 있다. 무엇보다 그 산출물을 재가공하여 활용하려는 노력이 드물다. 이 논문은 자연어 생성의 방향에서 접근하여 전산 어휘부로서 세종사전의 미시 구조를 살피고, 복잡한 미시 구조의 개별 어휘 항목을 문장생성 과정에 선택적으로 활용하기 위한 격자 형식화를 제안한다. 격자 형식화는 사전의 복잡한 기술 내용을 단순한 구조로 표현되게 하는 것이다. 이는 개별 어휘 항목이 아니라 여러 어휘 항목의 정보를 보게하고, 어휘부 정보를 자연어로 쉽게 구성하게 한다. 특히, 용언과 체언사전의 격자 형식화는 표현 구조를 쉽게 짜게 한다. 그리고 어미 사전의 격자 형식화는 표현 구조에서 표층 형태로 변환을 쉽게 한다. 우리는 통합 지식 베이스로서 세종사전의 활용을 위한 자연어 생성적 접근으로서 세종사전의 미시 구조를 살피고, 가능 표현 구조와 표층적인 어휘 형태의 생성을 위한 격자 형식화를 설계하였다. 또 이러한 과정을 통해 전산 어휘부로서의 개선점을 정리하였다. Sejong Dictionary is a knowledgebase platform which consists of various kinds of subcategory dictionaries and also a huge synthetic lexicon with morphologica, semantic and syntatic information. Although Sejong dictionary was the product of the project which was oriented to various application uses, it has been approached by a few studies of NLP and there is scarcely an effort to manipulate and use it. This paper approaches to Sejong dictionary from NLG study and investigates the microstructure of it and then set out to format the lattice structure as a design of information makeup for developing NLG. The lattice formating is to make from the complex structure into the simple structure. This makes us have the information of various lexical entries instead of that of individaul lexical item and also makes it easy to construct natural language expression from lexicon. For one, we show that the representing structure of predicate and argument can be easily composed on lattice formatting. In addition, we show that the surface expressions also can be easily converted from the representing structures on it. Furthermore, in the process of this examination, we figure out the improvements in the macro and micro structure of this dictionary for a computational feasibility. In all, we approached to Sejong dictionary from NLG perspective. we have examined the micro structure and tried to design the lattice formatting for computationally generating. During these process we arrange the improvements for computational lexicon.

      • KCI등재후보

        M세대의 인성발달 과제: 자연어 사용을 중심으로

        조정호 한국인격교육학회 2016 인격교육 Vol.10 No.1

        Mobile devices these days have become an important part of our daily lives. Mobile use has increased rapidly in our daily lives over face-to-face communication with natural language use. This means that most people live as part of Generation Mobile (Gen M). This paper aims to search for the tasks for moral character development (MCD) of Gen M with a focus on the use of natural language. According to the previous study, in the tropism model, moral characteristics of humans develop from subjectivity toward objectivity in cognition, from egoism (self-love) toward altruism (other-love) in affect, and from heteronomy toward autonomy in volition. Moral character, therefore, is closely related to human relations in real life, and human relations are directly related to the use of natural language. Considering this, Gen M may have exhibit a certain amount of retardation in the affective domain of MCD such as emotional development, because mobile-phone addiction among children and youths raises serious problems of moral character. They have less opportunity for face-to-face interaction to develop facets of human relationships including manners, perseverance, and emotional control with the use of natural language as mobile communication reduces face-to-face conversations. Mobile devices may lead to us becoming emotionless robots ourselves. Consequently, it is necessary to increase various educational opportunities and programs of face-to-face interaction with use of natural language in order to develop a sound moral character for Gen M. 오늘날 모바일 기기는 인간 삶의 중요한 부분이 되었다. 자연어를 사용하는 대면적 의사소통을 대체하는 모바일 커뮤니케이션이 급속히 증가하였다. 이것은 대부분의 사람들이 M세대(Generation Mobile, Gen M)로 살아가고 있음을 나타낸다. 그래서 이 연구에서는 M세대의 인성발달 과제를 자연어 사용 측면에서 탐색하였다. 본 연구의 결과, 인성은 인간관계를 전제로 하며, 인지적 영역에서는 주관성으로부터 객관성으로 발달해나가고, 정서 영역에서는 이기심으로부터 이타심으로 발달해나가며, 의지 영역에서는 타율성으로부터 자율성으로 발달해나간다. 이러한 인성은 일상의 인간관계에서 일어나는 현상이고, 일상에서의 인간관계는 자연어를 사용하여 이루어진다. 이를 고려하면 M세대는 대면적 인간관계 경험이 줄어드는 가운데 인성발달의 지체에 빠질 우려가 있으며, 모바일에 중독된 아동과 청소년들은 심각한 정서발달의 문제를 일으키고 있다. 이들은 모바일 기기가 대면적 의사소통을 대체하는 가운데 타인과 자연어를 사용하면서 예절, 인내, 감정 조절과 같은 정서적 인성을 올바르게 발달시키는 상호작용의 기회를 상실하였다. 따라서 M세대의 건전한 인성발달을 위하여 자연어를 사용하는 대면적 상호작용의 교육기회를 늘리고 관련 교육 프로그램을 강화할 필요가 있다.

      • KCI등재

        자연어 처리 기술을 활용한 문제행동 유형 분석 연구

        강정배,최은영,나운환 대구대학교 특수교육재활과학연구소 2013 특수교육재활과학연구 Vol.52 No.2

        학령기 전체 아동 수는 줄어드는 반면 부적응 문제를 보이는 아동은 지속적으로 증가하고있다. 이러한 부적응 아동 지원을 위해, 새로운 문제행동 지원 방안을 수립하는 방법과 기존문제행동 지원 방안의 업무를 대폭 줄이도록 하는 방법 등이 모색 되어야 한다. 본 연구에서는 기존 문제행동 지원방안의 업무를 줄일 수 있도록 IT 기술 분야인 자연어 처리 기술을사용한다. 자연어 처리 기술을 활용해 문제행동 유형을 자동으로 분석하기 위해 문제행동 영역 분석 방법을 개발하고, 개발된 유형분석 방법의 효용성을 검증하였다. 문제행동 영역별특성을 분석하여 자연어 처리기술에 필요한 문제행동 전자사전을 구축하였다. 구축된 전자사전을 활용하여 6개의 자연어 처리 기술을 활용한 문제행동 유형분석 방법을 개발한 결과 분석 방법 6이 전문가 분류결과와 84% 일치하는 결과를 나타냈다. 분석 방법 6은 기존에 수기로 진행하던 행동분석에 비해 9.9%의 시간절감 효과가 있었으며, 분석시스템을 사용한 후설문에 참여한 모든 교사가 문제행동을 지원하는 온라인 서비스가 개발되면 사용하겠다는의견을 밝혔다.

      • KCI우수등재

        사전학습 언어모델 기반 트랜스포머를 활용한 의미유사도기반 자연어이해 의도파악 방법

        정상근,서혜인,김현지,황태욱 한국정보과학회 2020 정보과학회논문지 Vol.47 No.8

        자연어이해는 로봇, 메신저, 자연어 인터페이스 등에 활용되는 근간 기술 중 하나이다. 본 연구에서는 자연어이해 문제 중 문장의 의도를 파악하는 의도파악기술에 있어, 전통적인 분류기술을 활용하는 것이 아닌, 문장의 의미를 벡터 형태로 가공할 수 있는 문장 및 의미틀 읽기장치를 학습시키고, 훈련문장과 질의문장의 벡터 공간상의 의미거리를 측정하여, 가장 가까운 훈련문장의 의도를 질의문장의 의도로 부착하는 방법을 제안한다. 이를 위해, 사전학습 언어모델 기반 트랜스포머를 활용하여 기호 형태의 문장 및 의미틀을 벡터 형태로 변환하는 방법을 소개한다. 한국어 기반 날씨 및 내비게이션 영역의 말뭉치와 영어 기반 항공교통 예약 영역, 음성 언어 이해 시스템 영역의 자연어 말뭉치등을 활용한 다양한 실험을 통하여 제안한 방법이 성공적으로 의미벡터를 배움을 보이고, 기존 의도파악 기술 대비 높은 성능을 가짐을 보인다. Natural language understanding (NLU) is a central technique applied to developing robot, smart messenger, and natural interface. In this study, we propose a novel similarity-based intent analysis method instead of the typical classification methods for intent analysis problems in the NLU. To accomplish this, the neural network-based text and semantic frame readers are introduced to learn semantic vectors using pairwise text-semantic frame instances. The text to vector and the semantic frame to vector projection methods using the pre-trained transformer are proposed. Then, we propose a method of attaching the intention tag of the nearest training sentence to the query sentence by measuring the semantic vector distances in the vector space. Four experiments on the natural language learning suggest that the proposed method demonstrates superior performance compared to the existing intention analysis techniques. These four experiments use natural language corpora in Korean and English. The two experiments in Korean are weather and navigation language corpora, and the two English-based experiments involve air travel information systems and voice platform language corpora.

      • KCI등재

        자연어처리와 기계학습을 활용한 기술 특허 분류

        이우식,이예진 차세대컨버전스정보서비스학회 2024 차세대컨버전스정보서비스기술논문지 Vol.13 No.1

        최근 빅데이터 시대의 도래로 인공신경망을 포함한 기계학습 모델들이 의학, 유전체 연구, 기업 경영 등 다양한 분야에 광범위한 영향을 미치고 있음에도 불구하고, 기술 특허 분석에 자연어 처리와 기계학습을 적용한 국내 리걸테크 연구는 충분히 발전하지 못한 상황이다. 본 연구는 이산화탄소 포집·활용에 대한 특허 데이터, 자연어 전처리 기법 그리고 기계학습모형 기반의 기술 특허 분류 시스템을 설계하고, 정확도, 카파 상관계수 그리고 F1-점수를 비교·분석하였다. 주요 결과를 요약·정리하면 다음과 같다. 첫째, 다섯 가지 이산화탄소 포집 및 활용 기술 분류에서 그래디언트 부스팅, 랜덤 포레스트, 의사결정나무 순으로 성능이 나타났다. 이를 통해 단일 결정 나무보다 배깅과 부스팅 기법을 적용한 랜덤포레스트 모형과 그래디언트 부스팅 모형이 더 우수한 학습 성능을 제공함을 확인할 수 있었다. 둘째, 특허의 요약과 제1 청구항을 활용한 기술 분류에서 비슷한 성능이 관찰되었다. 이는 자연어 처리 과정에서 중요한 키워드를 명사로만 추출한 것이 주요 요인으로 보인다. 본 연구는 자연어 전처리와 기계학습 모형을 이산화탄소 포집 및 활용 기술 특허 분류에 처음으로 적용한 의미 있는 연구로 사무 로봇 기술을 통해 반복적인 업무를 자동화하는 데 응용될 수 있는 가능성을 제시한다. With the advent of the big data era, machine learning models, including artificial neural networks, have had a wide-ranging impact on various fields such as medicine, genomics research, and corporate management. Despite this, domestic research in legal tech, particularly applying natural language processing and machine learning to technical patent analysis, has not sufficiently developed. This study designs a system for classifying patents on Carbon Dioxide Capture and Utilization (CCU) based on patent data, natural language pre-processing techniques, and machine learning models, and compares and analyzes accuracy, kappa coefficient, and F1-score. The main findings are summarized as follows: First, in classifying five types of CCU technologies, the performance was observed in the order of gradient boosting, random forest, and decision trees. This confirms that random forest and gradient boosting models, which apply bagging and boosting techniques, respectively, provide superior learning performance over single decision trees. Second, similar performance was observed in classifying technologies based on the abstract and first claim of patents. This suggests that the extraction of important keywords as nouns during the natural language processing is a significant factor. This research is meaningful as it applies natural language pre-processing and machine learning models to the classification of CCU technology patents for the first time, presenting the potential for applying robotic automation technology to automate repetitive tasks.

      • Predicate Logic Form을 이용한 자연어 텍스트로부터의 감정인식

        설용수(Yong-Soo Seol),김동주(Dong-Joo Kim),김한우(Han-Woo Kim),박정기(Jung-Ki Park) 한국컴퓨터정보학회 2010 한국컴퓨터정보학회 학술발표논문집 Vol.18 No.2

        전통적으로 자연어 텍스트로부터의 감정인식 연구는 감정 키워드에 기반한다. 그러나 감정 키워드만을 이용하면 자연어 문장이 원래 갖고 있는 통사정보나 의미정보는 잃어버리게 된다. 이를 극복하기 위해 본 논문에서는 자연어 텍스트를 Predicate Logic 형태로 변환하여 감정 정보처리의 기반데이터로 사용한다. Predicate Logic형태로 변환하기 위해서 의존 문법 구문분석기를 사용하였다. 이렇게 생성된 Predicate 데이터 중 감정 정보를 갖고 있는 Predicate만을 찾아내는데 이를 위해 Emotional Predicate Dictionary를 구축하였고 이 사전에는 하나의 Predicate마다 미리 정의된 개념 클래스로 사상 시킬 수 있는 정보를 갖고 있다. 개념 클래스는 감정정보를 갖고 있는지, 어떤 감정인지, 어떤 상황에서 발생하는 감정인지에 대한 정보를 나타낸다. 자연어 텍스트가 Predicate으로 변환되고 다시 개념 클래스로 사상되고 나면 KBANN으로 구현된 Lazarus의 감정 생성 규칙에 적용시켜 최종적으로 인식된 감정을 판단한다. 실험을 통해 구현된 시스템이 인간이 인식한 감정과 약 70%이상 유사한 인식 결과를 나타냄을 보인다.

      • KCI등재

        한국어 자연어 요구문서에서 구문 구조 기반의 조응어 처리 시스템

        박기선,안동언,이용석,Park, Ki-Seon,An, Dong-Un,Lee, Yong-Seok 한국정보처리학회 2010 정보처리학회논문지B Vol.17 No.3

        시스템 개발에 있어서 요구문서(requirements document)를 생성하고 정형 명세를 작성하는 것은 요구 분석 전문가와 명세 전문가에 의해 수행되고 있다. 만약 요구문서 생성과 정형 명세 작성 과정을 자동화 한다면 시스템 개발 비용 및 기간을 단축할 수 있고, 또한 전문가 사이의 잘못된 이해로 인한 오류를 줄일 수 있다. 대명사는 인칭대명사와 지시대명사로 분류될 수 있다. 일반적으로 요구문서의 특성상 인칭대명사는 사용되지 않기 때문에 본 논문은 지시대명사의 지시어 결정에 초점을 두고 있다. 지시대명사를 포함하는 요구문서에서 자연어처리 기법을 통해 정형화된 요구사항을 자동으로 추출하기 위해서는 대명사의 지시어 결정이 매우 중요하다. 본 연구의 최종 목표는 자연어 처리 기법을 통하여 자연어 요구문서로부터 시스템 개발에 필요한 정형 명세를 자동으로 생성하는데 있다. 이를 위해 본 논문은 선행연구를 기반으로 한국어로 기술된 자연어 요구문서에서 대명사에 대한 지시어를 결정하는 조응어 해소(anaphora resolution) 시스템을 제안한다. 본 시스템의 개발을 위해 조응어 해소를 위한 경험 규칙을 정의하고, 이를 통해 10개의 요구문서에 대해 실험한 결과 평균 재현율 92.45%, 정확률 69.68%의 성능을 보였다. When a system is developed, requirements document is generated by requirement analysts and then translated to formal specifications by specifiers. If a formal specification can be generated automatically from a natural language requirements document, system development cost and system fault from experts' misunderstanding will be decreased. A pronoun can be classified in personal and demonstrative pronoun. In the characteristics of requirements document, the personal pronouns are almost not occurred, so we focused on the decision of antecedent for a demonstrative pronoun. For the higher accuracy in analysis of requirements document automatically, finding antecedent of demonstrative pronoun is very important for elicitation of formal requirements automatically from natural language requirements document via natural language processing. The final goal of this research is to automatically generate formal specifications from natural language requirements document. For this, this paper, based on previous research [3], proposes an anaphora resolution system to decide antecedent of pronoun using natural language processing from natural language requirements document in Korean. This paper proposes heuristic rules for the system implementation. By experiments, we got 92.45%, 69.98% as recall and precision respectively with ten requirements documents.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼