오늘날 텍스트 자동 처리 분야의 당면 과제는 늘어나는 사용자의 정보 욕구에 능동적으로 대처할 수 있는 지능형 검색기 개발에 있다. 정보 통신의 발달은 사용자의 정보에 대한 물리적인 ...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=G3761813
-
2010년
Korean
직접 인용(citation directe) ; textual linguistics(linguistique textuelle) ; citation(citation) ; semantical representation (repré ; sentation sé ; mantique) ; contextuel exploration method(la mé ; thode d'exploration contextuelle) ; opré ; ration de prise en charge ; intersujec ; 직접 전달 담화 (discours rapporté ; directe) ; 담지(prise en charge) ; 발화행위이론(thé ; orie de l'é ; nonciation) ; 발화작용(opé ; ration é ; nonciative) ; 언술 양태(modalité ; é ; nonciatives). 정보검색기 ; 문서 필터링
한국연구재단(NRF)
0
상세조회0
다운로드오늘날 텍스트 자동 처리 분야의 당면 과제는 늘어나는 사용자의 정보 욕구에 능동적으로 대처할 수 있는 지능형 검색기 개발에 있다. 정보 통신의 발달은 사용자의 정보에 대한 물리적인 ...
오늘날 텍스트 자동 처리 분야의 당면 과제는 늘어나는 사용자의 정보 욕구에 능동적으로 대처할 수 있는 지능형 검색기 개발에 있다. 정보 통신의 발달은 사용자의 정보에 대한 물리적인 접근성은 용이하게 만들었으나 질적인 정보의 접근성은 역설적으로 어렵게 만드는 결과를 낳았다. 따라서, 오늘날 검색기 개발은 정보 검색의 지능화를 절실히 요구하고 있다. 그러나 이러한 연구들은 학제간 연구의 부재와 자연언어 분석 자체에 대한 어려움 등의 이유로 아직 뚜렷한 발전을 이루지 못하고 있는 실정이다. 본 연구의 주제인 미디어 텍스트에 나타난 인용문은 그 정보적인 가치와 상업적 활용 가능성으로 최근 정보 처리 분야에서 그 관심이 집중되고 있는 분야이다. 하지만 문서내의 논리적인 인과관계나 인용문을 비롯한 타인의 담화를 전달하는 문서내의 담화적인 구조 등에 관한 연구는 정보 처리 분야에서 아직까지 찾아 보기 힘들다. 본 연구는 이러한 이전 연구의 한계를 직시하고 인용문 검색을 연구의 주제로 삼아 다음과 같은 방법론을 통해 연구를 진행하였다. 우선, 기술 언어학적인 측면에서 [Desclés&Guentcheva 02]의 발화이론을 통해 인용 정보에 나타나는 상호주관적인 메카니즘 구조를 파악하고 유형화한다. 또한, 기존 연구들이 취해온 문장과 단어차원의 국부적인 분석에서 벗어나 담화 텍스트 차원의 분석으로 확장할 수 있는 맥락탐색기법 [Desclés&Minel 00]을 이용해 인용문 자동 주석기의 데이터 베이스 (이하 DB) 구축을 제안하였다. 더불어 본 연구에서 분석된 결과들은 단순한 언어학적 작업으로 마무리 되는 것이 아니라, 2007년부터 본 연구자가 프랑스 파리 소르본느 대학의 LaLIC연구팀 (Langages, Logique, Informatique et Cognition)과 공동으로 개발하고 있는 다국어 자동 주석기 ‘엑스콤 (EXCOM07: EXploration COntextuelle Multilingue)’에 탑재하여 평가하는 작업을 병행하여 앞서 언급한 기존 문서 자동 처리 시스템의 한계를 극복하고 효율성이 높을 것으로 기대되는 지능형 인용문 자동 검색기 개발에 구체적으로 활용될 수 있는 언어학적 토대연구를 제공한다.
다국어 초록 (Multilingual Abstract)
La croissance exponentielle des données disponibles sur Internet rend de plus en plus difficile l'accès à l'information pertinente pour un utilisateur. Nous nous plaçons donc dans le cadre d’une réflexion gé...
La croissance exponentielle des données disponibles sur Internet rend de plus en plus difficile l'accès à l'information pertinente pour un utilisateur. Nous nous plaçons donc dans le cadre d’une réflexion générale sur le filtrage sémantique et l’extraction d’informations à partir des textes coréens et français en vue d’une implémentation des connaissances linguistiques dans EXCOM07, plate-forme développée par l’équipe LaLIC. Nous nous proposons de rechercher des indicateurs et des indices complémentaires afin de pouvoir d’extraire des informations citationnelles dans les journaux coréens et français.
Dans un première temps du travail, nous proposons une typologie de formes des citations directes et des verbes de citation dans les textes médiatiques francais et coréens. Nous analysons des exemples à l'aide de la notion de «prise en charge» et de ses axiomes énonciatifs présentés dans (Desclés & Guentchéva 2002, Desclés 2007). Nous avons classé des verbes de citation selon de différentes modalités énonciatives et intersubjectives enfin construit une carte de sémantique des modalités énonciatives du discours rapportés directes en coréen et français. Ensuite, nous proposons une platform d’annotation sémantique de textes, appelé « EXCOM07 ». Basée sur la méthode de l’ « Exploration Contextuelle », elle permet à des analystes ou à d’autres utilisateurs, à travers une diversité de langues, de procéder à des annotations sémantiques de segments textuels par l'analyse des formes de surface dans leur contexte. Les citations sont traitées selon des « points de vue » discursifs de fouille ou de mise en texte basés sur la recherche de marqueurs linguistiques (« indicateurs » forts et « indices » complémentaires) et sur leur organisation dans une « carte sémantique ». Avec cette méthode, nous expliquons les classes de marqueurs linguistiques (indicateurs déclencheurs et indices complémentaires) correspondant à la carte sémantique dans les citations directes. Enfin nous présentons l’évaluation des connaissances linguistiques acquises dans EXCOM07.