http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
베이지안 추론망을 이용한 검색엔진 세부 모듈의 상세 분석 방법
송사광(Sa-kwang Song),이승우(Seungwoo Lee),정한민(Hanmin Jung) 한국정보과학회 2013 정보과학회논문지 : 소프트웨어 및 응용 Vol.40 No.5
검색엔진의 성능을 높이기 위해 계속적으로 세부 모듈의 수행결과를 분석하고 오류를 수정하는 과정을 거치게 되는데, 이는 매우 시간과 노력이 많이 들어가는 작업이다. 그러나, 이러한 과정을 거쳐 대상 문헌으로부터 색인어를 추출하는 방법을 개선하는 것은 검색엔진 성능을 높이기 위한 매우 중요한 연구주제이다. 일반적으로, 불용어 리스트를 통해 성능에 긍정적인 영향을 미치지 않는 색인어를 제거하거나, 핵심어 또는 전문용어 등 상대적으로 중요한 색인어를 강조하는 방식을 사용하여 검색엔진의 성능을 향상시킨다. 하지만, 어절 분리, 형태소 분석, 불용어 처리 등 검색엔진 내부의 다양한 단계별 처리 과정을 개발자 또는 연구자가 개별적/종합적으로 살펴보고 성능을 개선하기란 너무나 어려운 작업이다. 따라서, 본 연구에서는 연구자로 하여금 개별적인 색인어가 검색엔진에 미치는 영향을 각 단계별로 손쉽게 분석할 수 있도록, 베이지안 추론망과 어절의 분별력에 기반한 새로운 오류 분석 방법론을 제안한다. 각 단계별 처리 과정에서 생성된 색인어가 미치는 영향을 계량화하고, 이 계량화 정보를 가시화하여 연구자/개발자가 검색엔진의 성능을 향상 시킬 수 있는 도구를 제공한다. For improving performance of search engines, iteration of analyzing the results of internal modules of search engines and then modifying their errors is required in general. However, this job is highly labor-intensive and time-consuming for developers and researchers. Nevertheless, enhancing the methods of extracting good index terms from documents through this process is one of the most fundamental and important research topics. In general, the performance of search engines is enhanced by removing index terms that are negative to the performance or stressing on relatively important index terms. However, it is quite difficult for the researchers to investigate in detail and modify the problems occurred from multiple modules in a search engine. Therefore, we propose a failure analysis method based on both Bayesian inference network and discrimination power of a index term, in order for the researcher to easily analyze the effect of each index term on the search engine. To do this, we quantify the importance of each term and visualize them on the Bayesian inference network.
의료 문헌에서의 절차적 지식 추출을 위한 단위 절차 추출 연구
송사광(Sa-kwang Song),오흥선(Heung-Seon Oh),최윤정(Yoonjung Choi),장혜주(Heju Jang),맹성현(Sung-Hyon Myaeng),최성필(Sung-pil Choi),최윤수(Yunsoo Choi) 한국정보과학회 2011 한국정보과학회 학술발표논문집 Vol.38 No.1A
본 연구는 2인의 전문의와 함께 의료 문헌의 초록을 분석하여 의료문서에서의 절차적 지식을 모델링하고 텍스트 마이닝 기법을 적용하여 절차적 지식을 추출하는 방법론에 대해 기술한다. 절차적 지식은 목적과 해법의 묶음으로, 해법은 다시 단위 절차 지식의 네트워크로 정의 하였고, 목적과 해법 정보 추출과 단위, 절차 지식의 구성요소인 대상/행위/방법 개체를 인식하기 위해, 품사태깅, 구문분석, 술어-논항구조(Predicate-Argument Structure), 온톨로지 용어 매핑 정보 등에 기반한 기계학습 방법을 사용하였다. 실험을 위해 전문의와 함께 위암과 척추질환에 대한 1309 문서에 절차적 지식 태깅을 수행하였고, 이 문서 집합을 기반으로 목적/해법 추출 작업과 단위 절차 지식(대상질병/행위/적용방법) 추출 실험을 수행하여, 각각 82%와 63%의 F-measure 값을 얻을 수 있었다.
송사광(Sa-Kwang Song),맹성현(Sung Hyon Myaeng) 한국정보과학회 1999 한국정보과학회 학술발표논문집 Vol.26 No.1B
전통적인 정보검색시스템들은 사용자에게 많은 수의 결과 문서들을 리스트 형식으로 제공하여 사용자로 하여금 적합한 문서를 찾기 위해 각 문서들을 하나 하나 확인해야만 하는 방식을 취하고 있다. 본 논문에서는 이러한 단순한 리스트 형식의 검색 결과 제시방식을 지양하고 웹 환경에서 검색 결과 효율적으로 제시하고자 프리젠테이션 서버라는 개념을 제안한다. 프리젠테이션 서버는 다수의 검색엔진에서 얻어진 결과를 분석, 가공하여 이를 웹브라우저에 전달하여주는 중간 매개 시스템으로 웹브라우저에게 검색결과의 다양한 정보를 표현할 수 있도록 벡터 정보 외에 불리언 정보와 클러스터링 정보를 동시에 제공해주는 역할을 한다.