http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
CRF를 이용한 백과사전 도메인의 템플릿 기반 지식베이스 설계 및 구축
왕지현(Ji-Hyun Wang),이창기(Chang-ki Lee),김현진(Hyeon-Jin Kim),장명길(Myung-Gil Jang) 한국정보과학회 2005 한국정보과학회 학술발표논문집 Vol.32 No.1
본 논문은 백과사전 도메인의 지식베이스 설계 및 통계기반 정보추출 방법을 이용한 속성정보 인식에 대하여 기술한다. 총 13개 카테고리로 구성된 백과사전에 대해 99개의 템플릿과 285개의 속성을 정의하였으며, 각 표제어의 추출 대상인 속성정보는 표제어를 설명하는 본문에서 통계기반 기계학습모델인 CRF(Conditional Random Fields)를 적용하여 추출하였다. 백과사전 카테고리 별로 균일하게 선정된 4천 5백 문서를 학습에 사용하였고, 테스트 문서셋 500문서에 대해 속성인식률을 측정하였다. 성능 평가한 결과, F1 55.76% (P 74.89%, R 44.42%)의 성능을 나타내었다.
정보 검색에서 질의 형식화를 도와주는 "개념 마법사"의 설계
강현규(Hyun-Kyu Kang),왕지현(Ji-Hyun Wang),김영섬(Young-Sum Kim),서영훈(Young-Hoon Seo) 한국정보과학회 1997 한국정보과학회 학술발표논문집 Vol.24 No.2Ⅱ
정보 검색 시스템이나 웹(Web)이 방대해지고 초보적 수준의 사용자들이 늘어남에따라 간단한 조작만으로 원하는 정보를 얻어낼 수 있는 도구의 개발이 점점 중요해지고 있다. 일반적으로 정보 검색 시스템이나 검색 엔진을 통하여 질의 입력 방법이나 연산자들이 매우 다양하며 일반 사용자들은 질의를 형식화 하는 것이 쉽지 않다. 본 논문은 일반 사용자가 정보 검색 시스템이나 검색 엔진을 통하여 정보를 검색하기 위한 검색어 형식화를 도와주는 개념 마법사를 제안한다. 본 논문에서 제시한 개념 마법사는 실세계 지식의 부족을 시소러스를 이용하여 interactive하게 제시하고 웹을 기반으로하는 플러그인(plug-in)으로 제공함으로써 유용성 및 확장성이 크다.
양승원(Seung Weon Yang),이현영(Hyun Young Lee),왕지현(Ji Hyun Wang) 한국정보과학회 2009 정보과학회논문지 : 소프트웨어 및 응용 Vol.36 No.3
내비게이션 시스템에서 목적지를 찾기 위하여 목적지의 이름, 분류, 주소, 전화번호 등의 정보를 이용하게 되는데 대부분의 사용자들은 이들 중에서 목적지의 이름을 사용한다. 그런데 사용자들은 공급사에서 제공하는 POI DB에 등재된 이름을 정확히 알지 못할 뿐만 아니라 편의상 축약된 명칭이나 일반적으로 불리어지는 명칭 등으로 POI 검색을 시도하므로 검색이 실패하는 경우가 빈번하다. 본 논문에서는 내비게이션 시스템에서 이름으로 검색 할 때 검색 성공률을 제고할 수 있는 이형태 DB 구축 시스템을 제안한다. 이 시스템은 원 DB의 POI 명과 연결되는 이형태를 생성하여 DB화한다. 우리는 이형태의 생성을 위하여 약 650,000 개의 개체를 가지고 있는 원 DB의 POI 명으로부터 모은 패턴을 분석하여 이형태의 유형을 7 가지로 분류하였다. 분류한 유형을 토대로 일정한 패턴이 존재하여 자동화가 가능한 유형들에 대하여 577개의 규칙을 만들어 자동으로 이형태를 구축하였다. 규칙으로 만들기가 어렵거나 빈도수가 적은 개체들에 대해서는 수동으로 이형태를 구축하였다. 생성된 비율은 전체 POI DB의 35.8%에 해당하며 구축한 이형태 DB를 사용한 검색 성공률은 89%이었다. People use various information for searching POI in the navigation system such as name, category, address, phone number. Most of users use name and category to search their POI. They don't know exact name in POI DB provided by Maker. They use abbreviated or generalized name as key word for searching POI. Because of these reasons, the hit ratio has been very low. In this paper, We suggest a extra DB_construction system for raising the hit ratio. It generates allomorphes DB link to the POI name in original DB. We classified the POI names in original DB into seven types of allomorph by analyzing the gathered patterns from the POI DB which has over 650,000 entries. For auto_generating the allomorphes, we made 577 rules based on the classified types. And we generated the allomorphes manually for the entries which are difficult to make the rule and has low frequency. The generated allomorphes account for 35.8% of all original DB. The hit ratio is 89% under suggested system.