http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
박혁로(Hyouk-Ro Park),신중호(Joong-Ho Shin) 한국정보과학회 1997 한국정보과학회 학술발표논문집 Vol.24 No.2Ⅱ
자동색인이나 기계번역을 위한 한글 처리 과정에서 복합명사 분석은 많은 모호성을 발생시키기 때문에 매우 어려운 문제로 남아 있었다. 복합명사 분석에서 발생하는 모호성을 처리하기 위해서는 단어 발생 확률을 이용하여 가장 적합한 분석을 선택하는 통계적 방법이 필요하다. 복합명사 분석에 대한 기존의 통계적 방법은 수동 분석된 코퍼스를 이용하는 교사학습 방법을 이용하였다. 본 논문에서는 이와는 달리 형태소 분석기의 출력인 단순명사와 복합명사가 혼재된 명사 코퍼스를 이용하여 단어 발생 확률정보를 비교사학습 시키고 이들 확률정보를 이용한 복합명사 분석 방법을 제안한다.
박혁로(H. R. Park),최운천(U. C. Choi),최기선(K S Choi) 한국정보과학회 1990 한국정보과학회 학술발표논문집 Vol.17 No.1
본 논문에서는 한글 자료의 입/출력, 저장/처리 중에서 저장/처리에 관심을 제한하여 기존 한글 코드가 가지는 여러 가지 문제점들을 파악하고 이러한 문제점들로부터 한글은 자소 단위로 코드를 지정해야 한다는 것, 한 음절의 저장 길이가 일정해야 한다는 것, 그리고 초, 중, 종성에 대한 위치 정보를 나타내어야 한다는 요구 사항을 도출한다. 이러한 요구 사항을 만족시키는 한글 코드로서 한글의 저장/처리에 있어서 3 바이트 한글 코드를 사용할 것을 제안한다.
박혁로(H. R. Park),정진성(G. S. Chung),최기선(K. S. Choi) 한국정보과학회 1992 한국정보과학회 학술발표논문집 Vol.19 No.1
색인어의 중요도는 표현력과 식별력의 곱으로 표시된다. 기존의 자동 색인 시스템에서는 색인어의 표현력을 평가하기 위하여 문헌 내 색인어의 출현 빈도를 이용하였으나 본 논문에서는 색인의 출현 빈도 및 문장에서 색인어가 수행하는 역할을 이용하여 색인어의 중요도를 계산하였다. 실험용 검색 시스템을 구현하여 색인어 중요도 계산의 타당성을 실험한 결과, 출현 빈도뿐만 아니라 문장 내 색인어의 역할을 고려한 표현력 계산이 기존 시스템보다 뛰어난 검색 효율을 나타냈다.
최선화,박혁로,Choi Seon-Hwa,Park Hyuk-Ro 한국정보처리학회 2006 정보처리학회논문지B Vol.13 No.2
기계가독형사전(Machine Readable Dictionary)에서 단어의 정의문에 나타나는 항목 단어의 상위개념을 추출하는 대부분의 연구들은 전문가에 의해 작성된 어휘패턴을 사용하였다. 이 방법은 사람이 직접 패턴을 수집하므로 시간과 비용이 많이 소모될 뿐만 아니라, 자연언어에는 같은 의미를 가진 다앙한 표현들이 존재하므로 넓은 커버리지를 갖는 어휘패턴들을 수집하는 것이 매우 어렵다는 단점이 있다. 이런 문제점들을 해결하기 위하여, 본 논문에서는 구문적 특징만을 이용한 상위어 판별 규칙을 기계학습함으로써 기존에 사용되었던 어휘패턴의 지나친 어휘 의존성으로 인한 낮은 커버리지 및 패턴 수집의 문제를 해결하는 방법을 제안한다. 제안한 방법으로 기계학습된 규칙들을 상위어 자동추출과정에적용한 결과 정확도 92.37% 성능을 보였다. 이는 기존 연구들보다 향상된 성능으로 기계학습에 의해 수집된 판별규칙이 상위어 판별에 있어서 어휘패턴의 문제를 해결할 수 있다는 것을 입증하였다. Most approaches for extracting hypernyms of a noun from its definitions in an MRD rely on lexical patterns compiled by human experts. Not only these approaches require high cost for compiling lexical patterns but also it is very difficult for human experts to compile a set of lexical patterns with a broad-coverage because in natural languages there are various expressions which represent same concept. To alleviate these problems, this paper proposes a new method for extracting hypernyms of a noun from its definitions in an MRD. In proposed approach, we use only syntactic (part-of-speech) patterns instead of lexical patterns in identifying hypernyms to reduce the number of patterns with keeping their coverage broad. Our experiment has shown that the classification accuracy of the proposed method is 92.37% which is significantly much better than that of previous approaches.
사용자 적합성 피드백과 구루 평가 점수를 고려한 블로그 검색 방법
정경석,박혁로,Jeong, Kyung-Seok,Park, Hyuk-Ro 한국정보처리학회 2008 정보처리학회논문지B Vol.15 No.5
대부분의 웹 검색엔진은 문서의 적합도와 중요도를 함께 고려하는 순위화 방법을 사용한다. 문서의 적합도는 문서가 사용자의 검색의도를 만족시키는 정도이고, 중요도는 인기 있거나 양질의 내용을 포함하는 등 문서의 품질을 표시하는 정도라고 할 수 있다. 지금까지 웹 문서의 중요도를 평가하는 방법으로 가장 성공적인 것은 하이퍼링크 구조를 사용한 방법이다. 하지만 블로그의 경우, 해당 블로그를 작성한 블로거와 그 블로거가 소유하는 다른 문서들을 알 수 있기 때문에 문서의 중요도를 평가하는 다른 방법을 생각할 수 있다. 본 논문에서 제안하는 방법은 사용자의 북마크와 클릭를 이용하여 문서의 중요도를 계산하고, 그러한 문서 점수를 바탕으로 블로거의 구루점수를 계산한다. 마지막으로 문서를 순위화할 때 해당 문서를 작성한 구루의 구루 점수를 반영한다. 이렇게 되면 구루점수가 높은 구루 블로거의 문서들이 상위에 검색됨에 따라서 전반적으로 검색 품질이 개선될 수 있다. 블로그 문서를 대상으로 한 실험결과 제안하는 방법이 기존의 전통적인 웹 검색 성능과 비교하여 정답집합과의 연관성이 높음을 알 수 있었다. Most Web search engines use ranking methods that take both the relevancy and the importance of documents into consideration. The importance of a document denotes the degree of usefulness of the document to general users. One of the most successful methods for estimating the importance of a document has been Page-Rank algorithm which uses the hyperlink structure of the Web for the estimation. In this paper, we propose a new importance estimation algorithm for the blog environment. The proposed method, first, calculates the importance of each document using user's bookmark and click count. Then, the Guru point of a blogger is computed as the sum of all importance points of documents which he/she wrote. Finally, the guru points are reflected in document ranking again. Our experiments show that the proposed method has higher correlation coefficient than the traditional methods with respect to correct answers.