http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
정도헌 ( Do-heon Jeong ),황명권 ( Myung-gwon Hwang ),성원경 ( Won-kyung Sung ) 한국정보처리학회 2011 한국정보처리학회 학술대회논문집 Vol.18 No.1
대용량 데이터 환경에의 적용이 가능한 대용량 학습기반의 자동범주화 기법과 범용적으로 사용할 수 있는 기법은 대량의 정보를 처리해야하는 정보분석 및 정보서비스 환경에 가장 필요한 기술요소라 할 수 있다. 본 논문에서는 대용량의 문서를 단위 컴포넌트로 분할하여 학습하고 이를 동적으로 결합하는 대용량 분류기 생성 기법을 소개하고 자동범주화 성능을 SVM 모델과 비교하여 봄으로써, 본 기술의 활용 가능성을 살펴보도록 한다.
위키피디아 카테고리 유사도와 부트스트래핑 기법을 이용한 전문용어 정제
황명권(Myunggwon Hwang),정도헌(Do-Heon Jeong),이승우(Seungwoo Lee),정한민(Hanmin Jung),성원경(Won-Kyung Sung) 한국정보과학회 2011 한국정보과학회 학술발표논문집 Vol.38 No.2C
본 연구는 대용량의 문서집합에서 추출한 전문용어 후보군들의 정제 방법을 다룬다. 유용한 정보를 효과적으로 추출하기 위한 텍스트 마이닝의 목표가 이제는 전문가 또는 일반인들의 삶에 직접적으로 영향을 줄 수 있는 방향으로 흐름이 바뀌어 가고 있다. 기술 기회 발굴(Technology Opportunity Discovery) 연구 또한 이를 위한 것으로 시대의 흐름에 따른 전문용어의 생명주기 파악 그리고 그들 사이의 관계를 추출하기 위한 것에 집중하고 있다. 이러한 목표들을 성공적으로 달성하기 위해 잘 정제된 전문용어의 추출이 가장 우선시 되어야 하며 본 연구에서는 이를 위해 위키피디아의 카테고리 유사도 측정 방법에 기반한 부트스트래핑 방법을 제안한다. 측정된 카테고리 유사도를 전문용어의 정제에 적용함으로써 본 연구의 가능성을 도출한다.
황명권 ( Myunggwon Hwang ),정도헌,성원경 ( Do-heon Jeong ) 한국정보처리학회 2011 한국정보처리학회 학술대회논문집 Vol.18 No.2
자연어 처리에서 큰 걸림돌 중의 하나는 용어의 표현 다양성이라 할 수 있다. 용어들은 시제, 단수/복수 형태, 경우에 따라서는 동일한 의미의 다른 용어로 대체되어 사용될 수 있으며, 이러한 용어의 사용은 동일한 의미를 다르게 해석하는 원인이 되기도 한다. 이에 본 연구에서는 다양한 형태의 용어들을 하나의 표준화된 형태로 정규화 하는 방법을 제안한다.
황명권 ( Myung-gwon Hwang ),정도헌 ( Do-heon Jeong ),성원경 ( Won-kyung Sung ) 한국정보처리학회 2011 한국정보처리학회 학술대회논문집 Vol.18 No.1
본 논문은 의미적 정보처리에서 걸림돌이 되는 두문자어(Acronym)의 의미처리를 위한 전체적인 구조설계를 포함하고 있다. 두문자어는 일반적으로 복합어에서 의미가 큰 단어의 첫 번째 문자들로 구성된다. 두문자어를 구성하는 복합어는 다른 일반 명사들과 달리 대부분 고유한 의미를 갖고 있기 때문에 정보처리에서 의미 파악의 핵심적인 역할을 수행할 수 있다. 본 논문은 문서에서 출현하는 두문자어의 정확한 의미를 판단하기 위한 방법을 제안하며 현재까지 진행된 결과에 대해 언급하도록 한다.
황미녕(Mi-Nyeong Hwang),조민희(Min-Hee cho),황명권(Myung-Gwon Hwang),정도헌(Do-Heon Jeong),성원경(Won-Kyoung Sung) 한국정보과학회 2011 한국정보과학회 학술발표논문집 Vol.38 No.1C
용어는 기술(technology)을 직 · 간접적으로 표현하고, 기술의 발전 동향에 따라 용어의 사용 패턴 또한 변한다. 즉, 시계열을 포함하는 대용량 문서 집합의 분석을 통해 기술 용어의 생성, 성장, 쇠퇴, 소멸 등의 활용주기 파악이 가능하다. 본 논문은 기술용어의 활용주기 모델 정의를 위한 초기 연구로, 정의 가능한 모델의 종류를 파악하고, 이에 대한 타당성 분석에 집중하도록 한다.