RISS 검색 - 국내학술지논문

무료
기관 내 무료
유료

내보내기
내책장담기
한글로보기

정확도순

내림차순

내림차순

10개씩 출력

1
Anchor Text의 단어 정보를 이용한 자동 문서 범주화

허희근 ( Hee-keun Heo ),한기덕 ( Gi-deok Han ),정성원 ( Sung-won Jung ),임성신 ( Sung-shin Lim ),권혁철 ( Hyuk-chul Kwon ) 한국정보처리학회 2004 한국정보처리학회 학술대회논문집 Vol.11 No.1
- 원문보기
최근의 웹 문서는 텍스트뿐만 아니라 이미지, 사운드 등 다른 여러 형태로 표현되고 있어서 텍스트의 비중이 낮아지고 있다. 그래서 문서 내에서 일정량 이상의 단어 추출이 어려운 문서들에 대해서 기존의 단어 정보만을 이용한 문서 범주화 방법은 좋은 성능을 기대할 수 없다. 그래서 본 논문은 Anchor Text 단어 정보의 자질 적합성 판단에 의한 새로운 자동 문서 범주화 모델을 제안한다. 문서 범주화 모델로는 베이지언 확률 모델을 이용하였으며, 카이제곱 통계량을 사용하여 자질을 선정하였다. 문서 내에서 추출된 단어 자질들이 해당 문서를 판단하는데 부족하다고 판단되면 문서의 링크정보를 이용하여 연결된 문서의 단어 자질과 Anchor Text의 단어 자질을 반영함으로써 성능을 향상시킨다.
2
Anchor Text 정보와 링크 정보를 이용한 정보 검색 모델

한기덕(Gi-deok Han),정성원(Sung-won Jung),허희근(Hee-keun Heo),이교운(Kyo-woon Lee),권혁철(Hyuk-chul Kwon) 한국정보과학회 2004 한국정보과학회 학술발표논문집 Vol.31 No.1B
- 원문보기
90년대 이전에 정보 검색에 대한 연구는 문서의 내용을 기반으로 한 연구가 주류였으며, 90년대에는 링크를 이용한 연구가 활발하였다. 90년대 말에 Page Rank와 HITS가 링크를 이용한 연구의 대표적 사례이며, 최근에는 문서의 내용과 링크 정보를 같이 이용하는 연구가 많이 발표되고 있다. 본 논문도 문서의 정보와 링크 정보를 이용한 새로운 검색 모델을 제시하고자 한다. 본 논문에서 사용하는 링크 정보는 수집된 문서에서 추출한 Page Rank의 가중치와 한 페이지를 가리키는 링크들의 목록이며, 사용하고자 하는 문서의 정보는 본문 내용과 Anchor Text이다. 링크 정보와 문서 정보를 이용하여 Anchor 벡터와 문서 벡터를 만들고, 각각 질의어 벡터와 Cosine Measure를 하여 값을 구한 후, 더한 값을 해당 문서의 가중치로 하여 검색에 이용한다.
3
음절 N-Gram과 어절 통계 정보를 이용한 한국어 띄어쓰기 시스템

최성자(Sung-Ja Choi),강미영(Mi-Young Kang),허희근(Hee-Keun Heo),권혁철(Hyuk-Chul Kwon) 한국정보과학회 언어공학연구회 2003 한국정보과학회 언어공학연구회 학술발표 논문집 Vol.2003 No.10
- 원문보기

내보내기
내책장담기
한글로보기

정확도순

내림차순

내림차순

10개씩 출력

맨처음 페이지로 1 맨끝 페이지로

상세검색

RISS 보유자료

상세검색

해외전자자료

연관 검색어 추천