RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI우수등재

      확률 기반 미등록 단어 분리 및 태깅

      한글로보기

      https://www.riss.kr/link?id=A101826399

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      Processing of unknown words such as proper nouns and newly coined words is important for a morphological analyzer to process documents in various domains. In this study, a segmentation and tagging method for unknown Korean words is proposed for the 3-...

      Processing of unknown words such as proper nouns and newly coined words is important for a morphological analyzer to process documents in various domains. In this study, a segmentation and tagging method for unknown Korean words is proposed for the 3-step probabilistic morphological analysis. For guessing unknown word, it uses rich suffixes that are attached to open class words, such as general nouns and proper nouns. We propose a method to learn the suffix patterns from a morpheme tagged corpus, and calculate their probabilities for unknown open word segmentation and tagging in the probabilistic morphological analysis model. Results of the experiment showed that the performance of unknown word processing is greatly improved in the documents containing many unregistered words.

      더보기

      참고문헌 (Reference)

      1 이재성, "한국어 형태소 분석을 위한 3단계 확률 모델" 한국정보과학회 38 (38): 257-268, 2011

      2 김선호, "한국어 문서 처리를 위한 동적 생성 로컬 사전 기반 미등록어 분석" 한국정보과학회 29 (29): 407-416, 2002

      3 "http://wikitravel.org/ko/"

      4 G. G. Lee, "Syllable-patternbased unknown-morpheme segmentation and estimation for hybrid part-of-speech tagging of Korean" 28 (28): 53-70, 2002

      5 J. Kupiec, "Robust part-of-speech tagging using a hidden Markov model" 6 (6): 225-242, 1992

      6 B.-R. Park, "Recognizing unknown words by analyzing their examples" 25 (25): 397-407, 1998

      7 D. Lee, "Probabilistic models for Korean morphological analysis and part-of-speech tagging" Korea Univ. 2005

      8 D. Lee, "Language model smoothing for Korean morpheme recovery" 39 (39): 309-311, 2012

      9 S. S. Kang, "Korean morphological analysis using syllable information and multiple-word units" Seoul National University 1993

      10 Y. Zhang, "Joint word segmentation and POS tagging using a single perceptron" 888-896, 2008

      1 이재성, "한국어 형태소 분석을 위한 3단계 확률 모델" 한국정보과학회 38 (38): 257-268, 2011

      2 김선호, "한국어 문서 처리를 위한 동적 생성 로컬 사전 기반 미등록어 분석" 한국정보과학회 29 (29): 407-416, 2002

      3 "http://wikitravel.org/ko/"

      4 G. G. Lee, "Syllable-patternbased unknown-morpheme segmentation and estimation for hybrid part-of-speech tagging of Korean" 28 (28): 53-70, 2002

      5 J. Kupiec, "Robust part-of-speech tagging using a hidden Markov model" 6 (6): 225-242, 1992

      6 B.-R. Park, "Recognizing unknown words by analyzing their examples" 25 (25): 397-407, 1998

      7 D. Lee, "Probabilistic models for Korean morphological analysis and part-of-speech tagging" Korea Univ. 2005

      8 D. Lee, "Language model smoothing for Korean morpheme recovery" 39 (39): 309-311, 2012

      9 S. S. Kang, "Korean morphological analysis using syllable information and multiple-word units" Seoul National University 1993

      10 Y. Zhang, "Joint word segmentation and POS tagging using a single perceptron" 888-896, 2008

      11 J. Hatori, "Incremental joint approach to word segmentation, pos tagging, and dependency parsing in chinese" 1 : 1045-1053, 2012

      12 W. Gale, "Good-Turing smoothing without tears" 2 : 217-237, 1995

      13 R. Weischedel, "Coping with ambiguity and unknown words through probabilistic models" 19 (19): 361-382, 1993

      14 T. Nakagawa, "Chinese and Japanese word segmentation using word-level and character-level information" 466-472, 2004

      15 B. Kim, "Automatic space information extraction from Korean text" 18 (18): 2953-2962, 2015

      16 R. Sproat, "A stochastic finite-state word-segmentation algorithm for Chinese" 22 (22): 377-404, 1996

      17 Y. Zhang, "A fast decoder for joint word segmentation and POS-tagging using a single discriminative model" Association for Computational Linguistics 2010

      18 The National Institute of the Korean Language, "21st Century Sejong Project Final Result - 2011.12. Revised Edition"

      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2021 평가예정 계속평가 신청대상 (등재유지)
      2016-01-01 평가 우수등재학술지 선정 (계속평가)
      2015-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2002-01-01 평가 학술지 통합 (등재유지) KCI등재
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.19 0.19 0.19
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.2 0.18 0.373 0.07
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼