RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      인공지능 : 부분어절 조건부확률 기반 동형이의어 태깅 모델 = Artificial Intelligence : Korean Homograph Tagging Model based on Sub-Word Conditional Probability

      한글로보기

      https://www.riss.kr/link?id=A100154867

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      In general, the Korean morpheme analysis procedure is divided into two steps. In the first step as an ambiguity generation step, an Eojeol is analyzed into many morpheme sequences as candidates. In the second step, one appropriate candidate is chosen by using contextual information. Hidden Markov Model(HMM) is typically applied in the second step. This paper proposes Sub-word Conditional Probability(SCP) model as an alternate algorithm. SCP uses sub-word information of adjacent eojeol first. If it failed, then SCP use morpheme information restrictively. In the accuracy and speed comparative test, HMM`s accuracy is 96.49% and SCP`s accuracy is just 0.07% lower. But SCP reduced processing time 53%.
      번역하기

      In general, the Korean morpheme analysis procedure is divided into two steps. In the first step as an ambiguity generation step, an Eojeol is analyzed into many morpheme sequences as candidates. In the second step, one appropriate candidate is chosen ...

      In general, the Korean morpheme analysis procedure is divided into two steps. In the first step as an ambiguity generation step, an Eojeol is analyzed into many morpheme sequences as candidates. In the second step, one appropriate candidate is chosen by using contextual information. Hidden Markov Model(HMM) is typically applied in the second step. This paper proposes Sub-word Conditional Probability(SCP) model as an alternate algorithm. SCP uses sub-word information of adjacent eojeol first. If it failed, then SCP use morpheme information restrictively. In the accuracy and speed comparative test, HMM`s accuracy is 96.49% and SCP`s accuracy is just 0.07% lower. But SCP reduced processing time 53%.

      더보기

      참고문헌 (Reference)

      1 신준철, "한국어 품사 및 동형이의어 태깅을 위한 단계별 전이모델" 한국정보과학회 39 (39): 889-901, 2012

      2 박민서, "차세대 시퀀싱을 위한 짧은 서열 정렬에 대한 기술조사" 한국정보과학회 38 (38): 503-511, 2011

      3 박희근, "어절별 중의성 해소 규칙을 이용한 혼합형 한국어 품사 태깅 시스템" 한국정보과학회 13 (13): 427-431, 2007

      4 허정, "상호정보량과 복합명사 의미사전에 기반한 동음이의어 중의성 해소" 한국정보과학회 33 (33): 1073-1089, 2006

      5 이용구, "사전 정보를 이용한 단어 중의성 해소 모형에 관한 실험적 연구" 한국정보관리학회 24 (24): 321-342, 2007

      6 김준수, "가중치를 이용한 통계 기반 한국어 동형이의어 분별 모델" 한국정보과학회 30 (30): 1112-1123, 2003

      7 David Yarowsky, "Word-sense disambiguation using statistical models of Roget’s categories trained on large corpora" 454-460, 1992

      8 Soojong Lim, "Word Sense Disambiguation of Korean Verbs Using Weight Information from Context" 425-429, 1998

      9 Wang Woo Lee, "Word Sense Disambiguation System Using Lexical Co-occurrencing Set and Thesaurus(in Korean)" Ulsan university 2003

      10 Jin-dong Kim, "Twoply HMM: A Part-of-Speech Tagging Model based on Morpheme-Unit considering the Characteristics of Korean" 24 (24): 1502-1512, 1997

      1 신준철, "한국어 품사 및 동형이의어 태깅을 위한 단계별 전이모델" 한국정보과학회 39 (39): 889-901, 2012

      2 박민서, "차세대 시퀀싱을 위한 짧은 서열 정렬에 대한 기술조사" 한국정보과학회 38 (38): 503-511, 2011

      3 박희근, "어절별 중의성 해소 규칙을 이용한 혼합형 한국어 품사 태깅 시스템" 한국정보과학회 13 (13): 427-431, 2007

      4 허정, "상호정보량과 복합명사 의미사전에 기반한 동음이의어 중의성 해소" 한국정보과학회 33 (33): 1073-1089, 2006

      5 이용구, "사전 정보를 이용한 단어 중의성 해소 모형에 관한 실험적 연구" 한국정보관리학회 24 (24): 321-342, 2007

      6 김준수, "가중치를 이용한 통계 기반 한국어 동형이의어 분별 모델" 한국정보과학회 30 (30): 1112-1123, 2003

      7 David Yarowsky, "Word-sense disambiguation using statistical models of Roget’s categories trained on large corpora" 454-460, 1992

      8 Soojong Lim, "Word Sense Disambiguation of Korean Verbs Using Weight Information from Context" 425-429, 1998

      9 Wang Woo Lee, "Word Sense Disambiguation System Using Lexical Co-occurrencing Set and Thesaurus(in Korean)" Ulsan university 2003

      10 Jin-dong Kim, "Twoply HMM: A Part-of-Speech Tagging Model based on Morpheme-Unit considering the Characteristics of Korean" 24 (24): 1502-1512, 1997

      11 Eric Brill, "Transformation-based error-driven learning and natural language processing: A case study in part of speech tagging" 21 (21): 543-565, 1995

      12 Dong Myung Kim, "Simultaneous Korean POS and Homonym Tagging System using HMM(in Korean)" Ulsan University 2009

      13 Seung-Hoon Na, "Semi-CRF or Linear-chain CRF? A comparative Study of Joint Models for Korean Morphological Analysis and POS Tagging" 9-12, 2013

      14 Young-Jun Base, "Semantic Analysis of Korean Compound Noun using Lexical Semantic Network(U-WIN)" Ulsan University 2013

      15 Dan Roth, "Part of speech tagging using a network of linear separators" 1136-1142, 1998

      16 Joon-Choul Shin, "Comparison between Markov Model and Hidden Markov Model for Korean Part-of-Speech and Homograph Tagging" 152-155, 2013

      17 Ho Suk Lee, "A Survey of conditional Random Fields and Applications" 36 (36): 2009

      18 Scott M. Thede, "A Second-Order Hidden Markov Model for Part-of-Speech Tagging" 175-182, 1999

      19 Joon-Choul Shin, "A Korean Morphological Analyzer using a Pre-analyzed Partial Word-phrase Dictionary(in Korean)" 39 (39): 2012

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2027 평가예정 재인증평가 신청대상 (재인증)
      2021-01-01 평가 등재학술지 유지 (재인증) KCI등재
      2018-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2015-01-01 평가 등재학술지 유지 (계속평가) KCI등재
      2012-10-31 학술지명변경 한글명 : 소프트웨어 및 데이터 공학 -> 정보처리학회논문지. 소프트웨어 및 데이터 공학 KCI등재
      2012-10-10 학술지명변경 한글명 : 정보처리학회논문지B -> 소프트웨어 및 데이터 공학
      외국어명 : The KIPS Transactions : Part B -> KIPS Transactions on Software and Data Engineering
      KCI등재
      2010-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2008-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2006-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2003-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      2002-01-01 평가 등재후보 1차 PASS (등재후보1차) KCI등재후보
      2000-07-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.35 0.35 0.28
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.23 0.19 0.511 0.06
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼