RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • 통계 정보와 언어 지식의 보완적 특성을 고려한 혼합형 품사 태깅

        임희석(Heui Seok Lim),김진동(Jin Dong Kim),임해창(Hae Chang Rim) 한국정보과학회 1998 정보과학회논문지(B) Vol.25 No.11

        기존의 규칙 기반 품사 태깅 시스템은 규칙이 적용되는 언어 현상에 대해서 매우 높은 정확률을 보이나 처리 범위가 제한적이다. 반면 통계 기반 품사 태깅 시스템은 규칙 기반 품사 태깅 시스템보다 처리 범위가 넓고 견고하다는 장점을 갖지만, 규칙 기반 품사 태깅보다 정확률이 떨어진다는 단점이 지적되고 있다. 이에 본 논문은 통계 기반 품사 태깅과 규칙 기반 품사 태깅의 보완적 특성을 이용한 혼합형 품사 태깅 방법을 제안한다. 제안한 방법은 규칙에 의한 품사 태깅 결과를 선호함으로써 규칙이 적용되는 언어 현상에 대해서 높은 정확률을 유지하며 중의성이 해결되지 않은 어절에는 통계 정보에 의한 품사 태깅 결과를 할당함으로써 처리 범위와 견고성을 유지할 수 있다. 본 논문은 제안한 품사 태깅 방법으로 한국어 품사 태깅 시스템을 구현하였고, 이를 2만 어절 크기의 코퍼스에 대하여 실험하였다. 실험 결과, 구현된 품사 태깅 시스템은 통계 기반 품사 태깅 시스템의 처리 범위를 유지하면서 통계 기반 품사 태깅 시스템의 오류를 32.70%만큼 감소시킨 95.43%의 정확률을 보였다. The rule-based part-of-speech(POS) tagger is very accurate where rules are applied but its coverage is often limited to some core linguistic phenomena. To the contrast, while the probabilistic POS tagger is robust and extensive to various linguistic phenomena, the accuracy is lower than the rule-based POS tagger. In this paper, we propose a hybrid POS tagging method combining those complemental characteristics of the rule-based and the probabilistic POS tagger. By preferring the linguistic knowledge to stochastic information, the proposed method can keep the accuracy of the rule-based tagger. Also it has robustness and coverage of the probabilistic POS tagger by assigning a unique tag for the word whose ambiguity is not fully resolved by linguistic knowledge. A Korean POS tagger using the proposed method was implemented and experimented on the 20K Eojeol-sized open test corpus. As a result, the experiment result showed that the tagger had the accuracy of 95.43%, which reduced the error rate of the probabilistic tagger about 32.70%. Also, It is proved that the tagger is as robust and extensive as the probabilistic POS tagger.

      • 형태소 분석 단계에서 발생하는 어절의 중의성 분석 방안

        임희석(Heui-Seok Lim),이호(Ho Lee),임혜창(Hae-Chang Rim) 한국정보과학회 1993 한국정보과학회 학술발표논문집 Vol.20 No.1

        현재까지 국내에서 개발된 한국어 형태소 분석기들은 대부분 철자 검사기나 정보검색 시스템 등의 특정 응용분야만을 위한 것들이어서 한 어절의 모든 가능한 형태소 결합중에서 하나만을 그 분석 결과로 채택한다. 그러나 자연어는 그 특성상 많은 중의성을 포함하고 있으므로 자연어의 정확한 해석을 위해서는 형태소 분석 단계에서부터 어절의 가능한 모든 중의성을 분석하여야 하며 자연어 해석에 사용 될 적당한 형태소 결합을 선택할 수 있을 때까지 또는 불필요한 형태소 결합을 제거할 수 있는 정보가 제공될 때까지 중의성이 유지되어야 한다. 따라서 본 논문에서는 한국어 형태소 분석 단계에서 어절의 모든 가능한 중의성을 분석하기 위하여 형태소 분석 단계에서 발생하는 어절의 중의성을 유형별로 나누고 그 분석 방안을 제안한다.

      • KCI등재후보

        예제기반 한국어 표준 산업/직업 코드 분류

        임희석(Lim, Heui-Seok) 한국산학기술학회 2006 한국산학기술학회논문지 Vol.7 No.4

        통계청에서 실시하는 통계 조사에는 한국 표준 산업/직업 분류 코드를 작성하는 작업이 많이 포함되는데, 현재 대부분의 코드 분류 작업은 수작업으로 이루어지고 있으며, 이로 인하여 막대한 노동력과 비용이 소모되고 작업 결과의 일관성을 유지하기 어렵다는 문제점이 있다. 본 논문은 수동 코드 분류 규칙과 예제기반의 자동 학습을 이용 하는 한국어 표준 산업/직업 코드 자동 분류 시스템을 제안한다, 제안된 시스템은 산업과 직업에 대하여 설명하는 자연어를 입력받아 해당 산업/직업 분류 코드를 생성하는 시스템으로 수작업으로 구축된 규칙을 적용한 후 규칙이 적용 되지 않는 레코드는 예제 기반의 학습을 이용한 자동 분류 시스템에 의해서 해당 코드를 할당한다. 수작업 규칙 260여개와 40만여개의 예제를 이용하여 학습한 시스템에 대하여 실험한 결과 제안한 시스템은 직업 코드 분류에서 76.69% 그리고 산업 코드 분류에서는 99.68%의 정확도를 보였다. Coding of occupational and industrial codes is a major operation in census survey of Korean statistics bureau. The coding process has been done manually. Such manual work is very labor and cost intensive and it usually causes inconsistent results. This paper proposes an automatic coding system based on example-based learning. The system converts natural language input into corresponding numeric codes using code generation system trained by example-based learning after applying manually built rules. As experimental results performed with training data consisted of 400,000 records and 260 manual rules, the proposed system showed about 76.69% and 99.68% accuracy for occupational code classification and industrial code classification, respectively.

      • KCI등재후보

        은닉 마르코프 모델과 계층 정보를 이용한 개체명 경계 인식

        임희석(Lim, Heui-Seok) 한국산학기술학회 2006 한국산학기술학회논문지 Vol.7 No.2

        본 논문은 통계 기반 접근 방식인 HMM(Hidden Markov model)과 생물학의 개체명에 관한 온톨로지 정보를 이용한 생물학 문서에서의 개체명(named entity) 경계 인식 방법을 제안한다. 제안하는 방법은 31개의 자질 정보를 이용한 평탄화 기법을 사용하며 생물학 개체명의 계층 정보를 이용하여 HMM의 자료 부족 문제를 완화시킬 수 있도록 하였다. 개체명 경계 인식의 학습과 실험을 위하여 GENIA 코퍼스 ver 2.1을 사용하였으며 개체명 경계 인식 실험을 수행한 결과 모든 부류를 사용한 경우보다 정확도 및 실행 속도가 개선됨을 확인하였다. This paper proposes a method for boundary recognition of named entity using hidden markov model and ontology information of biological named entity. We uses smoothing method using 31 feature information of word and hierarchical information to alleviate sparse data problem in HMM. The GENIA corpus version 2.1 was used to train and to experiment the proposed boundary recognition system. The experimental results show that the proposed system outperform the previous system which did not use ontology information of hierarchical information and smoothing technique. Also the system shows improvement of execution time of boundary recognition.

      • KCI등재

        언어생활을 반영한 지능적 끝말잇기 프로그램 구현

        임희석(Lim, Heui-Seok) 한국산학기술학회 2008 한국산학기술학회논문지 Vol.9 No.1

        본 논문은 한국어의 사용 패턴을 고려한 지능적 끝말잇기 프로그램을 구현하였다. 끝말잇기 프로그램은 뇌손상 등을 통한 실어증 환자나 언어 능력 발달이 상대적으로 낮은 아동들의 언어 능력을 진단하고, 재미있게 재활치료를 하는데 기여할 수 있다. 하지만 컴퓨터는 사람과 비교하여 대용량의 단어 목록을 기억하기에 유리하므로 끝말잇기 프로그램에서 컴퓨터는 훨씬 유리한 조건이다. 따라서 컴퓨터의 보유 단어 목록에서 임의의 끝말을 생성하는 끝말잇기 프로그램은 지능적인 게임의 상대자로 부적합하며 게임자의 의욕을 저하시킬 수 있다. 게임자의 단어 사용 수준에 따라 컴퓨터의 대답의 난이도를 조절하고, 실제 언어생활의 사용 패턴을 반영한 끝말잇기 프로그램은 게임자로 하여금 컴퓨터 상대방이 사람인 것처럼 느끼게 할 수 있으며, 이를 통하여 끝말잇기 프로그램을 지속시킬 수 있다. An word relay game contributes to rehabilitation and treatment of language disorders such as aphasia. As a computer is better than human in memorizing very large vocabularies, the computer has much advantage over people in word relay game. Such the game result in decrease the motivation of players and patients in treatment of language disorders. To make people to continue word relay and to be effective to remedy language disorders, the game need to be intelligent and familar with a person. This paper proposes an implementation of intelligent Korean word relay game, which considers characteristics of Korean word usage patterns. The gaem is intelligent in constructing vocabulary database and choosing an answer considering the level of player.

      • 스마트 교육을 위한 세계의 ICT 활용 동향

        임희석(Heui-Seok Lim),유길상(Kil-Sang Yoo) 한국정보기술학회 2012 한국정보기술학회지 Vol.10 No.1

        기술 발달로 인하여 교육계획 수립, 학습 과정, 모니터링 등이 보다 효율적으로 이루어지고 있다. 세계의 여러 나라에서는 교육정보화의 중요성에 대하여 인식하고 첨단 ICT 활용 교육을 전략적으로 추진하기 위한 계획과 스마트 교육전략을 추진하고 있다. 차세대 스마트 교육의 일환으로 추진되어야 할 학습 시스템의 방향과 인터넷과 디지털 기술을 활용하여 학습과정의 효율성을 높이기 위하여 이에 대한 서비스계획과 국가 차원에서 이루어지는 각국의 전략과 문제점 그리고 스마트교육이 나아가야 할 방향을 살펴본다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼