RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • 한국어 통합정보사전 시스템

        황도삼(Do Sam Hwang),최기선(Key Sun Choi) 한국정보처리학회 2000 정보처리학회논문지 Vol.7 No.9

        Dictionaries are indispensable for NLP(natural language processing) systems. Sophisticated algorithms in the NLP systems can be fully appreciated only with matching dictionaries that are built systematically based on computational linguistics. Only few dictionaries are developed for natural language processing. Available dictionaries are far from complete specifications for practical uses. So, it is necessary to develop an integrated information dictionary that includes useful lexical information for processing and understanding natural languages such as morphology and syntactic and semantic information. In this paper, we propose a method to build an integrated dictionary, and introduce a dictionary developing system.

      • 한국어 통합정보사전 시스템

        황도삼,최기선,Hwang, Do-Sam,Choi, Key-Sun 한국정보처리학회 2000 정보처리논문지 Vol.7 No.9

        사전은 각종 자연언어처리 시스템에 있어서 고도의 언어처리 및 성능향상을 위한 필수 요소이며, 아무리 좋은 언어처리 도구와 알고리즘이라도 계산언어학에 근거한 양질의 체계적인 전자사전이 없는 한 이의 실용화는 불가능하다. 기존의 출판된 일반 사전은 자연언어처리 및 이해를 목적으로 하여 개발된 사전이 아니다. 또한, 자연언어처리 도구 및 응용시스템을 위해 개발된 사전은 각 시스템의 목적에 따라 각기 다른 체계에 의해 구축되어 있기 때문에 이용하는데 있어서 비효율적인 점이 있다. 따라서, 고도의 언어처리 및 이해를 목적으로 한 체계적이고 과학적인 방법론을 이용하여 형태소 구문 의미정보등 각종 정보가 통합된 통합정보사전의 개발이 필요하다. 본 논문에서는 통합정보사전을 구축하기 위한 방법론을 제시하고, 이에 근거하여 개발한 통합정보사전 개발 시스템을 제시한다. Dictionaries are indispensable for NLP(natural language processing) systems. Sophisticated algorithms in the NLP systems can be fully appreciated only with matching dictionaries that are built systematically based on computational linguistics. Only few dictionaries are developed for natural language processing. Available dictionaries are far from complete specifications for practical uses. So, it is necessary to develop an integrated information dictionary that includes useful lexical information for processing and understanding natural languages such as morphology and syntactic and semantic information. In this paper, we propose a method to build an integrated dictionary, and introduce a dictionary developing system.

      • 문형정보와 N - gram 단어정보를 이용한 연속음성인식 후처리

        엄한용(Han-yong Eom),황도삼(Do-sam Hwang) 한국정보과학회 2000 한국정보과학회 학술발표논문집 Vol.27 No.1B

        본 논문에서는 항공편 예약이라는 제한 영역에서의 연속음성인식 시스템을 위한 후처리 방안을 제시한다. 제안하는 후처리 방안은 200 문장의 항공편 예약 텍스트 데이터를 이용하여 문형 정보를 추출한 뒤 특정 문형별로 분류하였다. 분류된 문형과 음성인식 후의 문장을 비교하여 가장 유사한 문형을 추론한다. 추론한 특정 문형에서 나올 수 있는 형태소를 형태소들간의 N-gram 정보가 수록된 데이터베이스를 이용하여 형태소를 수정하고 보완한 결과를 최종 문장으로 출력한다.

      • 포스터 : 구문정보 가중치를 이용한 유사문서 판별기 설계 및 구현

        강원석 ( Won Seog Kang ),황도삼 ( Do Sam Hwang ),( Jung H Kim ) 한국컴퓨터교육학회 2011 한국컴퓨터교육학회 학술발표대회논문집 Vol.15 No.2

        문서의 복제나 표절 유무를 판별하는 유사 문서 판별은 표절의 정의에 따라 종류가 다양하다. 본 연구에서는 표층레벨의 표절 유무를 찾는 것이 아니라 심층레벨의 표절 유무를 찾는 유사문서 판별기를 설계, 구현한다. 본 시스템은 단어, 어절구조, 단위문구고 등의 구문정보를 찾아내고 각 정보의 가증치를 이용하여 유사문서를 판별하는 방법을 사용한다. 본 시스템을 실험한 결과 유용한 결과를 얻었다. 앞으로 검사데이타를 실험하여 실효성있는 유사문서 판별기로 개발할 필요가 있다.

      • 전문용어 추출시스템

        박정오(Jung-Oh Park),황도삼(Do-Sam Hwang) 한국정보과학회 2000 한국정보과학회 학술발표논문집 Vol.27 No.1B

        현재, 과학기술, 정치, 사회, 문화의 급격한 변화와 발전에 따라, 전문분야마다 새로운 전문용어가 빈번히 생성되거나 소멸되고 있다. 이러한 전문용어를 포함한 문서를 정확히 해석하기 위해서는 전문용어 전자사전이 필요하다. 전문용어 전자사전을 개발하는데는 수시로 생성되는 전문용어 표제어를 정확히 추출하는 것이 무엇보다 중요하다. 본 논문에서는 이러한 전문용어 표제어를 컴퓨터를 이용하여 추출하는 시스템을 개발하였다. 기본적으로는 기존의 전문용어가 사용된 특정어구를 이용하여 전문용어를 추출한다. 또한, 전문용어의 어절 패턴을 이용하여 후보 전문용어를 추출한 후, 전문용어를 구성할 수 있는 단어의 위치정보를 이용하여 전문용어를 추출하는 방법을 제안한다. 기존 전문용어 사전에 없는 단어에 대해서는 시소러스를 이용하여 유사 단어의 위치정보를 이용하는 방법을 이용하였다.

      • KCI등재

        구문의미분석을 이용한 유사문서 판별기

        강원석(Won-Seog Kang),황도삼(Do-Sam Hwang),Jung H Kim 한국콘텐츠학회 2014 한국콘텐츠학회논문지 Vol.14 No.3

        문서 저작권에 대한 관심과 중요성이 높아짐에 따라 문서 복제나 표절의 검출에 대한 필요성이 증대되고 있다. 이와 같은 이유로 많은 연구가 이루어지고 있으나 자연어 처리기술의 한계가 있어 문서의 심층적 표절 검출에 어려움이 있다.본 논문은 자연어 분석의 기술을 적용한 유사문서 판별기를 설계,구현한다. 이 시스템은 형태소 분석의 기술과 함께 구문의미 분석의 기술, 저빈도 및 관용표현 가중치을 이용하여 유사문서를 판별한다. 본 시스템의 성능을 실험하기 위하여 휴먼 판별과 기존 시스템, 그리고 휴먼 판별과 제안한 시스템의 판별과의 상관계수를 분석하였다. 실험결과, 구문의미 분석을 활용한 시스템의 개선점을 발견할 수 있었다. 앞으로 문서 유형을 정의하고 각 유형에 맞는 판별 기법을 개발할 필요가 있다. Owing to importance of document copyright the need to detectd ocument duplication and plagiarism is increasing. Many studies have so ught to meet such need, but there are difficulties indocument duplication detection due to technological limitations with the processing of natural language. This thesis designs and implements a discriminator of similar documents with natural language processing technique. This system discriminates similar documents using morphological analysis, syntactic analysis, and weight on low frequency and idiom. To evaluate the system, we analyze the correlation between human discrimination and term-based discrimination, and between human discrimination and proposed discrimination. This analysis shows that the proposed discrimination needs improving. Future research should work to define the document type and improve the processing technique appropriate for each type.

      • KCI우수등재

        구문중심의 다언어 기계번역 시스템

        이진태(Jin Tae Lee),황도삼(Do Sam Hwang),박창호(Chang Ho Park),이기식(Ki Sik Lee) 한국정보과학회 1986 정보과학회논문지 Vol.13 No.1

        본 논문은 한국과학기술원 시스템공학센터에서 제작한 구문중심의 다언어간 기계번역 시스템 (KANT)을 소개한다. 이 시스템은 크게 사전, 문법, 알고리즘의 3부분으로 구성되어 있다. 언어정보(사전, 문법)는 알고리즘부와 분리할 수 있으며, 실행시에 문법은 rule-translator 프로그램을 거쳐서 알고리즘부와 link 된다. 문법의 전체적인 구조는 계층적 (hierarchical) frame network 이며 경험적 (heuristic) 문법정보를 효과적으로 표현할 수 있다. 현재 일한 기계번역이 가능하며, 한일 기계번역과 영한 기계번역을 위한 언어정보를 구축하고 있는 중이다. This paper describes a syntax-based multilingual machine translation system KANT(KAIST Automatic Natural Language Translation) System which SERI (Systems Engineering Research Institute)/ KAIST has developed since June. 1983. The system consists of three parts, which are mainly Lexicon, Grammatical rules, and Algorithms for machine translation. The linguistic information module containing lexicon and grammatical rules can be seperated from the algorithm module, and the grammatical rules are translated by rule-translator program to be linked with the algorithm for translation. The overall structure of the grammar is a hierarchical frame network, and heuristic information of grammar can be constructed in it efficiently. At present KANT system can translate some Japanese into Korean, and we are constructing linguistic informations to apply this system for Korean-to-Japanese and English-to-Korean translations.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼