RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      다국어 기계번역을 위한 중간언어 모형과 방법론 연구_결과보고서

      한글로보기

      https://www.riss.kr/link?id=G3614175

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract) kakao i 다국어 번역

      1. 서론
      2. 연구개요
      2.1.연구 내용
      2.1.1. 형태소 분석 알고리즘 구축
      2.1.2. 전자사전 구축
      2.1.3. 중간언어 텍스트 의미 표시 개발
      2.1.4. 웹사이트를 통한 결과 시연
      2.2. 범위 및 방법
      2.2.1. 형태소 분석 알고리즘 구축
      2.2.2. 전자서전 구축
      2.2.3. 중간언어의미표시(Inter-Lingual-Representation: ILR) 개발
      2.2.4. 웹사이트를 통한 결과 시연
      3. 형태소 분석 방법론
      3.1. 한국어 형태소 분석 모듈의 설계
      3.1.1. 한국어 형태소의 특성
      3.1.2. 한국어 형태소 분석 방법론
      3.2 영어 형태소 분석 모듈의 설계
      3.2.1. 단어의 특성
      3.2.2. 형태소 분석 방법론
      3.3. 일본어 형태소 분석 모듈의 설계
      3.3.1. 형태소의 특성
      3.3.2. 형태소 분석 방법론
      3.4. 중국어 형태소 분석 모듈의 설계
      3.4.1. 중국어 형태소의 특성
      3.4.2. 중국어 형태소 분석 방법론
      4. 다국엉 전자사전 구축
      4.1. 한국어 전자사전
      4.2. 영어 전자사전
      4.3. 일본어 전자사전
      4.4. 중국어 전자사전
      5. 중간언어의미표시(Inter-Lingual-Representation: ILR) 방법론
      5.1. 중간언어표시(ILR)의 구조와 테이블 정보 기술 방법
      5.1.1. 중간언어표시(ILR)의 전체 구조
      5.1.2. 한국어, 영어, 일본어, 중국어 C-tale, O-table, M-table의 구성
      5.2. 중간언어표시(ILR)의 기술 방법
      5.2.1. C-table 정보를 ILR로 표시하는 방법
      5.2.2. M-table에 있는 정보(명사 수식어구)를 ILR로 표시하는 방법
      5.2.3. O-table에 있는 정보를 ILR로 표시하는 방법
      5.2.4. 중간언어표현(ILR) 전체구조
      5.3. 한국어 시연 문장의 중간언어표현(ILR)
      5.3.1. 한국어 시연문장1
      5.3.2. 한국어 시연문장2
      5.3.3. 한국어 시연문장3
      5.3.4. 한국어 시연문장4
      5.3.5. 한국어 시연문장5
      5.3.6. 한국어 시연문장6
      5.3.7. 한국어 시연문장7
      5.3.8. 한국어 시연문장8
      5.3.9. 한국어 시연문장9
      5.3.10. 한국어 시연문장10
      5.4. 일본어 시연 문장의 중간언어표현(ILR)
      5.4.1 일본어 시연문장1
      5.4.2. 일본어 시연문장2
      5.4.3. 일본어 시연문장3
      5.4.4. 일본어 시연문장4
      5.4.5. 일본어 시연문장5
      5.4.6. 일본어 시연문장6
      5.4.7. 일본어 시연문장7
      5.4.8. 일본어 시연문장8
      5.4.9. 일본어 시연문장9
      5.4.10. 일본어 시연문장10
      5.5. 영어 시연 문장의 중간언어표현(ILR)
      5.5.1. 영어 시연문장1
      5.5.2. 영어 시연문장2
      5.5.3. 영어 시연문장3
      5.5.4. 영어 시연문장4
      5.5.5. 영어 시연문장5
      5.5.6. 영어 시연문장6
      5.5.7. 영어 시연문장7
      5.5.8. 영어 시연문장8
      5.5.9. 영어 시연문장9
      5.5.10. 영어 시연문장10
      5.6. 중국어 시연 문장의 중간언어표현(ILR)
      5.6.1. 중국어 시연문장1
      5.6.2. 중국어 시연문장2
      5.6.3. 중국어 시연문장3
      5.6.4. 중국어 시연문장4
      5.6.5. 중국어 시연문장5
      5.6.6. 중국어 시연문장6
      5.6.7. 중국어 시연문장7
      5.6.8. 중국어 시연문장8
      5.6.9. 중국어 시연문장9
      5.6.10. 중국어 시연문장10
      6. 웹사이트를 통한 결과 시연
      6.1. 웹사이트의 개요
      6.2. 모델 시연
      6.3. 사전 검색기
      7. 결론

      참고문헌
      번역하기

      1. 서론 2. 연구개요 2.1.연구 내용 2.1.1. 형태소 분석 알고리즘 구축 2.1.2. 전자사전 구축 2.1.3. 중간언어 텍스트 의미 표시 개발 2.1.4. 웹사이...

      1. 서론
      2. 연구개요
      2.1.연구 내용
      2.1.1. 형태소 분석 알고리즘 구축
      2.1.2. 전자사전 구축
      2.1.3. 중간언어 텍스트 의미 표시 개발
      2.1.4. 웹사이트를 통한 결과 시연
      2.2. 범위 및 방법
      2.2.1. 형태소 분석 알고리즘 구축
      2.2.2. 전자서전 구축
      2.2.3. 중간언어의미표시(Inter-Lingual-Representation: ILR) 개발
      2.2.4. 웹사이트를 통한 결과 시연
      3. 형태소 분석 방법론
      3.1. 한국어 형태소 분석 모듈의 설계
      3.1.1. 한국어 형태소의 특성
      3.1.2. 한국어 형태소 분석 방법론
      3.2 영어 형태소 분석 모듈의 설계
      3.2.1. 단어의 특성
      3.2.2. 형태소 분석 방법론
      3.3. 일본어 형태소 분석 모듈의 설계
      3.3.1. 형태소의 특성
      3.3.2. 형태소 분석 방법론
      3.4. 중국어 형태소 분석 모듈의 설계
      3.4.1. 중국어 형태소의 특성
      3.4.2. 중국어 형태소 분석 방법론
      4. 다국엉 전자사전 구축
      4.1. 한국어 전자사전
      4.2. 영어 전자사전
      4.3. 일본어 전자사전
      4.4. 중국어 전자사전
      5. 중간언어의미표시(Inter-Lingual-Representation: ILR) 방법론
      5.1. 중간언어표시(ILR)의 구조와 테이블 정보 기술 방법
      5.1.1. 중간언어표시(ILR)의 전체 구조
      5.1.2. 한국어, 영어, 일본어, 중국어 C-tale, O-table, M-table의 구성
      5.2. 중간언어표시(ILR)의 기술 방법
      5.2.1. C-table 정보를 ILR로 표시하는 방법
      5.2.2. M-table에 있는 정보(명사 수식어구)를 ILR로 표시하는 방법
      5.2.3. O-table에 있는 정보를 ILR로 표시하는 방법
      5.2.4. 중간언어표현(ILR) 전체구조
      5.3. 한국어 시연 문장의 중간언어표현(ILR)
      5.3.1. 한국어 시연문장1
      5.3.2. 한국어 시연문장2
      5.3.3. 한국어 시연문장3
      5.3.4. 한국어 시연문장4
      5.3.5. 한국어 시연문장5
      5.3.6. 한국어 시연문장6
      5.3.7. 한국어 시연문장7
      5.3.8. 한국어 시연문장8
      5.3.9. 한국어 시연문장9
      5.3.10. 한국어 시연문장10
      5.4. 일본어 시연 문장의 중간언어표현(ILR)
      5.4.1 일본어 시연문장1
      5.4.2. 일본어 시연문장2
      5.4.3. 일본어 시연문장3
      5.4.4. 일본어 시연문장4
      5.4.5. 일본어 시연문장5
      5.4.6. 일본어 시연문장6
      5.4.7. 일본어 시연문장7
      5.4.8. 일본어 시연문장8
      5.4.9. 일본어 시연문장9
      5.4.10. 일본어 시연문장10
      5.5. 영어 시연 문장의 중간언어표현(ILR)
      5.5.1. 영어 시연문장1
      5.5.2. 영어 시연문장2
      5.5.3. 영어 시연문장3
      5.5.4. 영어 시연문장4
      5.5.5. 영어 시연문장5
      5.5.6. 영어 시연문장6
      5.5.7. 영어 시연문장7
      5.5.8. 영어 시연문장8
      5.5.9. 영어 시연문장9
      5.5.10. 영어 시연문장10
      5.6. 중국어 시연 문장의 중간언어표현(ILR)
      5.6.1. 중국어 시연문장1
      5.6.2. 중국어 시연문장2
      5.6.3. 중국어 시연문장3
      5.6.4. 중국어 시연문장4
      5.6.5. 중국어 시연문장5
      5.6.6. 중국어 시연문장6
      5.6.7. 중국어 시연문장7
      5.6.8. 중국어 시연문장8
      5.6.9. 중국어 시연문장9
      5.6.10. 중국어 시연문장10
      6. 웹사이트를 통한 결과 시연
      6.1. 웹사이트의 개요
      6.2. 모델 시연
      6.3. 사전 검색기
      7. 결론

      참고문헌

      더보기

      국문 초록 (Abstract) kakao i 다국어 번역

      본 연구과제(제 2세부과제)가 지향하는 궁극적인 목적은 다국어 기계번역 시스템에 실제로 적용될 수 있는 중간언어의 전산언어학적 완성판을 개발하는 데 있다. 이러한 목적을 달성하기 위해 본 과제는 제 1단계(2000-2002)에서 기반연구에 해당하는 4개 국어(한국어, 영어, 일본어, 중국어)의 기초 언어학적 연구를 수행하였고, 그 결과 워드넷 기반 중간언어 기계번역 시스템(WBIMT)의 체계를 수립한 바 있다. 또한 제2 단계(2002-2004)에서는 제 1단계의 연구를 기반으로 하여 중등수준의 중간언어 다국어 번역시스템 개발을 위해 개발 대상 문장의 수를 언어 당 약 300개, 4개 언어(한, 영, 일, 중) 총 1200개의 문형(sentence patterns)으로 확대ㆍ심화하고, 이들을 대상으로 하는 알고리즘의 확대 설계와 전자사전의 구축 그리고 다국어 데이터베이스의 의미 연결 고리인 ILI 연결 방법론(기능어 품사들의 어휘의미 분석 포함) 등을 수행하였다. 이러한 기존의 연구를 기반으로 이제 마지막 단계인 3단계(2004-2006)에서 수행한 본 연구과제의 내용을 간략히 기술하면 아래와 같다.

      1. 4개 국어 형태소 분석 알고리즘

      형태소 분석은 입력 텍스트에서 문장부호를 처리한 문자열을 입력으로 받아, 구문분석에 필요한 결과값을 출력해주면 되는 모듈이다. 제 2단계까지 다국어 기계 번역을 위한 중간언어 방법론과 모델의 개발은 구문 분석, 어휘의미 분석, ILI 방법론, 구문생성을 중심으로 연구가 진행되었다. 제 3단계는 전체 기계 번역 시스템의 모델을 완성하는 것이 목표이기 때문에 기존에 우선순위에서 후위를 차지했던 형태소 분석 모듈을 본격적으로 연구한다. 형태소 분석 문제와 직결되는 문제가 단어 사이의 띄어쓰기 문제인데, 단어 사이를 띄어 쓰는 한국어, 영어와 띄어 쓰지 않는 중국어, 일본어는 형태소 분석이 한 층 더 복잡해진다.

      2. 4개 국어 전자사전 구축

      3단계 최종 연구에서는 앞선 단계의 기본적인 어휘사전과 모형화된 기능어 사전을 바탕으로 하여, 구현과 정보 서비스를 지향한 사전 구축을 목표로 한다. 결과적으로 3단계에서는 4개 언어(한국어, 영어, 중국어, 일본어) 번역에 필요한 모든 사전 정보를 망라하고 있으며, 더욱이 중간언어를 지향한 개념 사전적 형태를 구비하고 있다. 전자사전 정보는 사전 정보 서비스를 통해 모든 연구자들에게 공개되며, 이러한 공개 서비스를 통하여 중간언어 기반 다국어 전자사전 정보의 완성도가 확인될 것이다.

      3. 중간언어 의미 표시

      제 3단계에서 본 과제가 구상하고 있는 언어중립적 지식표현 모형은 기본적으로 J.F.Sowa(1986)의 개념도식(CG)과 Jackendoff(1990)의 어휘개념구조(LCS) 그리고 Nirenburg,Raskin,Tucker(1987)의 텍스트의미표상(TMR)을 그 모델로 한다. Sowa의 개념도식이나 Jackendoff의 어휘개념구조는 일종의 지식표현 프레임워크로 기존의 자연언어 의미론의 연구업적들을 상당 부분 포함하고 있으며, Nirenburg 등의 텍스트의미표상은 형태론적 정보와 통사,의미론적 정보 외에도 언어외적 정보까지도 포함하는 등 포괄적 의미표상을 보여준다.

      4. 웹 사이트를 통한 결과 시연 계획

      1) 4개 언어 전자 사전 탐색 기능을 제공한다. 사용자가 특정 언어를 먼저 선택하고, 검색어를 입력하면 해당 정보가 출력되는 기능이다.
      2) ILI 레코드 탐색 기능을 제공한다. 사용자가 특정 언어를 선택하고 검색어를 입력하면, 검색어에 연결된 ILI 레코드의 내용이 출력된다. 동시에 ILI 레코드에 링크되어 있는 (입력 검색어의 언어를 제외한) 나머지 3개국 사전의 해당 표제어와 사전 내용이 출력된다.
      3) 중간 언어의 번역 단계별 분석 결과를 설명한 웹페이지를 제공한다. 미리 선정된 각 언어의 대표 문장들의 각 단계별 분석 결과를 번역의 진행 단계를 따라 가면서 체험할 수 있는 페이지를 제공할 것이다.
      번역하기

      본 연구과제(제 2세부과제)가 지향하는 궁극적인 목적은 다국어 기계번역 시스템에 실제로 적용될 수 있는 중간언어의 전산언어학적 완성판을 개발하는 데 있다. 이러한 목적을 달성하기 위...

      본 연구과제(제 2세부과제)가 지향하는 궁극적인 목적은 다국어 기계번역 시스템에 실제로 적용될 수 있는 중간언어의 전산언어학적 완성판을 개발하는 데 있다. 이러한 목적을 달성하기 위해 본 과제는 제 1단계(2000-2002)에서 기반연구에 해당하는 4개 국어(한국어, 영어, 일본어, 중국어)의 기초 언어학적 연구를 수행하였고, 그 결과 워드넷 기반 중간언어 기계번역 시스템(WBIMT)의 체계를 수립한 바 있다. 또한 제2 단계(2002-2004)에서는 제 1단계의 연구를 기반으로 하여 중등수준의 중간언어 다국어 번역시스템 개발을 위해 개발 대상 문장의 수를 언어 당 약 300개, 4개 언어(한, 영, 일, 중) 총 1200개의 문형(sentence patterns)으로 확대ㆍ심화하고, 이들을 대상으로 하는 알고리즘의 확대 설계와 전자사전의 구축 그리고 다국어 데이터베이스의 의미 연결 고리인 ILI 연결 방법론(기능어 품사들의 어휘의미 분석 포함) 등을 수행하였다. 이러한 기존의 연구를 기반으로 이제 마지막 단계인 3단계(2004-2006)에서 수행한 본 연구과제의 내용을 간략히 기술하면 아래와 같다.

      1. 4개 국어 형태소 분석 알고리즘

      형태소 분석은 입력 텍스트에서 문장부호를 처리한 문자열을 입력으로 받아, 구문분석에 필요한 결과값을 출력해주면 되는 모듈이다. 제 2단계까지 다국어 기계 번역을 위한 중간언어 방법론과 모델의 개발은 구문 분석, 어휘의미 분석, ILI 방법론, 구문생성을 중심으로 연구가 진행되었다. 제 3단계는 전체 기계 번역 시스템의 모델을 완성하는 것이 목표이기 때문에 기존에 우선순위에서 후위를 차지했던 형태소 분석 모듈을 본격적으로 연구한다. 형태소 분석 문제와 직결되는 문제가 단어 사이의 띄어쓰기 문제인데, 단어 사이를 띄어 쓰는 한국어, 영어와 띄어 쓰지 않는 중국어, 일본어는 형태소 분석이 한 층 더 복잡해진다.

      2. 4개 국어 전자사전 구축

      3단계 최종 연구에서는 앞선 단계의 기본적인 어휘사전과 모형화된 기능어 사전을 바탕으로 하여, 구현과 정보 서비스를 지향한 사전 구축을 목표로 한다. 결과적으로 3단계에서는 4개 언어(한국어, 영어, 중국어, 일본어) 번역에 필요한 모든 사전 정보를 망라하고 있으며, 더욱이 중간언어를 지향한 개념 사전적 형태를 구비하고 있다. 전자사전 정보는 사전 정보 서비스를 통해 모든 연구자들에게 공개되며, 이러한 공개 서비스를 통하여 중간언어 기반 다국어 전자사전 정보의 완성도가 확인될 것이다.

      3. 중간언어 의미 표시

      제 3단계에서 본 과제가 구상하고 있는 언어중립적 지식표현 모형은 기본적으로 J.F.Sowa(1986)의 개념도식(CG)과 Jackendoff(1990)의 어휘개념구조(LCS) 그리고 Nirenburg,Raskin,Tucker(1987)의 텍스트의미표상(TMR)을 그 모델로 한다. Sowa의 개념도식이나 Jackendoff의 어휘개념구조는 일종의 지식표현 프레임워크로 기존의 자연언어 의미론의 연구업적들을 상당 부분 포함하고 있으며, Nirenburg 등의 텍스트의미표상은 형태론적 정보와 통사,의미론적 정보 외에도 언어외적 정보까지도 포함하는 등 포괄적 의미표상을 보여준다.

      4. 웹 사이트를 통한 결과 시연 계획

      1) 4개 언어 전자 사전 탐색 기능을 제공한다. 사용자가 특정 언어를 먼저 선택하고, 검색어를 입력하면 해당 정보가 출력되는 기능이다.
      2) ILI 레코드 탐색 기능을 제공한다. 사용자가 특정 언어를 선택하고 검색어를 입력하면, 검색어에 연결된 ILI 레코드의 내용이 출력된다. 동시에 ILI 레코드에 링크되어 있는 (입력 검색어의 언어를 제외한) 나머지 3개국 사전의 해당 표제어와 사전 내용이 출력된다.
      3) 중간 언어의 번역 단계별 분석 결과를 설명한 웹페이지를 제공한다. 미리 선정된 각 언어의 대표 문장들의 각 단계별 분석 결과를 번역의 진행 단계를 따라 가면서 체험할 수 있는 페이지를 제공할 것이다.

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼