RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        다국어 병렬 말뭉치의 구축과 한국어교육 연구에의 활용

        민경모 계명대학교 한국학연구원 2020 한국학논집 Vol.0 No.78

        The aim of this research is to examine the potential problems which can be encountered while constructing a multilingual parallel corpus, and to give concrete examples showing how multilingual parallel corpora can be useful in Korean language education studies. Language education studies have expressed much interest in exploring differences in the parts of a language which cause difficulties for learners from different language groups. For this reason, the contrastive linguistic methodology has been used to examine differences and similarities between the target language and the learner’s mother tongue. In the case of applicative purpose contrastive studies, objectively extracting matching pairs from the two languages is above all important. Parallel corpora are used as the primary data for extracting the matching pairs, and the issue of their construction and use has been actively discussed since the 1990s. Since parallel corpora have such an important meaning as the primary data in language studies, large scale projects to construct parallel corpora were conducted in each country, and in Korea a great number of parallel corpora was constructed through the Sejong Project. Yet, when it comes to the parallel corpora constructed until now, the majority of them were parallel corpora of only two languages, and the target languages were mostly limited only to major languages. In particular, there has been no parallel corpus in Korea which included more than 3 languages, and the target languages have been extremely limited to languages such as English, Chinese, Japanese, French, German, etc. If we examine the problem of constructing parallel corpora from a contrastive studies perspective with Korean education in mind, the existing parallel corpora, with the exception of Chinese, have no relation to the mother tongues of the main Korean learners groups at the moment. Since the contrastive studies for Korean language education have a prerequisite of promoting understanding between the mother tongues of the learners, there is a need for constructing parallel corpora of Korean and mother tongues of the learners. Moreover, there is also a need to gather the primary data for contrastive studies on the types of languages by constructing multilingual parallel corpora of not only two, but also three or more languages. The discussion on constructing multilingual parallel corpora of three and more languages and constructing parallel corpora of minority languages is dealt with in this presentation for the first time in Korea. In this research, we construct experimental multilingual parallel corpora of Korean and English, Vietnamese, Uzbek, Thai, and Sinhalese, and also examine the problems of constructing multilingual parallel corpora centred around Korean. We examine the problems of data selection, hub languages, character codes, and example search which emerge in the construction of multilingual parallel corpora of minor languages. We also look into concrete examples on how to extract matching pairs of vocabulary to apply in parallel corpora by using a multilingual example search tool, which is being currently developed. 이 연구는 다국어 병렬 말뭉치를 구축하고자 할 때 발생하는 문제를 살피고, 한국어교육 연구에서 다국어 병렬 말뭉치가 유용하게 활용될 수 있음을 실례를 들어 보이는 데 그 목적이 있다. 언어교육 연구에서는 학습자가 어려워하는 학습 항목의 언어권별 차이를 밝히는 데 많은 관심을 기울여 왔다. 이를 위한 한 방편으로 목표 언어와 학습자 모어 간의 차이점과 유사점을 살피는 대조언어학적 방법론이 유용하게 활용되고 있는데, 응용적 목적의 대조 연구에서는 우선적으로 언어 간 대응쌍을 객관적으로 추출하는 것이 중요하다. 병렬 말뭉치는 언어 간 대응쌍 추출에 이용되는 기초 자료로, 구축 및 이용의 문제가 1990년대부터 활발히 논의되어 왔다. 병렬 말뭉치는 언어교육을 위한 기초 자료라는 측면에서 중요한 의미를 지니기에 세계 각국에서는 대규모의 병렬 말뭉치 구축 사업을 실시하였고, 국내에서도 세종계획을 통하여 상당량의 병렬 말뭉치를 구축하였다. 그러나 지금까지 구축된 병렬 말뭉치는 두 언어 간 병렬 말뭉치가 주를 이루고, 구축 대상 언어도 주요 언어에 국한되어 있다. 특히 국내에서는 세 언어 이상의 병렬 말뭉치, 즉 다국어 병렬 말뭉치가 아직까지 구축된 바 없으며, 구축 대상 언어도 영어, 중국어, 일본어, 프랑스어, 독일어 등 극히 한정된 언어에 머물러 있다. 한국어교육을 위한 대조 연구에 초점을 두어 병렬 말뭉치의 구축 문제를 살펴보면, 지금까지 구축된 병렬 말뭉치는 중국어를 제외하고는 현재의 주요 한국어 학습자 층의 모어와는 괴리된 측면이 있다. 한국어교육을 위한 대조 연구는 학습자 및 학습자 모어의 이해를 도모한다는 대전제가 있기에 한국어와 한국어 학습자 모어 간 병렬 말뭉치 구축이 요구된다. 또한 두 언어 간 병렬 말뭉치가 아닌 세 언어 이상의 다국어 병렬 말뭉치 구축을 통하여 언어 유형에 기반한 대조 연구의 기초 자료를 확보할 필요성도 제기된다. 이 연구에서 다루는 세 언어 이상의 다국어 병렬 말뭉치 구축 논의나 소수 언어를 대상으로 한 병렬 말뭉치 구축 논의는 국내에서 처음으로 이루어지는 것이다. 여기에서는 한국어와 영어, 베트남어, 우즈베크어, 태국어, 신할리즈어 간 다국어 병렬 말뭉치를 시험적으로 구축하고, 한국어를 중심 언어로 하는 다국어 병렬 말뭉치 구축의 문제를 살펴본다. 이어서 언어 간 대응쌍 추출의 예를 통하여 다국어 병렬 말뭉치가 한국어교육을 위한 기초 자료로서 유용하게 쓰일 수 있음을 보이고자 한다. 다국어 병렬 말뭉치의 구축 문제에서는 소수 언어를 병렬 말뭉치로 구축할 때 발생하는 자료 선택의 문제, 연계 언어의 문제, 문자 코드의 문제, 용례 검색의 문제를 살피고, 다국어 병렬 말뭉치의 활용에서는 개발하고 있는 다국어 용례 검색기를 통하여 언어 간 대응쌍을 어떻게 추출할 수 있는지를 실례를 들어 보일 것이다.

      • KCI등재

        말뭉치 기반 한외(韓外) 대조언어학 연구에 대한 일고찰

        황은하 ( Huang Yinxia ) 한국문학언어학회(구 경북어문학회) 2016 어문론총 Vol.69 No.-

        최근 언어학계는 단일언어의 연구는 물론, 언어간 연구에서도 말뭉치에 대한 관심과 활용 사례가 계속해서 늘고 있다. 그러나 언어간 연구에 필요한 말뭉치가 갖춰야 할 요건이나 연구 방법론에 대한 논의는 아직 미비한 편이다. 따라서 이 연구는 대조언어학(contrastive linguistics)에 필요한 말뭉치(corpus)의 유형과 개념, 구축 과정, 활용 현황과 문제점에 대해 논의하는 것을 목적으로 한다. 이를 위해 우선, 대조분석 연구의 두 가지 서로 다른 연구 방법론, 즉 단방향 대조분석(또는 대응 연구(correspondence analysis))과 쌍방향 대조분석 방법론을 살펴보고 연구 방법별로 어떤 말뭉치를 필요로 하는지를 논의한다. 다음으로, 서로 다른 두 말뭉치, 즉 병렬말뭉치(parallel corpus)와 비교말뭉치(comparative corpus)의 개념, 대조언어학 연구에 활용될 시 각각의 장점 및 말뭉치의 설계에서 시작해 자료의 선별과 수집, 텍스트의 전산화, 전처리, 문장 정렬 등의 구축 과정 전반에 대해 기술한다. 덧붙여 이 두 가지 말뭉치를 활용한 한국어와 외국어간의 대조분석 연구 현황을 자세히 살펴보고, 문제점을 짚어본다. There have been extensive research interests and applications based on a corpus in both monolingual and cross-linguistic studies. However, little attention has been paid to multilingual corpus design, compilation issues, and its application methods in cross-linguistic research. Accordingly, in this paper, we present different corpus types and corpus compilation methods for contrastive study, and discuss useful applications of a corpus for contrastive linguistics. To this end, we first compare two research methods: one-way and two-way contrastive analyses. Second, we show that a parallel corpus can be used for one-way contrastive analysis, and a comparable corpus can be used for two-way contrastive analysis. Moreover, we describe the concept and merits of parallel and comparable corpora, as well as their compilation process: corpus design, data collection and computerization, and mark-up. We also give a full briefing of the current state of contrastive study between Korean and foreign languages using parallel and comparative corpora. Finally, we discuss the remaining problems for corpus applications in contrastive linguistics.

      • KCI등재

        근대 국어 말뭉치 구축 현황과 개선 방안

        이래호 국어사학회 2023 국어사연구 Vol.- No.36

        본고는 21세기 세종계획 역사말뭉치와 역사자료 종합 정비 말뭉치 가운데 근대 국어 말뭉치의 현황과 문제점을 살펴보고 향후 말뭉치 구축에서 개선되어야 할 사항을 제안하는 데 목적이 있다. 21세기 세종계획에서는 265종의 문헌 약 391만 어절의 근대 국어 말뭉치를 구축하였고, 역사자료 종합 정비 사업에서는 역사말뭉치의 상당 부분을 정제하고 언해문의 경우 한문-언해문 병렬 말뭉치의 형식으로 가공하였는데 이 가운데 근대 국어 자료 말뭉치는 258종 약 351만 어절을 구축하였다. 역사자료 종합 정비 말뭉치는 이전 세종역사말뭉치의 오류들이 상당 부분 수정되었다. 그러나 근대 국어 일부 자료에서는 글자 입력의 오류, 띄어쓰기 오류, 분절 및 태깅 오류 등이 여전히 발견되는 데 향후 이러한 문제점을 개선하는 데 집중해야 할 것이다. 향후 말뭉치 구축에서 개선되어야 할 사항으로, 언간, 장서각 필사자료(소설, 실기류, 전기류 등) 등의 포함, 한자음 입력, 한문-언해문 병렬 말뭉치로의 지속적 구축, 말뭉치 텍스트에 대응하는 이미지 자료 구축과 이미지 서비스 방법에 대한 고민, 말뭉치 header에 풍부한 서지 정보와 지금까지의 연구 성과를 포함, 구축된 말뭉치의 코드 통일, 구축된 말뭉치를 잘 활용할 수 있는 검색 프로그램의 개발 등을 제안하였고, 향후 개인이 구축한 말뭉치들을 수집하여 종합화하기 위해서는 통일된 구축 형식을 정할 필요가 있음을 언급하였다.

      • KCI등재

        병렬말뭉치에서 중국어 ‘在’의 한국어 대응 양상 연구

        이문화(Li Wenhua) 학습자중심교과교육학회 2021 학습자중심교과교육연구 Vol.21 No.19

        목적 본 연구는 중한 병렬말뭉치에서 나타난 ‘在’의 품사 및 구조를 통하여 ‘在’에 대응되는 한국어의 양상과 특징을 살펴보았다. 방법 이를 위하여 약 20만 어절의 중한 병렬말뭉치에서 나타난 ‘在’의 용례 1,706개를 분석하였다. 동사在, 부사在, 개사在, 개사구在의 구조에 대해 살펴보고 품사에 따라 대응하는 한국어 표현을 살펴보았다. 결과 중한 병렬말뭉치에서 동사在, 부사在, 개사在, 개사구在가 모두 나타났고 그중에서도 개사구在와 개사在가 많이 출현하였다. 특히 개사구在는 다양하게 나타났다. 또 동사在, 부사在, 개사在 그리고 개사구在의 한국어 대응 양상에서 차이점이 나타났다. 동사在는 주로 동사 ‘있다’와 대응되고 부사在는 보조용언 ‘-고 있다’와 대응되었다. 개사在와 개사구在는 부사격조사 ‘-에서, -에’와 많이 대응되는 현상으로 나타났다. 이로서 ‘在’의 품사에 따라 대응되는 한국어의 양상도 다르다는 것을 보여주었다. 또한 개사在와 개사구在의 구조에 따라서도 대응되는 한국어 양상이 다양하게 나타났다. 결론 본 연구는 중한 병렬말뭉치를 기반으로 고빈도로 쓰인 중국어 在의 품사와 구조에 따른 그의 한국어 대응 양상을 전반적으로 살펴보는 데 의의가 있다. 그리고 본 연구의 결과는 중국어 교사, 한국인 학습자, 중국어 연구자에게 유용한 기초 자료가 될 것이다. Objectives This study used the Chinese-Korean parallel corpus to examine the forms and characteristics of Korean expressions which correspond to the Chinese word ‘在’ and which vary depending on the part-of-speech and structure of ‘在’. Methods To achieve this, 1,706 examples of ‘在’ which appear in the Chinese-Korean parallel corpus of approximately 200,000 words were analyzed. The structures of the verb 在, adverb 在, preposition 在, and prepositional phrase 在 were examined alongside the appropriate corresponding Korean expressions, according to their parts of speech. Results In the Chinese-Korean parallel corpus, the verb 在, adverb 在, preposition 在, and prepositional phrase 在 all appeared and, among them, the preposition 在 and prepositional phrase 在 appeared the most frequently, and the prepositional phrase 在 had the most diverse range of corresponding expressions. In addition, there were distinct correspondence patterns associated with the verb 在, adverb 在, preposition 在 and prepositional phrase 在. The verb 在 is predominately matched with the Korean verb ‘있다’, the adverb 在 is matched with the auxiliary term verb ‘-고 있다’, while the preposition 在 and prepositional phrase 在 were found to correspond frequently to the adverbial case markers ‘-에서’ and ‘-에’. This shows that the corresponding forms of Korean vary depending on the part-of-speech of ‘在’ and structure of the preposition 在 and prepositional phrase 在. Conclusions This study represents a meaningful examination of the overall patterns of correspondence appearing frequently in the Chinese-Korean parallel corpus between Korean expressions and the Chinese word 在. Furthermore, the results of this study will be useful as a reference for teachers of Chinese, Korean learners, and researchers of Chinese.

      • KCI등재

        병렬 말뭉치 필터링을 적용한 Filter-mBART기반 기계번역 연구

        문현석,박찬준,어수경,박정배,임희석 한국융합학회 2021 한국융합학회논문지 Vol.12 No.5

        최신 기계번역 연구 동향을 살펴보면 대용량의 단일말뭉치를 통해 모델의 사전학습을 거친 후 병렬 말뭉치로 미세조정을 진행한다. 많은 연구에서 사전학습 단계에 이용되는 데이터의 양을 늘리는 추세이나, 기계번역 성능 향상을 위해 반드시 데이터의 양을 늘려야 한다고는 보기 어렵다. 본 연구에서는 병렬 말뭉치 필터링을 활용한 mBART 모델 기반의 실험을 통해, 더 적은 양의 데이터라도 고품질의 데이터라면 더 좋은 기계번역 성능을 낼 수 있음을 보인다. 실험결과 병렬 말뭉치 필터링을 거친 사전학습모델이 그렇지 않은 모델보다 더 좋은 성능을 보였다. 본 실험결과를 통 해 데이터의 양보다 데이터의 질을 고려하는 것이 중요함을 보이고, 해당 프로세스를 통해 추후 말뭉치 구축에 있어 하나의 가이드라인으로 활용될 수 있음을 보였다. In the latest trend of machine translation research, the model is pretrained through a large mono lingual corpus and then finetuned with a parallel corpus. Although many studies tend to increase the amount of data used in the pretraining stage, it is hard to say that the amount of data must be increased to improve machine translation performance. In this study, through an experiment based on the mBART model using parallel corpus filtering, we propose that high quality data can yield better machine translation performance, even utilizing smaller amount of data. We propose that it is important to consider the quality of data rather than the amount of data, and it can be used as a guideline for building a training corpus.

      • KCI등재

        병렬말뭉치 기반 ‘-(으)러’의 중국어 대응 표현 연구

        YU XIANGXIN 연세대학교 언어연구교육원 한국어학당 2022 외국어로서의 한국어교육 Vol.66 No.-

        본고는 100만 어절 한·중 드라마 병렬말뭉치를 이용하여 [목적]의 의미를 나타내는 연결 어미 ‘-(으)러’와 문법화 과정에 있는 ‘뭐 하러’의 중국어 대응 표현을 고찰하였다. 병렬말뭉치를 분석한 결과 연결 어미 ‘-(으)러’는 총 943회로 나타났다. 병렬말뭉치에서 연결 어미 ‘-(으)러’는 가장 높은 빈도로 무표지에 대응되었는데, 이것은 연결 어미 ‘-(으)러’로 연결되는 두 동사(구)에 대응되는 중국어 동사(구)가 마침 중국어의 무표적 이동 목적 구문인 연동문을 이룰 수 있기 때문인 것으로 본다. 물론 ‘-(으)러’는 ‘为了, 是为了, 目的是, 是想’ 등의 일부 중국어 목적 표현과의 대응 관계도 찾을 수 있었는데, 다만 그 빈도가 매우 낮음을 확인할 수 있었다. ‘뭐 하러’는 병렬말뭉치에 총 93회로 나타났다. 병렬말뭉치에서 ‘뭐 하러’는 가장 높은 빈도로 같은 의미 기능을 갖는 중국어 어기 부사 ‘何必’와 대응되었으며, 이 외에 ‘뭐 하러’는 이유나 목적을 묻는 ‘为什么, 干吗, 做什么, 干什么, 怎么’ 등의 다양한 중국어 의문대사, [필요 없음]의 의미를 나타내는 중국어 표현 ‘没必要, 不需要, 不用’ 등과의 대응 관계도 찾을 수 있었다.

      • KCI등재

        基于自建平行语料库的信息不对称韩汉成语翻译研究

        金菊花 한중인문학회 2012 한중인문학연구 Vol.36 No.-

        민족특색이 다분한 성어는 여러 언어에 보편적으로 존재하는 “문화화석”이지만 민족문화 의 “비대칭”문제는 성어 번역에 있어서 난제로 되고 있다. 현재 한국어의 어휘체계에는 한자 어가 60%를 초과하는데 여기에는 한자성어뿐만 아니라 한국에서 만든 한자성어나 한국어에 서 기원된 성어도 있어 “비대칭”문제는 중한 성어번역에 있어서 문제가 되고 있다. 본고에서 1차 자료로 활용된 중한 병렬말뭉치의 표본 텍스트 범주는 주로 구어특징을 보이 는 비논설문과 권위 있는 번역 작품을 대상으로 함으로써 연구데이터의 대표성, 전형성, 구어 특성이 확보되어 있다. 구체적으로 보면, 코리아나 잡지(중한), 동아/조선/중앙일보, 소설, 한 국어교재 등 4개 범주에 총 중국어 105.3만자, 한국어 379,550 단어 규모이다. 이를 대상으로 비대칭 성어를 포함한 문장에 말뭉치주석(corpus annotation)을 달고 추출해 성어번역 연구 용 말뭉치를 구성하였는데, 성어는 대칭, 비대칭, 반대칭 등의 유형으로 분류하여 분석하였다. 본 논문의 목적은 비대칭 성어번역의 원칙과 방법을 구해 성어번역에서 비대칭으로 인한 문 제의 해결에 도움을 제공하는 데 있다. 본고는 먼저 한중 병렬말뭉치의 소개 및 성어 번역 관련 선행연구를 검토하고, 다음으로 비대칭 성어에 대해 정의 내리고, 병렬말뭉치 구축을 통 해 얻은 성어번역 연구용 데이터로부터 성어번역 전략을 요약하며 이어 성어번역에 있어서 그 효과에 영향을 미치는 요소를 언어, 번역, 인지, 문화 등의 몇몇 요소로 나누어 제시했다. 분석 결과, 한중 병렬말뭉치를 통한 비대칭 한중 성어 번역전략은 네 유형으로 분류할 수 있 었고, 색채적 의미 전환 변화가 큰 것으로 나타났다. 이런 번역전략은 언어유형론에 입각한 문법론의 제약 외에도 번역자의 이해 및 언어구사력을 포함한 번역에서 오는 제약, 문화제약, 언어사유 인지 등 여러 측면으로 비대칭 성어관계가 이루어진다고 볼 수 있었다. 위의 분석에 기초해 본고에서는 성어 번역은 두 언어의 문화를 잘 나타내야 하므로 “문화 등가”번역이라는 원칙을 제시했다. 이를 기반으로 “신” 기준 달성을 토대로 성어의 정형성 형 태, 화용론, 문화적 요소를 표현해내는 “달”기준을 적절하게 사용해야 함을 주장하였다. 이는 민족사유 특징과 이(異)문화에 대한 배려 및 독자들의 인지 특점을 감안해서이다. 이를 위 한 번역 방법으로는 병렬말뭉치에서 제시되었던 네 유형의 대응형식을 제안하였고 그 외에 문화인지를 기반으로 한 성어 문화요소의 활용 및 적용 등을 제기하였다. 문화의 이해를 위한 번역전략 선택, 응용, 활용, 창작 등이 불가피하다는 점을 지적하였다. Idioms are just like cultural fossils which are the most nation- characteristic and generally exist in all kinds of languages while due to the informational asymmetry among different nations with various culture backgrounds, the translation of idioms amongdifferent languages has become a serious bottleneck problem. Sino-Korean words account for more than 60% in Korean vocabulary which is used now, including Chinese idioms. However, here considerable numbers of self-made Chinese idioms and inherent idioms are still existingin Korean language, therefore the translation of Chinese-Korean idioms also has to confront with the dilemma of informational asymmetry. In the study, as the scope of parallel corpus’s model texts which are used as the first material, we chose non-political papers which show the characteristics of oral-language and authoritative translated-works to make sure the representativeness, typicality and oral characteristics of our research data. The corpus of this paper mainly includes four major structures: Korean magazine, the Asian News/ Korean News/ Center News, novels, Korean textbooks. And among them Chinese corpus 1053 million words, Korean corpus 379550 words are included. Targeting this the paper makes a quantitative and qualitative analysis about different types such as bilingual corresponding, asymmetry, semi-asymmetry, and meanwhile this paper tries to find out the advisable translation principles and strategies of idiom translation and solution ways of problems caused by the asymmetry in idiom translation. As the first step, the paper introducesthe Chinese-Korean corpus and reviews the existing studies related to idiom translation. And then we define asymmetricidiom, summarized idiom-translation strategies from idiom-translation data for study by building up parallel corpus. After the Idioms corpus is confirmed, we classifies the factors which bring influence to the effect of idiom-translation as language, translation, recognition, culture and other factors, followed by detailed explanation. This paper summarizes the purpose, meaning and current situation of information asymmetric idioms with introducing the scope and the theoretical orientation of the research, as well as definition and types of information asymmetric idioms. Then the paper investigates the classification of type about information asymmetric idioms as a whole, and summarizes information asymmetric idioms' strategy, investigating multidimensional quantitative analysis from the linguistics, culture, translation, cognition, etc. The research shows that in parallel corpus information asymmetric consists of four types, that the idioms (“chengyu”) equivalently corresponding idioms (“chengyu”), idioms (“chengyu”) to idioms (“non-chengyu”), and idioms corresponding non-idioms. Through the analysis of emotions and semantics in the process of translation, the characteristics, which are based on the two languages, could be acquired. Except for the characteristics, the inside reasons such as the language understanding and delivery ability of translators should also be considered in the information asymmetric, as well as national cultural features and perceive features of linguistic thinking. Given the analysis above, this thesis states that idiom translation should reflects the characteristics of national culture, and cultural equivalent is required. Furthermore, in view of the characteristics of language aesthetic which service for reader based on the thinking characteristics of different nations, this thesis proposes that trust should be the basis of translation criteria, the accuracy of the whole translation will be benefit from the highlight of the characteristics of idiom structure, discourse and culture. To be specific, the translation strategy should include four types which also appear in the corpus. In addition, the effective choice based on the culture cognition and material will enhance the process of Korean-Chinese translating. And at the same time, in order to ensure cultural equivalent, the dynamic translation strategy should make proper choice, application and recompose about culture material.

      • KCI등재

        병렬말뭉치 기반 접속 어미 ‘-(으)려고’의 중국어 대응 표현 연구

        우상흠 이중언어학회 2022 이중언어학 Vol.90 No.-

        This paper analyzes the Chinese corresponding expressions of the connective ending ‘-(eu)lyeogo’ and the idiomatic expression ‘-(eu)lyeogo hada/deulda’ using the Korean-Chinese TV drama parallel corpus. The connective ending ‘-(eu)lyeogo’ appears 704 times in the parallel corpus. ‘-(eu)lyeogo’ with the meaning of [purpose] and [intention/will] corresponds to the Chinese purpose expression with the highest frequency, and corresponds to the Chinese modal verbs with a higher frequency in the parallel corpus. In addition, ‘-(eu)lyeogo’ sentences are also translated into Chinese ‘no marking’ purpose sentences—serial-verb constructions or parataxis sentences, or ‘-(eu)lyeogo’ are omitted in the translation, when there is no corresponding Chinese expression for ‘-(eu)lyeogo’. On the other hand, the idiomatic expression ‘-(eu)lyeogo hada/deulda’ appears 953 times in the parallel corpus. ‘-(eu)lyeogo hada/deulda’ only has the meaning of [intention/will], so it only forms a corresponding relationship with various Chinese modal verbs in the parallel corpus. 본고는 한·중 드라마 병렬말뭉치를 이용하여 접속 어미 ‘-(으)려고’와 관용적 표현처럼 사용되는 ‘-(으)려고 하다’의 중국어 대응 표현을 살펴보았다. 병렬말뭉치를 분석한 결과 접속 어미 ‘-(으)려고’는 총 704회로 나타났다. [목적], [의도/의지]의 의미를 나타내는 ‘-(으)려고’는 병렬말뭉치에서 가장 높은 빈도로 중국어 목적 표현과 대응 관계를 이루었으며, 이 외에 주체의 의도나 의지를 드러내는 다양한 중국어 양태 동사와도 비교적 높은 빈도로 대응되었다. 한편, ‘-(으)려고’ 구문은 중국어 무표적 목적 구문인 연동문이나 의합문으로 번역되거나 ‘-(으)려고’가 생략되어 번역되기도 하였는데, 이때의 ‘-(으)려고’는 모두 ‘무표지’와 대응되었다. 또한 관용적 표현처럼 사용되는 ‘-(으)려고 하다/들다’는 병렬말뭉치에 총 953회로 나타났다. [의도/의지]의 의미만 나타내는 ‘-(으)려고 하다/들다’는 병렬말뭉치에서 다양한 중국어 양태 동사와만 대응 관계를 이루었음을 확인하였다.

      • KCI등재

        인공신경망 기계번역에서 말뭉치 간의 균형성을 고려한 성능 향상 연구

        박찬준,박기남,문현석,어수경,임희석 한국융합학회 2021 한국융합학회논문지 Vol.12 No.5

        최근 딥러닝 기반 자연언어처리 연구들은 다양한 출처의 대용량 데이터들을 함께 학습하여 성능을 올리고자 하는 연구들을 진행하고 있다. 그러나 다양한 출처의 데이터를 하나로 합쳐서 학습시키는 방법론은 성능 향상을 막게 될 가능성이 존재한다. 기계번역의 경우 병렬말뭉치 간의 번역투(의역, 직역), 어체(구어체, 문어체, 격식체 등), 도메인 등의 차이로 인하여 데이터 편차가 발생하게 되는데 이러한 말뭉치들을 하나로 합쳐서 학습을 시키게 되면 성능의 악영 향을 미칠 수 있다. 이에 본 논문은 기계번역에서 병렬말뭉치 간의 균형성을 고려한 Corpus Weight Balance (CWB) 학습 방법론을 제안한다. 실험결과 말뭉치 간의 균형성을 고려한 모델이 그렇지 않은 모델보다 더 좋은 성능을 보였다. 더불어 단일 말뭉치로도 고품질의 병렬 말뭉치를 구축할 수 있는 휴먼번역 시장과의 상생이 가능한 말뭉치 구축 프로세 스를 추가로 제안한다. Recent deep learning-based natural language processing studies are conducting research to improve performance by training large amounts of data from various sources together. However, there is a possibility that the methodology of learning by combining data from various sources into one may prevent performance improvement. In the case of machine translation, data deviation occurs due to differences in translation(liberal, literal), style(colloquial, written, formal, etc.), domains, etc. Combining these corpora into one for learning can adversely affect performance. In this paper, we propose a new Corpus Weight Balance(CWB) method that considers the balance between parallel corpora in machine translation. As a result of the experiment, the model trained with balanced corpus showed better performance than the existing model. In addition, we propose an additional corpus construction process that enables coexistence with the human translation market, which can build high-quality parallel corpus even with a monolingual corpus.

      • KCI등재

        한국어 종결어미 ‘-거든’에 대응하는 중국어 표현 연구 ― 한국 및 중국 드라마 병렬말뭉치 중심으로 ―

        왕옌리 중앙어문학회 2022 語文論集 Vol.92 No.-

        본 연구는 종결어미 ‘-거든’에 해당하는 중국어 대응표현을 밝히는 것에 목적을 둔다. 이를 위하여 우선 사전과 문법책 그리고 선행연구를 참고하여 종결어미 ‘-거든’의 의미기능을 문법론, 의미론, 화용론의 면에서 종합적으로 재정리하였다. 이를 바탕으로 한국 및 중국 드라마 병렬말뭉치 자료에서 종결어미 ‘-거든’에 대응되는 중국어 표현을 찾아내어 그 원인도 함께 분석하였다. 병렬말뭉치 분석 결과 종결어미 ‘-거든’에 대응된 중국어 표현이 없는 문구가 많았으나, 그 외에 대응된 중국어 표현은 어기조사(語氣助詞), 부사, 동사, 조동사, 구문, 두 개의 요소 등의 형식으로 다양하였다. 중국 드라마의 병렬말뭉치에서 중국어 어기조사로 대응한 빈도수는 한국드라마 병렬말뭉치에서보다 훨씬 높았다. 또한 병렬말뭉치에서 종결어미 ‘-거든’에 대응하는 중국어 요소들은 모두 일대일이 아니라 종결 어미 ‘-거든’ 하나에 두 개 혹은 두 개 이상의 중국어 요소로 대응한 경우도 있고 하나의 중국어 요소로 종결어미 ‘-거든’과 다른 한국어 형태소가 동시에 대응한 경우도 있다. 본 연구는 종결어미 ‘-거든’이 실제 사용된 모습과 대응관계를 그대로 보여주었다. 이 연구의 결과는 한국어 교수학습 현장이나 대조언어학에 기초자료로 활용될 수 있을 것이라고 생각된다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼