RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        口述性과 文字性의 사이, 메신저 대화의 談話와 文法 –메신저 대화 말뭉치와 구어 말뭉치의 비교를 중심으로–

        남길임 한국어문교육연구회 2022 어문연구(語文硏究) Vol.50 No.4

        This study analyzed the discourse and grammatical characteristics of instant messages (IMs) from the corpus linguistics perspective. In particular, we examined IMs by analyzing the turn-taking units and sentence units in an IM corpus and comparing them with a spoken corpus. The principle that “media changes bring about communication changes” applies not only to changes from spoken to written language but also to IMs, a third medium. This study examined this change in terms of discourse and grammar. The results showed that the amount of text per unit time of IM speech was 1/3 that of the spoken language, and the turn-taking frequency per 10,000 ecels (word space units) was less frequent than in spoken language. In addition, while the proportion of regulatory units was less than in the spoken language, the participants pursued cooperation in IM speech by actively expressing their attitudes. Conversely, the analysis of sentence unit complexity indicated that the use of short and fragmented sentences is preferred in IM speech compared to spoken language. 남길임, 2022, 구술성과 문자성의 사이, 메신저 대화의 담화와 문법, 어문연구, 196 : 5~34 이 연구의 목적은 말뭉치언어학적 관점에서 메신저 대화의 談話·文法的특성을 고찰하는 것이다. 메신저 말뭉치에 나타난 말차례 단위와 문장 단위를 분석하고, 이를 구어 전사 말뭉치와 비교함으로써, 談話와 文法 차원에서 메신저 대화의 특수성을 살펴본다. 매체의 변화가 의사소통의 변화를 가져온다는 Ong(1982)의 주장은 구어에서 문어로의 변화뿐만 아니라 제3의 매체인 메신저에도 적용되는바, 메신저 언어의 정량적, 정성적 분석을 통해 이러한 현상을 살펴볼 필요가 있다. 이 연구의 결과 밝혀진 사실은 다음과 같다. 첫째, 메신저 대화의 단위 시간당 텍스트량은 구어의 1/3 수준이며, 단위 어절 대비 말차례 교체의 빈도는 구어에 비해 다소 적은 수준이다. 둘째, 구어에 비해 조정 단위의 비중은 적지만, 대신 메신저에서 화자는 태도를 나타내는 표지를 적극적으로 사용함으로써, 참여자 간의 상호 협력을 추구한다. 셋째, 문장 단위의 복잡성 분석에서, 메신저 대화는 구어에 비해 짧은 단문, 조각문 위주의 사용을 선호한다. 이 연구는 현대 한국인의 일상 담화의 상당 부분을 차지하고 있는 메신저 대화의 談話 文法的 특성을 말뭉치의 계량적 분석을 통해 살펴보았다는 점에서 의의가 있다.

      • KCI등재

        제3의 매체–메신저 언어 연구

        남길임,황은하 한국어학회 2023 한국어학 Vol.99 No.-

        This study examines the lexical characteristics of messenger language, which holds an important position in everyday language beyond the dichotomy of spoken and written language. To investigate the macroscopic characteristics of messenger language, we utilize a customized parallel corpus of 1.4 million words of messenger raw text and its corrected text. In addition, the study analyzes the specificity of messenger language by comparing the raw text with the corrected text, Sejong spoken corpus, and Sejong written corpus. This study is structured as follows. First, in Chapter 2, we examine the characteristics and structure of the target corpus, as well as the research methodology. Then, in Chapter 3, we extract and analyze the messenger-specific forms by comparing the messenger raw text with the corrected corpus, the Sejong Written Corpus, and the Sejong Spoken Corpus. Furthermore, we categorize their messenger-specific forms based on Korean orthography, Korean standard language regulations, Korean Loanwords Notation, Out-of-Vocabulary words, and emoticons. Finally, in chapter 4, we will analyze how the types of messenger-specific forms are related to the functional characteristics of messenger language, such as orality, economy, and formality. Examining the characteristics of messenger-specific forms not only serves as a primary task to observe the changing communication patterns due to the emergence of new technologies and media but also provides practical resources for improving the performance of NLP tools such as morphological analyzers and spell checkers. 본 연구의 목적은 구어·문어의 이분법을 넘어서 일상 언어에서 중요한 지위를 가지게 된 메신저 언어의 어휘적 특성을 고찰하는 것이다. 거시적 차원에서의 메신저 언어의 특성을 고찰하기 위해, 본 연구에서는 메신저 언어를 원시 말뭉치로 하여 구축된 140만 어절의 맞춤법 교정 병렬 말뭉치를 활용하기로 한다. 또한 맞춤법 교정 말뭉치의 원문을 교정문 및 세종 구어, 문어와 비교 분석함으로써 메신저 언어의 특수성을 분석하기로 한다. 본 연구는 다음과 같이 구성된다. 2장에서는 연구 대상 말뭉치의 특성과 구조, 연구 방법론을 살펴본다. 3장에서는 세종 문어 및 구어, 교정 전후의 어절의 비교를 통해 메신저 언어의 불일치 어형을 분석하고, 규범적 관점에서 불일치 어형의 유형을 분석한다. 이때 불일치 어형의 유형은 한글 맞춤법, 표준어 규정, 외래어 표기법, OoV, 이모티콘의 유형으로 분석된다. 4장에서는 불일치 어절의 유형이 메신저 언어의 특성인 구어성, 경제성, 정표성 등의 기능과 일정한 관계를 가지고 있으며, 특정한 경향성을 가지고 있음을 분석할 것이다. 메신저 언어의 특수 어형의 특성을 살펴보는 것은 새로운 기술과 매체의 등장으로 변화하고 있는 의사소통 양상을 살펴보는 기초적인 작업일 뿐만 아니라 형태소 분석기, 맞춤법 검사기 등 NLP 도구의 성능 향상에 대한 실제적인 자원을 제공한다는 의의가 있다.

      • KCI등재

        ‘줄 모르다/알다’ 구문 분석 - 카카오톡 메신저 말뭉치를 중심으로 -

        이정민 우리말글학회 2023 우리말 글 Vol.98 No.-

        본 연구는 카카오톡 메신저 말뭉치에서 일어나는 ‘줄 모르다/알다’의 구문을 분석하고, 이 구문의 서술어 생략 현상을 분석하는데 목적이 있다. 이를 위해 국립 국어원에서 제공하고 있는 ‘메신저 말뭉치’를 분석하여 ‘줄 모르다/알다’ 구문을 산출한 다음 구문이 구현되는 환경을 통사 · 의미적으로 분석하였고, 서술어의 생략 현상에 대해서도 살펴보았다. 의미적 측면에서 ‘줄 모르다/알다’는 ‘방법/능력’의 의미로 사용되거나, ‘사실 인식’의 의미로 사용되는데 ‘방법/능력’의 의미보다 ‘사실 인식’의 의미로 사용될 때가 더 많았다. 그리고 형태 · 통사적 측면에서 ‘줄 모르다/알다’는 ‘사실 인식’의 의미로 사용될 때 제약이 적었다. 실현 빈도 측면에서는 ‘줄 모르다’의 경우 ‘사건이 사실임에도 불구하고 ‘모르다’의 주어는 사실을 알지 못했고, 화자는 알고 있을 때’의 빈도가 높았고, 이 유형의 ‘줄’은 ‘동사+-(으)ㄹ’과 잘 결합한다. ‘줄 알다’의 경우 ‘사건이 거짓임에도 불구하고 ‘알다’의 주어는 이를 잘못 인지하고 있고 화자는 거짓이라고 알고 있을 때’의 빈도가 높았다. 이 유형의 ‘줄’은 ‘서술격 조사 ‘이다’’, ‘동사’, ‘‘하다’형 용언 (용언 ‘하다’ 포함))’, ‘인용 문장’과 현재 시제 관형사형 어미 ‘-(으)ㄴ, -는’과 잘 결합한다. 서술어 생략은 구문 실현 빈도가 가장 높게 나타난 쪽에서 빈번할 것으로 예상되었지만, 결과는 다르게 나왔다. ‘줄 모르다’와 ‘줄 알다’ 모두 빈도가 적은 유형에서 서술어가 생략이 되었다. ‘줄 모르다’에서 ‘모르다’ 생략의 경우 ‘줄은’과 ‘줄이야’로 나타나는데, ‘줄은’은 관형절이 나타내는 사건을 단순히 강조하는 기능만 갖고 있지만 ‘줄이야’는 ‘줄 모르다’를 대신하면서 사건을 강조하는 기능을 갖는다. 그리고 ‘줄 알다’에서 ‘알다’ 생략의 경우 ‘사건이 거짓이고, ‘알다’의 주어와 ‘화자’ 모두 이를 거짓이라고 알고 있을 때’ 빈번하게 일어난다. 이 유형의 ‘줄 알다’는 과장이나 조롱을 의미하는데, 서술어를 생략함으로써 그러한 의미를 더 극대화한다. This study aims to analyze the syntax of 'Jul moreuda/alda' and investigate ellipsis phenomena of these structures in Kakao Talk Messenger Corpus. For this purpose, the 'Jul moreuda/alda' constructions were extracted from the Messenger Corpus provided by the National Institute of the Korean Language, and the environments in which these constructions occur were examined, as well as instances of predicate ellipsis. Regarding the semantics, the 'Jul moreuda/alda' constructions are used to convey both the meaning of 'ability/method' and the meaning of 'recognition of facts.' However, the usage of 'recognition of facts' was more prevalent than the meaning of 'ability/method.' From a morpho-syntactic perspective, when 'Jul moreuda/alda' are used to indicate 'recognition of facts,' it had fewer constraints. Regarding the frequency of occurrence, in the case of 'Jul moreuda', it was more frequently used when the event was indeed a fact, but the subject of 'moreuda' was unaware of the fact, and the speaker knew it. Additionally, this type of 'Jul' was often combined with the 'verb + -(eu)l' form. On the other hand, for 'Jul alda', it was more commonly used when the event was false, but the subject of 'alda' misunderstood it, and the speaker knew it was false. This type of 'Jul' often combined with the 'ida', verbs, 'hada' verbs, and quotations, along with the tense modifier '-(eu)n, -neun'. The ellipsis of predicates was expected to occur more frequently in the 'high-frequency type', but both 'Jul moreuda' and 'Jul alda' showed predicate ellipsis in the 'low-frequency type'. In 'Jul moreuda', the ellipsis of 'moreuda' appears as 'Jul-eun' and 'Jul-iya'. While 'Jul-eun' merely emphasizes the event expressed by the relative clause, 'Jul-iya' as a replacement for 'Jul moreuda' serving to further emphasize the event. In 'Jul alda' the ellipsis of 'alda' occurs frequently when the event is false, and both the subject of 'alda' and the speaker know it is false. This type of 'Jul alda' conveys exaggeration or ridicule, and by ellipsis of the predicate, it amplifies such meaning further.

      • KCI등재

        차별과 혐오 표현의 식별과 사전 활용의 쟁점 -메신저 대화 말뭉치를 중심으로-

        송현주,고예린,남길임 경북대학교 인문학술원 2022 동서인문 Vol.- No.20

        이 연구의 목적은 대화형 인공지능의 학습에 사용될 수 있는 데이터 구축 시 윤리적 쟁점이 될 여지가 있는, 차별과 혐오 표현의 식별과 이를 위한 사전 활용의 쟁점을 살펴보는 것이다. 이를 위하여 약 140만 어절 규모의 메신저 대화에 나타난 차별과 혐오 표현을 전수 검토하여 그 유형별 특성을 살펴보고, 어휘 정보 중심의 사전만을 활용하여 차별과 혐오 표현을 식별하는 데는 한계가 있음을 논의한다. 먼저, ‘어떤 개인이나 집단에 대한 편향적, 부정적 태도를 나타내는’ 차별과 혐오 표현은 메신저 대화에서, ‘인종/국가, 성별, 질병/장애, 나이, 계층, 정치/종교, 지역, 외모’로 8가지 유형으로 나타난다. 다음으로 이들 차별과 혐오 표현 식별을 위한 사전 정보의 활용 가능성을 분석하였는데, 미등재어의 문제, 뜻풀이 등 미시구조 부족 등의 한계를 확인할 수 있다. 차별과 혐오 표현의 식별에 기여하는 사전 정보의 업데이트를 위해서는 현재 사전 정책에 대한 비판적 고찰이 필요하며, 거시구조 차원에서의 표제어 확충, 정교한 뜻풀이와 사용상의 주의 사항 등을 보다 명시적으로 제시할 필요가 있다.

      • KCI등재
      • KCI등재

        사람과 AI 모델 간의 화행 주석 개선 방향 연구

        송영숙(宋永淑) ( Song Young-sook ),조원익(趙元翼) ( Cho Won-ik ) 한국어문교육연구회 2024 어문연구(語文硏究) Vol.52 No.1

        본 연구에서는 사람과 인공지능 모델의 협업 시스템 구축을 통해 자동 화행 주석의 품질을 높이고자 하였다. 이를 위해 국립국어원 메신저 말뭉치(2022)에서 총 33,138 문장을 선별해서 사람과 GPT-4 모델을 통해 주석을 한 후 RoBERTa 모델을 사용해서 분류 정확도를 평가하였다. 사람이 주석한 메신저 말뭉치의 정확도 평가 점수는 85.50인데 비해 사람과 GPT-4 모델이 모두 주석한 경우만으로 정확도를 평가한 경우 GPT-4 모델이 가장 자주 틀리는 주석의 범주는 '냉소/유머'였다. 이렇게 불일치를 보이는 경우를 제외하고 모델과 인간의 주석이 일치하는 문장으로만 분류 모델을 통해 성능 실험을 했을 때 정확도 점수는 95.32로 매우 높은 정확도를 보였다. In this study, we aim at improving the quality of speech act annotation by identifying and analyzing the annotation agreement between humans and the GPT-4 model to identify the categories of speech acts that the GPT-4 model frequently misclassifies. For this purpose, we selected a total of 33,138 sentences from the National Institute of Korean Language’s Messenger corpus (2022). The annotation was performed by human annotators and the GPT-4 model, and the classification accuracy was evaluated using the RoBERTa model. The accuracy score for the human-annotated messenger corpus is 85.50, while the accuracy score for the cases where both humans and the GPT-4 model annotated identically is 96.32. In particular, the category of speech acts that the GPT-4 model most frequently misclassifies is “sarcasm/humor.” This is likely due to highly frequent expressions such as “ㅋㅋㅋ” (lol) in the messenger corpus, which causes the model to incorrectly analyze even “Statement” as “sarcasm/humor.” For example, even when a human annotator classified the utterance “I have snacks and ramen. ㅋㅋㅋ” as “Statement”, the GPT-4 model misclassified it as “sarcasm/humor.” In an experiment conducted using only the sentences where the model and human annotators agreed, the accuracy score reached 95.32. Instead of merely discussing annotator agreement for newly proposed corpora, it is necessary to distinguish speech acts that are difficult to annotate from those that are relatively easy. Furthermore, within these categories, it is essential to select sentences that are challenging to automati cally annotate and conduct research focused on more challenging areas.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼