RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어
        • 저자
          펼치기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        『우리말샘』 최근 등재어의 형태·의미적 특성과 텍스트 장르별 출현 빈도 분석

        안진산 ( An Jinsan ),성민규 ( Sung Minkyu ),이수진 ( Lee Soojin ) 연세대학교 언어정보연구원 2023 언어사실과 관점 Vol.59 No.-

        이 연구의 목적은 최근 『우리말샘』에 등재되는 어휘 항목의 특징들을 분석하여 『우리말샘』의 최근 등재 경향성을 비판적으로 살펴보는 데 있다. 이를 위해 『우리말샘』에 2020년 7월 1일부터 2021년 6월 30일까지 1년 동안 등재된 어휘 항목들을 대상으로 어휘의 형태·의미적 특성을 분석하고, 2019~2021년 사이에 생성된 대량의 말뭉치에서 『우리말샘』 최근 등재 어휘 항목들이 실제로 사용된 양상을 관찰한다. 분석 결과, 최근 『우리말샘』에는 구 단위, 고유명사 부류, 전문어가 단어, 일반명사, 일상어보다 더 높은 비율로 등재되고 있는 경향이 있었다. 어휘의 실제 사용 양상을 분석했을 때는, 고유명사 부류 및 전문어 성격의 일부 최근 등재어들은 기사문(본문, 댓글), 영상 댓글, 메신저 대화에서 실제 사용예가 관찰되지 않았으며, 다른 텍스트 장르에 비해 기사문 본문에서 배타적으로 사용되는 어휘들이 최근 등재어에서 높은 비중을 차지하고 있음을 알 수 있다. 『우리말샘』의 최근 표제어 등재가 균형적·체계적으로 확장되고 있다기보다는 특정 의미 부류, 특정 사용역의 어휘들을 중심으로 이루어지고 있는 이러한 경향성은 ‘사용자 참여형 사전’인 『우리말샘』의 한계를 반증하는 것이며, 앞으로 『우리말샘』이 보완되어야 할 부분이 무엇인지 시사한다. This paper looks into the lexical items that have recently been added to Urimalsaem and evaluates the dictionary’s recent inclusion trends. To this end, we analysed the morphological and semantic characteristics of the lexical items that were included in Urimalsaem from 1 July 2020 to 30 June 2021 and examined their use in a large-scale corpus compiled between 2019 and 2021. The analysis showed that phrase units, proper noun classes, and specialised terms tended to be included in the dictionary at a higher rate than word units, common nouns, and common words. Regarding usage, it appeared that some of the included items from the proper noun and terminology categories were not in use in news articles (whether main text or comments), YouTube comments, and instant messaging chats. In addition, lexical items exclusively used in news articles were far more frequently included in the dictionary compared to other text genres. This shows that the recent inclusion of headwords in Urimalsaem has not been carried out in a balanced and systematic way; instead, there is a tendency to focus on vocabulary of specific semantic categories and specific use contexts, which is indicative of the limitations of Urimalsaem as a ‘user-generated content dictionary’. Ultimately, the results of this study point to the improvements that are yet to be made in the dictionary Urimalsaem.

      • KCI등재

        의미적 신어의 출현 및 정착 양상 연구

        남길임,안진산 한글학회 2022 한글 Vol.- No.336

        This study investigated the aspects of semantic changes and semantic neologisms from a short-term diachronic approach. This paper is written as follows. Section 2 introduces the distributional methodology, related research trends, and the time-sliced 1990–2018 online news article corpus analyzed in this study. Section 3 discusses how collocation and lexical similarity analyses were conducted to detect semantic neologisms. Previous studies in this area have had a limited ability to detect semantic changes because frequency-based analysis is too sensitive to corpus size to be reliable. Accordingly, Section 4 suggests that type frequency-based method is more effective than the token frequency method. Collocation type trend analysis should be to detect semantic changes. 이 연구는 단기통시적 관점에서 의미의 변화가 있다고 판단되는 형태를 ‘의미적 신어’로 지칭하고, 형태적 신어와 동일한 관점에서 의미적 신어의 출현과 정착 양상을 살피는 것을 목적으로 한다. 이를 위해 분포적 가설을 따르는 기존의 접근법의 분석 원리와 의의, 한계를 살펴보고, 이에 대한 대안으로 ‘공기어 유형 추이 분석’을 제안한다. 의미 변화의 양적 분석에서 주로 논의되어 온 ‘공기어 분석’과 ‘유사어 분석’은 새로운 의미와 관련된 공기어만을 고려하고 그 빈도가 일정 수준 이상으로 나타나야 한다는 전제에서 수행된다. 그러나 분포 범위 내 대부분의 공기어는 의미 변화와 직접적 관련이 없다는 점, 새로운 형태나 의미는 그 ‘새로움’ 때문에 본질적으로 저빈도로 나타난다는 특성으로 인해서 빈도에 기반한 공기어와 유사어의 자동 분석은 의미 변화의 양상을 충분히 살펴볼 수 없다는 한계를 가진다. 이에 대한 대안으로, 본고에서는 공기어 유형의 출현과 확산 추이를 연구자의 직관으로 분석함으로써, 의미적 신어의 최초 출현과 정착을 식별하는 원리를 제안한다. ‘공기어 유형 추이 분석’은 연도별 공기어의 유형과 토큰 수의 분포를 분석하는 방법으로, 의미적 신어의 최초 출현, 확산, 정착 시기를 식별하고, 의미적 신어의 확산 원리를 살펴볼 수 있다는 의의가 있다.

      • KCI등재

        UGC 표준형 말뭉치 구축을 위한 말뭉치언어학적 연구 - 유튜브 댓글을 중심으로 -

        남길임,안진산,황은하 한말연구학회 2020 한말연구 Vol.- No.57

        The hasty growth of CMC(Computer-Mediated Communication) are nowadays used by many Korean users to express their perspectives on various topics. However most of the data is difficult to process automatically due to the non-standard expressions, neologism including OOV(out-of-vocabulary) and web specific orthographic conventions. This study amis to propose the standardization procedure of Korean UGC corpus by constructing and analyzing Korean Youtube review corpus. For the purpose of this study, 250K word Youtube review corous was built: this was composed of all reviews on the K Drama channeds provided by three main Korean broadcasting companies. Chapter 2 presents the corpus analysis methodology for the research process including Youtube Comment Scraper tool and preprocessing. Chapter 3 addresses the classification of no standard forms, which focus on highly frequent forms in Korean UGC data. Chapter 4 deals with issues and considerations in constructing the parallel corpus between non-standard and standard forms for Korean linguistic analysis and NLP.

      • KCI등재

        구 단위 계열형 신어 [N + 세대] 연구 - ‘컴퓨터 세대’에서 ‘코로나 세대’, ‘MZ 세대’까지 -

        남길임,안진산 한국사전학회 2023 한국사전학 Vol.- No.42

        본 연구는 1990년부터 2021년까지 생산된 신문 기사 말뭉치를 대상으로 한국인들이 창조적으로 생산하고 사용해 온 [N + 세대]를 수집하고, 이의 사용 양상과 사전학적 기술 방안을 논의한 연구이다. [N + 세대]는 물리적이고 객관적인 연령층을 범주화하기보다는 명명자의 의도에 따라 사회·문화적, 정치적, 역사적 사건을 공유하는 경험의 공동체를 범주화하는 경향이 많은 것으로 드러났다. 본 연구에서는 이들을 명명 의도에 따라 여섯 가지 명명 유형으로 구분하고 10년을 단위로 한 이들의 고빈도 타입과 빈도를 분석하였다. 본 연구의 말뭉치 분석을 통해, 지난 30여 년간 사용된 [N + 세대]의 타입은 총 579개로 나타났으며, 이 중 45%에 해당하는 263개의 타입만이 일정한 빈도와 분포의 기준을 만족하는 것으로 드러났는데, 본 연구에서는 이들을 사전 등재 후보 목록으로 분류하고 이들의 등재 현황을『우리말샘』을 기준으로 분석하였다.『우리말샘』에 등재된 [N + 세대]는 총 164개 타입으로, 본 연구에서 생존 신어로 분석된 263개의 타입 중 84개의 타입만이『우리말샘』에 등재된 것으로 분석되었다. 본 연구에서는 구 단위 계열형 신어로서 [N + 세대]의 추출과 사전 등재 및 기술에 대한 합리적인 기준이 필요함을 논의하였다. This study collects the types of [N + seday ‘generation’] creatively produced and used by Koreans from 1990 to 2021 through a corpus of web-crawled articles and discusses their usage and lexicographic descriptions. It was found that [N + seday ‘generation’] tends to categorize a community of shared experiences of sociocultural, political, and historical events according to the intention of the individual naming it, rather than categorizing a certain physical and objective age group. In this study, we classified them into six types and analyzed their frequency by decade. We also found that a total of 579 types of [N + seday ‘generation’] were collected over the past 30 years, of which only 263 types, or 45%, met the criteria of a minimum frequency and distribution we applied. We classified them as headword candidates for listing to dictionaries and analyzed their status based on <Urimalsaem ‘our language pond’>. There are a total of 164 types of [N + seday ‘generation’] listed in <Urimalsaem>, which is only a fraction of the 263 types analysed as surviving neologisms in this study. This study discussed the need for reasonable criteria for the extraction, listing as a headwords and description of [N + seday ‘generation’] as a phrase-unit serialised neologisms.

      • KCI등재

        기사문과 댓글에 나타난 코로나 신어의 사용 양상과 사전학적 기술

        남길임(Nam, Kilim),안진산(An, Jinsan),강현아(Kang, Hyeonah) 한국사전학회 2021 한국사전학 Vol.- No.38

        본 연구는 다양한 웹 장르를 고려한 신어의 추출과 사전 기술의 가능성을 모색하기 위해, 기사문과 댓글을 중심으로 코로나19 말뭉치를 시기별로 구축하고, 코로나19 신어의 출현 빈도 및 사용 양상을 살펴본다. 연구 방법으로 기사문과 댓글 두 장르의 빈도와 더불어 고빈도 코로나 신어의 1차 공기어를 분석하고, 사례 연구로서 고빈도 코로나 신어 ‘K-방역’을 대상으로 2차 공기어 및 엔그램 분석을 수행한다. 이를 통해 일반적인 신어 추출과 기술의 주요 대상인 기사문과 댓글은 확연한 차이를 보이며, 대중의 언어로서 댓글 말뭉치가 가지는 가치와 한계를 확인할 수 있다. 특히 사전학적 관점에서 비전문가인 대중의 언어를 대표하는 댓글 자원이 거시구조와 미시구조 전반에서 사용자 언어 자원으로서 중요한 가치를 가진다는 것을 논의하고, 주요 사례로 ‘우한 폐렴’과 ‘K-방역’에 대한 사전 모형을 제시한다. This paper examines the occurrence frequencies and usage trends of COVID-19 neologisms in news articles and comments related to the pandemic in order to demonstrate the differences in neologism usage and evaluation across genre. In addition to frequency and primary collocate analyses, we carry out secondary collocate and n-gram analyses which provide a better understanding of the use context for neologisms, in a case study of the neologism ‘K-quarantine’. Results show that comment data prove invaluable for lexicographic description of neologisms, although experts need to decide to what extent the politically incorrectness of commenters’ language may be used in dictionaries. Finally, we propose a microstructural model for COVID-19 neologisms which integrates the findings of the study, taking the neologisms ‘Wuhan pneumonia’ and ‘K-quarantine’ as examples.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼