RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        Word2Vec 분석을 통한 근대 계몽기 잡지에서의 ‘문명(文明)’의 시기별 지형도

        전성규 ( Seongkyu Jeon ),장연지 ( Yeonji Jang ) 한림과학원 2020 개념과 소통 Vol.0 No.26

        본 논문은 1906년부터 1910년까지 발행된 근대 계몽기 잡지 11종의 한문단어체 기사를 대상으로 ‘문명(文明)’ 개념의 시기별 특징을, Word2Vec 즉, 텍스트에 나타나는 단어를 벡터화하여 ‘문명’과 의미적으로 가까운 단어를 분석하는 방법을 통해 살펴보는 것을 목적으로 한다. 1906년부터 1910년까지 1년을 단위로 하여 문명의 동시출현 빈도와 시기별 중요도, Word2Vec의 방법을 통해 문명의 공기어(共起語)를 확인하고 시기별 의미장의 특징을 확인하고자 하였다. ‘문명’이라는 키워드를 분석자가 지정하는 탑다운(top-down)의 분석 방식을 택했지만 Word2Vec이라는 비지도 학습 알고리즘을 사용하여 기계학습을 통해 문명의 공기어 목록들을 제시하였다. 1906년에서 1910년 사이 문명의 가중치는 크게 변동한다. 1908년까지 그 중요도가 가파르게 상승하다가 1909년 이후에는 급강한다. 문명이라는 개념이 가장 중요도가 높았던 1908년을 기점으로 하여 진화론적 관점에 놓여 있는 어휘들과 시장경제와 관련된 어휘들이 밀도높게 공기어 목록을 형성하고 있으며 1909년과 1910년에는 이전 어휘들과 성격을 달리하거나 군집화할 수 없는 다양한 어휘들이 문명과 관계성을 갖는다. 이러한 특성을 기반으로 하여 1906년과 1910년 사이 근대 계몽기 잡지 한문단어체 기사를 대상으로 ‘문명’의 의미장은 첫째, 사회진화론 및 아시아주의와 관련된 것, 둘째, 경제영역 및 일상의 담론과 관련된 것, 셋째, 수양 및 인격형성과 예술적 내면의 형성과 관련된 것으로 구분할 수 있다. 이 특성은 외부적이고 구조적인 문명화 과정 이후에 이루어지는 심리적 내면적 문명화 과정을 단계적으로 보여주고 있다. 그동안의 문명 개념은 근대성의 여러 특질 중 국민국가 담론과 밀접하게 결합하여 논의가 이루어져 왔지만, 문명경제사적 관점에서 근대적 경제영역의 성립과도 불가분한 관계에 있음을 확인할 수 있다. 1909년과 1910년에는 문명과 유의관계를 형성하는 어휘들 중 문학, 예술과 관련된 어휘의 성격을 띠는 것들이 확인되는데 이는 사회의 기능분화와 인간관계의 얽힘으로 인한 교양, 수양 담론과 문명의 관계성을 보여준다. This study examines the characteristics of the concept of ‘civilization’ by period, using a Word2Vec methodology, targeting 11 Korean articles written in Chinese script which were published in modern enlightenment magazines between 1906 and 1910. The meaning field of ‘civilization’ across this period was characterized through a ‘top-down’ analysis of the keyword “civilization” together with a list of synonyms adduced by machine learning, using an unsupervised learning algorithm called ‘Word2Vec’. Between 1906 and 1910, the relative usage of the concept of 'civilization' fluctuated greatly, rising sharply until 1908, and falling sharply after 1909. At the peak, in 1908, terms related to evolutionary development and the market economy formed a dense list of synonyms. But In 1909 and 1910, various terms occurred which could not be clustered or which differ in character when compared to the earlier period. Based on these characteristics, the features of the meaning of ‘civilization’ in the targeted articles can be summarized as follows: First, those related to social evolution and Asianism. Second, those related to the economic field and daily discourse. Third, those related to the formation of discipline and character and the formation of an aesthetic disposition. These characteristics show how the internal and psychological process of civilization follows the external and structural process of civilization. The concept of civilization has previously been discussed in close connection with the discourse of the nation-state as one of the characteristics of modernity, but this study confirms that the concept of civilization is also inextricably related to the establishment of the modern economic field. Also, in 1909 and 1910, among the terms that formed a significant relationship with civilization, many were identified which relate to literature and art. This shows the relationship between the liberal arts, cultivated discourse and civilization, due to the functional division of society and the entanglement of human relationships.

      • KCI등재

        분야별 용어 정비의 현황과 통합 관리

        김나영 ( Kim Nayeong ),장연지 ( Jang Yeonji ) 연세대학교 언어정보연구원 2023 언어사실과 관점 Vol.59 No.-

        본 연구의 목적은 각 분야에서 구축된 용어 자원들을 통합하여 체계적으로 관리할 수 있는 방안을 모색하는 데 있다. 현재까지 용어의 정비 및 표준화는 주로 특정 분야에 한정되어 개별적으로 실시되었고, 이에 따라 용어 정비의 결과물이 각각 상이한 체계와 구조를 갖게 되었다. 따라서 이미 구축된 용어를 불필요하게 다시 정비하거나, 여러 분야에서 사용되는 용어를 종합적으로 파악하지 못하고 지엽적인 정보만을 구축하는 문제가 발생하였다. 이에 본 연구에서는 분야별 용어 정비의 현황과 사례를 점검하고, 각 분야에서 기구축한 데이터베이스를 통합적으로 관리하고 대중에게 보급할 수 있도록 정비하는 방안을 모색한다. 또한, 다양한 분야의 용어집으로부터 용어 데이터를 수집하여 일관성 있게 정비하고 용어 간 관계를 설정하여 기존의 용어 자원을 활용할 수 있는 용어 통합 관리 방향을 제시한다. The purpose of this study is to explore ways to systematically manage integrated terminology resources across various fields. So far, terminology maintenance and standardization have been mainly conducted in specific fields separately, resulting in different systems and structures for terminology maintenance in each field. Therefore, problems have arisen where already established terminology is unnecessarily reorganized or only local information is built without comprehensively grasping the terminology used in various fields. In this study, we examine the status and cases of terminology maintenance in each field and explore ways to integrate and manage databases established in each field and make them available to the public. In addition, we collect terminology data from various fields and consistently organize them, and suggest a direction for terminology integration management by establishing relationships between terminologies to utilize existing terminology resources.

      • KCI등재

        통시 말뭉치에 기반한 언어 변화 연구 -20세기 신문 말뭉치의 구축과 분석-

        김한샘(Kim Hansaem),장연지(Jang Yeonji),강예지(Kang Yejee) 한글학회 2020 한글 Vol.- No.330

        이 논문에서는 역사 언어학과 전산 언어학의 융합 사례를 소개하고, 순방향의 언어 변화를 포착하기 위해 통시 말뭉치를 대상으로 단어 임베딩과 클러스터링 등의 전산 언어학적 방법론을 적용하였다. 실재하지 않는 조어의 재구와 검증이 쉽지 않고 언어 변화의 시대 구분에 대해 다양한 관점이 존재하며 방대한 양의 언어 자료에서 변화의 경향성을 찾기가 힘들었던 역사 언어학 연구의 어려움이 전산 언어학과의 융합을 통해서 극복되고 있다. 머신 러닝을 통해서 조어를 재구하고 연대를 구분하며 통시 말뭉치를 분석하여 언어 변화의 흐름을 파악할 수 있게 되었다. 한국어 통시 말뭉치를 구축하고 분석하여 언어 변화를 연구할 가능성을 모색하기 위해 20세기 전반기 신문 말뭉치를 대상으로 다양한 방법론 중에 단어 임베딩을 거친 클러스터링을 적용하여 어휘 사용 양상의 변화를 살펴보았다. 민주주의, 자유주의 등 ‘주의’가 후행하는 합성어를 대상으로 단어 임베딩 후 10년을 단위로 클러스터링을 진행한 결과 시간을 흐름에 따라 어휘 사용 양상의 변화를 포착하였다. This paper introduces a case study on the convergence of historical linguistics and computational linguistics. In this study, computational linguistic methodologies, such as word-embedding and clustering, were applied to a diachronic corpus to capture forward changes in language. Historical linguistics research is challenging because of the difficulties in reconstructing and verifying non-existent proto-languages. However, discoveries about how languages change are being made through computational linguistics using the vast amount of language data available to overcome these difficulties. Machine learning can be used to understand how languages change by reconstructing languages and analyzing diachronic corpuses from different periods. In this study, a Korean diachronic newspaper corpus from the first half of the 20th century was analyzed for changes in vocabulary usage patterns by applying word-embedded clustering. Clustering every 10 years after word-embedding for compound words that contain “jooeui” (ideology), such as “minjoojooeui” (democracy) and “jayoojooeui” (liberalism), showed changes in vocabulary usage over time.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼