본 연구는 기계학습을 이용한 자연어 처리 방법의 하나인 단어임베딩의 개념, 방법과 종류를 기술하고 더 나아가 러시아어의 단어임베딩을 활용해 일반언어학에서 어떠한 어휘의미 연구를 ...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A107991589
2021
-
단어임베딩 ; 워드투벡 ; 단어유사도 ; 유추평가 ; 러시아어 ; Word Embedding ; Word2Vec ; Semantic Similarity ; Analogical Inference ; Russian Language
KCI등재
학술저널
183-198(16쪽)
0
0
상세조회0
다운로드국문 초록 (Abstract)
본 연구는 기계학습을 이용한 자연어 처리 방법의 하나인 단어임베딩의 개념, 방법과 종류를 기술하고 더 나아가 러시아어의 단어임베딩을 활용해 일반언어학에서 어떠한 어휘의미 연구를 ...
본 연구는 기계학습을 이용한 자연어 처리 방법의 하나인 단어임베딩의 개념, 방법과 종류를 기술하고 더 나아가 러시아어의 단어임베딩을 활용해 일반언어학에서 어떠한 어휘의미 연구를 할 수 있는지를 주된 논의의 대상으로 삼는다. 단어임베딩은 큰 규모의 코퍼스를 대상으로 하여 기계학습 방식으로 대상 언어를 모형화하는 기법이다. 기계학습에 기반한 단어임베딩은 언어학적인 측면에서 어떤 의미가 있는지, 장점과 한계는 무엇인지 등에 대하여 단어유사도 평가와 단어유추 평가를 통해 논의할 수 있다. 단어유사도 평가는 임베딩의 품질 평가뿐만 아니라 단어 간 유사도를 정량적인 수치로 보여줌으로써 유의어의 변별적 특성을 밝힐 수 있다는 점에서 언어학적으로 분석해 볼 가치가 있으며 단어 유추평가는 갑과 을의 관계는 병과 정의 관계와 같다는 의미론적 유추에서 단어 벡터간 계산을 통해 단어들 사이의 의미적 문법적 관계를 도출해 낼 수 있다.
다국어 초록 (Multilingual Abstract)
This study examines the concepts and types of word embeddings, which is one of the natural language processing methods based on machine learning. This kind of a lexical semantic research can be conducted in general linguistics with Russian word embedd...
This study examines the concepts and types of word embeddings, which is one of the natural language processing methods based on machine learning. This kind of a lexical semantic research can be conducted in general linguistics with Russian word embedding. Word embedding is a technique for modeling a target language based on the machine learning. The study discusses strengths and limitations of word embeddings in terms of word similarity and word inference evaluation. Word similarity evaluation is worth analyzing linguistically in that it can reveal the discriminative characteristics of synonyms by not only evaluating the quality of word embeddings, but also showing the semantic similarity among words with a quantitative value. Semantic and grammatical relationships between words can be displayed by calculating word vectors based on the semantic analogy of relationships.
참고문헌 (Reference)
1 이기창, "한국어 임베딩" 에이콘 2019
2 김보라, "텍스트 긍정 부정 평가: 러시아 국립 코퍼스를 중심으로" 러시아 • 알타이지역 연구소 17 : 1-18, 2018
3 안정국, "집단지성을 이용한 한글 감성어 사전 구축" 한국지능정보시스템학회 21 (21): 49-67, 2015
4 정유남, "조선일보와 노동신문의 어휘 의미 비교 연구" 한국어의미학회 69 : 253-281, 2020
5 임희석, "자연어처리 바이블 핵심이론 응용시스템딥러닝" 휴먼사이언스 2020
6 김호용, "우리말샘 사전을 이용한 단어 의미유사도 측정 모델 개발" 3-4, 2018
7 최재웅, "숫자로 표상된 의미: 딥러닝 시대의 의미론" 언어정보연구소 34 : 305-337, 2018
8 유원준, "딥러닝을 이용한 자연어 처리 입문"
9 김일환, "디지털 자료와 의미 연구의 다양성" 한국어의미학회 56 : 89-109, 2017
10 김일환, "공기 관계 네트워크를 이용한 감정명사의 사용 양상 분석" 한국어학회 49 : 119-148, 2010
1 이기창, "한국어 임베딩" 에이콘 2019
2 김보라, "텍스트 긍정 부정 평가: 러시아 국립 코퍼스를 중심으로" 러시아 • 알타이지역 연구소 17 : 1-18, 2018
3 안정국, "집단지성을 이용한 한글 감성어 사전 구축" 한국지능정보시스템학회 21 (21): 49-67, 2015
4 정유남, "조선일보와 노동신문의 어휘 의미 비교 연구" 한국어의미학회 69 : 253-281, 2020
5 임희석, "자연어처리 바이블 핵심이론 응용시스템딥러닝" 휴먼사이언스 2020
6 김호용, "우리말샘 사전을 이용한 단어 의미유사도 측정 모델 개발" 3-4, 2018
7 최재웅, "숫자로 표상된 의미: 딥러닝 시대의 의미론" 언어정보연구소 34 : 305-337, 2018
8 유원준, "딥러닝을 이용한 자연어 처리 입문"
9 김일환, "디지털 자료와 의미 연구의 다양성" 한국어의미학회 56 : 89-109, 2017
10 김일환, "공기 관계 네트워크를 이용한 감정명사의 사용 양상 분석" 한국어학회 49 : 119-148, 2010
11 Лукашевич, Н., "Системы и средстваинформатики" 20-33, 2015
12 "WordNet"
13 박성수, "Word2vec과 앙상블 분류기를 사용한 효율적 한국어 감성 분류 방안" 한국디지털콘텐츠학회 19 (19): 133-140, 2018
14 Kutuzov A., "WebVectors: A Toolkit for Building Web Interfaces for Vector Semantic Models" Springer 2016
15 Berners-Lee, Tim, "Weaving the Web: The Original Design and Ultimate Destiny of the World Wide Web by its Inventor" Harper San Francisco 1999
16 Berners-Lee, T., "The semantic web"
17 Clark, Stephen, "The Handbook of Contemporary Semantic Theory" Wiley-Blackwell 493-522, 2015
18 "SentiWordNet"
19 "RusVectōrēs"
20 "RuThes Linguistic Ontology"
21 Baroni, M., "Nouns are vectors, adjectives are matrices:Representing adjective-noun constructions in semantic space" 2010
22 "HSE Internet studies lab"
23 Chetviorkin I. I., "Extraction of Russian Sentiment Lexicon for Product Meta-Domain"
24 Mikolov, T., "Efficient estimation of word representations in vector space" 2013
25 Chollet, F., "Deep Learning with R" Manning Publications Company 2018
코로나19가 러시아 디지털경제에 미치는 영향 - 전자상거래를 중심으로 -
‘몽골-타타르의 멍에’에 관한 사학사적 고찰 - 문화적 영향을 중심으로 -
학술지 이력
연월일 | 이력구분 | 이력상세 | 등재구분 |
---|---|---|---|
2027 | 평가예정 | 재인증평가 신청대상 (재인증) | |
2021-01-01 | 평가 | 등재학술지 유지 (재인증) | |
2018-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2015-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2011-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2009-09-02 | 학술지명변경 | 외국어명 : The Korean Journal of Slavic Studies -> The Korean Journal of Slavic Studies | |
2009-09-01 | 학술지명변경 | 외국어명 : 미등록 -> The Korean Journal of Slavic Studies | |
2009-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2007-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2006-01-17 | 학술지명변경 | 한글명 : 슬라브연구 -> 슬라브硏究 | |
2004-01-01 | 평가 | 등재학술지 선정 (등재후보2차) | |
2003-01-01 | 평가 | 등재후보 1차 PASS (등재후보1차) | |
2001-07-01 | 평가 | 등재후보학술지 선정 (신규평가) |
학술지 인용정보
기준연도 | WOS-KCI 통합IF(2년) | KCIF(2년) | KCIF(3년) |
---|---|---|---|
2016 | 0.58 | 0.58 | 0.52 |
KCIF(4년) | KCIF(5년) | 중심성지수(3년) | 즉시성지수 |
0.44 | 0.41 | 0.844 | 0.33 |