제 목 : 감성분석을 통한 금융 뉴스가 주가에 미치는 영향 본 연구는 야후파이낸스(finance.yahoo.com)와 CNN(edition.cnn.com)의 개별 종목 주가의 뉴스를 감성분석하여 주가를 예측한다. 분석 사례 기...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=T17106510
서울 : 서울과학기술대학교, 2024
학위논문(석사) -- 서울과학기술대학교 , 빅데이터AI경영정보학과 , 2024. 8
2024
한국어
서울
; 26 cm
지도교수: 천세학
I804:11034-200000806288
0
상세조회0
다운로드제 목 : 감성분석을 통한 금융 뉴스가 주가에 미치는 영향 본 연구는 야후파이낸스(finance.yahoo.com)와 CNN(edition.cnn.com)의 개별 종목 주가의 뉴스를 감성분석하여 주가를 예측한다. 분석 사례 기...
제 목 : 감성분석을 통한 금융 뉴스가 주가에 미치는 영향 본 연구는 야후파이낸스(finance.yahoo.com)와 CNN(edition.cnn.com)의 개별 종목 주가의 뉴스를 감성분석하여 주가를 예측한다. 분석 사례 기업으로 테슬 라와 애플 기업의 뉴스 기사를 크롤링하여 주가 예측에 사용하고자 했다. 먼 저 위 2개 웹사이트에서 테슬라와 애플 관련한 뉴스 기사를 데이터베이스에 저장하여 해당일의 뉴스 정보를 긍정, 중립, 부정으로 나누고 각각 뉴스에 따 라 감성분석 결과를 이용하여 뉴스가 보도되기 전후의 종가의 변화율과의 관 계를 살펴보고자 했다. 기존의 연구들이 개별 기업보다는 지수 예측에 관심을 두고 예측했고, 해당 뉴스가 보도된 날의 종가와의 관계를 분석한 것이라면 본 연구는 장 마감후의 뉴스의 경우 오늘 종가와 다음날 종시가의 변화량을 계산하여 뉴스의 직접적 효과를 보고자 하였다. 또한 국내의 연구들은 BERT 를 이용하여 감성분석을 했지만, 본 논문에서는 보다 금융분야에 특화된 FinBERT의 효과성도 측정하느 면에서 이들의 효과도를 비교하고자 했다. 즉 BERT의 모델 중 많은 양의 데이터를 학습한 BERT와 금융 도메인을 사전 학 습한 모델인 FinBERT의 뉴스의 감성분석 결과를 이용한 주가 예측율이 어떻 게 다른지 살펴보고자 했다. 본 연구를 위해 야후파이낸스(finance.yahoo.com)의 종목 게시판의 2023년 4 월부터 2023년 5월까지의 최근 뉴스 기사, CNN의 경우 2010년부터 2023년까 지의 개별종목 테슬라와 애플의 뉴스 기사를 크롤링하였다. 비교를 좀 더 다 양하게 분석하기 위해 CNN의 나머지 빅테크 기업인 구글, 아마존, 마이크로소 프트, 메타, 엔비디아를 2020년부터 2024년까지 뉴스 기사를 크롤링을 추가하 였다. 데이터베이스에 미국 년도별 서머타임을 고려하여 주식 장 전, 중, 후를 구분했고, 주가 데이터수집 라이브러리(yfinance)를 이용하여 종가 변화량을 계산하여 저장하였다. 수집된 뉴스를 바탕으로 감성분석에는 기본모델이면서 가장 많은 말뭉치로 훈련된 BERT모델과 금융 도메인을 사전 학습한 모델인 FinBERT를 활용해 긍정, 중립, 부정 뉴스의 개수와 감성분석 점수를 평균하여 라벨링 하였다. 라벨링 한 감성분석 점수는 당일 긍정점수의 평균값은 1과 2 사이, 중립점수는 0과 1사이, 부정점수는 –1과 0의 값으로 연속형 변수로 만들 었다. 총 4개의 변수, 즉 감성분석 결과 긍정, 중립, 부정의 뉴스 개수와 감성 스코어를 독립변수로 하고, 뉴스 공지 후 주가의 변화율을 종속변수로 회귀분 석을 하였다. 연구결과는 다음과 같다. 첫째 테슬라의 BERT와 FinBERT감성분석 결과 BERT는 긍정 571, 중립 1462, 부정 586, FinBERT의 경우 긍정 361, 중립 1611, 부정 651의 분류로 비슷한 값을 보였다. 회귀분석결과 BERT보다 FinBERT를 이용한 회귀분석결과 긍정뉴스의 개수가 더 높은 t값과 유의한 p 값을 보여주었다. 둘째, BERT와 FinBERT의 경우 통계적으로 유의한 차이는 없었지만 회귀분석결과 부정뉴스의 개수가 많을수록 하락하는 것은 유의한 것 으로 나타났고, 긍정이나 중립의 뉴스개수는 큰 영향을 주지 않는 것으로 나 타났다. 감성분석스코어의 경우 유의하지는 않지 이 값이 높을수록 주가가 하 락하는 것으로 나타나서 감성분석스코어를 이용하여 주가를 예측하는 것에 한 계가 있었음을 보여주었다. 위의 결과를 종합해 볼 때 투자자는 어쩌면 뉴스 의 내용보다는 뉴스의 개수에 영향을 많이 받고, 긍정뉴스보다는 부정뉴스에 민감하게 반응한다는 것을 알 수 있었다.
다국어 초록 (Multilingual Abstract)
This study predicts stock prices by analyzing news on individual stock prices from Yahoo Finance (finance.yahoo.com) and CNN (edition.cnn.com). As analysis case companies, we wanted to crawl news articles about Tesla and Apple companies and use them t...
This study predicts stock prices by analyzing news on individual stock prices from Yahoo Finance (finance.yahoo.com) and CNN (edition.cnn.com). As analysis case companies, we wanted to crawl news articles about Tesla and Apple companies and use them to predict stock prices. First, news articles related to Tesla and Apple from the above two websites are stored in the database, the news information of the day is divided into positive, neutral, and negative, and the sentiment analysis results are used according to each news to determine the rate of change in the closing price before and after the news is reported. I wanted to look at the relationship with . While existing studies focused on predicting indices rather than individual companies and analyzed the relationship with the closing price on the day the news was reported, this study calculated the amount of change between today's closing price and the next day's closing price in the case of news after the market closes. So, we wanted to see the direct effect of the news. In addition, domestic studies conducted sentiment analysis using BERT, but this paper sought to compare the effectiveness of FinBERT, which is more specialized in the financial field, by measuring its effectiveness. In other words, we wanted to examine how the stock price prediction rates using the news sentiment analysis results of BERT, which learned a large amount of data among BERT models, and FinBERT, a model that pre-trained the financial domain, differed.
For this study, recent news articles from April 2023 to May 2023 on Yahoo Finance's (finance.yahoo.com) stock bulletin board, and news articles about individual stocks Tesla and Apple from 2010 to 2023 on CNN. crawled. To make the comparison more diverse, CNN added news articles from the remaining big tech companies, Google, Amazon, Microsoft, Meta, and NVIDIA, from 2020 to 2024. In the database, we classified before, during, and after the stock market by taking into account daylight saving time for each year in the United States, and used the stock price data collection library (yfinance) to calculate and store the closing price change. For sentiment analysis based on the collected news, BERT model, which is the basic model and trained with the largest corpus, and FinBERT, a model pre-trained in the financial domain, were used to average the number of positive, neutral, and negative news and the sentiment analysis score to label them. . The labeled emotional analysis score was made into a continuous variable with the average positive score of the day being between 1 and 2, the neutral score being between 0 and 1, and the negative score being -1 and 0. A total of four variables, that is, the number of positive, neutral, and negative news and emotional score as a result of emotional analysis, were used as independent variables, and the rate of change in stock price after news announcement was used as a dependent variable.
The research results are as follows. First, as a result of Tesla's BERT and FinBERT sentiment analysis, BERT showed similar values with a classification of positive 571, neutral 1462, and negative 586, and FinBERT was classified as positive 361, neutral 1611, and negative 651. As a result of regression analysis using FinBERT rather than BERT, the number of positive news showed a higher t value and a significant p value. Second, in the case of BERT and FinBERT, there was no statistically significant difference, but the results of regression analysis showed that the decline was significant as the number of negative news increased, and the number of positive or neutral news did not appear to have a significant effect. In the case of the sentiment analysis score, it was not significant, but the higher the value, the lower the stock price, showing that there were limitations in predicting stock prices using the sentiment analysis score. Considering the above results, it can be seen that investors are probably more influenced by the number of news stories than the content of the news, and that they react more sensitively to negative news than to positive news.
목차 (Table of Contents)