RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        The Performance Evaluation System for the Modern Pentathlon based on the Concept of Performance Analysis of Sport

        Hyongjun Choi(최형준),Doryung Han(한도령) 한국컴퓨터정보학회 2020 韓國컴퓨터情報學會論文誌 Vol.25 No.9

        본 연구는 올림픽 정식 종목 중 하나인 근대5종 경기의 경기력 평가 시스템을 개발하는데 주된 목적을 두었다. 근대5종을 위한 경기력 평가 지표 시스템을 위하여 마이크로소프트사 엑셀 2016을 VBA와 함께 사용하였으며, 현장 적용을 고려하여 개발하였다. 결론적으로 경기력 평가 지표를 위한 시스템은 스포츠부호화분석 이론의 적용으로 구현이 가능하였으며, 경기력 평가 지표 시스템에 사용되는 분석인자는 성공적인 운동수행 기술에 기초하여 선정하였다. 마지막으로 향후 개발된 시스템을 활용한 빅데이터의 시뮬레이션이 요구되며, 타 스포츠종목의 성공적인 운동수행 결과를 토대로 한 체계적인 고찰이 필요하다고 사료된다. This study intended to develop the Performance Evaluation system for the modern pentathlon such as an Olympic sporting event. The performance evaluation index system for the modern pentathlon was developed by Microsoft Excel 2016 with Visual Basic for Application that it is able to be understandable for the practical field in sport. Consequently, the system for the performance evaluation index is able to be developed within the concept of performance analysis of sport such as a notational analysis of sport. And the performance indicators for the performance evaluation index were selected by the skills to make successful outcomes. Finally, the simulation with big data gathering by the developed system would be requested that systematic reviews on successful outcomes in other sporting events would be necessary.

      • KCI등재

        테니스 경기분석을 위한 빅데이터 분석 기법의 적용

        최형준(Hyongjun Choi),이윤수(Yun-Soo Lee) 한국체육측정평가학회 2020 한국체육측정평가학회지 Vol.22 No.1

        이 연구는 최근 4차 산업혁명의 주요 기술 중에 하나인 빅데이터 분석 기법을 활용하여 프로테니스협회에서 제공한 테니스 경기 공식기록을 대상으로 경기대회(그랜드슬램과 Masters 1000)를 구분한 후 연도(1991년부터 2019년 까지)에 따라 나타나는 변수별 변화 추이를 분석함으로써 테니스 경기분석을 위한 빅데이터 분석 기법을 적용해 보고 이를 평가하는데 목적을 두었다. 이 연구의 대상은 그랜드슬램(N=19,682)과 Masters 1000 (N=18,784) 경기의 공식기록이었으며, 사용된 측정변수는 총 59개였다. 자료의 수집을 위하여 python 3.8.1 버전 프로그램을 사용하였으며, 자료의 정제, 자료의 전처리, 자료의 통계처리, 자료의 시각화 과정에서의 자료처리를 위하여 통계프로그램 R 3.5.1 버전을 사용하였다. 이 연구에서는 테니스 경기의 분석을 위하여 빅데이터를 활용하여 연도별 경기대회에서 나타난 각 변수의 원자료를 비교하였고, 변수별 일반적인 특성을 알아보기 위하여 커널밀도추정 결과에 대한 변화추이를 분석하였으며, 경기대회와 연도에 따른 변수별 평균 차이의 비교를 위해 이원분산분석(two-way ANOVA)을 실시하여 얻은 결론은 다음과 같다. 첫째, 1991년부터 2019년까지의 테니스 경기를 그랜드슬램과 Masters 1000로 구분하여 비교한 결과, 2009년을 기준으로 그랜드슬램에서 나타난 변수값이 감소하는 변화 양상을 보였다. 둘째, 수집된 자료의 커널밀도추정을 통해 얻은 비교 결과, winner tiebreaks won과 loser tiebreaks won 변수를 제외한 대부분의 변수에서는 경기대회 간 유사성이 나타냈다. 셋째, 그랜드슬램과 Masters 1000, 및 연도에 따른 변수의 평균차이에 대한 변화 추이를 비교한 결과, loser tiebreaks won 변수에서만 연도 간 통계적 유의성이 나타나지 않았으며, 그 외의 변수에서는 경기대회 및 연도에 따라서 통계적으로 유의한 차이를 보였다(p<.05). The purpose of this study was to discuss the application of the Big Data Analytics for the performance analysis results in tennis that it is now one of key technology in the era of 4th industrial revolution. The consideration of all data was based on different tournaments(grand slam & Masters 1000) and competitions’ years from 1991 to 2019. The subjects of this study were the matches in Grand Slam (N=19,682) and the matches in Masters 1000 (N=18,784). The variables used in this study were totally 59 variables relevant to the performances in the matches. The python program version 3.8.1 was used in the data collection and R version 3.5.1 was used in the data processes, such as data cleaning, data preprocessing, and data visualization. The comparison of raw data between different years in the tournaments was considered in order to interpretate the data, and the comparison of results from the kernel density estimation was concerned to identify the general characteristics of each variable. The results of two-way ANOVA test were also considered to compare means of variables within the tournaments and years. Consequently, there are three findings in this study as following belows; First of all, the values of all variables were decreasing from the year 2009 in the comparison of raw data by the tournaments from 1991 to 2019. Secondly, the patterns of the kernel density estimation on the winner tiebreaks won and loser tiebreaks won were differently occurred between the tournaments. Thirdly, the result of two-way ANOVA shown that there was no significant difference on the loser tiebreaks won variable, but there were significant differences on the other variables by the way(p<.05).

      • KCI등재

        테니스 경기분석을 위한 주요 분석인자의 일관성 탐색

        최형준(Hyongjun Choi),조은형(Eun Hyung Cho),김응준(Eung Joon Kim),한도령(Do Ryung Han) 한국체육측정평가학회 2011 한국체육측정평가학회지 Vol.13 No.3

        본 연구는 테니스 경기 공식기록을 통하여 승패의 차이를 분석할 때 사용되는 분석인자들에 대한 일관성을 알아내고자 하였다. 특히, 본 연구에서는 하나의 대회가 아닌 10개의 테니스 대회에서 나타나는 ``승자``와 ``패자``간의 차 이를 경기기록과 세트기록으로 구분하여 비교해보고, 이에 대한 차이를 논함으로써 분석인자의 탐색에 대한 일관성에 대해 살펴보고자 하였다. 본 연구를 위하여 2005년부터 2010년까지의 4대 그랜드슬램 테니스 대회의 자료(경기기록(n=687), 세트기록(n=391))가 대상이 되었으며, ``승자``와 ``패자``간 차이를 비교한 결과는 다음과 같다. 첫째, 대회별로 나누지 않고 전체자료를 대상으로 비교한 결과에서는 경기기록의 경우 11개의 분석인자에서 모두 통계적으로 유의한 차이를 나타낸 반면, 세트기록에서는 브레이크 포인트 승리율을 제외한 10개의 분석인자에서 통계적으로 유의한 차이를 나타냈다(p<.05). 둘째, 경기기록을 대회별로 살펴본 결과, 6개의 분석인자에서 공통적으로 통계적 차이(p<.05)를 보였다. 셋째, 세트기록을 대회별로 살펴본 결과, 3개의 분석인자에서 공통적으로 통계적 차이 (p<.05)를 보였다. 따라서 각 대회의 특성과 선수의 경기력 차이와 같은 변인을 고려하지 않고 자료의 범위에 따라서 분석인자를 탐색할 때의 일관성이 나타났으며, 향후 실시간분석에 적용할 수 있을 것으로 사료된다. The purpose of this study was to compare the differences of identification of performance indicators which were distinguishing the winning and losing performances in Tennis Gland Slam competitions. Especially, the consistencies of identification on Performance Indicators through statistical comparisons using Wilcoxon Signed Ranks tests were considered. For this study, 687 matches and 391 sets were selected as subjects in 4 Grand Slam tennis competitions (from 2005 to 2010). Totally, 11 performance indicators were selected from the official stats of 4 Grand Slam tennis championships as independent variables for this study that they were % of successful serves, aces, double faults, unforced errors, % of successful 1st serve, % of successful 2nd serve, winners, received points, break points conversions, % of net approaches and total point obtained. As results of the study, there were 3 summarized findings as following below; Firstly, there were significant differences of all 11 performance indicators between winning and losing where the data were arranged as match results (p<.05). Likely, there were also significant differences of 10 performance indicators between winning and losing where the set data were used for comparisons (p<.05). Only 1 performance indicator was shown differently between match and set data that it was "Break point conversions". Secondly, there were significant differences on 6 performance indicators distinguishing winning and losing where matches` data were used in the comparisons of championships separately (p<.05). The performance indicators were % of successful 1st serve, % of successful 2nd serve, winners, received points, break points conversions and total point obtained. Thirdly, there were significant differences on only 3 performance indicators distinguishing winning and losing where sets` data were used in the comparisons of championships separately (p<.05). The performance indicators were % of successful 1st serve, received points and total point obtained. Consequently, further researches are required that the development of the systematic structures of identification for KPI and real-time analysis systems as well.

      • KCI등재

        축구 월드컵 경기 공식기록을 통한 데이터의 시각화

        최형준(Hyongjun Choi) 한국체육측정평가학회 2016 한국체육측정평가학회지 Vol.18 No.1

        이 연구는 2002년부터 2014년 축구 월드컵 경기에서 나타난 자료의 시각화하기 위한 목적을 가진다. 또한, 학습돤 자기구성지도를 이용하여 원자료의 특성을 고려한 예측값을 도출해내어, 원자료와 학습된 자기구성지도을 사용하여 원자료를 예측하는 게 가능한지를 알아보고자 하였다. 이 연구를 위하여 2002년부터 2014년 축구 월드컵 경기에서 나타난 512개의 자료를 20개의 독립변인과 함께 정리하였으며, 통계프로그램인 R 3.2.0 버전을 코호넨 패키지 2.0.18버전과 함께 자료처리를 위해 사용하였다. 학습을 마친 자기구성지도의 양자화 오류는 3.906이었으며, 지형화 오류는1.248로 나타났다. 이 연구를 통해 얻은 연구결과는 첫째, 학습된 자기구성지도는 학습이후, 원자료의 특성을 투영하고자 하였으며, 이러한 특성을 이용하여 군집을 시각화 할 수 있었다. 둘째, 원자료의 특성은 학습된 자기구성지도의 예측 알고리즘을 통하여 오차범위 5%에서 대부분 예측과 일치하다고 나타났다. 따라서, 향후 연구에서는 더 많은 양의 자료로 원자료의 특성을 학습과 투영을 통해 시각화할 수 있을지에 대해 연구가 이루어져야 한다고 사료된다. This study was to visualize raw data from 2002 to 2014 soccer World Cup officials. It was also aimed that the trained Self-Organizing Map suggested the predictable values of attitudes on raw data. Thus, this study was finally, to identified the possibility of prediction using raw data and the trained Self-Organizing Map on soccer World Cup stats. In order to approaches those purposes, totally, 512 set of data from the official web sites were used as the subjects of this study. And a R 3.2.0 statistical package with kohonen package 2.0.18 was used to analyse the data within the Self-organizing Map developed by Helsinki Univeristy of Technology. After the training of Self-organizing map, the quantization error was 3.906 and the topographic error was 1.248. Consequently, the results of the study was as following; Firstly, the trained SOM was trying to project the features of raw data after the training. Also, it was possible to make clusters within the projections on the trained SOM. Secondly, the features of raw data have been shown on the prediction algorithm of the trained SOM that almost all of raw data were projected within 5% of error range. Finally, it is required that following researches would be considered more data sets of official stats in soccer in order to be trained and be projected of the features of raw data.

      • KCI등재

        스포츠경기분석의 이슈와 전망

        최형준(Hyongjun Choi),엄한주(Han Joo Eom) 한국체육측정평가학회 2020 한국체육측정평가학회지 Vol.22 No.3

        The article was to review the historical development of performance analysis of sport. Also, this article intended to discuss current issues in the field of performance analysis of sport in Korea. The methodological development was mainly focused on the determination of the historical development of performance analysis of sport, but it was not only the main concerned for this study. The current issues on the performance analysis of sport were relevant to the naming of job description relating to the role of performance analysis of sport, that it was commonly called as a match analysis of sport, a game analysis of sport, a movement analysis of sport, a motion analysis of sport, a mathematical analysis of sport, a statistical analysis of sport and a record and analysis of sport. Consequently, this article discussed that the issue of naming on the performance analysis of sport, the issue of job titles relating to the performance analysis of sport, and the prospects of the field of performance analysis of sport.

      • KCI등재

        군집분석을 통한 K리그 축구팀 플레이스타일 분류

        김종원(Jongwon Kim),최형준(Hyongjun Choi) 한국체육측정평가학회 2021 한국체육측정평가학회지 Vol.23 No.1

        본 연구는 2020 K리그 경기에서 발생한 패스 관련 분석인자들을 이용하여 군집분석을 통해 K리그 팀들의 플레이스타일을 알아보고자 하였다. 2020 K리그 모든 팀들의 전 경기(스플릿 후 경기 제외)를 대상으로 하였으며, 연구의 대상이 된 경기 수는 총 132경기였으며, 양 팀의 자료를 각각 고려하였다(n=264). K리그 프로축구연맹 ‘데이터포탈’에서 제공받은 18개의 패스 관련 분석인자들을 Microsoft Office Excel 2007을 이용하여 정리하였고, 그 후 R 3.6.2를 이용하여 자료 처리하였다. 통계적 검증을 위하여 기술통계 분석(descriptive statistics analysis)을 실시한 후, 데이터 마이닝 기법 중 하나인 k-평균 군집분석(k-means cluster analysis)과 교차분석(cross-tabulation analysis)을 실시하였다. 본 연구의 군집분석을 통하여 얻어진 군집의 수는 3개였다. 절반 이상의 팀들이 군집 1에 속하였고, 군집2(전북, 울산, 강원)와 군집3(대구, 광주, 인천)에는 각각 3팀이 속하였다. 최상위 팀인 1위 팀 전북과 2위 팀 울산이 속한 군집2는 다른 군집들과 비교해 공격 1/3지역 패스 비율, 숏 패스 비율, 전진 패스 비율을 제외한 나머지 15개의 분석인자들에서 가장 높은 평균값을 나타냈고, 군집3의 경우 가장 낮은 평균값을 보였다. 분석인자들 간의 유사성을 이용하여 군집을 나누는 방법으로 직접적인 팀의 플레이스타일을 표현하는데 한계가 있지만, 본 연구에서 사용된 분석인자들을 통해 비슷한 유형의 팀들을 군집하는데 의미가 있다. The purpose of this study was to identify the playing styles of football clubs in K-League through cluster analysis using performance indicators related to pass. All matches excepted to split matches were used for analysis and all data were provided from Korea Football League(n=264). All data were preprocessed on Microsoft Office Excel 2007 and statistical analysis was conducted on R 3.6.2. Descriptive statistical analysis was firstly used to calculate means and standard deviations for each performance indicators and then k-means cluster analysis, one of the data mining method, was conducted to identify clusters. Finally, cross-tabulation analysis was used to identify K-League teams into each cluster. Three clusters were identified and Jeonbuk, Ulsan and Gangwon was included in cluster 2 whilst Daegu, Gwangju and Incheon was included in cluster 3. The other teams were included in cluster 1. Cluster 2 had greater performance indicators related to pass rather than other clusters. Although cluster analysis, grouping performance indicators in such a way that performance indicators in the same cluster are more similar each other compared to other clusters, could not determine accurate playing styles in football, it is literally meaningful to group the similar type of teams. There needs to be a great interpretation of the characteristics of the formed clusters.

      • KCI우수등재

        모션캡쳐 시스템에 기반한 GPS 측정장비의 정확성 분석

        이승훈 ( Lee Seunghun ),최형준 ( Choi Hyongjun ) 한국체육학회 2020 한국체육학회지 Vol.59 No.6

        이 연구는 스포츠 현장에서 활용되고 있는 GPS시스템의 정확성을 검증하고자 모션캡처시스템을 기준으로 차이를 분석해 정확도를 확인하는데 목적이 있다. 6명을 대상으로 4가지 움직임 종류와 3가지 속도 변화 조건에서 모션캡처 장비와 GPS장치 간 속도(m/s) 값을 바탕으로 정확성을 비교하였고, 자료의 표준화 과정을 거쳐 장비별 일치 시점에 대한 편차(RMSD)특성을 해석하였다. 이 연구를 통하여, GPS 측정 자료가 MCS에 비해 과소평가되는 경향이 있지만, 평균 이동속도와 거리에 대해 정확한 추정치를 제시하였으며, 복잡한 움직임 보다 단순한 움직임일 때 상대적으로 정확하였다. 또한 속도가 빠를수록 편찻값이 증가하는 경향을 보이지만 추정 가능한 수준이다. 평균적으로 0.2m/s 이내의 비교적 작은 오차로 예측이 가능한 수준으로 속도 증가의 폭이 클수록 편차에 영향을 받으며, 속도 변화의 정도가 크지 않은 종목을 측정할 경우 신뢰할 수 있는 자료를 제공할 수 있다. 특히 동적(dynamic)인 요소가 강한 운동 분류에서 활용성이 기대되며, 정적(static)인 요소가 높은 종목의 경우 GPS만으로는 운동량의 과소평가되는 부분으로 인하여 복합적인 측정 방법으로 정확성을 향상시킬 필요가 있다. The purpose of this study is to verify the accuracy of GPS systems used in sports sites by analyzing differences based on motion capture systems. Accuracy was compared to 6 people based on the speed (m/s) values between motion capture equipment and GPS devices under 4 types of motion and 3 conditions of speed change, and the characteristics of deviation (RMSD) for matching points by equipment were interpreted through standardization process of data. Through this study, although the measurement data of GPS equipment tends to be underestimated, accurate estimates of average travel speed and distance were given, and were relatively more accurate than in simple movements. In addition, the faster the speed, the more likely the deviation value to increase, but at an estimated level. On average, a relatively small error of less than 0.2 m/s will affect the deviation as the width of the increase in velocity is greater, and reliable data can be provided when measuring events that do not have a significant degree of change in speed. In particular, for sports where dynamic elements are expected to be utilized in strong motor classification, and where static elements are high, it is necessary to improve accuracy with a complex measurement method due to the underestimation of motor mass by GPS alone.

      • KCI우수등재

        K리그 축구 경기에서 나타난 상황 요인 별 주요 공격 분석인자의 상대성 분석

        김종원 ( Kim¸ Jongwon ),최형준 ( Choi¸ Hyongjun ) 한국체육학회 2021 한국체육학회지 Vol.60 No.1

        본 연구는 2020 K리그 경기에서 발생한 주요 공격 인자들을 수집하고 이를 상황 요인(경기 장소, 상대팀 수준, 최근 팀 경기력, 최근 상대팀 경기력) 별 상대성 분석을 하고자 하였다. 본 연구에서는 2020 K리그 모든 팀들의 전 경기(스플릿 후 경기 제외)를 대상으로 하였으며, 연구의 대상이 된 경기 수는 132경기였다. 자료 수집을 위해 한국프로축구연맹에서 제공하는 ‘데이터포탈’의 공식 자료를 사용하였고, 자료를 정리하기 위해 1차적으로 Microsoft Office Excel 2007을 이용하였다. 통계 분석은 IBM SPSS 25.0을 이용하였으며, 정규성 분포를 이루지 않아 비모수 통계 기법인 Mann-Whitney U 검정법과 Kruskal-Wallis H 검정법을 이용하여 평균 차이를 비교 분석하였다. 본 연구에서 나타난 결과는 첫째, K리그 팀들은 홈에서 경기를 할 때가 원정에서 경기를 할 때보다 더 높은 볼 점유율을 기록했고(α<.05), 둘째, 강팀을 상대로 경기할 때가 중팀과 약팀을 상대로 할 때보다 더 적은 슛, 유효 슛, 패스, 전진 패스와 낮은 볼 점유율을 기록했으며(α<.05), 셋째, 팀의 최근 경기력이 좋을 때와 상대팀의 경기력이 좋지 않을 때 더 많은 패스, 전진 패스와 높은 볼 점유율을 기록했다(α<.05). The aim of this study was to identify the effect of situational variables e.g. match venue, opposition quality, current form, current opposition’s form on key attacking performance indicators from 2020 Korea Football League. All match(n=132) excepted for split matches were used for analysis and the data were provided by Korea Professional Football League(data.kleague.com). Microsoft Office Excel 2007 was used to collect data and the data were analysed in IBM SPSS 25.0 to determine differences between independent variables. Normality tests were firstly conducted and Mann-Whitney U test and Kruskal-Wallis H test was conducted as a non-parametric statistics method. The results showed that ball possessions were significantly different between home and away teams whilst all key attacking performance indicators were significantly different according to different quality of team. Also, there were significant differences in passes, forward passes and ball possessions among current team forms and opposition team forms.

      • KCI우수등재

        2019 세계 남자 농구 월드컵 대회의 경기분석을 위한 군집분석

        저우차오 ( Zhou Chao ),최형준 ( Choi Hyongjun ) 한국체육학회 2020 한국체육학회지 Vol.59 No.3

        본 연구는 2019 세계 남자 농구 월드컵 경기대회의 공식기록을 사용하여 승패, NBA 선수 비율, 대륙별 특성에 대한 차이를 군집분석으로 알아보는데 목적을 두었다. 본 연구의 대상은 2019 세계 남자 농구 월드컵 경기대회의 공식기록을 통해 얻어지는 기록 중에서 32개 팀이 경기한 총 184개 경기기록이었으며, 총 33개의 변수를 통해 승패, NBA 선수 비율, 대륙별 특성에 대한 차이를 비교하였다. 본 연구의 자료수집과 처리를 위하여 통계프로그램 R 3.6.2 버전을 패키지와 함께 사용하였고, 모든 통계적 검증은 유의수준은 95%로 설정하여 얻은 결론은 다음과 같다. 첫째, 승패별 차이에서는 승리한 팀과 유사성이 높은 군집에서 득점과 연관된 변수가 패배한 팀과 유사성이 높은 군집에 비해서 높게 나타났다. 둘째, NBA 선수 비율별 차이에서는 실제 자료와 군집분석 결과와의 명확한 분류가 이루어지지는 않았지만, NBA 선수 비율에 따라 구분된 집단 중 B그룹(NBA 선수: 1-3명)인 경우에서는 다른 그룹에 비해 높은 유사성을 보였다. 셋째, 대륙별차이에서는 실제 자료와 군집분석 결과와의 뚜렷한 군집 기준을 나타내지 않았으며, 원자료 일부가 2개 군집에 혼합되어 소속되는 결과를 보이기도 하였다. 본 연구의 연구결과를 토대로 향후 사례수를 증가하여 경기대회 간 교차 분석이나 변수의 일반적인 특성을 파악하는 연구가 필요할 것으로 사료되며, 농구 경기의 빠른 전술 및 전략 변화를 감지할 수 있는 패턴 인식과 관련한 연구도 필요할 것으로 판단되는 바이다. The purpose of this study was to compare differences of characteristics on winning factors, ratio of NBA players and regional areas using the cluster analysis within the official data of 2019 men basketball world cup. The subjects of this study were 184 matches’data by 32 teams which participated to the 2019 men basketball world cup. In addition, totally 33 variables from the official data were selected and used in this study. For the data collection and process, the statistical software, called R version 3.6.2 was used with relevant packages. Also, the statistical results was determined within 95% level of confidence interval. The conclusion of this study was as following belows; First of all, the comparison by winning factors shown that the winning team had greater relationship to scoring factors rather than the losing teams’ cluster. Secondly, the ratio of NBA players in a team could not show the critical classification between the groups, but the group B (1∼3 NBA players) group shown higher similarity to the cluster, compared to other groups. Thridly, there were not many clear similarity found in the comparison between regional areas, but some raw data were located in several clusters in this study. Consequently, further researches on the increasing cases, cross comparison between competition and variables, and the identification of general characteristics by variables are strongly required.

      • KCI등재

        텍스트마이닝기법을 적용한 동계올림픽 관련 연구의 키워드 비교 분석

        이규원(Kyu-won Lee),최형준(Hyongjun Choi) 한국체육측정평가학회 2018 한국체육측정평가학회지 Vol.20 No.3

        이 연구는 동계올림픽의 5회 대회(1998 나가노, 2002 솔트레이크시티, 2006 토리노, 2010 밴쿠버, 2014 소치)를 중심으로 오픈소스 통계프로그램인 R 프로그램 텍스트마이닝 Word Cloud 패키지와 TF-DI(Term Frequency-Date Index) 기법을 적용하여 동계올림픽의 연구 키워드를 알아보는 데 목적이 있다. 스칼라(https://scholar.google.co.kr)에서 제공하는 검색엔진을 이용하여 연구 대상을 검색하였고, 검색된 연구 대상을 빈도분석을 통하여 다음과 같은 결과를 도출하였다. 첫째, 올림픽별 20개 이상의 빈도가 나타난 공통 단어를 살펴보게 되면 ‘Olymp’, ‘Global’ 등 18개의 단어가 나타난다. 18개의 나타난 단어를 통하여 동계올림픽 5회 대회의 연구에서 공통으로 나타난 단어들이 무엇인지 알 수 있었고, 올림픽별 출현 빈도가 높은 단어를 통하여 대회별 연구 키워드를 파악할 수 있었다. 둘째, 5회 대회의 18개의 공통 단어를 기반으로 대회별 트렌드를 알아보기 위하여 TF-DI값을 살펴보게 되면 ‘olymp’가 가장 높은 TF-DI 수치를 나타냈으며, ‘sport’, ‘game’, ‘event’ 순으로 나타났다. 이를 통하여 지속적으로 ‘olymp’와 관련된 연구가 이루어졌음을 알 수 있다. 이 연구에서와 같이 텍스트에 기반한 수치 데이터를 기초자료로 제시한다면 연구 키워드를 손쉽게 파악할 수 있을 것으로 사료된다. This research is centered on the 5th Winter Olympic Games (1998 Nagano, 2002 Salt Lake City, 2006 Torino, 2010 Vancouver, 2014 Sochi), an open source statistical program, R program text mining Word Cloud package and Term Frequency- The purpose of this study was to examine the research keywords of the Winter Olympics by applying the Date Index technique. were gathered in to Microsoft Excel and Text Processing Software the research subjects using the search engine provided by Scala Google (https://scholar.google.co.kr) The following results were obtained through the frequency analysis of the searched subjects. First, when you look at common words that have more than 20 frequencies per Olympic Games 18 words such as 'Olymp' and 'Global' appear. Through the 18 words, we can see what the common words are in the study of the 5th Winter Olympic Games, The research keywords were found through the words with high frequency of Olympics. Second, if we look at the TF-DI values to see trends based on 18 common words of the 5th contest, 'olymp' showed the highest TF-DI value, 'Sport', 'game' and 'event'. It can be seen that the research related to 'olymp' has been consistently conducted. If these numerical data are presented as basic data, it will be possible to grasp research keywords.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼