인터넷이 도입된 이후 여러 정보 기술의 비약적인 발전이 있어왔다. 그중에 특히 최근 몇 년 동안은 폭발적인 데이터 양의 증가로 빅데이터(Big Data)가 정보 기술의 핵심 키워드가 되고 있다. ...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=T14017330
서울 : 성균관대학교 일반대학원, 2016
학위논문(석사) -- 성균관대학교 일반대학원 , 기술경영학과 , 2016. 2
2016
한국어
데이터 사이언티스트 ; 빅데이터 ; PLS-SEM ; SmartPLS
서울
PLS path modeling to investigate the relations between competencies of data scientist and big data analysis performance : focused on Kaggle platform
iv, 57 p. : 삽화 ; 30 cm
지도교수: 조근태
부록 수록
참고문헌 : p. 44-48
0
상세조회0
다운로드인터넷이 도입된 이후 여러 정보 기술의 비약적인 발전이 있어왔다. 그중에 특히 최근 몇 년 동안은 폭발적인 데이터 양의 증가로 빅데이터(Big Data)가 정보 기술의 핵심 키워드가 되고 있다. ...
인터넷이 도입된 이후 여러 정보 기술의 비약적인 발전이 있어왔다. 그중에 특히 최근 몇 년 동안은 폭발적인 데이터 양의 증가로 빅데이터(Big Data)가 정보 기술의 핵심 키워드가 되고 있다. 빅데이터란 Knox(2012)의 정의에 따르면 “3V를 갖는, 즉, 거대한 규모(Volume)와 다양한(Variety) 혙애의 데이터를 빠른 속도(Velocity)로 처리”를 의미한다. 이러한 변화에 따라 학술적으로도 빅데이터의 자원적인 측면, 그 자원을 활용하는 기술적인 측면에 관한 연구가 활발히 진행되고 있다. 하지만, 그 데이터를 저장하고 가공하는 주체인 데이터 사이언티스트에 관한 연구는 부족한 실정이다. 이에 본 논문에서는 빅데이터 성과를 높이는 데이터 사이언티스트의 역량에 관해 탐색한다.
본 연구의 목적은 데이터 사이언티스트의 역량을 기술, 경영 그리고 현업 영역으로 구분하여 각 요소가 빅데이터 분석성과에 미치는 영향에 대해 분석하는 것이다. 또한, 데이터 사이언티스트의 인구통계변수(연령, 전공, 국가 등)를 기준으로 조절효과를 분석한다. 이를 위해 자료수집으로 설문조사를 실시하였고, 분석방법으로는 요인분석과 부분최소제곱 구조방정식(PLS-SEM)을 사용하였다.
연구결과는 다음과 같다. 첫째, 데이터 사이언티스트의 탁월한 요소로는 머신러닝, 문제해결 및 경영분석, 우선적 개선 요소로는 시각화와 통계, 그리고 문제를 일으키는 요소로는 의사소통 및 협업으로 나타났다. 둘째, 조절효과를 분석한 결과 연령, 학력, 전공, 국가에서 집단별 차이가 있는 것이 확인되었다. 본 연구는 데이터 사이언티스트의 개별 역량과 성과 사이의 관계구조를 분석함으로써 해당 연구에 새로운 이론적 기초를 제공하고, 실용적으로는 데이터 사이언티스트가 필수적으로 갖추어야할 핵심역량의 우선도를 판별한다.
다국어 초록 (Multilingual Abstract)
The purpose of this research is to examine the effects of three competencies of data scientists on the analysis performance of big data. Furthermore, we analyzed the moderating effect on the basis of the data scientists’ demographics variables (e.g....
The purpose of this research is to examine the effects of three competencies of data scientists on the analysis performance of big data. Furthermore, we analyzed the moderating effect on the basis of the data scientists’ demographics variables (e.g., age, major, and country or region). In order to investigate this, we conducted a survey to gather data and used factor analysis and PLS-SEM for the analysis methods.
The results are as follows. First, some of main competency factors have an influential effect on the big data analysis performance. To be specific, the superior factors of the data scientists were machine learning, problem solving, and business analysis; the priority improvement factor was hacking skill; and furthermore, the factors that caused problems were shown to be communications and collaboration. Second, after analyzing the moderating effects, we identified that there was a difference between the scientists in terms of age, education, major, and country or region. This research is to provide a new theoretical basis needed for the relevant research by analyzing the structural relationship between the individual competencies and performance; and practically to identify the priorities of the core competencies that data scientists must have.
목차 (Table of Contents)