RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI우수등재

        우리나라 공공데이터의 소재정보

        김기환,이창호,최보승 한국데이터정보과학회 2019 한국데이터정보과학회지 Vol.30 No.5

        As the fourth industrial revolution becomes a major issue, interest in big data is growing. Big data refers to the technology for analyzing and utilizing countless numbers of data, and public data segments close to the real world account for their utilization. In Korea, data are widely generated in the public data sector as government 3.0 policy, starting with e-government. However, the sites that provide the data are not organized and the data being delivered different from site to site, requiring a lot of information to access them. Therefore, the present status of big data and administrative data existing in the country is classified according to the institutions, contents, utilization, and disclosure levels in order to better understanding the general outline of public data providing sites. As an information on material resources of the public data is summarized, basic knowledge on the presence, content, and utilization of big data and administrative data across a country were developed and statistical utilization status, methods, values, and limit development was developed. 4차 산업 혁명이 주요 이슈로 떠오르면서 빅데이터에 대한 관심도 커지고 있다. 빅데이터는 무수히 많은 데이터를 분석하여 활용하는 기술을 의미하며, 활용 측면에서 실생활에 밀접한 공공데이터 부문이 많은 비중을 차지하고 있다. 우리나라의 경우 전자정부를 시작으로 정부 3.0을 실시하면서 공공데이터 부문에서 데이터가 광범위하게 생성되고 있다. 하지만 데이터를 제공하는 사이트가 정리되어 있지 않으며, 데이터의 제공형태도 각 사이트마다 상이하여 데이터 이용에 많은 정보를 필요로 하고 있다. 이에 본 논문에서는 국가에 존재하는 빅데이터와 행정자료의 현황을 기관, 내용, 활용 및 공개 정도 등으로 분류하여 전체 윤곽을 파악하고 이해할 수 있도록 내용을 정리하였다. 공공데이터의 소재 정보를 정리함으로써 국가전반의 빅데이터와 행정자료의 존재현황과 내용 및 활용도에 대한 기본지식을 배양하고, 통계적 활용 현황, 방법, 가치와 한계, 발전방향에 관한 소양을 쌓을 수 있게 하고자 한다.

      • KCI등재

        데이터 중심의 정보 시스템 도입 방법론: 고객관계관리 시스템에의 적용 사례

        박종한,이석기,Park, Jong-Han,Lee, Seok-Kee 한국데이터정보과학회 2010 한국데이터정보과학회지 Vol.21 No.2

        최근 대부분의 기업이 정보시스템 개발을 아웃소싱에 의존하면서, 도입하고자 하는 정보시스템을 효과적으로 활용하는데 필요한 데이터와 현재 기업이 가지고 있는 데이터간의 차이에 대한 사전 분석이 성공적인 정보시스템 도입을 위해 반드시 필요하다. 그 예로 고객관계관리 시스템의 도입 사례의 경우 가장 큰 실패 요인이 사전에 기업이 가지고 있는 데이터에 대한 분석을 간과한 것에 기인하고 있다. 하지만, 아직까지 데이터 관점에서 정보시스템 도입 방법론을 체계적으로 제안한 연구가 존재하지 않았다. 본 연구에서 정보시스템 도입과 관련된 데이터 비용을 사전에 분석하여 도입 의사결정에 활용할 수 있는 정보시스템 도입 방법론을 제안하고 실제 사례에서 어떻게 활용 될 수 있는지를 사례 시뮬레이션을 통해 보여주고자 한다. 제안된 방법론을 이용해 실제 기업의 정보시스템 도입 의사결정자들은 기업의 전략에 따라 다양한 정보시스템을 디자인하고 그에 따른 데이터 관련 비용을 장, 단기적인 계획 하에서 분석 가능하므로, 도입 단계에서 숨어있는 데이터 관련 비용에 의해 발생할 수 있는 정보시스템 도입 실패에 대한 위험 부담을 사전에 방지할 수 있다. While outsourcing has become a basic strategy of the information system adoption, there is an emerging needs to analyze the gap between the required data and the existing data for the new system from an adopting company's perspective. In CRM adoption failure cases, the first reason is adopting company pay no attention to the data that will support investment and systems. So far, there is no attempt to consider data driven approach in information system adoption field. Hence, we propose Information System Adoption Model based on Data (ISAMD) and show how to use in real world by simulation. By using ISAMD, information system adoption decision maker can simulate the needed data and related cost with various information system alternatives in short term, and long term planning. ISAMD can prevent the possible threat of unexpected data cost in adopting new system at the adopting decision stage.

      • KCI우수등재

        이미지 데이터에 대한 비선형 분류 방법의 비교

        박규리,박창이 한국데이터정보과학회 2021 한국데이터정보과학회지 Vol.32 No.4

        Image classification is one of the most actively studied topics in machine learning. Image data generally has a two-dimensional or three-dimensional matrix structure, and vectorization is performed to apply traditional classification techniques such as support vector machine (SVM). However, vectorization may ignore the structural information provided by image data. Convolutional neural network (CNN) using structural information has been introduced as a remedy to the drawback, but neural networks including CNN generally require a lot of data. On the other hand, SVM shows stable classification performances even with a small number of samples, and extensions of SVM reflecting structural information such as support matrix machine (SMM) and kernel support matrix machine (KSMM) have been recently proposed. In this paper, we compare the predictive performances of SVM, SMM, KSMM, and CNN on image data with relatively small number of samples. 이미지 분류는 기계학습에서 가장 활발하게 연구되고 있는 주제 중 하나이다. 이미지 데이터는 일반적으로 2차원 혹은 3차원 행렬 구조를 가지고 있으며, 지지벡터기계 등 전통적인 분류 기법을 적용하기 위해 벡터화를 시행하게 된다. 하지만 벡터화는 이미지 데이터가 제공하는 구조적 정보를 무시할 수 있다. 구조적 정보를 이용하는 합성곱 신경망은 이러한 단점을 보완하기 위해 도입되었으나, 합성곱 신경망을 포함하는 신경망은 일반적으로 많은 데이터를 요구한다. 반면 지지벡터기계는 적은 수의 표본에서도 상대적으로 안정적인 분류 성능을 보일 뿐만 아니라 지지행렬기계 및 커널 지지행렬기계로 확장됨으로써 이미지 데이터의 구조적 정보도 반영할 수 있게 되었다. 본 논문에서는 표본의 개수가 상대적으로 적은 이미지 데이터에 대하여 비선형 분류 방법인 지지벡터기계, 커널 지지행렬기계, 그리고 합성곱 신경망의 예측 성능을 비교하고 선형 분류 방법이지만 이미지 데이터의 구조적 정보를 반영하는 지지행렬기계도 함께 비교한다.

      • KCI우수등재

        혼합정규분포를 가정한 조건부 상호정보의 준모수적 추정량을 이용한 고차원 자료에서의 변수선택

        안치경(Chikyung Ahn),김동욱(Donguk Kim) 한국데이터정보과학회 2018 한국데이터정보과학회지 Vol.29 No.6

        변수간의 비선형적인 연관성을 감지할 수 있는 상호정보 (mutual information)는 변수선택의 좋은 기준이 되지만 고차원 자료에서는 적용하기 쉽지 않아 많은 연구가 진행되어 왔다. Cai 등 (2009)은 일반적인 상호정보가 아닌 최대 2차원까지만 고려하여 추정하는 조건부 상호정보를 이용하여 추정의 어려움을 해결하였으며, 고차원자료에 SVM을 적용하기 위한 변수선택에서 기존의 필터링 방법과 SVM-RFE로 선택된 변수들보다 더 분류 성능이 뛰어난 변수들을 선택하는 것을 보였다. Ahn과 Kim (2014)은 조건부 상호정보의 추정에 대한 계산효율을 높이기 위해 설명변수간에는 모수적으로 분포가정을 하는 준모수적 조건부 상호정보 추정량을 제안하였다. 하지만 설명변수간에 정규분포라는 가정이 심하게 위배되면 분류성능이 매우 저하될 수 있는 단점이 있다. 본 연구에서는 설명변수의 분포를 혼합정규분포로 가정하여 조건부 상호정보를 가중치를 활용하여 준모수적인 방법으로 추정하는 방법을 제시하였다. 반응변수와 설명변수 간에는 모수적 분포를 가정하지 않으므로 비모수적 연관성을 측정하는 상호정보의 특징을 보존하며 설명변수간에는 모수적 분포가정을 하여 추정의 효율을 향상시킬 수 있다. 모의실험결과 혼합정규분포를 가정한 조건부 상호정보의 준모수적 추정법이 유의변수 선택능력에서 매우 우수하였다. We propose a method of estimating conditional mutual information by semiparametric method using mixed normal distribution assumption between explanatory variables. In order to maintain the advantage of mutual information that keeps the nonparametric relationship between the explanatory variable and the response variable, the mutual information between the explanatory variable and the response variable is estimated in a nonparametric manner. Furthermore, to improve the efficiency of mutual information estimation, the mutual information between the explanatory variables is to be estimated parametrically. Since the estimated density function is used as a weight for conditional mutual information estimation, the outliers with relatively small density estimate have little effect on the semi-parametric estimator of conditional mutual information. Experimental results show that the semi-parametric estimation method of conditional mutual information assuming mixed normal distribution have shown excellent performance in terms of significant variable selection.

      • KCI등재

        R을 활용한 조건부 가치 측정법: 정보 가치 측정 사례 연구

        정병준,박노진,Jung, Byung-Joon,Pak, Ro-Jin 한국데이터정보과학회 2011 한국데이터정보과학회지 Vol.22 No.6

        The development of information technology provides us with more useful information but it arose to protect such information from inappropriate users. In the course of analyzing and managing the risks associated with information, it should be needed to accurately measure the value of information. We try to consider the contingent valuation method for this purpose. The contingent valuation method which is used to assess the value of public goods or nonmarket goods makes an statistical estimation for the willingness-to-pay. We show with an example how we can estimate the value of information by calculating the amount we are willing to pay the value of information that exists on the information system. Calculation is carried out by using R. 정보기술의 발달은 인간에게 많은 유익한 정보를 쉽게 제공하고 있으나 그 유익한 정보를 부적절한 사용자로부터 보호할 필요가 생겼다. 정보와 관련된 위험을 분석 및 관리하는 과정에서 정보에 대한 가치를 정확히 측정해야 한다. 한 가지 방법으로 조건부 가치 측정법에 대하여 고찰하려 한다. 공공재 또는 비시장재의 가치를 평가하는 방법인 조건부 가치 측정법을 통하면 관심 대상의 가치에 대한 불용의액수를 통계인 방법으로 추정할 수 있다. 특별히, 지불 용의액에 대한 신뢰구간의 추정에 초점을 맞추어 보았다. 정보시스템에 존재하는 정보의 가치를 보전하기 위해 지불하고자 하는 금액으로부터 정보의 가치를 통계적으로 추정하는 방법을 R을 이용한 사례를 분석하여 소개한다.

      • KCI우수등재

        재중동포 가족 찾기 서신 데이터베이스 구축 및 토픽 모델링과 로컬 대리 분석을 적용한 서신 내용 분석

        김현희(Hyon Hee Kim),조진남(Jinnam Jo) 한국데이터정보과학회 2021 한국데이터정보과학회지 Vol.32 No.1

        본 연구에서는 1974년에서 2008년까지 진행된 KBS 한민족방송 가족 찾기 프로그램으로 발송된 재중동포 서신 8만 여통에 대하여 데이터베이스를 구축하고 서신의 내용을 분석하였다. 서신을 스캔하여 이미지 파일로 생성한 다음, 태그를 사용하여 서신 내용을 요약하여 서신 이미지를 저장하였다. 태그를 기반으로 검색이 가능하며 검색된 서신에 대한 발송지, 발송자, 발송일 정보와 태그를 저장하여 분석에 활용할 수 있도록 하였다. 데이터베이스 구축 시 서신의 주제를 분류하기 위해서 정치, 경제, 문화, 생활 등의 대분류를 정의하였으며, 각 대분류 내에서 구체적 내용을 파악하기 위해 토픽 모델링을 실시하였고 해당 주제에서 중요한 키워드를 찾기 위해서 나이브 베이즈 알고리즘으로 서신 분류 모델을 생성하고 설명가능 인공지능 기술의 하나인 로컬 대리 분석을 적용하여 해당 분야로 분류하게 된 핵심 키워드들을 추출하였다. 정치 분야의 서신 내용으로는 남북 관계, 한국 정부에 대한 요청 등의 주제를 찾아내었고, 경제 분야의 서신 내용으로는 물품 요청 및 국어사전, 일한사전 등과 같은 구체적인 요청 품목을 찾아내었다. 많은 빅데이터 연구가 다양한 학문 분야에서 융합 연구로 이루어지고 있는 반면, 인문학 분야에서 적용된 예는 드물다. 본 연구는 인문학 연구에도 빅데이터 분석에서 활용되는 다양한 분석 기법을 적용하여 성공적으로 결과를 도출할 수 있다는 것을 보여줌으로써 인문학 분야에서의 빅데이터 기반 연구가 의미가 있음을 보여준다. In this paper, we presented a correspondence database from ethnic Koreans living in China and content analysis using topic modeling and local surrogates. Scan image files were generated from correspondences and contents were summarized using tags. And then, image files were uploaded into the database. In addition, sender information such as name, location, dates, and subjects were inserted. Topic modeling was applied to specialized subjects such as politics, economy, society, and culture. Also, important keywords were extracted using the local surrogate analysis, one of the explainable artificial intelligence technology. In the subject of politics, the relationship between South Korea and North Korea and requests for improving the status of Korean living in China to Korean government were found. In the subject of economics, requests for daily necessity, dictionary, etc. were found. This paper shows that successful results can be derived from humanities research by applying various big data analysis techniques used in big data research.

      • KCI등재

        텍스트 마이닝을 활용한 영화흥행 예측 연구

        이상훈,조장식,강창완,최승배,Lee, Sanghun,Cho, Jangsik,Kang, Changwan,Choi, Seungbae 한국데이터정보과학회 2015 한국데이터정보과학회지 Vol.26 No.6

        최근 빅 데이터는 학계에서 키워드로 자리매김을 하고 있다. 빅 데이터의 유용성은 학계뿐만 아니라 정부, 지자체 그리고 기업체까지 파급되고 있고, 빅 데이터 속에서 유용한 정보를 도출해 내기 위해 노력하고 있다. 본 연구에서는 영화에 대한 리뷰를 가지고 텍스트 마이닝 (text mining)을 이용한 빅 데이터 분석을 수행한다. 본 연구의 목적은 포털 사이트 'D'사와 영화진흥위원회의 영화에 대한 리뷰 데이터, 그리고 고객들의 평점평균 (score)과 스크린 수 (screen number)를 설명변수로 사용하고, 영화 흥행 여부를 종속변수로 하여 로지스틱 회귀분석을 통한 영화 흥행 예측 모형을 제안하는 것이다. 분석결과, 본 연구에서 제안한 예측모형의 정분류율은 95.74%로 얻어졌다. Recently, big data is positioning as a keyword in the academic circles. And usefulness of big data is carried into government, a local public body and enterprise as well as academic circles. Also they are endeavoring to obtain useful information in big data. This research mainly deals with analyses of box office success or failure of films using text mining. For data, it used a portal site 'D' and film review data, grade point average and the number of screens gained from the Korean Film Commission. The purpose of this paper is to propose a model to predict whether a film is success or not using these data. As a result of analysis, the correct classification rate by the prediction model method proposed in this paper is obtained 95.74%.

      • KCI등재

        데이터 구조에 강건한 K 관리도의 관리 모수 결정

        박잉근,이성임,Park, Ingkeun,Lee, Sungim 한국데이터정보과학회 2015 한국데이터정보과학회지 Vol.26 No.6

        공정의 안정성을 평가하기 위해 사용되는 Shewhart 관리도 기법은 최근 다양한 분야에서 널리 응용되고 있지만, 품질 특성치에 대한 엄격한 확률분포를 가정한다. 하지만 현업에서 수집되고 있는 데이터의 확률분포는 알려진 경우가 많지 않으며, 다변량 데이터로 확장될수록 확률분포를 결정하는데 더 큰 어려움이 따른다. 이러한 문제점을 해결하기 위해 다양한 비모수 관리도 기법이 연구되었는데, 최근 연구되고 있는 비모수 관리도 기법 중 하나인 RBF (Radial Basis Function) 커널 기반의 SVDD (Support Vector Data Description) 관리도는 관리상태 하의 데이터 영역에 대한 경계를 결정함으로써 공정의 이상상태를 탐지하는 기법으로 K 관리도로 불리우며, 다양한 분야에서 적용되고 있다. 그런데 K 관리도를 적용하기 위해서는 관리도의 성능을 결정짓는 커널모수 등의 선택이 중요하며, 관리도를 작성하기 전에 미리 결정되어야 한다. 이를 위해 기존의 연구들은 격자 탐색법 등을 활용하여 모수를 결정하고 있지만, 선택 가능한 범위에 대한 반복적인 계산으로 최적값을 선택하고 있어 계산 비용이 커지고 또 시간 등의 문제로 실제 문제에 적용하기 어려운 점이 있다. 따라서 본 연구에서는 데이터의 구조에 따라 모의실험을 통해 선택 가능한 영역에서의 효율성을 비교 검토하고, 이를 바탕으로 쉽게 적용할 수 있는 새로운 모수 선택 방법을 제안하고자 한다. 이를 통해 데이터 구조에 대해 강건함을 보이는 모수의 선택과 K 관리도의 구성을 논의하고 실제 자료에 적용해 보았다. These days Shewhart control chart for evaluating stability of the process is widely used in various field. But it must follow strict assumption of distribution. In real-life problems, this assumption is often violated when many quality characteristics follow non-normal distribution. Moreover, it is more serious in multivariate quality characteristics. To overcome this problem, many researchers have studied the non-parametric control charts. Recently, SVDD (Support Vector Data Description) control chart based on RBF (Radial Basis Function) Kernel, which is called K-chart, determines description of data region on in-control process and is used in various field. But it is important to select kernel parameter or etc. in order to apply the K-chart and they must be predetermined. For this, many researchers use grid search for optimizing parameters. But it has some problems such as selecting search range, calculating cost and time, etc. In this paper, we research the efficiency of selecting parameter regions as data structure vary via simulation study and propose a new method for determining parameters so that it can be easily used and discuss a robust choice of parameters for various data structures. In addition, we apply it on the real example and evaluate its performance.

      • KCI우수등재

        빅데이터 기반 전력계통 배전설비 고장예측시스템 구축 및 최적 투자비 산출을 위한 선행활동 수행에 관한 연구

        임청원(Chung-won Lim),한상국(Sang-kook Han) 한국데이터정보과학회 2018 한국데이터정보과학회지 Vol.29 No.3

        최근 들어 신뢰성분석을 이용한 시설물의 유지보수를 수행하는 RCM이 모든 산업분야에서 활발히 진행되고 있으며, 특히 빅데이터 처리기술이 발전함에 따라 산업전반에 걸쳐 빅데이터를 이용한 서비스가 활성화되고 있다. 배전설비에 있어서도 RCM 및 빅데이터 기술을 적용한 관리를 시도하고 있으나 대부분의 배전설비에 대한 RCM은 열화에 의한 고장정보만을 고려하고 있다. 그러나 같은 종류의 장치라고 하더라도 사용환경이나 사용정도에 따라 고장정도는 많은 차이가 존재한다. 따라서 환경적인 요인을 고려한 RCM (reliability centered maintenance; 설비의 각 부품 단위별로 고장 해석 및 성향분석을 통해 부품의 교체시기를 사전에 판명, 교체함으로써 설비 보전비율의 극소화와 생산성 극대화를 추구하는 설비 보전 방식의 하나)을 수행하여야 최적의 유지보수 정책이 수립될 수 있다. 그러나 현재 국내 배전설비 유지보수에 빅데이터 기술을 적용하거나 RCM을 수행하기 위해서는 유지보수 및 고장 데이터 관리, 환경요인의 데이터화 등 우선적으로 해결되어야 할 사항들이 많다. 본 연구에서는 빅데이터를 이용한 최적의 배전설비 관리를 위해 선행되어야 할 사항들을 정리하고, 문제를 해결할 수 있는 방안을 연구함으로써 배전설비관리에 빅데이터 기술 및 RCM 기술을 적용한 최적의 관리 시스템을 구축할 수 있는 방안을 제시하고자 한다. Nowadays, RCM(Reliability Centered Maintenance), which means performing maintenance based on Reliability Analysis, is broadly applied to all over the industries. We also have seen an active utilization of big data in industries especially as advancements in big data processing technology is made. RCM and big data are also applicable to managing distribution facilities but are limited to fault resulted from deterioration only. However, as usage environment or usage level can cause different faults even from the same type of facilities, RCM must be performed in consideration of environmental factors to establish optimal maintenance plan. Currently, in case of domestic distribution facilities in Korea, there are issues to be resolved before applying RCM or big data such as maintenance and fault data system management, track record of environmental factors or more. This research studies the issues that must be settled in advance and the solutions to develop optimal distribution facility management system based on big data and RCM.

      • KCI우수등재

        건강보험청구자료와 의약품정보데이터베이스를 이용한 중환자실 약물상호작용 분석

        이현주(Hyun Joo Lee),윤단비(Dan-Bi Yoon),박소현(Sohyeon Park),정선영(Sun-Young Jung) 한국데이터정보과학회 2018 한국데이터정보과학회지 Vol.29 No.6

        약물상호작용은 두 개 이상의 약제를 함께 사용하면서 서로 영향을 미치는 것으로, 임상적으로 약효의 변화와 함께 약물이상반응을 초래할 가능성이 있다. 본 연구는 건강보험청구자료를 이용하여 중환자실에서 노인환자를 대상으로 마약성 진통제와 중환자실 다빈도사용 약제의 병용처방 현황 및 잠재적 약물상호작용을 파악하고자 하였다. 2016년 고령환자데이터셋과 의약품정보데이터베이스인 Micromedex를 분석에 사용하였다. 전체 대상자 1,327,455명 중 중환자실에서 마약성 진통제를 처방한 환자는 20,050명으로 평균 나이는 76.4세였고 중환자실 재원일수는 중앙값 3일이었다. 전체 환장 중 91.1%에서 병용처방이 이루어졌고, 환자당 병용처방 약물개수는 중앙값 3개 (범위, 0-25)이었다. 마약성 진통제와 약물상호작용이 있는 약물은 54.3%에서 처방되었다. 다변수 로지스틱 회귀모형으로 잠재적 약물상호작용 관련요인을 파악한 결과, 관련요인은 수술, 병용약물수, 연령, 응급식을 통한 입원이었다. A drug-drug interaction occurs when two or more drugs interact with each other; this can clinically result in adverse drug events with changes in drug effects. This study aimed to analyze prevalence of polypharmacy and potential drug-drug interactions (pDDI) with opioid analgesics in geriatric patients in the intensive care unit using claims data. We used the aged patients’ sample for 2016 and Micromedex as the drug information database in this analysis. Among 1,327,455 patients, we selected 20,050 patients who were prescribed opioids in the intensive care unit. Mean age was 76.4 years and median ICU stay was 3 days. Among the 20,050 patients, prevalence of coprescription was 91.1%; median number of drugs prescribed per patient was 3 (range, 0-25). The prevalence of pDDI between opioids and other drugs was 54.3%. Multiple logistic regression showed that pDDI was related to surgery, number of drugs prescribed, age, and admission through emergency room.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼