RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        Generalized Lasso를 이용한 공간 군집 기법

        송은정,최호식,황승식,이우주,Song, Eunjung,Choi, Hosik,Hwang, Seungsik,Lee, Woojoo 한국통계학회 2014 응용통계연구 Vol.27 No.4

        In this paper, we propose a penalized likelihood method to detect local spatial clusters associated with disease. The key computational algorithm is based on genlasso by Tibshirani and Taylor (2011). The proposed method has two main advantages over Kulldorff's method which is popoular to detect local spatial clusters. First, it is not needed to specify a proper cluster size a priori. Second, any type of covariate can be incorporated and, it is possible to find local spatial clusters adjusted for some demographic variables. We illustrate our proposed method using tuberculosis data from Seoul. 본 논문에서는 질병과 연관성을 갖는 국소 공간 군집을 검출할 수 있는 벌칙 가능도 방법을 제안한다. 핵심적인 계산 알고리즘은 Tibshirani와 Taylor (2011)에 의해 제안된 일반화된 라소(generalized lasso)에 기반한다. 제안된 방법은 현재 널리 사용되고 있는 국소 공간 군집 방법인 Kulldorff의 기법에 비해 두가지 주요 장점을 가지고 있다. 첫째로, 제안된 방법은 사전에 군집의 크기를 미리 결정해 줄 필요가 없다. 둘째로, 임의의 설명변수를 공간 군집 탐색 기법에 고려할 수 있기 때문에 인구학적인 변수를 보정하였을 때 나타나는 국소 공간 군집을 찾는 것이 가능하다. 우리는 제안된 방법을 서울시 결핵 자료를 사용하여 설명한다.

      • KCI등재

        단순 베이즈 분류에서의 범주형 변수의 선택

        김민선,최호식,박창이,Kim, Min-Sun,Choi, Hosik,Park, Changyi 한국통계학회 2015 응용통계연구 Vol.28 No.3

        단순 베이즈 분류($Na{\ddot{i}}ve$ Bayes classification)는 출력변수가 주어졌을 때 입력변수들이 조건부 독립이라는 가정에 기반한다. 단순 베이즈 가정은 비현실적이지만 고차원의 확률 추정 문제를 일련의 일차원 확률 추정 문제로 단순화 시킨다는 장점이 있으며, 특히 스팸 메일 필터링, 추천 시스템(recommendation system) 등 방대한 데이터를 다루는 분야야에서 흔히 사용된다. 본 논문에서는 입력변수와 출력변수간의 카이제곱 통계량에 기반한 변수선택법을 제안한다. 이 방법은 단순 베이즈 분류의 장점인 데이터 처리 및 계산의 단순성을 유지하면서도 설명력이 있는 변수를 선택할 수 있으며 SNP(single nucleotide polymorphism)에 의한 질병의 분류 등의 초고차원 혹은 빅데이터에서 유용할 것으로 기대된다. $Na{\ddot{i}}ve$ Bayes Classification is based on input variables that are a conditionally independent given output variable. The $Na{\ddot{i}}ve$ Bayes assumption is unrealistic but simplifies the problem of high dimensional joint probability estimation into a series of univariate probability estimations. Thus $Na{\ddot{i}}ve$ Bayes classier is often adopted in the analysis of massive data sets such as in spam e-mail filtering and recommendation systems. In this paper, we propose a variable selection method based on ${\chi}^2$ statistic on input and output variables. The proposed method retains the simplicity of $Na{\ddot{i}}ve$ Bayes classier in terms of data processing and computation; however, it can select relevant variables. It is expected that our method can be useful in classification problems for ultra-high dimensional or big data such as the classification of diseases based on single nucleotide polymorphisms(SNPs).

      • KCI등재

        동형암호를 활용한 앙상블학습방법의 추론

        정재경(Jaekyeong Jung),이종영(Jongyoung Lee),신성철(ShungChul Shin),이성일(Sungil Lee),최호식(Hosik Choi) 한국자료분석학회 2023 Journal of the Korean Data Analysis Society Vol.25 No.5

        데이터와 관련된 법안이 최근 개정됨에 따라 초 개인화 서비스를 위한 빅데이터 분석이 활발히 이루어지고 있다. 초 개인화 서비스는 대규모 데이터 통합, 외부 데이터와의 결합 등의 기술을 필요로 하지만, 동시에 민감한 개인정보 유출로 인한 개인 및 기업의 피해와 이로 인한 불필요한 사회적 손실에 대한 우려로 인한 사용상의 한계성도 내재하고 있다. 이와 같은 보안위험을 줄이기 위한 여러 방안 중 개인정보가 보호되는 동형암호(homomorphic encryption) 기술을 고려할 수 있다. 특히, 동형암호는 데이터 결합과 분석과정에서 개인정보 유출을 원천적으로 차단함과 더불어 원본 데이터의 정보를 보존할 수 있는 특징을 가지고 있다. 본 연구에서는 실제 금융 분야의 민원자료에 동형암호를 활용한 앙상블학습방법(ensemble method)의 추론을 수행하는 알고리즘을 개발 및 적용하여 통상적인 평문(plaintext)에서 도출한 random forest와 XGBoost의 스코어와 암호문(ciphertext)에서의 두 방법을 통해 산출한 스코어의 값이 일치함을 보이고자 한다. 실증결과로, 약 0.4초의 단위 추론 계산시간을 달성하여 트리구조에 기반한 앙상블학습방법의 활용 가능성을 확인할 수 있었다. According to the recent amendment of data-related bills, active efforts are being made to conduct big data analysis for hyper-personalization services. Hyper-personalization services involve several data integration, including external data. However, it also inherently possesses limitations in usage due to concerns about private information leaks, which can lead to damages to individuals and businesses and unnecessary societal losses. One approach to mitigate such security risks is to use homomorphic encryption, which protects private information. In particular, homomorphic encryption fundamentally prevents private information leakage during data integration and analysis processes and retains original data. In this study, we develop an algorithm for performing inference using an ensemble learning method with homomorphic encryption and apply it to real financial complaint data. We demonstrate the equivalence between scores obtained from random forest and XGBoost in plaintext and those derived from the homomorphic ciphertext. Empirical results show that the algorithm achieves inference computation times in approximately 0.4 seconds, confirming the potential utility of the tree-based ensemble learning method.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼