http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
이범주(Bum Ju Lee) 대한전기학회 2021 대한전기학회 학술대회 논문집 Vol.2021 No.10
심혈관질환은 전 세계적으로 주요 사망원인들 중 하나이다. 본 연구의 목적은 심혈관질환 위험요인들이 도시/농촌간에서 통계적 차이성이 있는지에 대한 분석결과를 밝히고자 한다. 본 연구에서는 질병관리청으로부터 공개데이터로 제공되는 국민건강영양조사 제 7기 2018년도 데이터를 이용하였고, 데이터 분석은 이진로지스틱회귀분석(binary logistic regression)을 이용하여 수행하였다. 심혈관질환 위험요인 변수들 중에서 나이, systolic BP, height, glucose, HbA1c, waist circumference, body mass index, cholesetrol, HDL cholesterol, triglyceride 변수는 crude 분석결과에서 도시/농촌간 매우 높은 유의성이 나타났다. 그러나 나이, 성별, 수입정도, 교육정도, 직업, 결혼유무의 교란변수들을 통제한 보정분석에서는 height와 BMI를 제외한 모든 변수들은 모두 통계적 유의성이 사라졌다. 이러한 연구 결과는 향후 대중보건 및 역학 분야에서 기초정보로 활용될 수 있을 것으로 예측된다.
머신러닝 기반 사회인구학적 특징을 이용한 고혈압 예측모델
이범주 ( Bum Ju Lee ) 한국정보처리학회 2021 정보처리학회논문지. 소프트웨어 및 데이터 공학 Vol.10 No.11
최근 전 세계적으로 인공지능과 머신러닝을 기반으로 임상정보를 활용한 다양한 고혈압 식별 및 예측 모델이 개발되고 있다. 그러나 고혈압 관련 모델에 대한 대부분의 선행연구는 침습적 및 고가의 분석비용을 통한 변수들이 대부분 사용되었고, 인종과 국가의 특징에 대한 고려가 충분히 제시되지 않았다. 따라서 이 연구의 목적은 일반적인 사회인구 통계학적 변수만을 사용하여 쉽게 이해할 수 있는 한국인 성인 고혈압 예측 모델을 제시하는 것이다. 이 연구에서 사용된 데이터는 질병관리청 국민건강영양조사 (2018년)를 이용하였다. 남성에서, wrapper-based feature subset selection 메소드와 naive Bayes를 이용한 모델이 가장 높은 예측 성능 (ROC = 0.790, kappa = 0.396)을 보였다. 여성의 경우, correlation-based feature subset selection 메소드와 naive Bayes를 사용한 모델이 가장 높은 예측 성능(ROC = 0.850, kappa = 0.495)을 나타내었다. 또한 모든 모델들에서 사회인구 통계학적 변수들만을 이용한 고혈압의 예측 성능이 남성보다 여성에게서 더 높게 나타나는 것을 발견하였다. 본 연구의 결과인 machine learning 기반 고혈압 예측 모델은 한국인에 대한 단순한 사회인구학적 특성만을 사용하였기 때문에 향후 공중 보건 및 역학 분야에서 쉽게 사용될 수 있을 것으로 예상된다. Recently, there is a trend of developing various identification and prediction models for hypertension using clinical information based on artificial intelligence and machine learning around the world. However, most previous studies on identification or prediction models of hypertension lack the consideration of the ideas of non-invasive and cost-effective variables, race, region, and countries. Therefore, the objective of this study is to present hypertension prediction model that is easily understood using only general and simple sociodemographic variables. Data used in this study was based on the Korea National Health and Nutrition Examination Survey (2018). In men, the model using the naive Bayes with the wrapper-based feature subset selection method showed the highest predictive performance (ROC = 0.790, kappa = 0.396). In women, the model using the naive Bayes with correlation-based feature subset selection method showed the strongest predictive performance (ROC = 0.850, kappa = 0.495). We found that the predictive performance of hypertension based on only sociodemographic variables was higher in women than in men. We think that our models based on machine leaning may be readily used in the field of public health and epidemiology in the future because of the use of simple sociodemographic characteristics.