http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
강수연,전희정,김지혜,송종우,Kang, Suyeon,Jeon, Heejeong,Kim, Jihye,Song, Jongwoo 한국통계학회 2015 응용통계연구 Vol.28 No.5
최근 상업방송의 도입과 채널의 다양화로 국내 드라마 시장의 시청률 경쟁이 심화되었다. 이에 시청률에 대한 실증적인 연구의 필요성이 대두되고 있다. 본 연구의 목적은 다양한 데이터마이닝 기법을 이용하여 최근 방송시장의 변화를 고려한 국내 드라마 시청률 예측 모형을 제시하고 시청률에 유의한 영향을 미치는 변수들을 도출하는 데 있다. 모형 적합 시 선형회귀모형, LASSO 회귀모형, 랜덤 포레스트, 그래디언트 부스팅 등과 같은 다양한 분석 방법을 고려하였다. 이 때 드라마 방영 전 알 수 있는 기본 정보들만을 고려하여 드라마의 초반 시청률을 예측하는 모형을 적합한 후 방영 초기의 여론을 고려한 평균 시청률 예측 모형을 적합하였다. 그 결과 드라마 초반 시청률은 방송사, 방송시간, 드라마 방영 이전 드라마 관련 검색량 등 드라마의 구조적 요인과 임소문 효과의 영향을 크게 받으며, 평균 시청률은 드라마 초반 시청률과 드라마 방영 이후 드라마 관련 검색량 등 방영 초기의 여론에 큰 영향을 받는 것으로 나타났다. Audience rating competition in the domestic drama market has increased recently due to the introduction of commercial broadcasting and diversification of channels. There is now a need for thorough studies and analysis on audience rating. Especially, a drama rating is an important measure to estimate advertisement costs for producers and advertisers. In this paper, we study the drama rating prediction models using various data mining techniques such as linear regression, LASSO regression, random forest, and gradient boosting. The analysis results show that initial drama ratings are affected by structural elements such as broadcasting station and broadcasting time. Average drama ratings are also influenced by earlier public opinion such as the number of internet searches about the drama.
입력 패턴 학습을 통해 터치 영역 최적화를 지원하는 가상키보드의 사용성 평가
강수연(Suyeon Kang),김지영(Jiyoung Kim),박민희(Minhee Park),임호정(Hojeong Im),김헌(Huhn Kim) 대한인간공학회 2019 大韓人間工學會誌 Vol.38 No.6
Objective: The purpose of this study was to verify the usability of two typical smartphone virtual keyboards that optimize the touch area of each key by learning touch input patterns. Background: Virtual keyboards have many limitations due to their small size and lack of tactile feedback. Therefore, many studies have been conducted to improve the usability of the virtual keyboard. Among them, the verification on the usefulness of a virtual keyboard, with which optimizes the user’s touch area by learning his or her input pattern, is still insufficient. Method: In this study, the participants performed the task of inputting presented sentences using three virtual keyboards (Nota, AL, and Smartboard) that provide different levels of touch optimization support. Through the experiment, sentence matching ratio and typing time data were collected, and subjective satisfaction were also rated after the typing task was finished. Results: There were significant differences in the sentence matching ratio, typing time, and subjective satisfaction between Nota, AL and Smartboard. The Nota keyboard showed significantly better performances than the Smartboard in all respects. However, the AL keyboard showed no significant difference in sentence matching ratio and typing time compared to the Smartboard without such optimization function. Rather, the AL keyboard was less satisfied than the Smartboard. Conclusion: Automatically optimizing the touch area based on users" input pattern was more useful to the users than predicting, visually expanding and highlighting the keys that will be entered next. Application: In the future, smart phone manufacturers or virtual keyboard makers can use this result as a reference when they want to provide a similar function for touch area optimization.
김동아,강수연,송종우,Kim, Dongah,Kang, Suyeon,Song, Jongwoo 한국통계학회 2015 응용통계연구 Vol.28 No.3
일반적인 2집단 분류(2-class classification)의 경우, 두 집단의 비율이 크게 차이나지 않는 경우가 많다. 본 논문에서는 두 집단의 비율이 크게 차이나는 불균형 데이터(unbalanced data)의 분류 문제에 대해서 다루고자 한다. 불균형 데이터의 분류방법은 균형이 맞는 데이터(balanced data)의 경우보다 분류하기 어려운 경우가 많다. 이런 자료에서 보통의 분류모형을 적용하게 되면 많은 경우에 대부분의 관측치가 큰 집단으로 분류 되는 경우가 많은데 실질적인 어플리케이션에서는 이런 오분류가 손해가 더 큰 경우가 대부분이다. 우리는 sampling 기법을 이용하여 다양한 분류 방법론의 성능을 비교 분석 하였다. 또한 비대칭 손실(asymmetric loss)을 가정한 경우에 어떤 방법론이 가장 작은 loss를 생성하는 지를 비교하였다. 성능 비교를 위해서는 오분류율(misclassification rate), G-mean, ROC, 그리고 AUC(Area under the curve) 등을 이용하였다. We study a classification problem of significant differences in the proportion of two groups known as the unbalanced classification problem. It is usually more difficult to classify classes accurately in unbalanced data than balanced data. Most observations are likely to be classified to the bigger group if we apply classification methods to the unbalanced data because it can minimize the misclassification loss. However, this smaller group is misclassified as the larger group problem that can cause a bigger loss in most real applications. We compare several classification methods for the unbalanced data using sampling techniques (up and down sampling). We also check the total loss of different classification methods when the asymmetric loss is applied to simulated and real data. We use the misclassification rate, G-mean, ROC and AUC (area under the curve) for the performance comparison.
Cheong Seek Kim(김정식),SuYeon Kang(강수연),Ji Won Rhim(임지원),Soo-Gil Park(박수길) 한국고분자학회 2015 폴리머 Vol.39 No.2
폴리페닐렌옥사이드(PPO)와 폴리에테르이미드(PEI)에 대해 각각 설폰화(SPPO) 및 아민화(APEI) 반응이 이루어졌다. SPPO와 APEI의 특성평가를 위하여 FTIR, 열무게분석(TGA), 팽윤도, 이온교환용량(IEC) 및 이온전도도 등에 대한 측정을 하였다. 표면불소화를 실시한 후 표면불소화된 SPPO와 APEI 막과 불소화하지 않은 막과의 차이점을 알아보기 위하여 위에서 실시한 특성평가를 다시 수행하여 비교하였다. SPPO막의 이온교환용량을 고정시킨 후 APEI의 이온교환용량을 변경하면서 전체적으로 3개 유형의 바이폴라막을 제조하였고, 이를 차염소산 발생을 위하여 여러 전류밀도 하에서 저농도 및 고농도 소금용액에 적용하였다. 표면불소화된 막의 차염소산 생성 농도는 APEI의 이온교환용량에 의존하며 80 mA/m<SUP>2</SUP>에서 차염소산 농도 491-692 ppm의 결과를 얻었으며, 5 mA/m<SUP>2</SUP>에서 18-28 ppm의 차염소산 농도를 나타내었으며 내구성이 매우 상승된 것을 보여 주었다. Poly(phenylene oxide) (PPO) and polyether imide (PEI) were sulfonated and aminated to create sulfonated poly(phenylene oxide) (SPPO) and aminated polyether imide (APEI), respectively. Characterization of the SPPO and APEI were performed via measurements of FTIR, thermogravimetry (TGA), swelling degree, ion exchange capacity (IEC), and ion conductivity. Next, the surfaces of these membranes were modified by surface fluorination at room temperature. The surface fluorinated SPPO and APEI membranes underwent characterization again for the mentioned measurements to determine any differences. The 3 types of bi-polar membranes were prepared by varying the IEC of the APEI at a fixed SPPO IEC value, which were applied to the low and high NaCl concentration of feed solution at the different current density, respectively. The hypochlorite concentration derived from the surface fluorinated membranes was dependent on the IEC of the APEI and ranged from 491 to 692 ppm at 80 mA/m<SUP>2</SUP>. At low current density of 5 m A/m<SUP>2</SUP>, the hypochlorite concentrations ranged from 18 to 28 ppm for the 4 hrs surface fluorinated membranes and their durability increased greatly.
당뇨병 발생 예측을 위한 다층 스태킹 앙상블 모델 구축 기법
성아영 ( Ayeong Seong ),윤소현 ( Sohyun Yun ),강수연 ( Suyeon Kang ),김건우 ( Gun-woo Kim ) 한국정보처리학회 2023 한국정보처리학회 학술대회논문집 Vol.30 No.2
최근 현대인의 식습관 및 고령화로 인해 당뇨병 환자의 수가 연간 증가하고 있다. 따라서 현재는 아직 당뇨병이 발생하지 않았더라도 미래에 발생할 가능성 예측의 중요성이 커지고 있다. 기존의 당뇨병 발생 여부 진단 연구는 회귀 분석과 같은 단일 모델을 사용하여 수행된다. 그러나 당뇨병에 영향을 미치는 변수들은 복잡하게 얽혀있어 단일 모델만으로는 패턴을 충분히 학습하기 어렵다. 본 논문에서는 데이터에 적합하게 자동으로 다층 스태킹 앙상블 모델을 구성하는 알고리즘을 이용한 다층 스태킹 앙상블 모델을 제안한다. 제안하는 방법은 성능이 높은 모델들을 기준으로 층을 쌓으며 모델을 구성하며 실험 결과 다른 자동 기계학습 라이브러리와 비교해 F1 score 기준으로 최대 12.89%p의 성능 향상을 보였다.