        생의학 학술 문헌의 불확실성 기반 지식 동향 분석에 관한 연구

        허고은,송민,Heo, Go Eun,Song, Min 한국정보관리학회 2019 정보관리학회지 Vol.36 No.2

        불확실성이란 정보의 합의나 현존하는 지식 부족으로 인해 명제의 지식이 불완전한 상태를 의미한다. 과학적 지식의 불확실성을 연구하는 학술문헌의 양은 시간이 흐름에 따라 기하급수적으로 증가하고 있으며, 이에 따라 새로운 지식이 발견되고 연구가 발전하고 있다. 이처럼 시간의 흐름은 지식의 불확실성의 패턴을 발견하는데 중요한 요인이 될 수 있음에도 불구하고 기존의 연구들은 불확실성 단어의 단순 출현 빈도를 기반으로 특정 학문 영역에서 불확실성의 특성을 파악해왔다. 따라서, 본 연구에서는 구축한 불확실성 단어를 생의학 영역의 불확실성 연구에 적용하여 시간의 흐름에 따른 불확실성의 변화와 패턴을 파악하고자 한다. 시간의 흐름에 따른 생의학 지식의 패턴을 분석하기 위해 대표 개체 페어, 동사 유형, 대표 개체의 패턴을 살펴보았으며 선형회귀 분석을 통해 유의성 검증을 수행했다. 개체 페어 분석에서는 17건 중 7건의 개체 페어가 유의하게 감소하는 패턴을 보였다. 10개의 대표적인 동사 유형은 모두 시간이 흐름에 따라 유의하게 감소했다. 대표 개체의 연도별 상대적 중요도 분석에서는 유의하게 상승과 하강 패턴을 보이는 개체들의 불확실성 증감을 분석했다. Uncertainty means incomplete stages of knowledge of propositions due to the lack of consensus of information and existing knowledge. As the amount of academic literature increases exponentially over time, new knowledge is discovered as research develops. Although the flow of time may be an important factor to identify patterns of uncertainty in scientific knowledge, existing studies have only identified the nature of uncertainty based on the frequency in a particular discipline, and they did not take into consideration of the flow of time. Therefore, in this study, we identify and analyze the uncertainty words that indicate uncertainty in the scientific literature and investigate the stream of knowledge. We examine the pattern of biomedical knowledge such as representative entity pairs, predicate types, and entities over time. We also perform the significance testing using linear regression analysis. Seven pairs out of 17 entity pairs show the significant decrease pattern statistically and all 10 representative predicates decrease significantly over time. We analyze the relative importance of representative entities by year and identify entities that display a significant rising and falling pattern.

      • KCI등재

        지적장애인의 의미론적 언어 특성에 관한 국내 연구동향 분석

        허고은(Heo, Go-eun),이은주(Lee, Eun-ju) 단국대학교 특수교육연구소 2020 특수교육논총 Vol.36 No.3

        연구목적: 본 연구는 지적장애인의 의미론적 언어 특성에 관한 최근 연구의 동향을 종합․분석하여 실질적인 임상현장의 요구를 확인하고 나아가 지적장애인의 의미론적 능력 향상을 위한 보다 유의미한 향후 연구 방향에 대해 논의하고자 하였다. 연구방법: 선정 기준에 따라 2010년부터 2020년까지 국내 학술지에 발표된 논문 31편을 최종 선정하였으며, 이를 발표연도, 연구 대상, 연구 목적, 종속변인에 따라 분석하였다. 또한 의미론 영역은 크게 ‘어휘, 비유언어, 유추추론, 단어정의, 정보처리’의 다섯 영역으로 구분하여 살펴보았다. 연구결과: 분석 결과, 다섯 가지 의미론 영역 중 어휘와 관련된 연구가 모든 연도에서 가장 많았고 꾸준히 연구되고 있었다. 연구 대상은 학령기가 가장 많았으며 경도 수준의 지적장애인이 가장 많았고, 대상자 집단 구성 시 지적장애인만을 포함한 연구가 많았다. 연구목적은 비교․특성연구가 중재연구보다 많았으며, 종속변인은 어휘, 비유언어, 유추추론, 정보처리, 단어정의 순으로 많은 연구가 발표되었다. 영역별 하위 범주를 살펴보면, 어휘는 수용․표현어휘력 연구가 많았고, 비유언어는 은유연구가 많았으며, 유추추론에서는 단어유추 연구가, 정보처리에서는 어휘인출 특성 연구가 많았다. 결론: 분석 결과를 토대로 향후 연구 방향에 대한 제언은 다음과 같다. 첫째, 지적장애인의 의미론적 능력 향상을 위한 보다 다양한 연구의 시도가 필요하다. 둘째, 지적장애인의 효과적인 어휘 중재를 위한 생태학적 어휘목록 개발이 필요하다. 셋째, 지적장애인의 의미론 능력 향상을 위한 다양한 디지털 기기의 적용 연구가 필요하다. 넷째, 실제 임상 현장의 특성을 반영하여 중등도 이상의 지적장애인을 대상으로 한 연구가 필요하다. Purpose: This study analyzed trends in research on the semantic language characteristics of people with intellectual disabilities in Korea. Method: Thirty-one papers, published in Korean academic journals from 2010 to 2020 were analyzed; based on their participants, purposes, and dependent variables. Results: Continuous research was conducted each year on the subtopic of semantics. In terms of the participants, most of the papers focused on school-age children and people with mild intellectual disabilities. Also, there were many papers involving only people with intellectual disabilities in groups. As for the purpose of the studies, there were more comparative and characteristics studies than intervention studies. In terms of the dependent variables, many studies were conducted regarding the order of words, figurative language, analogical reasoning, information processing, and word definition area. Conclusion: The analysis of these research trends suggested the current requirements in clinical settings. Directions for future research to improve the semantic abilities of people with intellectual disabilities were discussed.

      • 비음수행렬 인수분해를 적용한 효율적인 텍스트 문서 학습

        허고은(Go-Eun Heo),정용규(Yong-Gyu Jung) 한국정보과학회 2009 한국정보과학회 학술발표논문집 Vol.36 No.2C

        텍스트 데이터에 대하여 단어 출현 횟수 및 주제어를 검출하는 문서 학습의 방법으로 유사한 대상을 그룹화 시키는 군집화의 방법이나 조건부 확률을 통하여 학습을 이루어내는 베이지안 분류기 등 기존의 여러 방법들이 연구되었고 제안되었다. 하지만 이러한 기존의 방법들은 베이지안 분류기 같은 경우 분류기를 학습시키기 위하여 사전에 분류를 미리 해야 한다는 번거로움이 존재하며 추가적으로 개발자의 주관적인 판단이 개입되어 좀 더 명확하고 효율적인 데이터를 추출해 내기가 어렵다. 또한 제한적인 영역에 한해서만 적용가능하기 때문에 점점 복잡하고 대용량화 되어가는 텍스트 및 웹 문서에 적용하기가 힘들다. 따라서 본 논문에서는 다양한 분야의 실시간 뉴스기사 URL 목록을 포함한 데이터 셋을 가지고 비음수 행렬 인수분해를 적용해본다. 이를 통해 나타나는 단어와 기사의 제목은 유사도를 측정하여 수치적으로 확인이 가능하며 더 나아가 문서의 특징을 효율적으로 추출하여 문서의 성격을 또렷하게 확인 가능하다는 것을 알 수 있었다.

      • KCI등재

        리뷰 텍스트 기반 감성 분석과 네트워크 분석에 관한 연구

        김유미,허고은,Kim, Yumi,Heo, Go Eun 한국문헌정보학회 2021 한국문헌정보학회지 Vol.55 No.3

        As review text contains the experience and opinions of the customers, analyzing review text helps to understand the subject. Existing studies either only used sentiment analysis on online restaurant reviews to identify the customers' assessment on different features of the restaurant or network analysis to figure out the customers' preference. In this study, we conducted both sentiment analysis and network analysis on the review text of the restaurants with high star ratings and those with low star ratings. We compared the review text of the two groups to distinguish the difference of the two and identify what makes great restaurants great. 리뷰 텍스트는 이용자들의 경험과 의견이 구체적으로 담겨있어 이를 분석하면 리뷰 대상에 대한 많은 내용을 파악할 수 있다. 이에 따라 리뷰 텍스트에 대해 감성 분석을 진행하여 음식점의 각 요인에 대한 이용자의 평가 등을 파악하는 연구, 네트워크 분석을 통한 이용자들의 선호를 파악하는 연구들이 진행되어왔다. 본 연구에서는 음식점 리뷰 텍스트의 별점 기반 만족도가 높은 음식점과 낮은 음식점을 분석대상으로 선정하여 감성 분석과 네트워크 분석을 통합적으로 수행하였다. 서로 다른 두 집단의 리뷰 텍스트에서 나타나는 차이로 음식점의 특성을 파악하여 좋은 음식점의 기준과 음식점 만족도에 영향을 미치는 주요인을 확인하고자 하였다.

      • KCI등재

        토픽 모델링 기반 비대면 강의평 분석 및 딥러닝 분류 모델 개발

        한지영,허고은,Han, Ji Yeong,Heo, Go Eun 한국문헌정보학회 2021 한국문헌정보학회지 Vol.55 No.4

        2020년 신종 코로나바이러스 감염증(코로나19)으로 인한 전 세계적인 팬데믹으로 교육 현장에도 큰 변화가 있었다. 대학에서는 보조 교육 수단으로 생각했던 원격수업을 전면 도입하였고 비대면 수업이 일상화되어 교수자와 학생들은 새로운 교육환경에 적응하기 위해 큰 노력을 기울이고 있다. 이러한 변화 속에서 비대면 강의의 질적 향상을 위하여 강의 만족도 영향요인에 관한 연구가 필요하다. 본 연구는 코로나 전과 후로 변화된 대학 강의 만족도 영향요인을 파악하기 위해 빅데이터를 활용한 새로운 방법론을 제시하고자 한다. 토픽 모델링을 활용하여 코로나 전과 후의 강의평을 분석하고 이를 통해 강의 만족도 영향요인을 파악하여 대학교육이 나아가야 할 방향성을 제언하였다. 또한, 딥러닝 언어 모델인 KoBERT를 기반으로 0.84의 F1-score를 보이는 토픽 분류 모델을 구축함으로써 강의의 만족, 불만족 요인을 다각도로 파악할 수 있으며 이를 통해 강의 만족도의 지속적인 질적 향상에 기여할 수 있다. Due to the global pandemic caused by COVID-19 in 2020, there have been major changes in the education sites. Universities have fully introduced remote learning, which was considered as an auxiliary education, and non-face-to-face classes have become commonplace, and professors and students are making great efforts to adapt to the new educational environment. In order to improve the quality of non-face-to-face lectures amid these changes, it is necessary to study the factors affecting lecture satisfaction. Therefore, This paper presents a new methodology using big data to identify the factors affecting university lecture satisfaction changed before and after COVID-19. We use Topic Modeling method to analyze lecture reviews before and after COVID-19, and identify factors affecting lecture satisfaction. Through this, we suggest the direction for university education to move forward. In addition, we can identify the factors of satisfaction and dissatisfaction of lectures from multiangle by establishing a topic classification model with an F1-score of 0.84 based on KoBERT, a deep learning language model, and further contribute to continuous qualitative improvement of lecture satisfaction.

      • KCI등재

        텍스트마이닝과 주경로 분석을 이용한 미발견 공공 지식 추론 - 췌장암 유전자-단백질 유발사슬의 경우 -

        안혜림,송민,허고은,Ahn, Hyerim,Song, Min,Heo, Go Eun 한국비블리아학회 2015 한국비블리아학회지 Vol.26 No.1

        This study aims to infer the gene-protein 'brings_about' chains of pancreatic cancer which were referred to in the pancreatic cancer related researches by constructing the gene-protein interaction network of pancreatic cancer. The chains can help us uncover publicly unknown knowledge that would develop as empirical studies for investigating the cause of pancreatic cancer. In this study, we applied a novel approach that grafts text mining and the main path analysis into Swanson's ABC model for expanding intermediate concepts to multi-levels and extracting the most significant path. We carried out text mining analysis on the full texts of the pancreatic cancer research papers published during the last ten-year period and extracted the gene-protein entities and relations. The 'brings_about' network was established with bio relations represented by bio verbs. We also applied main path analysis to the network. We found the main direct 'brings_about' path of pancreatic cancer which includes 14 nodes and 13 arcs. 9 arcs were confirmed as the actual relations emerged on the related researches while the other 4 arcs were arisen in the network transformation process for main path analysis. We believe that our approach to combining text mining analysis with main path analysis can be a useful tool for inferring undiscovered knowledge in the situation where either a starting or an ending point is unknown. 본 연구에서는 췌장암의 유전자-단백질 상호작용 네트워크를 구성하고, 관련 연구에서 주요하게 언급되는 유전자-단백질의 유발관계 사슬을 파악함으로써, 췌장암의 원인을 규명하는 실증적인 연구로 이어질 수 있는 미발견 공공 지식을 제공하려 하였다. 이를 위하여 텍스트마이닝과 주경로 분석을 Swanson의 ABC 모델에 적용해 중간 개념인 B를 방향성을 가진 다단계 모델로 확장하고 가장 의미 있는 경로를 도출하였다. 본 연구의 주제가 된 췌장암의 사례처럼 시작점과 끝점조차 한정할 수 없는 미발견 공공 지식 추론에서 주경로 분석은 유용한 도구가 될 수 있을 것이다.

      • 하비갑개 수술 후 비강 모델 내의 세부 유동장 대한 실험 및 수치해석적 연구

        장지원(Ji-Won Chang),허고은(Go Eun Heo),김성균(Sung Kyun Kim) 대한기계학회 2011 대한기계학회 춘추학술대회 Vol.2011 No.10

        In addition to respiration, three other major physiological functions of nose can be described as air-conditioning, filtering and smelling. Detailed knowledge of airflow characteristics in nasal cavities is essential to understanding of the physiological and pathological aspects of nasal breathing. In our laboratory, a series of experimental investigations have been conducted on the airflow in normal and abnormal nasal cavity models by means of PIV under both constant and periodic flow conditions. In this work, more specifically experimental and numerical results on the surgically modified inferior turbinate model were presented. With the high resolution CT data and a careful treatment of the model surface under the ENT doctor’s advice yielded quite sophisticated cavity models for the PIV experiment. Physiological nature of the airflow was discussed in terms of velocity distributions and vortical structures for inspirational and expiration nasal periods. Since the inferior turbinate and middle turbinate are key determinants of nasal airflow, the turbinectomy obviously altered the main stream direction: although the mainstream shifted upward for middle turbinectomy, it shifted downward for inferior turbinectomy. This phenomenon may cause local changes in physiological function and the flow resistance.

