http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
영한 기계 번역 품사 집합과 펜트리뱅크 코퍼스 품사 집합간의 품사 대응
이성욱(Songwook Lee),이공주(Kong Joo Lee),서정연(Jungyun Seo) 한국정보과학회 1999 한국정보과학회 학술발표논문집 Vol.26 No.2Ⅱ
펜트리뱅크 코퍼스를 기계 번역에서 품사 태깅의 통계 정보 추출에 이용하기 위해서는 펜트리뱅크 코퍼스의 품사 집합과 기계 번역의 품사 집합의 품사 대응이 필요하다. 본 연구는 기계 번역의 품사 태그 집합과 펜트리뱅크의 48개의 품사 태그를 서로 적절히 대응하여 펜트리뱅크 코퍼스의 통계 정보를 이용하는 품사 태깅 시스템을 구축하는데 발생하는 문제점과 그 해결 방안을 제안한다.
이성욱(Songwook Lee),서정연(Jungyun Seo) 한국정보과학회 2005 정보과학회논문지 : 소프트웨어 및 응용 Vol.32 No.10
This study aims to identify grammatical relations (GRs) in Korean sentences. The key task is to find the GRs in sentences in terms of such GR categories as subject, object, and adverbial. To overcome this problem, we are faced with the many ambiguities. We propose a statistical model, which resolves the grammatical relational ambiguity first, and then finds correct noun phrases (NPs) arguments of given verb phrases (VP) by using the probabilities of the GRs given NPs and VPs in sentences. The proposed model uses the characteristics of the Korean language such as distance, no-crossing and case property. We attempt to estimate the probabilities of GR given an NP and a VP with Support Vector Machines (SVM) classifiers. Through an experiment with a tree and GR tagged corpus for training the model, we achieved an overall accuracy of 84.8%, 94.1%, and 84.8% in identifying subject, object, and adverbial relations in sentences, respectively. 본 연구의 목적은 한국어 문장의 문법관계를 분석하는 데 있다. 주된 문제는 문장의 주어, 목적어, 부사어를 문장에서 찾아내는 것이다. 이 문제를 해결하기 위해서 한국어 구문 분석에서 발생하는 여러 중의성을 고려해야 한다. 우리는 문법관계의 중의성을 먼저 해결하고 그 다음에 주어진 명사구와 용언구의 문법관계 확률을 이용하여 용언구의 술어-논항 관계 중의성을 해소하는 통계적 방법을 제안한다. 제안된 방법은 어절간의 거리, 교차구조 금지, 일문일격의 원칙 등의 한국어 언어 특성을 반영하였다. 용언구와 명사구 사이의 문법관계에 대한 확률은 지지벡터 분류기를 이용하여 추정하였다. 제안된 방법은 문법관계 및 구문구조 부착 말뭉치를 이용하여 자동으로 문법관계를 학습하였고 주어, 목적어, 부사 각각의 문법관계분석에 대해 각각 84.8%, 94.1%, 84.8%의 성능을 얻었다.
이병준 ( Byeong-jun Lee ),심주용 ( Ju-yong Sim ),이준영 ( Jun-yeong Lee ),이성욱 ( Songwook Lee ) 한국정보처리학회 2022 한국정보처리학회 학술대회논문집 Vol.29 No.2
우리는 전이 학습을 이용하여 원하는 특정 패션 스타일 분류기를 학습하였다. 패션 스타일 검색 결과물을 온라인 쇼핑몰과 연결하는 웹 서비스를 사용자에게 제공한다. 패션 스타일 분류기는 구글에서 이미지 검색을 통해 수집된 데이터를 이용하여 ResNet34[1]에 전이 학습하였다. 학습된 분류 모델을 이용하여 사용자 이미지로부터 패션 스타일을 17가지 클래스로 분류하였고 F1 스코어는 평균 65.5%를 얻었다. 패션 스타일 분류 결과를 네이버 쇼핑몰과 연결하여 사용자가 원하는 패션 상품을 구매할 수 있는 서비스를 제공한다.
박준혁,이성욱,Park, Junhyeok,Lee, Songwook 한국정보처리학회 2018 정보처리학회논문지. 소프트웨어 및 데이터 공학 Vol.7 No.7
세계 인구의 고령화가 진행되는 오늘날 노인들을 위한 의료 서비스의 수요는 점차 증가할 것으로 보인다. 특히, 응급실을 방문하는 노인 환자는 일반 환자보다 다양한 질병을 갖고 있거나, 특이한 증상을 호소하는 등 복잡한 의학적, 사회적 및 신체적 문제를 가지고 있는 경우가 많다. 우리는 65세 이상의 응급실을 방문한 노인 환자의 사망률 예측을 위해 연령, 성별, 혈압, 체온, 혈액검사, 주증상명 등의 의료 데이터를 사용하였다. Feed Forward 신경망과 지지벡터기계를 각각 학습하여 사망률을 예측하고 그 성능을 비교하였다. 1개의 은닉층을 사용한 Feed Forward 신경망의 실험결과가 가장 좋았으며, 이 때 F1 점수는 52.0%, AUC는 88.6%이다. 좀 더 좋은 의료 자질을 추출하여 제안 시스템의 성능을 향상시킨다면 응급실에 방문한 노인 환자들을 위한 효과적이고 신속한 의료 자원 배분을 통해 더 좋은 의료 서비스를 제공할 수 있을 것이다. As the global population becomes aging, the demand for health services for the elderly is expected to increase. In particular, The elderly visiting the emergency department sometimes have complex medical, social, and physical problems, such as having a variety of illnesses or complaints of unusual symptoms. The proposed system is designed to predict the mortality of the elderly patients who are over 65 years old and have admitted the emergency department. For mortality prediction, we compare the support vector machines and Feed Forward Neural Network (FFNN) trained with medical data such as age, sex, blood pressure, body temperature, etc. The results of the FFNN with a hidden layer are best in the mortality prediction, and F1 score and the AUC is 52.0%, 88.6% respectively. If we improve the performance of the proposed system by extracting better medical features, we will be able to provide better medical services through an effective and quick allocation of medical resources for the elderly patients visiting the emergency department.
이현규 ( Lee Hyun Gyu ),이성욱 ( Lee Songwook ) 한국정보처리학회 2016 정보처리학회논문지. 소프트웨어 및 데이터 공학 Vol.5 No.8
본 연구의 목적은 트위터에서 수집된 트윗들의 감성을 분석하고 각 문장의 감성 정보를 반자동으로 부착하여 감성 말뭉치를 구축할 수 있는 시스템의 구현이다. 트위터 API를 이용해 트윗을 수집한 후 각 트윗이 어떤 감성을 갖는지 감성사전을 이용해 분석한다. 사용자는 감성 분석 결과를 확인하고 누락된 감성 정보를 추가하거나 의존구조 사이에 존재하는 감성 정보를 추가할 수 있다. 감성 정보는 JSON 구조로 부착함으로써 감성 말뭉치 구축 및 활용에 용이하게 하였다. 제안 시스템은 긍정, 부정, 중립 문장에 대한 감성 분석 결과 약 76%의 성능을 보였다. Our goal is to build the system which collects tweets from Twitter, analyzes the sentiment of each tweet, and helps users build a sentiment tagged corpus semi-automatically. After collecting tweets with the Twitter API, we analyzes the sentiments of them with a sentiment dictionary. With the proposed system, users can verify the results of the system and can insert new sentimental words or dependency relations where sentiment information exist. Sentiment information is tagged with the JSON structure which is useful for building or accessing the corpus. With a test set, the system shows about 76% on the accuracy in analysing the sentiments of sentences as positive, neutral, or negative.
지지벡터기계(Support Vector Machines)를 이용한 한국어 화행분석
은종민,이성욱,서정연,En Jongmin,Lee Songwook,Seo Jungyun 한국정보처리학회 2005 정보처리학회논문지B Vol.12 No.3
본 연구에서는 지지 벡터 기계(Support Vector Machines)를 이용하여 한국어 대화의 화행을 분석하는 방법을 제안한다. 우리는 발화의 어휘 및 품사와 이진 품사 쌍을 문장 자질로 사용하고 이전 발화의 문맥을 문맥 발화로 사용한다. 카이 제곱 통계량을 이용해 적절한 자질을 선택하고 선택된 자질로 지지 벡터 기계를 학습하였다. 학습된 지지 벡터 기계 분류기를 이용하여 각 발화의 화행을 분석하였다. 호텔 예약 영역의 말뭉치에 대해 제안된 시스템을 이용하여 실험한 결과 약 $90.54\%$의 정확률을 얻었다. We propose a speech act analysis method for Korean dialogue using Support Vector Machines (SVM). We use a lexical form of a word, its part of speech (POS) tags, and bigrams of POS tags as sentence features and the contexts of the previous utterance as context features. We select informative features by Chi square statistics. After training SVM with the selected features, SVM classifiers determine the speech act of each utterance. In experiment, we acquired overall $90.54\%$ of accuracy with dialogue corpus for hotel reservation domain.