http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
양기주(GiJoo Yang) 한국정보과학회 1993 한국정보과학회 학술발표논문집 Vol.20 No.2
본 논문에서는 기능적 관점을 가진 언어이론을 이용한 한국어 문장생성 방법론을 제시하였다. 기능적 언어이론에 의한 문장생성 방법을 논의하였고 기존의 시스팀 구현물에서 나타날 수 있는 문제점을 지적하였으며 이 문제점을 해결할 수 있는 방법론에 대해 기술하였다.
다중 프로세서에서의 캐시접근 실패율을 위한 경험적 모델링
이강우(Kangwoo Lee),양기주(Gijoo Yang),박춘식(Choonshik Park) 한국정보과학회 2006 정보과학회논문지 : 시스템 및 이론 Vol.33 No.1·2
본 논문에서는, 소규모 시뮬레이션을 통하여 수집된 표본에 통계적인 추정방법을 적용하여 모델을 구하는 경험적 모델링 기법을 제안한다. 이 기법을 이용하여 대칭형 구조를 갖는 다중프로세서 시스템에서의 캐시접근실패율을 위한 두 종류의 모델을 구하였다. 목표시스템의 사양이 고정되었을 때 입력데이타의 크기변화에 따르는 모델과, 입력데이타의 크기가 고정되었을 때 목표시스템의 프로세서 수의 변화에 따르는 모델이다. 모델의 정확성을 제고하기 위하여 한 프로그램에 존재하는 공유데이타들에 대하여 종류별 캐시접근실패에 대한 개별적인 모델들을 구한 후 이들을 종합함으로써 최종적인 모델을 구하였다. 또한 최소 제곱 추정법과 로버스트 추정법을 병용하여 이탈점으로 인한 왜곡을 최소화함으로써 모델의 정확도를 향상시켰다. 경험적 모델링은 표본에 대한 분석이 필요 없으면서도 모델의 정확도가 매우 높다. 또한 소규모의 시뮬레이션만 수행하면 되고, 실험을 통하여 일련의 표본을 수집할 수만 있으면 모든 분야의 연구에 적용할 수 있다. 경험적 모델을 이용한 24가지 경우의 예측시도 중 17번의 경우에는 1% 미만의 예측오차율을 보였으며, 나머지 경우에도 매우 높은 정확도를 보였다. 특히 프로그램의 실행양식이 불규칙하거나, 표본의 수가 충분하기에는 부족한 경우에도 좋은 결과를 보여준다. This paper introduces an empirical modeling technique. This technique uses a set of sample results which are collected from a few small scale simulations. Empirical models are developed by applying a couple of statistical estimation techniques to these samples. We built two types of models for cache miss rates in Symmetric Multiprocessor systems. One is for the changes of input data set size while the specification of target system is fixed. The other is for the changes of the number of processors in target system while the input data set size is fixed. To develop accurate models, we built individual model for every kind of cache misses for each shared data structure in a program. The final model is then obtained by integrating them. Besides, combined use of Least Mean Squares and Robust Estimations enhances the quality of models by minimizing the distortion due to outliers. Empirical modeling technique produces extremely accurate models without analysis on sample data. In addition, since only small scale simulations are necessary, once a set of samples can be collected, empirical method can be adopted in any research areas. In 17 cases among 24 trials, empirical models present extremely low prediction errors below 1%. In the remaining cases, the accuracy is excellent, as well. The models sustain high quality even when the behavioral characteristics of programs are irregular and the number of samples are barely enough.
성폭력 피해자 조사면담용 인공지능 챗봇 개발과 형사정책적 함의
조은경(Jo, Eunkyung),양기주(Yang, Gijoo),윤여훈(Yoon, Yeohoon),이윤정(Lee, Yoonjung),문혜민(Moon, Hyemin) 한국형사정책학회 2022 刑事政策 Vol.34 No.1
대면조사가 어려운 취약한 피해자로부터 양질의 진술을 획득하고 2차 피해 가능성을 최소화하기 위해 면담 챗봇 개발이 최근에 주목받고 있다. 이 논문에서는 수사실무에서 권장되는 바람직한 성폭력 피해자 면담 원리를 구현하기 위해 자연어처리(NLP) 목적 지향 대화 시스템을 적용한 국내 연구 개발 사례를 소개하였다. 챗봇은성폭력 범죄 구성요건 분류체계를 토대로 피해자 진술 녹취록을 코딩하여 데이터를구축하였다. 한국어로 커스터마이징된 Rasa 프로그램을 이용하여 NICHD 면담기법 기반 스토리라인을 적용한 대화형 챗봇을 구축 사례를 소개하였다. 향후 기술적인 제한점을 극복하고 챗봇 개발에 성공할 경우, 챗봇에 의해 획득된 피해자 진술의법적 지위와 진술의 임의성 등 형사정책적 함의를 다각적으로 논의하였다. The purpose of this paper is to introduce a case of artificial intelligence chatbot system development for sexual violence victim interview and to discuss its implications for the criminal justice policy. The chatbot is expected to collect voluntary statements from sexual violence victims who are unwilling or unable to report details and to reduce possible secondary victimization arising from the interactions with human investigators. The chatbot currently being developed is utilizing the NLP task-oriented dialogue system and the principles of NICHD protocol which was developed for interviewing children and vulnerable witnesses. Implications for the potential legal status of the chatbot as inverviewer and chatbot-obtained victim statements are discussed.
일-한 기계 번역 시스템 : 연어 패턴을 이용한 어휘 다의성 해소
문경희(Kyong-Hi Moon),이종혁(Jong-Hyeok Lee),김정인(Jung-In Kim),양기주(Gijoo Yang) 한국정보과학회 1998 정보과학회논문지(B) Vol.25 No.8
본 논문에서는 문법 체계의 유사성으로 인해 주로 직접 번역 방식을 채택하고 있는 일-한 기계 번역에서 고품질의 번역을 위한 어휘 다의성 해소 기법을 제안한다. 구문, 의미 정보가 상대적으로 부족한 직접 번역 방식에서는 높은 수준의 어휘 다의성 해소를 위해 정교한 공기 정보가 요구된다. 따라서 다의성을 가지는 어휘들에 대해 다양한 형태의 공기 제약을 자유롭게 표현할 수 있는 연어 패턴의 기술방법을 제안하고, 명사와 용언의 시소러스 계층 구조를 이용한 유사도 점수 계산법을 통해 가장 적절한 의미가 선택되는 변환 모델을 제시한다. 성능 평가를 위하여 다의어의 대부분을 차지하는 조사와 동사를 대상으로 실험한 결과, 조사에 대해서는 약 93.3%, 동사에 대해서는 약 82.6%의 높은 다의성 해소율을 보임으로써 제안한 방법이 유효함을 보였다. Due to grammatical similarities of both languages, almost all Japanese-Korean MT systems have been developed under the direct MT strategy, in which the word sense disambiguation is considered essential to high-quality translation, but also as a difficult task due to lack of syntactic and semantic clues. In this paper, a word sense disambiguation using sophisticated collocation patterns is proposed under the direct MT framework. First, we present a description method of collocation patterns that can specify a variety of selection restrictions between words. And then we also describe a similarity scoring mechanism based on thesaurus hierarchies of nouns and verbs to select the best-matched one from among several possible patterns. Finally, some experimental evaluations were done using a large-scale corpus of Asahi newspaper articles. They show that the word sense ambiguity of highly polysemous particles and verbs can be resolved with an accuracy of 93.3% and 82.6% for each.
주제를 깊이 있게 다루는 블로그 피드 검색을 위한 위키피디아 기반 질의 확장 방법
송우상(Woosang Song),이예하(Yeha Lee),이종혁(Jong-Hyeok Lee),양기주(Gijoo Yang) 한국정보과학회 2010 정보과학회 컴퓨팅의 실제 논문지 Vol.16 No.11
본 논문에서는 질의로 주어진 주제를 깊이 있게 다루는 블로그 검색을 위한 위키피디아 기반 질의 확장 방법을 제안한다. 제안된 방법은 질의와 연관된 위키피디아 문서를 질의 확장에 사용한다. 실험을 위해 대규모 블로그 실험 데이터인 TREC Blogs08 collection과 영문 위키피디아 데이터를 사용하였다. 실험 결과 제안된 방법은 기존의 블로그 포스트 기반 질의 확장 방법에 비해 MAP을 비롯한 검색 성능을 큰 폭으로 향상시켰다. This paper proposes a Wikipedia-based feedback method for in-depth blog distillation whose goal is to find blogs that represent in-depth thoughts or analysis on a given query. The proposed method uses Wikipedia articles which are relevant to the query. TREC Blogs08 collection which is a large-scale blog corpus and English Wikipedia dump were used for experiments. The proposed method significantly increased the retrieval performance including MAP over the conventional postbased feedback method.
규칙 기반 문장 단위 무형대용어 해결을 통한 성폭력 피해자 조사 면담 진술서 생략어 복원
전현정(Hyeonjeong Jun),허여솔(Yeosol Heo),홍진원(Jinwon Hong),양기주(Gijoo Yang) 한국정보기술학회 2023 한국정보기술학회논문지 Vol.21 No.2
Research on software that determines the credibility of statements using natural language processing technology is emerging. If accurate restoration of subjects that are frequently omitted from victims statements is performed, the performance of judging the credibility of statements can be improved through accurate sentence understanding of the computer. Machine learning and deep learning models, which were mainly used in existing research on Korean Zero Anaphora Resolution (ZAR), have limitations such that anaphora can be restored only when preceding words exist. Due to the nature of the investigative interview, efficient sentence-wise restoration is possible based on the predicate. Therefore, this study adopts a method of restoring omitted perpetrators or victims as the subject on a sentence-by-sentence basis using parsers and a rule-based model. We conducted an experiment using 2,396 sentences. Our model outperforms and its F1 score is 90.79%, which is considered decent for the credibility check system.