http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
시맨틱 프레임을 이용한 한국어 패러프레이즈 자동 평가 방법
박한철 ( Hancheol Park ),권가진 ( Gahgene Gweon ),최호진 ( Ho-jin Choi ) 한국정보처리학회 2014 한국정보처리학회 학술대회논문집 Vol.21 No.1
본 연구는 지능형 QA시스템과 관련한 연구에서, 자동 패러프레이즈 생성 시스템을 평가하는 새로운 방법을 제시한다. 기존의 패러프레이즈 생성 시스템의 자동 평가 방법은 참조할 수 있는 패러프레이즈 정보의 양이 크게 제한되어 있었으며, 원 문장의 콘텍스트(context)와 이에 의존하는 통사적 구조(syntactic structure) 및 의미적 구조의 유사성을 고려하지 않고, 단순 구/단어 수준의 의미 유사성을 기반으로 생성된 패러프레이즈를 평가하였다. 이러한 문제를 해결하기 위해 본 연구는 시맨틱 프레임(semantic frame)을 이용한 패러프레이즈 문장 평가 방법을 제시한다. 본 연구에서 제시하는 방법론은 문장의 콘텍스트를 표현하는 프레임과 이러한 프레임이 발생시키는 통사적, 의미적 구조의 유사성을 바탕으로 원 문장과 패러프레이즈 문장의 ‘의미 유사성’, ‘어휘 형태 비 유사성’을 평가하는 방식이다.
말뭉치 자원 희소성에 따른 통계적 수지 신호 번역 문제의 해결
박한철(Hancheol Park),김정호(Jung-Ho Kim),박종철(Jong C. Park) 한국정보과학회 2017 정보과학회논문지 Vol.44 No.2
통계적 기계 번역을 이용한 구어-수화 번역 연구가 활발해짐에도 불구하고 수화 말뭉치의 자원 희소성 문제는 해결되지 않고 있다. 본 연구는 수화 번역의 첫 번째 단계로써 통계적 기계 번역을 이용한 구어-수지 신호 번역에서 말뭉치 자원 희소성으로부터 기인하는 문제점들을 해결할 수 있는 세 가지 전처리 방법을 제안한다. 본 연구에서 제안하는 방법은 1) 구어 문장의 패러프레이징을 통한 말뭉치 확장방법, 2) 구어 단어의 표제어화를 통한 개별 어휘 출현 빈도 증가 및 구어 표현의 번역 가능성을 향상시키는 방법, 그리고 3) 수지 표현으로 전사되지 않는 구어의 기능어 제거를 통한 구어-수지 표현 간 문장 성분을 일치시키는 방법이다. 서로 다른 특징을 지닌 영어-미국 수화 병렬 말뭉치들을 이용한 실험에서 각 방법론들이 단독으로 쓰일 때와 조합되어 함께 사용되었을 때 모두 말뭉치의 종류와 관계없이 번역 성능을 개선시킬 수 있다는 것을 확인할 수 있었다. Despite the rise of studies in spoken to sign language translation, low-resource problems of sign language corpus have been rarely addressed. As a first step towards translating from spoken to sign language, we addressed the problems arising from resource scarcity when translating spoken language to manual signals translation using statistical machine translation techniques. More specifically, we proposed three preprocessing methods: 1) paraphrase generation, which increases the size of the corpora, 2) lemmatization, which increases the frequency of each word in the corpora and the translatability of new input words in spoken language, and 3) elimination of function words that are not glossed into manual signals, which match the corresponding constituents of the bilingual sentence pairs. In our experiments, we used different types of English-American sign language parallel corpora. The experimental results showed that the system with each method and the combination of the methods improved the quality of manual signals translation, regardless of the type of the corpora.
효율적인 자동 주석을 위한 단어 임베딩 인공 신경 정리 증명계 구축
양원석(Wonsuk Yang),박한철(Hancheol Park),박종철(Jong C. Park) 한국정보과학회 2017 정보과학회논문지 Vol.44 No.4
본 연구는 전문기관에서 생산되는 검증된 문서의 정보를 웹상의 수많은 검증되지 않은 문서에 자동 주석하여 신뢰도를 향상하고 심화 정보를 추가하는 시스템을 제안한다. 제안하는 시스템은 국가암정보센터의 검증된 문서들에서 추출한 19,304개 명제를 위키피디아 암 관련 문서에서 추출한 1,486개 명제에 주석하는 과제를 수행하기 위해, 기존 인공 신경 정리 증명계의 순환 모듈을 단어 임베딩 모듈로 교체하였다. 이를 통해 기존의 근본적인 문제점이었던 학습 시간 문제를 해결하였고, 동일한 환경에서 기존 시스템의 학습 시간이 233.9일로 추정된 것에 비해 재구축한 시스템은 102.1분 내로 학습이 완료되었다. 제안하는 시스템의 장점은 명제를 텐서로 인코딩하여 미분 가능하게 전체적인 연산을 진행하는 인공 신경 정리 증명계가 단어의 정확한 일치를 파악하는 전통적인 정리 증명계를 포함하며 동시에 유사어 관계로부터의 논리 전개 역시 가능하게 한다는 점을 실제 문서 데이터에서 입증했다는 것이다. We present a system that automatically annotates unverified Web sentences with information from credible sources. The system turns to neural theorem proving for an annotating task for cancer related Wikipedia data (1,486 propositions) with Korean National Cancer Center data (19,304 propositions). By switching the recursive module in a neural theorem prover to a word embedding module, we overcome the fundamental problem of tremendous learning time. Within the identical environment, the original neural theorem prover was estimated to spend 233.9 days of learning time. In contrast, the revised neural theorem prover took only 102.1 minutes of learning time. We demonstrated that a neural theorem prover, which encodes a proposition in a tensor, includes a classic theorem prover for exact match and enables end-to-end differentiable logic for analogous words.
분산 표상 기법을 이용한 단어의 비표준 의미 사용 탐지
이희제(Huije Lee),박한철(Hancheol Park),양원석(Wonsuk Yang),박종철(Jong C. Park) 한국HCI학회 2018 한국HCI학회 학술대회 Vol.2018 No.1
본 연구에서는 분산 표상 기법으로 텍스트에서 사전상의 의미로 사용되지 않은 어휘(이하, 비표준의미 어휘)를 탐지하는 모델을 제안한다. 어휘의 어형은 동일하나 비표준 의미로 사용되는 경우를 판단하는 것은 자동화된 텍스트 분석 및 오역의 문제를 해결하는 데 중요한 요소이다. 본 연구에서는 분산 표상기법으로 생성된 문맥 및 대상 단어 벡터를 이용하여, 대상 단어가 주어진 문맥 내에서 적합한지를 검증하고 대상 단어가 비표준 의미로 사용되었는지 여부를 판단한다. 본 연구에서는 기존 연구에서의 문맥 벡터생성 방식이 지니는 문제점을 해결하기 위해, 통합적인 문맥 정보를 표상하는 방법과 문맥 내 단어들의 가중치를 주는 방법을 제안한다. 제안하는 방법은 트위터 데이터를 이용한 실험에서 기존에 제안된 모델보다 더 높은 성능을 보였다.
김건엽(Gun-Yeob Kim),이연진(Yeon-Jin Lee),조은지(Eun-Ji Cho),이재인(Jae-In Lee),임은채(Eun-Chae Im),황한철(Hancheol Hwang),김상윤(Sang-Yoon Kim),홍성창(Sung-Chang Hong),김진호(Jin-Ho Kim),박성직(Seong-Jik Park) 대한환경공학회 2022 대한환경공학회지 Vol.44 No.11
목적 : 토양에서 암모니아 배출에 미치는 영향에 관한 문헌 고찰을 통하여 주요 요인들을 파악하고, 암모니아 배출감소를 위한 대책을 설립한다. 방법 : 농업, 암모니아, 미세먼지 등의 키워드를 활용하여 학술검색을 수행하였으며, 수집된 문헌에 대하여 토양의 특성이 암모니아 배출에 미치는 영향에 대해서 각 항목별로 정리하였다. 결과 및 토의 : 암모니아의 대기 중으로 배출은 잠재적으로 농업인의 경제적 수익을 감소시킬 뿐만 아니라 초미세먼지(PM2.5) 형성에 전구물질로 작용하여 대기 환경에 부정적인 영향을 미칠 수 있다. 국내 암모니아 주요 배출원 중에서 농업이 차지하는 비중은 78% 정도로 보고되고 있다. 본 연구에서는 토양에서 암모니아 배출은 암모니아 비료의 종류, 토양수분, pH, 온도, 양이온교환용량, 유기물, 토성에 영향을 받는다. 토양수분의 증가는 암모니아 배출량을 증가시킨다. 토양 pH가 증가함에 따라서 암모니아 배출량이 증가하는데 특히 7.5 이상에서 크게 증가한다. 토양 온도의 증가는 요소의 가수분해 속도와 암모니아 가스로 전환하는 속도를 증가시켜 암모니아 배출이 증가한다. 양이온교환용량이 큰 토양은 암모늄을 흡착시켜서 암모니아 배출을 감소시킨다. 점토 함량과 토양 유기물 함량이 높은 토양은 토양 pH 변화에 완충성이 커서 암모니아 배출을 감소시킨다. 결론 : 토양에서 암모니아 배출에 대한 기작 및 원인에 대한 이해를 바탕으로 최적의 토양 관리 및 환경 관리를 통해서 대기 중으로의 암모니아 배출을 저감 할 수 있다. Objectives : Major factors affecting ammonia emission from the soil and strategies to reduce ammonia emission were investigated through literature surveys. Methods : An academic search was conducted using keywords such as agriculture, ammonia, and fine dust, and the effects of soil characteristics on ammonia emission were summarized for each factor. Results and Discussion : Emissions of ammonia into the atmosphere can reduce economic returns for a farmer and negatively impact the atmospheric environment by acting as a precursor to PM2.5 formations. It is reported that agriculture accounts for 78% of the total ammonia emission sources in Korea. Ammonia emission from the soil is affected by the type of ammonia fertilizer, soil moisture, pH, temperature, cation exchange capacity, organic matter, and soil texture. An increase in soil moisture increases ammonia emissions. As soil pH increases, ammonia emissions increase, noticeably above 7.5. An increase in soil temperature increases the rate of hydrolysis of urea and the rate of conversion to ammonia gas, resulting in increased ammonia emissions. Soils with high cation exchange capacity adsorb ammonium to reduce ammonia emissions. Soils with a high clay content and soil organic matter content are more buffered to changes in soil pH, reducing ammonia emissions. Conclusion : Based on understanding the mechanisms and causes of ammonia emission from the soil, it is possible to establish soil and environmental management to reduce ammonia emissions into the atmosphere.