http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
이준범 ( Jun-beom Lee ),김소언 ( So-eon Kim ),박성배 ( Seong-bae Park ) 한국정보처리학회 2021 한국정보처리학회 학술대회논문집 Vol.28 No.1
문장 압축은 원본 문장의 중요한 의미를 보존하는 짧은 길이의 압축 문장을 생성하는 자연어처리 태스크이다. 문장 압축은 사용자가 텍스트로부터 필요한 정보를 빠르게 획득할 수 있도록 도울 수 있어 활발히 연구되고 있지만, 기존 연구들은 사람이 직접 정의한 압축 규칙이 필요하거나, 모델 학습을 위해 대량의 데이터셋이 필요하다는 문제점이 존재한다. 사전 학습된 언어 모델을 통한 perplexity 기반의 문장 점수 측정을 통해 문장을 압축하여 압축 규칙과 모델 학습을 위한 데이터셋이 필요하지 않은 연구 또한 존재하지만, 문장 점수 측정에 문장에 속한 단어들의 의미적 중요도를 반영하지 못하여 중요한 단어가 삭제되는 문제점이 존재한다. 본 논문은 언어 정보 중 품사 정보, 의존관계 정보, 개체명 정보의 중요도를 수치화하여 perplexity 기반의 문장 점수 측정에 반영하는 방법을 제안한다. 또한 제안한 문장 점수 측정 방법을 활용하였을 때 문장 점수 측정 기반 문장 압축 모델의 문장 압축 성능이 향상됨을 확인하였으며, 이를 통해 문장에 속한 단어의 언어 정보를 문장 점수 측정에 반영하는 것이 의미적으로 적절한 압축 문장을 생성하는 데 도움이 될 수 있음을 보였다.
권영빈,김민기,김소언,권오성 중앙대학교 생산공학연구소 1995 생산공학연구소 논문집 Vol.4 No.2
본 논문에서는 필기형태의 변형을 효과적으로 흡수하여 흘림체 숫자를 인식하는 방법을 제안한다. 제안한 시스템은 입력된 숫자를 등간격을 갖는 선분으로 분할하고 이 선분들로부터 특징을 추출한 후에 정의된 알파벳을 사용하여 스트링으로 표현한다. 입력과 원형 스트링사이의 정합은 스트링 편집과 연산자들에 의해 정의된 비용함수를 사용하여 수행이 된다. 두 스트링을 비교하는 순서는 전단계의 편집결과를 기반으로 하여 결정되도록 하였다. 실험결과에 의하면 제안된 방법은 실시간 응답을 제공하고, 95명의 서로 다른 사람들로부터 얻은 955개의 흘려 쓴 필기 숫자에 대해 91.7%의 인식률을 나타내고 있다. In this paper, we propose a method efficiently handling the variation of handwriting styles. In our system, an input numeral is converted into the sequence of line-segments of equal size and sequence is into the sequence of line-segments of equal size and sequence is represented by the string over defined alphabet after extracting the features from line-segments. The matching between input and prototype strings can be carried out by string editing and the cost function defined according to the operators. The order for symbol comparison between two strings is decided based on the previous editing result. From experimental results, the proposed method supports the real-time response and it reaches 91.7% of recognition rate over 955 cursive handwriting numerals obtained from 95 different persons.