RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • 유사 SMS 말뭉치 구축 시스템

        송영길(Yeongkil Song),김학수(Harksoo Kim) 한국정보과학회 2009 한국정보과학회 학술발표논문집 Vol.36 No.1

        모바일 환경에서 자연어처리 응용 프로그램 개발을 위해서는 대용량의 말뭉치가 필수적이다. 그러나 모바일 말뭉치를 구축하는 것은 현실적으로 불가능한 일이다. 그래서 본 논문에서는 일반 구어체 말뭉치를 이용하여 유사 SMS 말뭉치를 구축하는 시스템을 제안한다. 제안 시스템은 일반 구어체 말뭉치에 SMS의 특성을 적용하여 유사 SMS 말뭉치를 생성한다. SMS를 수집하여 실험한 결과 유사 SMS를 이용하는 것이 일반 구어체 말뭉치를 이용하는 것 보다 좋은 결과를 보였다.

      • KCI등재

        위키피디아 기반 개체명 사전 반자동 구축 방법

        송영길(Yeongkil Song),정석원(Seokwon Jeong),김학수(Harksoo Kim) 한국정보과학회 2015 정보과학회논문지 Vol.42 No.11

        개체명은 다양한 자연어처리 연구 및 서비스에 중요한 정보로 이용된다. 개체명 인식의 성능을 향상시키기 위한 여러 연구에서 개체명 사전을 이용한 자질이 개체명 인식 성능에 큰 영향을 준다는 것을 보이고 있다. 그러나 개체명 사전을 구축하는 것은 매우 시간 소모적이고, 인력 소모적인 작업이다. 이를 완화하기 위해서 본 논문에서는 개체명 사전을 반자동으로 구축하는 방법을 제안한다. 제안 시스템은 능동학습을 이용하여 위키피디아 분류정보로 구성된 가상 문서를 개체명 범주 당 하나씩 생성한다. 그리고 잘 알려진 정보검색 모델인 BM25를 이용하여 위키피디아 엔트리와 가상문서 사이의 유사도를 계산한다. 마지막으로 유사도를 바탕으로 각 위키피디아 엔트리를 개체명 범주로 분류한다. 서로 다른 3종류의 개체명 범주 집합에서 실험한 결과, 제안 시스템은 매크로 평균 F1-점수 0.9028, 마이크로 평균 F1-점수 0.9554이라는 높은 성능을 보였다. A named entity(NE) dictionary is an important resource for the performance of NE recognition. However, it is not easy to construct a NE dictionary manually since human annotation is time consuming and labor-intensive. To save construction time and reduce human labor, we propose a semi-automatic system for the construction of a NE dictionary. The proposed system constructs a pseudo-document with Wiki-categories per NE class by using an active learning technique. Then, it calculates similarities between Wiki entries and pseudo-documents using the BM25 model, a well-known information retrieval model. Finally, it classifies each Wiki entry into NE classes based on similarities. In experiments with three different types of NE class sets, the proposed system showed high performance(macro-average F1-score of 0.9028 and micro-average F1-score 0.9554).

      • KCI등재

        인공지능 : SVM을 이용한 음성채팅시스템의 성능 향상 방법

        안혁주 ( Hyeokju Ahn ),이성희 ( Sunghee Lee ),송영길 ( Yeongkil Song ),김학수 ( Harksoo Kim ) 한국정보처리학회 2015 정보처리학회논문지. 소프트웨어 및 데이터 공학 Vol.4 No.6

        음성채팅시스템에서 사용자의 음성 질의는 자동음성인식기를 통하여 텍스트 질의로 변환된다. 만약 자동음성인식기의 1순위 결과가 틀린다면 이 오류는 그대로 음성채팅시스템에 전파된다. 자동음성인식기의 1순위 정밀도를 향상시키기 위하여 본 논문에서는 RankSVM을 이용하여 자동음성인식기의 n개 결과를 재순위화하는 후처리 모델을 제안한다. 채팅시스템을 학습하기 위해서는 대용량의 채팅 문장들이 필요하다. 만약 새로운 채팅 문장들이 학습데이터에 자주 추가되지 않는다면 채팅시스템의 응답은 금방 진부해질 것이다. 이러한 문제를 해결하기 위하여 본 논문에서는 SVM을 이용하여 TV와 영화 시나리오로부터 채팅 문장들을 자동으로 선택하는 데이터 수집 모델을 제안한다. 실험에서 제안된 후처리 모델은 후처리를 하지 않은 모델보다 정확률에서 4.4%, 재현율에서 6.4% 더 좋은 결과를 보였다. 그리고 제안된 데이터 수집 모델은 98.95%의 높은 정확률과 57.14%의 재현율을 보였다. In spoken chatting systems, users’spoken queries are converted to text queries using automatic speech recognition (ASR) engines. If the top-1 results of the ASR engines are incorrect, these errors are propagated to the spoken chatting systems. To improve the top-1 accuracies of ASR engines, we propose a post-processing model to rearrange the top-n outputs of ASR engines using a ranking support vector machine (RankSVM). On the other hand, a number of chatting sentences are needed to train chatting systems. If new chatting sentences are not frequently added to training data, responses of the chatting systems will be old-fashioned soon. To resolve this problem, we propose a data collection model to automatically select chatting sentences from TV and movie scenarios using a support vector machine (SVM). In the experiments, the post-processing model showed a higher precision of 4.4% and a higher recall rate of 6.4% compared to the baseline model (without post-processing). Then, the data collection model showed the high precision of 98.95% and the recall rate of 57.14%.

      • 모바일 환경에 적합한 경량화된 한국어 전처리 시스템

        김종환(Jonghwan Kim),이세희(Sehee Lee),이주호(Jooho Lee),송영길(Yeongkil Song),김학수(Harksoo Kim) 한국정보과학회 강원지부 2008 한국정보과학회 강원지부 학술대회 논문집 Vol.2 No.1

        PDA, 휴대폰과 같은 모바일 환경의 텍스트 통신의 사용이 증가함에 따라 불편한 텍스트 입력 환경에 의해 입력 문장에 오류가 발생하며 오탈자를 포함함 통신체를 사용함으로서 문장의 정확한 의미를 알 수 없는 경우가 있다. 또한 의미를 정확히 파악할 수 없는 띄어쓰기가 생략된 문장들과 한글의 초성, 중성, 종성을 해체 하는 특이한 형태의 습관적인 오류들이 빈번히 발생한다. 본 논문에서는 이러한 문제들을 PC에 비해 상대적으로 열악한 환경에서도 동작이 가능한 언어분석 전처리 시스템을 제안한다. 언어분석 전처리 시스템은 3단계의 모듈로 구성된다. 1단계에서는 휴리스틱을 이용하여 해체된 음절을 결합하고, 2단계에서는 변환 사전과 통계 정보를 이용하여 철자 오류를 보정한다. 마지막으로 3단계에서는 통계와 규칙이 결합된 하이브리드 방법을 채용하여 띄어쓰기 오류를 보정한다.

      • 제한된 하드웨어 자원을 가진 모바일 기기용 한국어 전처리 시스템

        김종환,이세희,이주호,송영길,김학수 강원대학교 정보통신연구소 2009 정보통신논문지 Vol.13 No.-

        With the rapid evolution of the mobile environment, demand for natural language processing in mobile devices is increasing. We propose a Korean sentence preprocessing system that is designed for mobile devices with limited hardware resources. The proposed system consists of three modules. The first one is a module to assemble disjoint Korean syllables using various types of lexical rules. The second one is a module to correct spelling errors using a dictionary and statistical information. The last one is a module to correct spacing errors using a hybrid method of statistical information and transformation rules. In the experiments on the first module, the proposed method showed the perfect precision of 100% in assembling simple-disjoint Korean syllables and the high precision of 99.98% in assembling double-disjoint Korean syllables. In the experiments on the second module, the proposed method showed the correction error rate of 11.22%. In the experiments on the last module, the proposed method showed better performances than the comparison systems in spite of small memory usage. Based on theses experimental results, we conclude that the proposed system is suitable for mobile devices with limited hardware resources (maybe especially small memories).

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼