RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • 문화원형 콘텐츠의 OSMU 변환을 위한 개발 프로세스 개선 모델에 관한 연구

        임해창(Hae-Chang Lim),박원용(Won-yong Park) 한국멀티미디어학회 2006 한국멀티미디어학회 학술발표논문집 Vol.2006 No.2

        콘텐츠를 하나의 소스를 통한 다양하게 활용하는 기능형 콘텐츠로 개발하는 OSMU(One Source Multi Use)는 콘텐츠 산업의 발달에 따라 국내에서 중요성이 크게 부각되었으나 생산을 위한 프로세스는 정립되지 않았다. 본 논문에서는 한국 문화원형을 기반으로 한 문화 콘텐츠 개발로 범위를 좁혀 상세화하고, 그에 대한 모델을 실제 산업에 적용할 수 있는 범위까지 확장하여 제시함으로써 대상을 어떻게 분석 하고 체계화하여 디지털화 하며, 부분적으로 개별화된 콘텐츠들을 어떻게 통합하는 지에 대한 구체적인 사례를 제시하였다. 또한 이에 대한 타당성을 기존 과제 수행자들을 대상으로 한 설문조사를 통하여 확인하였다. 마지막으로 제안된 새로운 프로세스를 한국 무예의 원형 및 무과시험 복원을 통한 디지털 콘텐츠 개발에 적용하여 실제 원소스 멀티유즈 콘텐츠 생산에 마치는 프로세스의 효과에 대해 살펴보았다.

      • KCI우수등재

        배제 정보를 이용한 효율적인 한국어 형태소 분석기

        임회석(Heui-Seok Lim),윤보현(Bo-Hyun Yun),임해창(Hae-Chang Rim) 한국정보과학회 1995 정보과학회논문지 Vol.22 No.6

        The existing Korean morphological analyzers generate all the possible candidates only to accept the correct candidates, creating significant amount of implausible candidates. Hence the string processing time and the dictionary access frequency in analyzing a word are aggravated. To lower the above inefficiency, this paper proposes the efficient Korean morphological analyzer using exclusive information, which represents the exclusive relation between specific phoneme, specific syllable, specific string and each part of speech. We discuss how it can reduce the implausible candidates in analyzing a word. The result of the experiment showed that Korean morphological analyzer using exclusive information decreased the dictionary access frequency about 40.16% in comparison with others by reducing the implausible candidates. 모든 형태소 결합을 찾아내는 기존의 한국어 형태소 분석 방법은 후보 생성 과정에서 불필요한 분석 후보를 생성하여 문자열 처리 시간과 사전 탐색 횟수를 가중시키는 단점이 있다. 본 논문은 이러한 비효율성을 감소시키기 위하여 배제 정보(Exclusive Information)를 이용한 효율적인 한국어 형태소 분석 방법을 제안한다. 배제 정보는 음소, 음절, 문자열 각각과 특정 품사와의 배제 관계를 나타내는 정보이다. 배제 정보를 이용한 형태소 분석 시스템은 필요 없는 분석 후보 생성을 감소시키므로 효율적인 분석을 수행한다. 한국어 어절 약 30만개에 대해서 실험한 결과, 본 논문에서 제시한 배제 정보를 이용한 한국어 형태소 분석 시스템은 분석 후보의 생성을 줄임으로 기존의 시스템보다 사전 탐색 횟수를 약 40.16% 감소시킬 수 있었다.

      • 생의학 도메인에서 약어 중의성 해결을 위한 최적 자질의 규명

        임호건(Ho-Gun Lim),서희철(Hee-Cheol Seo),김선호(Seonho Kim),임해창(Hae-Chang Rim) 한국정보과학회 언어공학연구회 2004 한국정보과학회 언어공학연구회 학술발표 논문집 Vol.16 No.1

        생의학 도메인에서 약어 중의성 해결이란 생의학 문서에 나타난 약어의 원래 형태(long form)를 판별하는 작업이다. 본 논문은 생의학 도메인에서 약어 중의성 해결에 적합한 자질들을 실험적으로 탐색하는데 목적이 있다. 이를 위해서 약어 중의성 해결에 사용할 문맥을 전역 문맥(topical context)과 지역 문맥(local context)으로 구분하고, 각각의 문맥에서 스테밍(stemming), 불용어 제거, 품사 부착 등의 과정을 통해서 다양한 자질들을 고려하도록 한다. 생의학 도메인에서 약어 중의성 해결을 위한 실험 자료의 부족을 해결하기 위해서, 학습 자료와 평가 자료를 자동으로 구축했으며, 평가를 위한 약어로는 기존 연구에서 사용된 두 가지 약어 목록을 사용했다. 또한 단순 베이지언 모델(Naive Bayesian Model)을 이용해서 각 자질들의 유용성을 평가하였다. 실험 결과, 전역 문맥이 지역 문맥보다 더 좋은 성능을 보였으며, 전역 문맥에서는 불용어만을 제거한 경우가 각각의 평가 자료에서 94.2%와 96.2%로 가장 좋은 결과를 보였으며, 전역 문맥과 지역 문맥을 함께 사용하는 경우에 각각의 평가 자료에서 1.8%와 0.3%의 성능 향상이 있었다.

      • 통계 정보와 언어 지식의 보완적 특성을 고려한 혼합형 품사 태깅

        임희석(Heui Seok Lim),김진동(Jin Dong Kim),임해창(Hae Chang Rim) 한국정보과학회 1998 정보과학회논문지(B) Vol.25 No.11

        기존의 규칙 기반 품사 태깅 시스템은 규칙이 적용되는 언어 현상에 대해서 매우 높은 정확률을 보이나 처리 범위가 제한적이다. 반면 통계 기반 품사 태깅 시스템은 규칙 기반 품사 태깅 시스템보다 처리 범위가 넓고 견고하다는 장점을 갖지만, 규칙 기반 품사 태깅보다 정확률이 떨어진다는 단점이 지적되고 있다. 이에 본 논문은 통계 기반 품사 태깅과 규칙 기반 품사 태깅의 보완적 특성을 이용한 혼합형 품사 태깅 방법을 제안한다. 제안한 방법은 규칙에 의한 품사 태깅 결과를 선호함으로써 규칙이 적용되는 언어 현상에 대해서 높은 정확률을 유지하며 중의성이 해결되지 않은 어절에는 통계 정보에 의한 품사 태깅 결과를 할당함으로써 처리 범위와 견고성을 유지할 수 있다. 본 논문은 제안한 품사 태깅 방법으로 한국어 품사 태깅 시스템을 구현하였고, 이를 2만 어절 크기의 코퍼스에 대하여 실험하였다. 실험 결과, 구현된 품사 태깅 시스템은 통계 기반 품사 태깅 시스템의 처리 범위를 유지하면서 통계 기반 품사 태깅 시스템의 오류를 32.70%만큼 감소시킨 95.43%의 정확률을 보였다. The rule-based part-of-speech(POS) tagger is very accurate where rules are applied but its coverage is often limited to some core linguistic phenomena. To the contrast, while the probabilistic POS tagger is robust and extensive to various linguistic phenomena, the accuracy is lower than the rule-based POS tagger. In this paper, we propose a hybrid POS tagging method combining those complemental characteristics of the rule-based and the probabilistic POS tagger. By preferring the linguistic knowledge to stochastic information, the proposed method can keep the accuracy of the rule-based tagger. Also it has robustness and coverage of the probabilistic POS tagger by assigning a unique tag for the word whose ambiguity is not fully resolved by linguistic knowledge. A Korean POS tagger using the proposed method was implemented and experimented on the 20K Eojeol-sized open test corpus. As a result, the experiment result showed that the tagger had the accuracy of 95.43%, which reduced the error rate of the probabilistic tagger about 32.70%. Also, It is proved that the tagger is as robust and extensive as the probabilistic POS tagger.

      • 어절 태그 변형 규칙을 이용한 한국어 품사 태거

        임희석(Heui-Seok Lim),김진동(Jin-Dong Kim),임해창(Hae-Chang Rim) 한국정보과학회 1997 정보과학회논문지(B) Vol.24 No.6

        변형 규칙 학습을 이용한 품사 태거는 태깅 규칙을 자동으로 추출하고, 태깅 결과를 이해/분석하기 쉬우며 시스템 성능 향상을 위한 노력이 적게 든다는 장점이 있다. 그러나 영어권 언어에 적용된 변형 규칙 기반 학습 방법을 한 어절 내에 두 개 이상의 형태소 태깅 오류를 포함할 수 있는 한국어에 그대로 적용하기 어렵다. 본 논문은 어절 태그 변형 규칙을 이용한 한국어 품사 태거를 제안한다. 어절 태그란 한 어절을 구성하는 형태소의 품사열로 정의된다. 어절 태그 변형 규칙을 이용하면 어절내 하나 이상의 형태소 태깅 오류가 있어도 수정이 가능하며, 하나의 변형 규칙이 동일한 어절 태그를 갖는 여러 어절을 처리할 수 있다. 또한 본 논문은 오류 어절의 어휘 및 형태소 정보를 고려함으로써, 오류 수정을 위하여 주위 문맥만을 이용할 때 발생하는 변형 규칙 미학습으로 인한 오류와 변형 규칙 과다 적용으로 인한 오류를 감소시킨다. 제안된 품사 태거는 약 12만 한국어 어절을 이용하여 학습하고, 2만 어절 크기의 실험 코퍼스에 적용한 결과 약 95.6%의 정확도를 보였다. A transformation rule-based POS(part-of-speech) tagger has many advantages including automatic rule acquisition, ease of understanding and analyzing tagging results. However, to develop a transformation rule-based Korean POS tagger, we must consider very agglutinative and derivational characteristics of Korean. In this paper, we propose a Eojeol-tag transformation rule-based Korean POS tagger which can reflect the characteristics of Korean. And we propose a method of improving the tagger by using the lexical information of a mistagged Eojeol. After the tagger being trained on 120k Korean Eojeol sized corpus, we have acquired 249 transformation rules. The tagger With these 249 transformation rules has shown about 95.6% accurate tagging results on 20k Eojeols of test corpus.

      • 신경망을 이용한 반자동 구문분석 말뭉치 구축도구

        임준호(Joon-Ho Lim),곽용재(Yong-Jae Kwak),박소영(So-Young Park),임해창(Hae-Chang Rim) 한국정보과학회 2003 한국정보과학회 학술발표논문집 Vol.30 No.1B

        구문분석 말뭉치는 통계적 구문분석 분야의 필수적인 항목으로 많은 유용성을 가지지만, 말뭉치를 구축할 때, 막대한 시간과 비용이 요구되기 때문에 구축자의 수작업을 감소시키는 방법에 대한 연구가 필요하다. 본 논문에서는 대량의 신뢰도 있는 구문분석 말뭉치를 구축하기 위해 신경망을 사용하는 반자동 구문분석 말뭉치 구축도구에 대해서 설명한다. 개발된 도구는 구문패턴 추출, 신경망 학습, 반자동 구축의 세 단계로 구성된다. 구문패턴 추출 단계에서는 사용자가 정의한 자질집합을 사용하여 기존에 구축된 말뭉치에서 구문패턴들을 추출하고, 신경망 학습의 단계에서는 추출된 구문패턴들을 사용하여 신경망을 학습한다. 그리고, 반자동 구축 단계에서는 학습된 신경망을 사용하여 반자동으로 구문분석 말뭉치를 구축한다. 본 논문에서 제안하는 방법은 다양한 자질집합을 조합하여 사용할 수 있고, 학습을 사용하기 때문에 학습 집합에 나타나지 않은 경우에 대해서도 합리적인 결정을 내릴 수 있다. 소량의 구문분석 말뭉치를 대상으로 실험한 결과, 본 논문에서 제안하는 방법이 약 42.5%의 수작업 횟수 감소율을 보였음을 알 수 있었다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼