RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재SCOPUS

        웹 정보검색 시스템의 문서 순위 결정

        안동언,강인호,An, Dong-Un,Kang, In-Ho 한국과학기술정보연구원 과학기술정보센터 2003 Journal of Information Science Theory and Practice Vol.34 No.2

        인터넷의 발달로 인해 웹에서 얻을 수 있는 정보의 종류와 수는 급진적으로 증가하고 있다. 기존의 문서 위주의 구성에서 멀티미디어 서비스, 쇼핑몰 등 종류와 매체에 있어서 다양한 변화를 보이고 있다. 이에 따라 사용자가 요구하는 정보의 단위는 문서 뿐만 아니라, 사이트 그리고 서비스 단위로 확장되고 있다. 웹 환경에서 사용자의 정보 요구를 보면 크게 세가지로 볼 수 있다. 첫째는 원하는 정보를 설명하는 혹은 정보와 관련된 문서를 찾는 내용검색, 둘째는 사용자가 관심 있어 하는 개인이나 단체의 사이트 입구를 찾는 사이트 검색, 셋째는 사용자가 관심 있어 하는 서비스를 제공하는 웹 페이지를 찾는 서비스 검색을 들 수 있다. 본 논문에서는 이러한 사용자의 정보 요구 목적에 따라서 문서 순위화가 달라져야 함을 보인다. 지금까지 정보 검색에서 언급된 내용 정보, 링크 정보 그리고 URL 정보의 유용함을 사용자의 정보 요구 형태에 따라서 분류한다. 내용 검색에서는 내용 정보가 유용한 반면 링크 정보와 URL 정보를 결합할 경우 성능의 저하를 초래했다. 반면 사이트 검색에서는 내용 정보만 쓰는 것 보다는 링크 정보와 URL 정보를 결합할 경우 성능의 향상을 얻을 수 있었다. The Web is rich with various sources of information. It contains the contents of documents, multimedia data, shopping materials and so on. Due to the massive and heterogeneous web document collections, users want to find various types of target pages. We can classify user queries as three categories according to users'intent, content search, the site search, and the service search. In this paper, we present that different strategies are needed to meet the need of a user. Also we show the properties of content information, link information and URL information according to the class of a user query. In the content search, content information showed the good result. However, we lost the performance by combining link information and URL information. In the site search, we could increase the performance by combining link information and URL information.

      • 한국어 생성 시스템에서 보조용언의 생성

        안동언(Dong Un An) 한국정보과학회 1995 한국정보과학회 학술발표논문집 Vol.22 No.1

        본 논문에서는 기계번역 시스템의 한국어 생성에서 양상자질로부터 어떻게 보조용언을 생성할 것인가를 다룬다. 보조용언을 생성하기 위해서는 세 가지를 고려하여야 한다. 첫째, 양상자질에 대응되는 보조용언을 기능과 의미에 따라 분류하여야 한다. 둘째, 각 보조용언의 분류에 대해 생성되는 대표 보조용언 표층어를 결정하여야 한다. 셋째, 일정한 순서에 따라 보조용언을 술어의 어간과 결합하여야 한다. 이러한 문제점을 해결하기 위하여 corpus를 분석하여 빈도수에 의해 계산적으로 보조용언에 관한 언어적 지식을 얻는다. corpus를 기반으로 하는 보조용언의 생성을 제안하고 평가를 통해 생성 결과의 향상을 보인다.

      • 기계번역 시스템 한국어 보조용언 생성

        안동언(Dong Un An) 한국정보과학회 1997 정보과학회논문지(B) Vol.24 No.1

        본 논문에서는 기계번역 시스템의 한국어 생성에서 양상자질로부터 어떻게 보조용언을 생성할것인가를 다룬다. 보조용언들은 한국어 술어를 형성하기 위하여 본용언에 한국어 특유의 순서로 결합된다. 이 순서는 수학적으로 선형 순서이거나 부분 순서가 아니다. 또한 양상자질에서 보조용언을 표충화하기 위해서 한국어 생성기는 서로 비슷한 의미를 가진 여러 보조용언들 중에서 가장 자연스러운 것을 선택하여야 한다. 이러한 문제점을 해결하기 위해서 말뭉치를 분석하여 양상과 보조용언에 관한 신뢰성 있는 언어 지식을 얻어, 이를 이용하는 말뭉치 기반의 보조용언 생성을 제안한다. 첫째, 말뭉치를 분석하여 의미와 기능에 따라서 보조용언을 분류한다. 둘째, 각 양상에 대한 대표 보조용언을 말뭉치의 빈도수를 기반으로 선택한다. 셋째, 보조용언들간의 순서 관계에서 휴리스틱을 사용하여 부분 순서로 바꾸고 위상 정렬에 의해서 최대한 실제 순서 정보에 접근하는 선형 보조용언 어순을 얻는다. 마지막으로, 실험 및 평가를 통해서 말뭉치를 기반으로 하는 보조용언의 생성이 보조용언 어순의 정확성과 생성된 대표 보조용언의 자연스러움을 가져오는 것을 보인다. This paper presents how to generate auxiliary verbs from modality features in a Korean generation of machine translation system. To form a complete predicate, auxiliary verbs are concatenated together with a main-verb stem, being arranged in the Korean-specific order, which is neither a linear order nor a partial order mathematically. To lexicalize an auxiliary verb from a modality feature, the Korean synthesizer must choose the best one among several different auxiliary verb candidates whose meanings are very similar to one another. To cope with these difficulties, a corpus-based auxiliary verb generation is suggested, where a large corpus is analyzed to acquire reliable linguistic knowledge on auxiliary verbs and modalities. Through the corpus analysis, firstly, auxiliary verbs are classified into modality groups according to their meanings and grammatical functions. Secondly, the representative for each modality group is selected on the basis of frequency in the corpus. Thirdly, the corpus-based ordering relations among auxiliary verbs are transformed into a partial ordering by using several kinds of heuristics, and then through the topological sorting we derive a linear auxiliary verb order covering as much actual ordering information as possible. Finally, by experiment and performance evaluation, we show that the corpus-based auxiliary verb generation may be a great help in generating correct auxiliary verb order and natural auxiliary verb.

      • 웹용 다국어 기계번역을 위한 전처리기

        안동언(Dong un An),이영우(Young Woo Lee),서진원(Jin Won Seo),정성종(Sung Jong Chung) 한국정보과학회 1998 한국정보과학회 학술발표논문집 Vol.25 No.2Ⅱ

        여러 언어들로 작성된 웹문서들을 다국어 기계번역기에서 번역하기 위해서는 우선 해당 웹문서가 어떠한 언어로 작성되었는지를 알아내야 한다. 코드 분석을 통하여 웹문서를 작성한 언어를 알게 되면 해당 언어를 번역하는 기계번역기를 작동시킬 수 있다. 또한, 웹문서에서 기계번역의 대상은 HTML 태그를 제외한 일반 문장이다. 따라서, 웹용 기계번역의 전처리기에서 웹문서에서 HTML 태그를 분리하여야 하며 번역이 완료된 후 번역된 문서에 HTML 태그를 복원하여 웹브라우저에서 번역된 문서를 볼 수 있어야 한다. 본 논문에서는 웹용 다국어 기계번역을 위한 전처리기의 태그관리기와 코드인식기를 설명한다.

      • KCI등재

        문서분류에서 가상문서기법을 이용한 성능 향상

        이경순,안동언,Lee, Kyung-Soon,An, Dong-Un 한국정보처리학회 2004 정보처리학회논문지B Vol.11 No.4

        본 논문에서는 문서분류의 학습단계에 가상적합문서기법을 적용하여 성능을 향상시킬 수 있는 방법을 제안한다. 어떤 범주에 대해 적합하다고 판단된 두 개의 적합문서를 결합해서 생성된 문서 또한 적합문서가 된다는 관찰을 통해서, 문서분류기가 학습할 수 있는 새로운 정보를 추가함으로써 분류기의 학습을 돕는다. 제안하는 방법은 학습문서집합에 있는 적합문서들의 쌍을 조합해서 단순히 변환함으로써 가상의 문서를 생성한다. 이 방법에 의해서 생성된 가상 문서는 두 개의 적합문서에 같이 발생하는 어휘들에 대해서는 높은 가중치를 갖고, 문서 내의 어휘 공간이 확장되는 특성을 갖는다. 대량의 문서를 포함하는 TREC-11 필터링 태스크 참여에서 제안한 방법은 제공되는 학습문서를 이용한 기본 성능에 비해 71%의 성능 향상을 보였다. 또한 문서분류 연구에서 일반적으로 비교를 위해 이용하는 실험집합인 Routers-21578에서 학습집합의 적합문서 개수가 100개 이하인 범주에 대해서 기본 학습문서를 이용한 분류기에 비해 11%의 성능향상을 보였다. 가상문서를 계속 추가해 나가면서 성능의 변화를 분석한 결과, 가상문서의 추가는 문서분류기의 학습능력을 도와 성능이 꾸준히 향상되고 있음을 보였다. This paper proposes a virtual relevant document technique in the teaming phase for text categorization. The method uses a simple transformation of relevant documents, i.e. making virtual documents by combining document pairs in the training set. The virtual document produced by this method has the enriched term vector space, with greater weights for the terms that co-occur in two relevant documents. The experimental results showed a significant improvement over the baseline, which proves the usefulness of the proposed method: 71% improvement on TREC-11 filtering test collection and 11% improvement on Routers-21578 test set for the topics with less than 100 relevant documents in the micro average F1. The result analysis indicates that the addition of virtual relevant documents contributes to the steady improvement of the performance.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼