RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
          펼치기
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI우수등재

        기계 독해 성능 개선을 위한 데이터 증강 기법

        이선경(Sunkyung Lee),최은성(Eunseong Choi),정선호(Seonho Jeong),이종욱(Jongwuk Lee) 한국정보과학회 2021 정보과학회논문지 Vol.48 No.12

        기계 독해(Machine Reading Comprehension)란 컴퓨터가 주어진 텍스트의 의미를 이해 및 이를 평가하는 방법으로, 자연어 이해를 위한 중요한 기술 중 하나이다. 주어진 글에 대해서 질의가 주어졌을 때, 이에 대한 올바른 응답을 찾는 질의-응답이 가장 대표적인 기계 독해 과제이다. 기계 독해 기술은 최근 심층 인공신경망 기반의 자연어 처리 기술의 발달에 따라 획기적인 성능 개선을 보였다. 그럼에도 불구하고, 주어진 데이터가 희소할 때 성능 개선에 어려움이 있을 수 있다. 이를 해결하기 위해 본 논문에서는 단어 단위 및 문장 단위의 텍스트 편집을 통한 데이터 증강 기법을 활용하여 기존 모델의 변경을 최소화하며 성능 개선을 하고자 한다. 즉, 본 연구에서는 영어 질의응답 데이터에서 가장 널리 활용되고 있는 사전 학습된 언어 모델 기반의 기계 독해 모델에 데이터 증강 기법을 적용하여 기존 모델 대비성능이 향상되는 것을 확인하였다. Machine reading comprehension is a method of understanding the meaning and performing inference over a given text by computers, and it is one of the most essential techniques for understanding natural language. The question answering task yields a way to test the reasoning ability of intelligent systems. Nowadays, machine reading comprehension techniques performance has significantly improved following the recent progress of deep neural networks. Nevertheless, there may be challenges in improving performance when data is sparse. To address this issue, we leverage word-level and sentence-level data augmentation techniques through text editing, while minimizing changes to the existing models and cost. In this work, we propose data augmentation methods for a pre-trained language model, which is most widely used in English question answering tasks, to confirm the improved performance over the existing models.

      • KCI우수등재

        상위 N개 항목의 추천 정확도 향상을 위한 효과적인 선호도 표현방법

        이재웅(Jaewoong Lee),이종욱(Jongwuk Lee) 한국정보과학회 2017 정보과학회논문지 Vol.44 No.6

        협업필터링은 사용자들이 평가한 항목들의 유사성을 기반으로 평가되지 않은 항목을 효과적으로 추천해주는 기법이다. 기존에는 사용자가 평가하지 않은 항목 중 상위  개 항목의 추천 정확도를 높이기 위하여 사용자의 항목의 대한 상대적 선호도를 반영하는 쌍 기반 선호도(pair-wise preference)와 목록 기반 선호도(list-wise preference)가 제안되었다. 하지만 이러한 방법들은 사용자가 평가한 항목 간의 상대적인 선호도를 표현하는데 한계가 있으며, 각각의 항목들의 중요도를 반영할 수 없는 단점이 있다. 본 논문에서는 유사도 및 순위 값을 계산할 때 평점 선호도 표현 방법과 역 사용자 빈도수(inverse user frequency)를 이용하여 사용자의 잠재된 선호도를 표현하는 새로운 방법을 제안한다. 제안 방법을 메모리 기반 협업필터링에 적용하여 비교한 결과 기존 방법보다 최대 2배 이상 정확도가 향상되는 것을 확인할 수 있었다. Collaborative filtering is a technique that effectively recommends unrated items for users. Collaborative filtering is based on the similarity of the items evaluated by users. The existing top-N recommendation methods are based on pair-wise and list-wise preference models. However, these methods do not effectively represent the relative preference of items that are evaluated by users, and can not reflect the importance of each item. In this paper, we propose a new method to represent user"s latent preference by combining an existing preference model and the notion of inverse user frequency. The proposed method improves the accuracy of existing methods by up to two times.

      • SSCISCIESCOPUS
      • CrowdStart: Warming up cold-start items using crowdsourcing

        Hong, Dong-Gyun,Lee, Yeon-Chang,Lee, Jongwuk,Kim, Sang-Wook Elsevier 2019 expert systems with applications Vol.138 No.-

        <P><B>Abstract</B></P> <P>The cold-start problem is one of the critical challenges in personalized recommender systems. A lot of existing work has been studied to exploit a user-item rating matrix as well as additional information for users/items, <I>e.g.</I>, user profiles, item contents, and social relationships among users. However, because existing work is primarily biased to the auxiliary information for users/items, it is difficult to identify various and reliable item neighbors that are relevant to cold-start items. To alleviate this limitation, we propose a new <I>crowd-enabled</I> framework, called <ce:sans-serif>CrowdStart</ce:sans-serif>, which is an integrated <I>human-machine</I> approach for new item recommendation. The main contributions of the <ce:sans-serif>CrowdStart</ce:sans-serif> framework are two-fold: (1) To find various and reliable item neighbors for new items, we design two-step crowdsourcing tasks that harness not only machine-only algorithms but also the knowledge of crowd workers (including a few experts and a large number of non-expert workers in a crowdsourcing platform). (2) We develop a novel hybrid model to exploit the user-item rating matrix, the content information about items, and the crowd-based item neighbors from human knowledge into new item recommendation. To evaluate the effectiveness of the <ce:sans-serif>CrowdStart</ce:sans-serif> framework, we conduct extensive experiments including both a user study and simulation tests. Through the empirical study, we found that the <ce:sans-serif>CrowdStart</ce:sans-serif> framework provides <I>relevant, diverse, reliable</I>, and <I>explainable</I> crowd-based neighbors for new items and the crowd-based neighbors are meaningful for improving the accuracy of new item recommendation. The datasets and detailed experimental results are available at https://goo.gl/1iXTUE.</P> <P><B>Highlights</B></P> <P> <UL> <LI> A new framework is proposed to adopt crowdsourcing to the cold-start item problem. </LI> <LI> Sophisticated user interfaces for crowdsourcing is designed. </LI> <LI> Human-machine collaboration is used to address the cold-start item problem. </LI> <LI> Real-world evaluation is conducted with about 400 workers on Amazon Mechanical Turk. </LI> <LI> The proposed framework is effective at improving the cold-start item recommendations. </LI> </UL> </P>

      • KCI우수등재

        다차원 공간에서 정확한 선형 스카이라인 알고리즘

        박희수(Heesoo Park),이종욱(Jongwuk Lee) 한국정보과학회 2018 정보과학회논문지 Vol.45 No.10

        스카이라인 질의는 지배 개념을 이용하여 사용자 선호도에 적합한 후보 집합을 찾아주는 질의로, 여러 개의 데이터의 속성을 고려한 의사 결정 문제에 효과적이다. 하지만 데이터의 속성이 많아질 경우 스카이라인의 결과가 지나치게 많아지는 문제가 발생한다. 본 논문에서는 이와 같은 문제를 해결하기 위해서 사용자의 선호도 함수를 선형 함수로 제약한 선형 스카이라인 질의를 정확하게 계산하는 알고리즘을 제안한다. 기존 연구에서는 데이터 속성의 수만큼 가상의 점을 데이터에 추가하여 선형 스카이라인을 구하는 방법을 제안하였으며, 이와 같은 방법은 정확한 선형 스카이라인을 구하지 못함이 확인되었다. 본 논문에서는 이와 같은 문제점을 해결하기 위해 가상의 점을 추가하는 방법을 수정하였으며, 정확한 선형 스카이라인을 찾을 수 있도록 증명하고, 다양한 실험을 통해 제안 방법의 정확함을 검증하였다. Skyline query is a preference query that finds a candidate set for user preferences, employing the dominance property. It can be effectively used for decision problems that have multiple data attributes. However, a problem arises whereby the skyline becomes too large as the number of attributes in the data increases. To solve this problem, in this paper, we propose a new algorithm for a linear skyline query that restricts a user’s preference function by a linear function. In the previous work, a method was proposed to obtain a linear skyline by adding the same number of virtual points to the data as the number of attributes. However, it has been observed that this previous method does not guarantee the correctness of the linear skyline. We revised this method by adding virtual points in order to find the correct linear skyline. We prove that the proposed algorithm finds the correct linear skyline, and we empirically evaluate the correctness of the proposed algorithm.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼