http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
음식의 재료들을 고밀도 벡터 공간상 화학적 조합으로 임베딩하기 위한 방법론
박동현(Donghyeon Park),박용규(Yonggyu Park),장부루(Buru Chang),백진헌(Jinheon Baek),강재우(Jaewoo Kang) 한국정보과학회 2019 정보과학회 컴퓨팅의 실제 논문지 Vol.25 No.1
약 본 논문은 음식의 재료들을 컴퓨터가 이해할 수 있는 벡터로 표현하는 것을 목표로 한다. 식품공학자들이 재료를 화학 분자의 조합으로 규명해 놓은 데이터에 기반을 두어, 최신 기술인 임베딩 방식을 이용해 음식의 재료들을 고밀도 벡터 공간에 화학적인 조합으로 표현하는 시도를 처음으로 도입하는 것이 본 논문의 주 내용이다. 음식 재료의 화학적 조합의 임베딩은 단순히 텍스트들의 동시 출현 빈도를 이용한 연관성이 아닌 재료를 실제 구성하는 화학 분자들의 조합으로 표현되기 때문에, 사람이 인지하지 못하는 재료의 특징을 파악하고, 조화에 맞는 재료를 추천하는 등의 태스크에 활용가능하다. 본 연구에서는 음식 재료를 Doc2vec 방식으로 벡터화한 결과를 카테고리별로 시각화하여 벡터의 성능을 정성적으로 평가한다. The purpose of this study is to represent food ingredients, in vectors that computers can understand. Based on data relative to food-chemical engineers defining ingredients with a combination of chemical compounds, the main contribution of this study is that it is the first to introduce and represent food ingredients, with a combination of chemical compounds in dense vector space. Since embeddings of food ingredients are represented by actual chemical compounds, they can detect chemical characteristics of ingredients that humans may not. So, embeddings can be used to recommend ingredients that go well with other ingredients. For experimental purpose, we visualize embedded vectors by their food category and evaluate performance of vectors qualitatively.
김현재(Hyunjae Kim),박용규(Yonggyu Park),이진혁(Jinhyuk Lee),강재우(Jaewoo Kang) 한국정보과학회 2019 정보과학회 컴퓨팅의 실제 논문지 Vol.25 No.1
웹 서비스가 활성화되면서 유저들은 점점 더 스포일러에 쉽게 노출되고 있다. 최근 연구들에서 주어진 문서 또는 문장을 스포일러로 분류하는 자동화된 모델들이 제안됐으나 이 모델들은 스포일러뿐만 아니라 유저에게 유용한 정보일 수 있는 비 스포일러 부분도 유저가 볼 수 없도록 숨기는 문제점이 있다. 본 논문에서는 문서 또는 문장이 아닌 스팬 단위로 스포일러를 검출하여 높은 세분성을 얻을 것을 제안한다. 스팬 단위 스포일러 검출을 수행하기 위해 3,890여 개의 영화 작품을 포함하는 데이터 세트를 구성했고 제안하는 모델은 해당 데이터 세트에서 베이스라인 모델들을 능가하는 성능을 보였다. 또한 정성적 분석은 스포일러를 스팬 단위로 검출하는 것이 유저 만족도를 높여줄 수 있음을 보여준다. As web services grows, the rate at which users are exposed to spoilers is also increasing. Recent studies have presented models that automatically classify whole documents or sentences as spoilers or not. However, these models have a limitation of hiding not only spoilers, but also non-spoiler parts which can be beneficial to users. In this paper, we propose to detect spoilers in span-level for higher granularity. For span-level spoiler detection, we create a large dataset which covers over 3,890 movies. Our proposed model outperforms various baseline models in span-level spoiler detection. Experimental analysis supports our hypotheses that detecting spoilers in span-level improves user satisfaction.