RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        시그니처 트리를 사용한 의미적 유사성 검색 기법

        김기성(Kisung Kim),임동혁(Donghyuk Im),김철한(Cheolhan Kim),김형주(Hyoungjoo Kim) 한국정보과학회 2007 정보과학회논문지 : 데이타베이스 Vol.34 No.6

        As ontologies are used widely, interest for semantic similarity search is also increasing. In this paper, we suggest a query evaluation scheme for k-nearest neighbor query, which retrieves k most similar objects to the query object. We use the best match method to calculate the semantic similarity between objects and use the signature tree to index annotation information of objects in database. The signature tree is usually used for the set similarity search. When we use the signature tree in similarity search, we are required to predict the upper-bound of similarity for a node; the highest similarity value which can be found when we traverse into the node. So we suggest a prediction function for the best match similarity function and prove the correctness of the prediction. And we modify the original signature tree structure for same signatures not to be stored redundantly. This improved structure of signature tree not only reduces the size of signature tree but also increases the efficiency of query evaluation. We use the Gene Ontology(GO) for our experiments, which provides large ontologies and large amount of annotation data. Using GO, we show that proposed method improves query efficiency and present several experimental results varying the page size and using several node-splitting methods. 온톨로지의 활용이 늘어나면서 의미적 유사성 검색에 대한 관심이 높아지고 있다. 본 논문에서는 질의 객체와의 의미적 유사성이 높은 객체를 검색하는 최근접 질의 기법을 제안하였다. 의미적 유사성을 측정하는 유사성 함수로는 최적 대응값 방식의 유사도 함수를 사용하였으며 주석 정보에 대한 색인을 위해 시그니처 트리를 사용하였다. 시그니처 트리는 집합 유사성 검색에서 많이 사용되는 색인 구조로서 유사성 검색에 사용하기 위해서는 검색시 각 노드를 탐색하였을 때 발견할 수 있는 유사도의 최대값을 예측할 수 있어야 한다. 이에 본 논문에서는 최적 대응값 방식의 유사도 함수에 대한 예측 최대값 함수를 제안하고 올바른 예측 함수임을 증명하였다. 또한 시그니처 트리에 동일한 시그니처가 중복되어 저장되지 않도록 구조를 개선하였다. 이는 시그니처 트리의 크기를 감소시킬 뿐만 아니라 질의 성능 또한 향상시켜 주었다. 실험의 데이타로는 대용량 온톨로지와 주석 정보 데이타를 제공하는 Gene Ontology(GO)를 사용하였다. 실험에서는 제안한 방법의 성능 향상 외에도 페이지 크기와 노드 분할 방법이 의미적 유사성 질의 성능에 미치는 영향에 대해 알아보았다.

      • KCI등재

        T-MERGE 연산자에 기반한 분산 토픽맵의 자동 통합

        김정민(Jungmin Kim),신효필(Hyopil Shin),김형주(Hyoungjoo Kim) 한국정보과학회 2006 정보과학회논문지 : 소프트웨어 및 응용 Vol.33 No.9

        온톨로지 통합은 두 소스 온톨로지들을 통합하여 하나의 새로운 온톨로지를 생성하는 과정으로서 시맨틱 웹, 데이타 통합, 지식관리시스템 등 여러 온톨로지 응용 시스템에서 중요하게 다루는 연구주제이다. 그러나 과거의 연구들은 대부분 두 소스 온톨로지들 사이에 의미적으로 대응되는 공통 요소를 효과적으로 찾기 위한 온톨로지 매칭 기법에 집중되어 있으며 매핑 요소들을 통합하는 과정에서 발생하는 문제를 정의하고 해결하는 방법에 대해서는 간과하고 있다. 본 논문에서는 매칭 프로세스에 의해 주어진 매핑 결과에 기반하여 두 소스 온톨로지들을 통합해 나가는 상세한 통합 프로세스를 정의하고 매핑 요소들 사이에 존재하는 통합 충돌의 유형에 대한 분류 체계 및 충돌을 탐지하고 해결하기 위한 기법을 제안한다. 또한 충돌의 탐지 및 해결을 포함하여 통합 과정을 캡슐화하는 T-MERGE 연산자와 통합 과정의 기록과 오류 복구를 위한 MergeLog를 설계 및 구현한다. 제안하는 통합 모듈의 성능을 보이기 위해 동, 서양 철학 온톨로지들과 야후 및 네이버 백과사전의 일부를 온톨로지로 구현하여 실험 데이타로 활용하였으며 그 결과 전문가의 수작업에 의한 온톨로지 통합과 동일한 결과를 적은 시간과 노력으로 얻을 수 있음을 보인다. Ontology merging describes the process of integrating two ontologies into a new ontology. How this is done best is a subject of ongoing research in the Semantic Web, Data Integration, Knowledge Management System, and other ontology-related application systems. Earlier research on ontology merging, however, has studied for developing effective ontology matching approaches but missed analyzing and solving methods of problems of merging two ontologies given correspondences between them. In this paper, we propose a specific ontology merging process and a generic operator, T-MERGE, for integrating two source ontologies into a new ontology. Also, we define a taxonomy of merging conflicts which is derived from differing representations between input ontologies and a method for detecting and resolving them. Our T-MERGE operator encapsulates the process of detection and resolution of conflicts and merging two entities based on given correspondences between them. We define a data structure, MergeLog, for logging the execution of T-MERGE operator. MergeLog is used to inform detailed results of execution of merging to users or recover errors. For our experiments, we used oriental philosophy ontologies, western philosophy ontologies, Yahoo western philosophy dictionary, and Naver philosophy dictionary as input ontologies. Our experiments show that the automatic merging module compared with manual merging by a expert has advantages in terms of time and effort.

      • KCI등재

        협업 필터링 추천시스템에서의 취향 공간을 이용한 평가 예측 기법

        이형동(Hyungdong Lee),김형주(Hyoungjoo Kim) 한국정보과학회 2007 정보과학회논문지 : 데이타베이스 Vol.34 No.5

        협업 필터링은 정보 과잉 문제를 해결하기 위한 정보 필터링의 주요 기법이며, 전자 상거래 분야에서 추천 시스템과 같은 응용 프로그램에서 널리 사용된다. 협업 필터링 시스템은 사용자들의 대상 항목에 대한 평가를 수집한 후 취향이 서로 비슷한 사용자들의 의견을 바탕으로 아직 평가되지 않은 항목에 대해 예측을 수행한다. 시스템의 예측 성능은 사용자들에 의해 공통적으로 평가된 항목들의 개수에 좌우된다. 그러므로 대상 항목들이 수시로 추가되거나 제거되는 동적 컬렉션의 경우 협업 필터링 알고리즘을 그대로 적용하기 어렵다. 본 논문에서는 동적 컬렉션에 대한 협업 필터링 적용 방법을 제시한다. 제안한 방법에서는 SVD 기법을 이용하여 항목들의 취향 공간을 생성한 후 과거 항목들과 새로운 항목들 간의 연관성을 구하기 위해 핵심 항목들의 클러스터를 구성한다. 이를 평가하기 위해서 사용자 평가 데이타베이스를 시간에 의해 두 부분으로 나누고, 동적으로 추가되는 상황을 시뮬레이션하여 시스템의 예측 성능을 분석했다. 이를 통해 본 방법이 동적 컬렉션에 효과적으로 적용됨을 보인다. Collaborative filtering is a popular technique for information filtering to reduce information overload and widely used in application such as recommender system in the E-commerce domain. Collaborative filtering systems collect human ratings and provide predictions based on the ratings of other people who share the same tastes. The quality of predictions depends on the number of items which are commonly rated by people. Therefore, it is difficult to apply pure collaborative filtering algorithm directly to dynamic collections where items are constantly added or removed. In this paper we suggest a method for managing dynamic collections. It creates taste space for items using a technique called Singular Vector Decomposition (SVD) and maintains clusters of core items on the space to estimate relevance of past and future items. To evaluate the proposed method, we divide database of user ratings into those of old and new items and analyze predicted ratings of the latter. And we experimentally show our method is efficiently applied to dynamic collections.

      • KCI등재

        부분 문자열 선택도 추정을 위한 서픽스트리 변환 기법

        이홍래(Hongrae Lee),심규석(Kyuseok Shim),김형주(Hyoungjoo Kim) 한국정보과학회 2007 정보과학회논문지 : 데이타베이스 Vol.34 No.2

        선택도 추측은 관계형 데이타베이스에서 질의 최적화의 한 중요한 요소이다. 숫자 데이타에 대한 조건식에 대하여 이 주제는 많은 연구가 되어 왔으나 부분문자열에 대한 조건식은 최근에 이르러서야 관심의 초점이 되고 있다. 우리는 이 논문에서 이 문제를 위한 새로운 서픽스 트리 변환 알고리즘을 제시한다. 제안하는 기법은 서픽스 트리의 노드들을 단순히 잘라 없애 버리기 보다는 기본적으로 비슷한 카운트를 갖는 노드들을 구조적 정보를 유지하면서 병합하여 전체 크기를 줄인다. 본 논문은 여러 제약 사항하에서 서픽스 트리를 그 크기를 줄이도록 변환을 하는 알고리즘을 제시하고 실생활 데이타를 대상으로 실험을 수행하여 우리가 제안하는 알고리즘이 기존의 알고리즘들보다 우수한 평균 상대 에러와 에러 분포특성을 지니고 있음을 보인다. Selectivity estimation has been a crucial component in query optimization in relational databases. While extensive researches have been done on this topic for the predicates of numerical data, only little work has been done for substring predicates. We propose novel suffix tree transform algorithms for this problem. Unlike previous approaches where a full suffix tree is pruned and then an estimation algorithm is employed, we transform a suffix tree into a suffix graph systematically. In our approach, nodes with similar counts are merged while structural information in the original suffix tree is preserved in a controlled manner. We present both an error-bound algorithm and a space-bound algorithm. Experimental results with real life data sets show that our algorithms have lower average relative error than that of the previous works as well as good error distribution characteristics.

      • KCI등재

        사용자 경향에 기반한 동적 추천 기법 : 영화 추천 시스템을 중심으로

        이수정(Soojung Lee),이형동(Hyungdong Lee),김형주(Hyoungjoo Kim) 한국정보과학회 2004 정보과학회논문지 : 소프트웨어 및 응용 Vol.31 No.2

        대부분의 추천 시스템에서는 개인의 선호 정보를 바탕으로 한 내용-기반 추천 기법과 다른 사람들로부터의 추천을 기반으로 한 사회적 추천 기법을 사용한다. 이들 두 기법은 각각 장단점을 갖고 있으며, 서로 경쟁 관계에 있다기보다 상호 보완적인 성격을 갖고 있다. 이에 두 기법의 적절한 조합이 전체추천 시스템의 질을 결정하는 관건이 된다. 본 논문에서는 사용자 개인 마다 각 기법에 대한 만족도와 의존도가 다름을 밝히고, 이러한 각 개인의 경향에 따라 여러 추천 기법의 결과를 개인별로 조합해 주는 기법을 제안하였다. 각 개인의 경향을 나타내는 척도로 충성도, 다양도, 전문가도 등의 척도를 정의하여 사용하였으며, 이 원리에 의해 동작하는 조합 엔진의 결과는 최고 40%, 평균 23%의 coverage 개선 효과를 나타내었다. Many recommender systems are based on Content-based Filtering and Social Filtering. Both methods have their own advantages and disadvantages, and they complement each other rather than compete. So incorporating of both methods can make the better system and combination technique controls the quality of the entire recommender system. In this paper, we presented each user has his own tendency to decide which is the better recommendation for himself among the various recommendation results, and suggested the personalized combination technique. To represent user tendency, we defined and used loyalty, diversity and pioneerity and showed by experiments that our combination technique is useful. This combination technique improved the average coverage 23% and for the ceiling 40%.

      • ARIES / RL : 장기 트랜잭션을 지원하기 위한 ARIES 확장

        정재목(JaeMok Jeong),이강우(KangWoo Lee),김형주(HyoungJoo Kim) 한국정보과학회 2000 정보과학회논문지 : 데이타베이스 Vol.27 No.1

        본 논문에서는 장기 트랜잭션이 존재할 경우에, 제한된 로그 공간을 효율적으로 사용하기 위해 재로깅이라는 기법을 ARIES에 확장한 ARIES/RL 알고리즘을 제시한다. ARIES/RL은 로그 공간이 현재 수행되는 트랜잭션에 충분하지 않은 경우 트랜잭션 취소나 재시동 고장회복에 사용되는 로그레코드를 로그의 끝쪽으로 옮기는 기법이다. 이 기법은 기존의 ARIES가 가지는 장점을 그대로 유지하면서, 장기 트랜잭션을 수행시키는 경우 로그를 더 효율적으로 사용하게 된다. 또한 논문에서는 ARIES/RL의 성능 평가의 결과를 제시한다 We propose the ARIES/RL which extends the with `re-logging' technique to manage the limited online log space efficiently even though long-duration transactions exist. Re-logging is a technique that log records used in transaction rollback and restart recovery are copied forward in the log, whenever the online log is not sufficient for keeping logs of on-going transactions. It does not hurt the advantages of ARIES. Moreover, it handles log space efficiently in executing long-duration transactions. We also present the evaluation result of ARIES/RL and show that ARIES/RL handles online log efficiently.

      • KCI우수등재

        Boosting Image Caption Generation with Parts of Speech

        Philgoo Kang(강필구),Yubin Lim(임유빈),Hyoungjoo Kim(김형주) Korean Institute of Information Scientists and Eng 2021 정보과학회논문지 Vol.48 No.3

        With the integration of smart devices and reliance on AI into our daily lives, the ability to generate image caption is becoming increasingly important in various fields such as guidance for visually-impaired individuals, human-computer interaction and so on. In this paper, we propose a novel approach based on parts of speech (POS), such as nouns and verbs extracted from image to enhance the image caption generation. The proposed model exploits multiple CNN encoders, which were specifically trained to identify features related to POS, and feed them into an LSTM decoder to generate image captions. We conducted experiments involving both Flickr30k and MS-COCO datasets using several text metrics and additional human surveys to validate the practical effectiveness of the proposed model.

      • KCI등재
      • KCI등재

        분산 인 메모리 DBMS 기반 병렬 K-Means의 In-database 분석 함수로의 설계와 구현

        구해모(Heymo Kou),남창민(Changmin Nam),이우현(Woohyun Lee),이용재(Yongjae Lee),김형주(HyoungJoo Kim) 한국정보과학회 2018 정보과학회 컴퓨팅의 실제 논문지 Vol.24 No.3

        데이터의 양이 증가하면서 단일 노드 데이터베이스로는 저장과 처리를 동시에 수행하기에는 부족하다. 따라서, 데이터를 분산시켜 복수 노드로 구성된 분산 데이터베이스에 저장되고 있으며 분석 역시 효율성을 위해 병렬 기능을 제공해야한다. 전통적인 분석 방식은 데이터베이스에서 분석 노드로 데이터를 이동시킨 후 분석을 수행하기 때문에 네트워크의 비용이 발생하며 사용자가 분석을 위해 분석 프레임워크도 다를 수 있어야한다. 본 연구는 군집화 분석 기법인 K-Means 군집화 알고리즘을 관계형 데이터베이스와 칼럼 기반 데이터베이스를 이용한 분산 데이터베이스 환경에서 SQL로 구현하는 In-database 분석 함수로의 설계와 구현 그리고 관계형 데이터베이스에서의 성능 최적화 방법을 제안한다. As data size increase, a single database is not enough to serve current volume of tasks. Since data is partitioned and stored into multiple databases, analysis should also support parallelism in order to increase efficiency. However, traditional analysis requires data to be transferred out of database into nodes where analytic service is performed and user is required to know both database and analytic framework. In this paper, we propose an efficient way to perform K-means clustering algorithm inside the distributed column-based database and relational database. We also suggest an efficient way to optimize K-means algorithm within relational database.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼