RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        문서 내용의 계층화를 이용한 문서 비교 방법

        황명권,배용근,김판구,Hwang, Myung-Gwon,Bae, Yong-Geun,Kim, Pan-Koo 한국정보통신학회 2006 한국정보통신학회논문지 Vol.10 No.12

        웹의 비약적인 성장으로 웹에는 무수한 정보를 축적하고 있으며, 특히 텍스트 문서는 인간에 의해 가장 쉽게 그리고 많이 이용되는 형식이라 하겠다. 텍스트 문서의 효율적 검색을 위해 많은 연구가 이루어졌으며, 확률을 이용한 방법, 통계적인 기법을 이용한 방법, 벡터 유사도를 이용한 방법, 베이지안 자동문서 분류 방법 등이 제안되었다. 그러나 이러한 기존의 방법들은 문서의 특징을 정확하게 반영할 수 없고, 의미적 검색이 이루어지지 않는 단점을 가지고 있다 이에 본 논문은 문서를 미리 분류하는 기존의 방법을 개선하기 위해, 유사한 문서를 의미적으로 찾아내기 위한 새로운 문서 분류의 척도를 제안하며 이를 적용하는 방법을 제시한다. 본 방법은 문서의 내용을 의미적인 계층으로 표현하고 중요 도메인에 가중치를 두며, 문서들간의 도메인 가중치와 도메인 내의 개념 일치도를 이용하여 유사도를 구한다. The current web is accumulating abundant information. In particular, text based documents are a type used very easily and frequently by human. So, numerous researches are progressed to retrieve the text documents using many methods, such as probability, statistics, vector similarity, Bayesian, and so on. These researches however, could not consider both subject and semantic of documents. So, to overcome the previous problems, we propose the document similarity method for semantic retrieval of document users want. This is the core method of document clustering. This method firstly, expresses a hierarchy semantically of document content ut gives the important hierarchy domain of document to weight. With this, we could measure the similarity between documents using both the domain weight and concepts coincidence in the domain hierarchies.

      • 두문자어 의미 태깅 방법

        황명권 ( Myung-gwon Hwang ),정도헌 ( Do-heon Jeong ),성원경 ( Won-kyung Sung ) 한국정보처리학회 2011 한국정보처리학회 학술대회논문집 Vol.18 No.1

        본 논문은 의미적 정보처리에서 걸림돌이 되는 두문자어(Acronym)의 의미처리를 위한 전체적인 구조설계를 포함하고 있다. 두문자어는 일반적으로 복합어에서 의미가 큰 단어의 첫 번째 문자들로 구성된다. 두문자어를 구성하는 복합어는 다른 일반 명사들과 달리 대부분 고유한 의미를 갖고 있기 때문에 정보처리에서 의미 파악의 핵심적인 역할을 수행할 수 있다. 본 논문은 문서에서 출현하는 두문자어의 정확한 의미를 판단하기 위한 방법을 제안하며 현재까지 진행된 결과에 대해 언급하도록 한다.

      • 온톨로지 기반 친족관계 추출 방법

        황명권 ( Myung-gwon Hwang ),최동진 ( Dong-jin Choi ),김판구 ( Pan-koo Kim ) 한국정보처리학회 2009 한국정보처리학회 학술대회논문집 Vol.16 No.2

        시맨틱 웹의 발전과 더불어 소셜 네트워크 자동 구축에 대한 연구가 활발히 진행되고 있다. 본 논문은 온톨로지를 기반의 소셜 정보 추출에 대한 방법을 다루고 있으며, 특히, 이에 필요한 온톨로지 모델링, 사람들 사이의 관계 추출을 위한 패턴 정의에 대해 기술하고 있다. 온톨로지와 패턴을 기반으로 역사적 인물들의 친족관계를 파악함으로써 소셜 정보의 추출에 대한 가능성을 미리 짐작해 본다.

      • KCI등재

        의미적 텍스트 처리를 위한 주제별 문맥 정보 추출 방법

        황명권(Myung-Gwon Hwang),최동진(Dong-Jin Choi),김판구(Pan-Koo Kim) 한국정보기술학회 2010 한국정보기술학회논문지 Vol.8 No.11

        This paper suggests a method which extracts a context information depending on a subject. In the research, the context information means a set of noun concepts related deeply to a specific subject(topic). To build the context, it utilizes Wikipedia which is huge document set constructed by collective intelligence and considers titles of Wikipedia documents as subjects and extracts context information contextually close the subject. To measure context weight, we use TF(Term Frequency) which considers how many times a word occurs, iTF(inverse Term Frequency) which calculates how important the word in the document, and semantic weight which measures relationship between a word and others occurred together. We analyze its performance in comparison with other similar words and suggest its diverse application areas.

      • 워드넷 기반의 의미적 이미지 인덱싱 방법

        황명권(Myung-Gwon Hwang),윤병수(Byung-Su Youn),김동철(Dong-Chul Kim),김판구(Pan-Koo Kim) 한국멀티미디어학회 2009 한국멀티미디어학회 학술발표논문집 Vol.2009 No.1

        본 논문은 텍스트를 가진 이미지를 의미적으로 인덱싱하는 방법을 다루고 있다. 이미지의 텍스트는 이미지의 내용을 묘사하고 이미지 핵심에 대해서는 조금 더 자세히 다루는 것이 일반적이다. 이미지를 가장 잘 표현하는 단어에 가중치를 의미적으로 부여하기 위해, Term Frequency와 문맥 가중치를 측정하는 방법을 제안한다. 본 논문에서는 이미지에 대한 저차원 처리에 대해서는 전혀 다루지 않고 text를 처리하기 때문에 자연어 처리의 일종이라 할 수 있다.

      • KCI등재

        두문자어 지식베이스 자동 구축과 활용 방안

        황명권(Myung-Gwon Hwang),정도헌(Do-Heon Jeong) 한국정보기술학회 2011 한국정보기술학회논문지 Vol.9 No.6

        Acronym is a term which consists of initials of technical term used frequently in specific domain. In the field of semantic information processing, the acronym is big obstacle which should be solved, however it has been ignored in almost all of research about term semantics. Therefore, in order to semantically process the acronym, this paper contains an automatic construction method of the acronym knowledge base. The method is divided mainly into three parts : first part extracting pairs of acronym and its expansion, second part selecting acronym-expansion pairs which have high reliability, and the last part finding appropriate glossaries of the selected acronyms. This paper describes whole method in detail and mentions the value and the applicability of the acronym knowledge base. The method is simple but the result can ensure its reliability and can be utilized as fundamental data in the future work.

      • 지리정보의 의미적인 검색을 위한 온톨로지 구축 방법

        황명권 ( Myung-gwon Hwang ),공현장 ( Hyun-jang Kong ),김판구 ( Pan-koo Kim ) 한국정보처리학회 2006 한국정보처리학회 학술대회논문집 Vol.13 No.1

        웹 정보의 의미적 검색을 위한 시맨틱 웹의 연구가 활발히 진행되고 있다. 시맨틱 웹에서 핵심이 되는 것은 온톨로지이다. 2004년 2월 W3C는 온톨로지 구축을 위해 RDF(S)와 OWL을 온톨로지 구축 언어의 표준으로 제정하고 총 13개의 기술문서를 공표하여, 온톨로지 언어의 정의와 구축 사례 및 활용의 내용을 제공하고 있다. 이로 인해, 많은 온톨로지들이 여러 목적에 의해 구축되고 있으며, 그 활용도는 점차 증가하고 있다. 하지만 지리정보의 검색을 위한 온톨로지는 구축이 어려우며 이에 대한 연구도 미흡하다. 이에 본 논문에서는 지역과 지역의 위치 정보, 지역 내의 건물 및 도로에 대한 위치정보를 온톨로지로 구축할 수 있는 방법과 이를 지리정보 검색에 활용할 수 있는 방안을 연구하였다. 그 결과, 우리는 위치에 대한 온톨로지 구축을 위한 3가지 어휘를 설계하였고, 이를 이용하여 효율적이고 의미적인 지리정보 검색이 가능하다는 것을 확인할 수 있었다.

      • 위키피디아 카테고리 정보에서 상위어 후보 선정 방법

        황명권(Myung-Gwon Hwang),최동진(Dong-Jin Choi),김판구(Pan-Koo Kim) 한국정보기술학회 2010 Proceedings of KIIT Conference Vol.2010 No.-

        의미적 정보처리에 대한 연구의 중요성이 높아지면서, 지식베이스에 대한 의존도는 더욱 높아지고 있다. 가장 활발하게 사용되고 있는 지식베이스는 프린스턴 대학의 워드넷으로, 일상적으로 사용되는 영어 개념의 대부분을 정의하고 있고, 그 개념들 사이의 의미적 네트워크를 형성하고 있다. 하지만 다양한 기술의 발전 등에 따른 새로운 용어들이 늘고 있으며, 이들은 웹에 게시되는 문서에 시용되고 있다. 이에 기존의 워드넷으로는 그러한 용어들을 모두 커버하지 못하는 한계점이 발생하고 있다. 이에, 본 연구에서는 위키피디아 문서를 이용한 새로운 용어의 정의에 대한 전체적인 설계를 다루고 있으며, 특히 위키피디아에서 제공하는 각 문서의 카테고리 정보가 기술하는 여러 정보들 중에서 적합한 상위어 후보를 선정하는 방법을 집중적으로 기술한다.

      • 구글 Trigram의 활용 사례: 문서 편집기로의 활용

        황명권 ( Myung-gwon Hwang ),이효갑 ( Hyo-gap Lee ),최동진 ( Dong-jin Choi ),김판구 ( Pan-koo Kim ) 한국정보처리학회 2010 한국정보처리학회 학술대회논문집 Vol.17 No.2

        본 논문은 구글(Google)에서 제공하는 n-gram 데이터가 사람들에게 실제로 어느정도의 효율성을 제공할 수 있는지에 대한 내용을 다루고 있다. 이를 위해, 구글의 trigram만을 이용하며, 규모를 줄이기 위해 필터링 과정을 거쳐 trigram 데이터베이스를 형성하였다. 그리고 이를 반영할 수 있는 텍스트 에디터를 구현하여, 사람의 타이핑 속도에 따라 얻을 수 있는 효율성을 측정하였다. 실험 결과에서 n-gram 데이터가 업무 향상에 효율성을 제공할 수 있지만, 여전히 큰 규모의 데이터집합에서 검색하는데 소모되는 시간의 한계점을 발견할 수 있었다.

      • Unknown Word Lexical Dictionary의 자동 생성 방법

        황명권 ( Myung-gwon Hwang ),윤병수 ( Byung-su Youn ),정일용,김판구 ( Pan-koo Kim ) 한국정보처리학회 2008 한국정보처리학회 학술대회논문집 Vol.15 No.1

        본 연구는 의미적 정보 검색을 위한 연구 중의 하나로, 현재까지의 의미적 문서 검색에서 큰 걸림돌이었던 사전에 정의되지 않은 단어(Unknown Word)들의 어휘 사전(Lexical Dictionary)을 자동으로 생성하기 위한 것이다. 이를 위해 UW를 기존의 영어 어휘 사전인 워드넷(WordNet)에 정의되지 않은 단어로 간주하고, 웹 문서의 입력을 통하여 UW와 관련된 단어들을 추출하여 의미적 관련 정도를 확률적, 의미적 방법으로 측정한다. 본 논문에서는 UW Lexical Dictionary를 자동으로 구축하기 위한 방법에 대해서만 기술하였고, 정량적이고 객관적인 평가는 포함하지 않고 있다. 하지만 본 연구의 효용성을 확인하기 위한 몇 가지 문서로부터 추출된 결과는 본 연구가 상당히 의미적이며 가치가 높을 것으로 기대되고 있다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼