RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        STW를 이용한 웹 문서 장르 분류에 관한 연구

        고병규,김판구,오군석 한국엔터프라이즈아키텍처학회 2012 정보기술아키텍처연구 Vol.9 No.4

        Many researchers have been studied to reveal human natural language to let machine understand its meaning by text based, page rank based or more. Particularly, it has been considered that URL and HTML Tag information in web documents are attracting people’s attention again to analyze huge amount of web document automatically. In this paper, we propose a STW (Semantic Term Weight) approach based on syntactic and linguistic structure of web documents in order to classify what genres are. For the evaluation, we analyzed more than 1,000 documents from 20-Genre-collection corpus for training the documents based on SVM algorithm. Afterwards,we tested KI-04 corpus to evaluate performance of our proposed method. This paper measured their accuracy by classifying them into an experiment using STW and one without using STW. As the results, the proposed STW based approach showed approximately 10.2% which is higher than one without use of STW. 웹 문서의 지속적인 증가로 인해 텍스트 기반, Page Rank 등의 방법으로 한 연구들이 증가하고 있다. 특히 웹 문서 내 URL 정보, HTML Tag 정보 등을 활용하는 연구들이 다시 주목을 받고 있다. 따라서 웹 문서 장르 분류를 위해 앞서 언급한 웹 문서 내 특징 요소들을 바탕으로 본 논문에서는 STW(Semantic Term Weight)를 적용하여 웹 문서 장르 분류하는 연구를 기술한다. 웹 문서 장르분류에 사용되는 데이터 셋은 학습 문서와 테스트 문서로 구성되고, SVM 알고리즘을 사용하여 웹 문서 분류 실험을 수행한다. 학습 과정을 위해 20-Genre-collection corpus 내 1,000여개의 문서를 선정하여 SVM 알고리즘을 통해 학습하였고, 테스트 과정에서 사용된 데이터 셋은 KI-04 corpus를 사용하였다. 테스트 과정 후 STW를 사용한 실험과 STW를 사용하지 않은 실험으로 분류하여 정확도를 측정하였다. 또한 이를 바탕으로 1,212개의 테스트 문서를 분류하였다. 그 결과 STW를 사용한 실험이 그렇지 않은 실험 보다 약 10.2% 높은 정확도를 보였다.

      • KCI등재

        균형상살 검출 알고리즘에서 검출과 관련된 설계변수의 민감도 해석 몇 최적화

        고병규,김광훈,손권,Ko, B.K.,Kim, K.H.,Son, K. 대한의용생체공학회 2011 의공학회지 Vol.32 No.1

        This study suggested an optimized algorithm for detecting the loss of balance(LOB) in the seated position. And the sensitivity analysis was performed in order to identify the role of each design variable in the algorithm. The LOB algorithm consisted of data processing of measured signals, an internal model of the central nervous system and a control error anomaly(CEA) detector. This study optimized design variables of a CEA detector to obtain improved values of the success rate(SR) of detecting the LOB and the margin time(MT) provided for preventing the falling. Nine healthy adult volunteers were involved in the experiments. All the subjects were asked to balance their body in a predescribed seated posture with the rear legs of a four-legged wooden chair. The ground reaction force from the right leg was measured from the force plate while the accelerations of the chair and the head were measured from a couple of piezoelectric accelerometers. The measured data were processed to predict the LOB using a detection algorithm. Variables S2, h2 and hd are related to the detector: S2 represents a data selecting window, h2 a time shift and hd an operating period of the LOB detection algorithm. S2 was varied from 0.1 to 10 sec with an increment of 0.1 sec, and both h2 and hd were varied from 0.01 to 1.0 sec with an increment of 0.01 sec. It was found that the SR and MT were increased by up to 9.7% and 0.497 sec comparing with the previously published case when the values of S2, h2 and hd were set to 4.5, 0.3 and 0.2 sec, respectively. Also the results of sensitivity analysis showed that S2 and h2 had considerable influence on the SR while these variables were not so sensitive to the MT.

      • Wikipedia에서 온톨로지 개념 인식을 위한 핵심어 추출

        고병규 ( Byeong-kyu Ko ),김판구 ( Pan-koo Kim ) 한국정보처리학회 2010 한국정보처리학회 학술대회논문집 Vol.17 No.1

        최근 주목받고 있는 의미적 정보처리의 지식베이스인 온톨로지는 정형화된 표현을 통해 정확한 지식 처리와 추론관계를 명시해야 하기 때문에 온톨로지 확장에 대한 중요성 역시 강조되고 있다. 온톨로지 확장을 위한 기존의 방법들은 전문가를 통한 수작업 형태이거나 보편화된 사전이나 시소러스 집단의 분석을 통한 통계의 확률분포를 이용하는 반자동화된 방법들이 있다. 이에 본 논문에서는 Wikipedia에서 특정 도메인 문서들만을 수집한 후 중요문장 추출과정을 통해 해당 문서 내의 핵심어를 파악하여 이를 온톨로지의 개념 인식을 위한 정보로 활용할 수 있는 방안을 제시하고자 한다.

      • KCI등재

        설화 스토리 내 인물정보 추출 방법에 관한 연구

        고병규(Byeong Kyu Ko),김정인(Jeong In Kim),이은지(Eun Ji Lee),김판구(Pan Koo Kim) 한국스마트미디어학회 2016 스마트미디어저널 Vol.5 No.2

        스토리텔링 기법을 사용하여 교육, 마케팅, 창작 등 다양한 분야에서 활용하고 있다. 특히 창작분야에서는 기존의 구전설 화와 같이 짧고 이해하기 힘든 이야기를 현재의 상황과 배경에 맞춰 새롭게 창작하는 이야기들이 많아지고 있지만, 많은 이야기들이 나옴으로써 이야기의 소재 및 아이디어가 한계에 다다르고 있고 기존의 이야기를 바탕으로 하여 새롭게 각색하는 방법이 매우 힘든 실정이다. 따라서, 본 논문에서는 스토리텔링 저작 지원 소프트웨어 내 사용할 수 있는 스토리 개발을 위한 사전 단계인 텍스트 분석 및 인물정보 추출 방법을 통해 사용자로 하여금 기존의 이야기를 바탕으로 새로운 창작의 기회를 제공할 수 있는 시스템을 개발하고, 이에 대한 기술적인 내용을 기술한다. Storytelling techniques have been using for utilizing in various fields such as education, marketing and so on. In creative content sector, especially, the amount of creating the a newly story content from existing oral tales which are short and quite hard to understand the context has been increased. However, there are some limitations for creating the ideas of the story according to the expansion of the stories while the approach for new adaptation of existing stories is quite challenging. In this paper, therefore, we described the preliminary steps of text analysis and object extraction method for story development which can be applied to the storytelling authoring supported software.

      • KCI등재후보

        온톨로지 기반 업무 매뉴얼 검색 시스템 설계

        김정인, 고병규, 김판구 IT연구소 2012 정보기술융합공학논문지 Vol.2 No.2

        온톨로지는 시맨틱 웹 기술 중 하나로 각 개체별 의미적 관계를 생성함으로 다양한 정보 서비스에 활 용된다. 이를 통해 본 논문에서는 효율적인 업무처리를 위해 업무를 기반으로 온톨로지 설계, 구축 과정과 추론 규칙, SPAR-QL을 이용하여 웹 문서를 통한 검색 시스템을 개발하였다. 기존 업무 매뉴얼 시스템 내 데이터와 일반적으로 시행하는 업무 관련 정보를 바탕으로 데이터를 수집하여 본 연구에 맞도록 데이터를 가공한 후 Protege를 통해 온톨로지 내 클래스 및 인스턴스를 정의하고, 추론 규칙을 정의하기 위한 클래 스 내 속성 값을 정의하였으며, 이를 바탕으로 웹 문서 내 SPAR-QL을 이용한 검색 서비스를 제안하였다. 본 연구에서 제안한 업무매뉴얼 온톨로지는 기존의 카테고리 형식의 단순 검색을 탈피하여 특정 검색에 대한 다양한 정보를 연계함으로써 보다 나은 서비스를 제공한다.

      • 위키피디아 문서를 이용한 전문용어 N-Gram 구축

        최준호 ( Jun-ho Choi ),고병규 ( Byung-gyu Go ),이준 ( Jun Lee ),김판구 ( Pan-koo Kim ) 한국정보처리학회 2011 한국정보처리학회 학술대회논문집 Vol.18 No.1

        자연어 처리 분야 중 현재 가장 활용도가 높은 분야는 질의어 추천기능, 단어 자동 완성 기능 등으로 정보검색에서 사용자가 입력한 문자들을 바탕으로 질의어를 완성해주는 것이다. 이러한 기능을 위해서는 문서 내용을 고려한 N-Gram 데이터 구축이 필수적이다. 본 논문에서는 문서 편집기나 검색엔진의 질의어 추천 등에 많이 활용되는 N-Gram 데이터의 전문용어별 구축을 위해 위키피디아 문서를 이용하는 방안을 제시하였다.

      • KCI등재

        상호 정보량과 로그 정규화를 이용한 뉴스 카테고리 분류

        이재욱(Jae-Uk Lee),고병규(Byeong-Kyu Ko),김판구(Pan-Koo Kim) 한국정보기술학회 2016 한국정보기술학회논문지 Vol.14 No.7

        Recently, web documents are difficult to classify into an accurate related category due to the development of easily available of social networks for users such as twitter, facebook, instagram and so on. Previous category classification method of one of the supervised learning classified category into many duplication word according to word frequency of each standard data. In order to improve the misclassification of document according to frequency gap, this paper proposes the category classification method of news web document using mutual information which compares sharing information quantity about each document based on probability value and log classification which assigns high weight for category of low constructed word. and comparing this paper result with previous result. As a result, the precision rate has been increased up to 3.28% than the previous research based on the frequency.

      • KCI등재

        Link Grammar를 이용한 도메인 온톨로지 확장 방안

        최준호(Jun-ho Choi),최창(Chang Choi),고병규(Byeong-Kyu Ko),김판구(Pan-koo Kim) 한국정보기술학회 2011 한국정보기술학회논문지 Vol.9 No.3

        Ontology which is the fundamental for semantic web is getting important while the semantic information processing is developed. To build and extend ontologies, much of research has been proposed such as semi-automatic and full-automatic methods through analyzing raw text documents. However, the methods based on document set in specific domain has a limitation which the ontology depends on the domain. Therefore, this research has used Wikipedia document set for extension of generalized ontology. The Wikipedia contains unrestricted subjects and one document is filled with one subject in detail. Moreover, since the content is written by domain specialist, we can say that Wikipedia provides trustworthy contents. This research which deals with ontology extension, it extracts important sentences from Wikipedia documents and the sentences are structured by Link Grammar. Finally, the ontology extension is accomplished through conceptualization step which grasps subjects, objects, and predicates from the structured contents. In the performance evaluation compared our method to the other method using Context-Free Grammar showed better accuracy more than 12% points.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼