RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        과학 기술 문헌 분석을 위한 기계학습 기반 범용 전문용어 인식 시스템

        최윤수,송사광,전홍우,정창후,최성필,Choi, Yun-Soo,Song, Sa-Kwang,Chun, Hong-Woo,Jeong, Chang-Hoo,Choi, Sung-Pil 한국정보처리학회 2011 정보처리학회논문지D Vol.18 No.5

        문헌에서의 전문용어 인식 연구는 정보검색, 정보추출, 시맨틱 웹, 질의응답 분야 등의 연구를 위한 선행 연구로서, 지금까지 대부분 특정 분야, 특히 생의학 분야에서 집중되어 연구되어 왔다. 그러나 기존 연구들이 특정 도메인 또는 문헌 내부 통계 정보를 활용함으로써 범용적인 전문용어 인식에 한계점을 보여 왔기 때문에, 본 연구에서는 웹 검색 결과와 사전, 후보용어의 문형 특징 등을 활용하는 기계 학습 기반 범용 전문용어 인식 방법을 제안하였다. 제안한 방법을 문헌의 지역 통계 정보를 사용하는 방법(C-value)과 비교 실험하여 80.8%의 F-값으로 6.5%의 성능향상을 보였다. 다양한 응집도 자질들을 접목한 두 번째 실험에서는 Normalized Google Distance 방법과 접목한 방식이 F-값 81.8%의 성능으로 최고의 성능을 나타냈다. 기계 학습 방법으로는 로지스틱 회귀분석, C4.5, SVMs 등을 적용하였는데, 일반적으로 이진 분류에 좋은 성능을 보이는 SVMs과 로지스틱 회귀분석 방법보다 결정 트리 방식의 C4.5가 전반적으로 좋은 성능을 보였다. Terminology recognition system which is a preceding research for text mining, information extraction, information retrieval, semantic web, and question-answering has been intensively studied in limited range of domains, especially in bio-medical domain. We propose a domain independent terminology recognition system based on machine learning method using dictionary, syntactic features, and Web search results, since the previous works revealed limitation on applying their approaches to general domain because their resources were domain specific. We achieved F-score 80.8 and 6.5% improvement after comparing the proposed approach with the related approach, C-value, which has been widely used and is based on local domain frequencies. In the second experiment with various combinations of unithood features, the method combined with NGD(Normalized Google Distance) showed the best performance of 81.8 on F-score. We applied three machine learning methods such as Logistic regression, C4.5, and SVMs, and got the best score from the decision tree method, C4.5.

      • 시맨틱 구문 트리 커널 기반의 단백질 간 상호작용 식별

        정창후(Chang-Hoo Jeong),전홍우(Hong-Woo Chun),최윤수(Yun-Soo Choi),최성필(Sung-Pil Choi) 한국정보과학회 2010 한국정보과학회 학술발표논문집 Vol.37 No.1C

        본 논문에서는 단백질 간 상호작용 자동 식별을 위해서 구문 트리 커널을 확장한 시맨틱 구문 트리 커널을 제안한다. 기존의 구문 트리 커널은 구문 트리의 단말 노드를 구성하는 개별 어휘에 대해서 단순하게 외형적 비교를 수행하기 때문에 실제 의미적으로는 유사한 두 구문 트리의 커널 수치가 상대적으로 낮아져서 단백질 간 상호작용 식별의 성능이 떨어지는 문제점이 발생한다. 이를 극복하기 위해서 두 구문트리의 구문적 유사도(syntactic similarity)와 어휘 의미적 유사도(lexical semantic similarity)를 동시에 효과적으로 계산하여 이를 결합하는 새로운 커널을 고안하였다. 그리고 제안된 시맨틱 구문 트리 커널을 활용하여 단백질 간 상호작용 식별 성능을 향상시킬 수 있음을 실험을 통하여 보여주었다.

      • 술어-논항 구조의 패턴 유사도를 활용한 혼합 커널 기반 관계 추출

        정창후(Chang-Hoo Jeong),전홍우(Hong-Woo Chun),최윤수(Yun-Soo Choi),송사광(Sa-Kwang Song),최성필(Sung-Pil Choi) 한국정보과학회 2011 한국정보과학회 학술발표논문집 Vol.38 No.1C

        문서 내에 존재하는 개체 간의 관계를 자동으로 추출할 때 다양한 형태의 문서 분석 결과를 활용할 수 있다. 본 논문에서는 기존에 개발되어 비교적 높은 성능을 보여준 트리 커널의 구절 구조 유사성 정보와 두 개체 사이의 유의미한 연관관계를 표현하는 술어-논항 구조 패턴의 유사성 정보를 활용하는 혼합 커널을 제안한다. 구문적 구조를 이용하는 기존의 트리 커널 기법에 술어와 논항 간의 의미적 구조를 활용하는 술어-논항 구조 패턴 유사도 커널을 결합하여 상호보완적인 혼합 커널을 구성하였고, 실험을 통하여 개발된 커널의 성능을 측정하였다. 실험 결과 구절 구조 정보를 이용하는 트리 커널만을 단독으로 사용했을 때보다 술어-논항 구조의 패턴 정보를 결합한 혼합 커널을 사용했을 때에 더 좋은 성능을 보이는 것을 확인할 수 있었다. 이는 관계 인스턴스에 대한 구절 구조 정보뿐만 아니라 개체 간의 유의미한 연관관계를 표현해주는 술어-논항 구조 패턴 또한 관계 추출 작업에 매우 유용한 정보임을 입증하고 있다.

      • KCI등재

        술어-논항 구조의 어휘 패턴을 이용한 스트링 커널 기반 관계 추출

        정창후(Chang-Hoo Jeong),전홍우(Hong-Woo Chun),송사광(Sa-Kwang Song),홍순찬(Soon-Chan Hong),정한민(Hanmin Jung),최성필(Sung-Pil Choi) 한국정보과학회 2012 정보과학회논문지 : 소프트웨어 및 응용 Vol.39 No.12

        문서 내에 존재하는 핵심개체들 간의 다양한 상호작용을 정확하게 파악하고 활용하기 위해서는 관계 추출 기술이 필수적이다. 스트링 커널을 이용한 관계 추출은 커널의 입력으로 사용되는 스트링을 효과적으로 구성하는 것이 커널 계산 속도나 정확성 측면에서 중요한 요소임에도 불구하고 기존 연구에서는 입력 스트링을 효과적으로 구성하지 못했다. 본 논문에서는 개체 쌍 사이에 존재하는 술어-논항 구조의 어휘 패턴 문자열을 정규화해서 스트링 커널에 적용하는 방법을 제안한다. 술어-논항 구조 패턴은 문장을 구성하는 모든 단어에 대한 술어-논항 관계 그래프에서 중요하게 지정된 두 개체를 연결하는 최소집합의 술어-논항으로 구성된 순서 열로서, 문장 내에서 상호작용하는 두 개체 간의 연관관계를 표현해주는 중요한 단서 정보가 된다. 제안된 시스템의 평가를 위해서 과학기술문헌에 존재하는 핵심개체들 간의 연관관계 추출 성능을 평가하는 테스트컬렉션을 구축하여 실험을 진행하였다. 정확도 측정 결과, 스트링커널의 입력으로 문장 전체를 사용한 경우에는 55.07%, 개체 쌍 사이의 문자열을 사용한 경우에는 61.04%, 그리고 술어-논항 구조의 어휘 패턴 문자열을 사용한 경우에는 69.14%로, 술어-논항 구조의 어휘 패턴 문자열을 사용했을 때 성능이 가장 좋게 나타났다. 결론적으로 문장 내의 술어-논항 구조를 분석하여 정규화된 어휘 패턴을 생성하고 이렇게 생성된 문자열을 스트링 커널에 적용하는 방법이 관계 추출에 유용한 방법임을 알 수 있었다. The relation extraction is one of the most essential parts in text mining in order to capture various detailed interactions between entities found in documents. The previous research has not shown good results on how to effectively construct the input string of the kernel. Actually, it is very important in terms of efficiency and effectiveness of kernel computation. Therefore, we propose a string-kernel method which normalizes the syntactic pattern strings consisting of predicate-argument structures (PAS) existing between a pair of entities in a sentence. The pattern string is the minimumlength sequence of PASs out of all kinds of possible sequences for any pair of words in a sentence, which is a very important clue revealing the interconnection between two entities in a sentence. The proposed method has been implemented and performed experiments to prove its usefulness upon our own test collection designed for verifying the relationship between the entities in documents. The experiments shows that the proposed methods performed the best since its accuracy reaches 69.14% whereas 55.07% and 61.04% are the results of the other two comparison settings: one uses entire strings as the input for the kernel, the other receives all strings between two target entities. Consequently, we proved that the better performance could be obtained from the proposed string-kernel based method, which extracts the normalized lexical pattern consisting of predicate-argument structure in a sentence and then applies it to the string kernel method.

      • KCI등재

        SINDI-WALKS : 과학기술지식발견 워크벤치

        최성필(Sung-Pil Choi),전홍우(Hong-Woo Chun),정창후(Chang-Hoo Jeong),정한민(Hanmin Jung) 한국정보과학회 2012 정보과학회 컴퓨팅의 실제 논문지 Vol.18 No.12

        본 논문은 학술 논문이나 특허 등과 같은 과학기술 문헌에 내재된 기술 지식을 추출하고 체계적으로 관리할 수 있는 통합 워크벤치인 SINDI-WALKS를 소개한다. 이 시스템은 기본적으로 PLOT, 즉 인명, 지명, 기관명 그리고 기술용어를 텍스트에서 식별하고 이들 간의 의미적 관계를 추출하는 기술 지식 추출 엔진과 이들 엔진들에 대한 모니터링 및 오류 분석을 위한 테스트 베드 기능을 포함한다. 또한 기술 지식 추출 엔진이 활용할 수 있는 학습 집합을 효율적으로 구축할 수 있는 테스트컬렉션 구축 기능을 지원한다. 추가적으로 추출된 기술 지식에 대한 가시적 관리를 위한 시맨틱 트리플 통합 관리 기능이 지원된다. 본 논문에서 소개하는 워크벤치를 기반으로 기술 지식 추출 성능 개선과 함께 추출된 지식의 효율적 관리 및 분석이 가능하다. This paper introduces a workbench system called SINDI-WALKS for acquiring valuable knowledge from scientific literature such as papers and patents. The system basically includes scientific knowledge extraction engines that identify PLOTs, i.e. Persons, Locations, Organizations and Terms in texts and extract semantic relations between them. Also, it provides test beds for monitoring the execution of the engines and inspecting the errors of them. An annotation tool is additionally supported in order to construct training sets for improving the performance of the core engines. Finally, various administrative functions are also provided to visually manage the extracted semantic triples. The proposed workbench in this paper can facilitate the scientific knowledge extraction and exploitation.

      • 병력 데이터 기반의 치매 발병 가능성 예측을 위한 AI 모델

        진훈(Hoon Jin),박정주(Jeong-Ju Park),박진영(Jing-Young Park),전홍우(Hong-Woo Chun) 대한전자공학회 2023 대한전자공학회 학술대회 Vol.2023 No.6

        With the rapid development of artificial intelligence technology, many attempts are being made to diagnose Alzheimers dementia, a*nd recently, several companies have provided early diagnosis services through blood collection. Many scholars have reported that early diagnosis technology should be used nationwide to reduce personal and social costs for managing patients with dementia [3]. Through this paper, we designed and built an artificial intelligence data model to predict the possibility of dementia using non-invasive methods such as medical data and health examination data, and verified its usability by implementing a prototype system. In the future, through the improvement and stabilization of the performance of the system and the development of additional services, it will provide services that can be easily and conveniently used by many people concerned about dementia.

      • [우수논문] 술어-논항 구조의 어휘 패턴을 이용한 스트링 커널 기반 관계 추출

        정창후(Chang-Hoo Jeong),최성필(Sung-Pil Choi),전홍우(Hong-Woo Chun),홍순찬(Soon-Chan Hong),정한민(Hanmin Jung) 한국정보과학회 2012 한국정보과학회 학술발표논문집 Vol.39 No.1B

        문서 내에 존재하는 중요한 개체들 간의 관계를 자동으로 추출할 때 개체와 개체 사이의 상호작용 표현에 중요하게 관여하는 핵심자질을 잘 선택할수록 빠르고 정확하게 관계 추출을 수행할 수 있다. 본 논문에서는 개체 쌍 사이에 존재하는 술어-논항 구조의 어휘 패턴 문자열을 정규화해서 스트링 커널에 적용하는 관계 추출 방법을 제안한다. 제안된 시스템의 성능 평가를 위해서 과학기술문헌에 존재하는 중요한 개체들 간의 연관관계 추출 성능 평가를 수행하는 테스트컬렉션을 자체적으로 구축하였으며 실험을 통하여 제안된 방법의 성능을 측정하였다. 정확도 실험 결과, 스트링 커널의 입력으로 문장 전체를 사용한 경우에는 55.0693%, 개체 쌍 사이의 문자열을 사용한 경우에는 61.0331%, 그리고 술어-논항 구조의 어휘 패턴문자열을 사용한 경우에는 69.14%로, 술어-논항 구조의 어휘 패턴 문자열을 사용했을 때 성능이 가장 좋게 나타났다. 결론적으로 문장 내의 술어-논항 구조를 분석하여 정규화된 어휘 패턴을 생성하고 이렇게 생성된 문자열을 스트링 커널에 적용하는 방법이 관계 추출에 유용한 방법임을 알 수 있었다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼