RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        바이오 분야 학술 문헌에서의 분야별 관계 추출 데이터셋 반자동 구축에 관한 연구 - 알츠하이머병 유관 유전자 간 상호 작용 중심으로 -

        최성필,유석종,조현양,Choi, Sung-Pil,Yoo, Suk-Jong,Cho, Hyun-Yang 한국도서관정보학회 2016 한국도서관정보학회지 Vol.48 No.1

        본 논문에서는 생의학 분야의 특정 세부 분야에 특화된 관계 추출 학습 말뭉치를 효율적으로 구축할 수 있는 시스템을 소개한다. 이 시스템은 대상 분야에 해당하는 용어집(유전자, 단백질, 질환 명칭 등)을 입력하면, 대용량 상호 작용 데이터베이스를 통해서 이들 용어 간의 연관 관계를 1차적으로 생성하고 생성된 연관 관계 집합을 다시 학술 데이터베이스에서 검색하여 최종적으로 연관 관계 포함 문장을 추출하는 형태로 수행된다. 개발된 시스템의 유용성 검증을 위해서 알츠하이머병 분야에서의 유전자 간 상호 작용 학습 말뭉치를 구축하는데 본 시스템을 적용하였고, 140개의 유전자 집합을 입력하여 이 분야에 특화된 학습 집합인 유전자 쌍 및 상호 작용 포함 문장 3,510 건을 추출하였다. 본 논문에서 제안한 시스템을 활용함으로써 기존에 완전 수작업으로 수행되던 연관 관계 추출용 학습 말뭉치 구축의 효율성을 높일 수 있고 다양한 세부 분야에 적합한 학습 말뭉치 구축에 도움을 줄 수 있다. This paper introduces a software system and process model for constructing domain-specific relation extraction datasets semi-automatically. The system uses a set of terms such as genes, proteins diseases and so forth as inputs and then by exploiting massive biological interaction database, generates a set of term pairs which are utilized as queries for retrieving sentences containing the pairs from scientific databases. To assess the usefulness of the proposed system, this paper applies it into constructing a genic interaction dataset related to Alzheimer's disease domain, which extracts 3,510 interaction-related sentences by using 140 gene names in the area. In conclusion, the resulting outputs of the case study performed in this paper indicate the fact that the system and process could highly boost the efficiency of the dataset construction in various subfields of biomedical research.

      • KCI등재

        구조화된 저널리즘 서비스를 위한 과학 칼럼 정보 지식화 프레임워크 설계

        최성필,김혜선,김지영,Choi, Sung-Pil,Kim, Hye-Sun,Kim, Ji-Young 한국문헌정보학회 2015 한국문헌정보학회지 Vol.49 No.1

        This paper proposes a noble service architecture based on scientific infographic as well as semi-automatic knowledge process for 'KISTI's Scent of Science' database, which has been highly credited as a science journalism service in Korea. Unlike other specialized scientific databases for domain experts and scientists, the database aims at providing comprehensible and intuitive information about various important scientific concepts which may seem not to be easily understandable to general public. In order to construct a knowledge-base from the database, we deeply analyze the traits of the database and then establish a semi-automatic approach to identify and extract various scientific intelligence from its contents. Furthermore, this paper defines a scientific infographic service platform based on the knowledge-base by offering its detailed structure, methods and characteristics, which shows a progressive future direction for science journalism service. 본 논문에서는 과학 저널리즘의 대표적인 성공 사례로 평가되고 있는 KISTI의 과학향기 칼럼에 대한 반자동 지식화 방안과 이를 기반으로 과학기술 인포그래픽 기반의 서비스 체제를 제안한다. 전문가나 특정 분야 과학자를 대상으로 하는 전문 정보와는 달리 과학향기 콘텐트는 일반 대중을 대상으로 알기 쉬운 과학 상식을 제공하고 있다. 이러한 특성을 바탕으로 과학향기 데이터베이스를 지식화하기 위한 방법론 즉, 지식 유형, 지식 추출 방법 및 절차 등을 세부적으로 살펴본다. 또한 과학향기 지식베이스를 기반으로 과학기술 인포그래픽 서비스 체제를 새롭게 정의하고 이에 대한 세부적인 구성도, 방법론 및 특징 등을 기술한다. 이를 통해서 미래의 과학 저널리즘 서비스가 나아가야 할 발전적 방향을 제안한다.

      • KCI등재

        자동 색인을 위한 한국어 형태소 분석기의 실제적인 구현 및 적용

        최성필,서정현,채영숙,Choi, Sung-Pil,Seo, Jerry,Chae, Young-Suk 한국정보처리학회 2002 정보처리학회논문지B Vol.9 No.5

        본 논문에서는 정보검색 시스템에서 필수적인 자동 색인을 위한 한글 형태소 분석기를 구현하였다. 현존하는 대용량의 데이터에 대한 자동 색인을 효율적으로 수행하기 위해서 새로운 개념이나 아이디어의 도입 및 적용에 초점을 맞추기보다는 기존에 연구되었던 다양한 어절 분석 기법들을 바탕으로 어절분석 속도의 최대화, 형태소 분석기의 모듈화 및 구조화에 초점을 맞추었다. 따라서 본 논문에서 개발된 시스템의 특징은 이론적인 측면보다는 소프트웨어 공학적인 측면이 훨씬 더 강조된다 품사 사전의 구조화가 우선적으로 수행되었으며, 이에 따라서 체언 및 용언 분석 모듈, 수사 분석 모듈 둥이 구현되었다. 또한 형태소의 패턴을 이용한 미등록어 분석 기능이 개발되었다. 개발된 전체 시스템은 정보 검색 엔진인 K-2000 시스템의 색인 모듈로 장착되어서 적용되었다. In this paper, we developed Korean Morphological Analyzer for an automatic indexing that is essential for Information Retrieval. Since it is important to index large-scaled document set efficiently, we concentrated on maximizing the speed of word analysis, modularization and structuralization of the system without new concepts or ideas. In this respect, our system is characterized in terms of software engineering aspect to be used in real world rather than theoretical issues. First, a dictionary of words was structured. Then modules that analyze substantive words and inflected words were introduced. Furthermore numeral analyzer was developed. And we introduced an unknown word analyzer using the patterns of morpheme. This whole system was integrated into K-2000, an information retrieval system.

      • KCI등재

        술어-논항 튜플 기반 근사 정렬을 이용한 문장 단위 바꿔쓰기표현 유형 및 오류 분석

        최성필,송사광,맹성현,Choi, Sung-Pil,Song, Sa-Kwang,Myaeng, Sung-Hyon 한국정보처리학회 2012 정보처리학회논문지B Vol.19 No.2

        본 논문에서는 Predicate-Argument Tuple (PAT)를 기반으로 텍스트 간 심층적 근사 정렬(Approximate Alignment)을 통한 문장 단위 바꿔쓰기표현(sentential paraphrase) 식별 모델을 제안한다. 두 문장 간의 PAT 기반 근사 정렬 결과를 바탕으로, 두 문장의 의미적 연관성을 효과적으로 표현하는 다양한 정렬 자질(alignment feature)들을 정의함으로써, 바꿔쓰기표현 식별 문제를 지도 학습(supervised learning) 기반의 자동 분류 모델로 접근하였다. 실험을 통해서 제안 모델의 가능성을 확인할 수 있었으며, 시스템의 오류 분석을 통해 제안 방법이 아직 해결하지 못하는 다양한 바꿔쓰기표현 유형들을 식별함으로써 향후 시스템의 성능 개선 방향을 도출하였다. This paper proposes a model for recognizing sentential paraphrases through Predicate-Argument Tuple (PAT)-based approximate alignment between two texts. We cast the paraphrase recognition problem as a binary classification by defining and applying various alignment features which could effectively express the semantic relatedness between two sentences. Experiment confirmed the potential of our approach and error analysis revealed various paraphrase patterns not being solved by our system, which can help us devise methods for further performance improvement.

      • KCI등재

        구문 트리 가지치기 및 소멸 인자 조정을 통한 트리 커널 기반 단백질 간 상호작용 추출 성능 향상

        최성필(Sung-Pil Choi),최윤수(Yun-Soo Choi),정창후(Chang-Hoo Jeong),맹성현(Sung-Hyon Myaeng) 한국정보과학회 2010 정보과학회논문지 : 소프트웨어 및 응용 Vol.37 No.2

        본 논문에서는 기존의 연구에서 시도되었던 것과는 달리, 복잡하고 추출하기가 어려운 다양한 형태의 자질 및 단서 정보가 필요 없는 합성곱 구문 트리 커널 기반의 단백질 간 상호작용 추출 기법을 소개한다. 이 기법의 특징은 단백질 이름 쌍을 포함한 상호작용 포함 후보 문장에 대한 구문 트리만을 이용하여 추출을 시도한다는 것이며 부가적인 자질이나 커널 함수가 불필요하다는 장점이 있다. 이를 기반으로 본 논문의 연구 성과는 다음과 같다. 첫째, 단백질 간 상호작용 추출에 있어서 구문 트리 커널을 적용할 경우 불필요한 문맥 정보를 효과적으로 제거하는 구문 트리 가지치기 작업이 필수적임을 기존 연구 결과와의 성능 비교로써 증명한다. 둘째, 동일한 학습 조건에서 구문 트리 커널의 소멸 인자(decay factor)는 평활인자(smoothing factor)로서 중요한 역할을 하며, 성능 변화의 핵심 요소임을 보인다. 특히 학습 집합의 규모에 따라서 소멸인자가 성능에 미치는 영향력이 상이한 패턴으로 나타남을 제시하였다. 결론적으로 기존의 최신 연구결과로서 주장한 “단일 커널보다 혼합 커널의 성능이 더 뛰어나다”라는 가설이 항상 성립하는 것은 아니라는 것을 합성곱 구문 트리 커널 단독으로 적용하여 높은 성능을 나타냄으로써 보여주었다. 동일한 조건으로 수행한 실험에서 기존의 두 연구 결과에 비해 19.8%, 14%의 성능 개선을 나타내었다. This paper introduces a novel way to leverage convolution parse tree kernel to extract the interaction information between two proteins in a sentence without multiple features, clues and complicated kernels. Our approach needs only the parse tree alone of a candidate sentence including pairs of protein names which is potential to have interaction information. The main contribution of this paper is two folds. First, we show that for the PPI, it is imperative to execute parse tree pruning removing unnecessary context information in deciding whether the current sentence imposes interaction information between proteins by comparing with the latest existing approaches' performance. Secondly, this paper presents that tree kernel decay factor can play an pivotal role in improving the extraction performance with the identical learning conditions. Consequently, we could witness that it is not always the case that multiple kernels with multiple parsers perform better than each kernels alone for PPI extraction, which has been argued in the previous research by presenting our outperformed experimental results compared to the two existing methods by 19.8% and 14% respectively.

      • KCI등재

        SINDI-WALKS : 과학기술지식발견 워크벤치

        최성필(Sung-Pil Choi),전홍우(Hong-Woo Chun),정창후(Chang-Hoo Jeong),정한민(Hanmin Jung) 한국정보과학회 2012 정보과학회 컴퓨팅의 실제 논문지 Vol.18 No.12

        본 논문은 학술 논문이나 특허 등과 같은 과학기술 문헌에 내재된 기술 지식을 추출하고 체계적으로 관리할 수 있는 통합 워크벤치인 SINDI-WALKS를 소개한다. 이 시스템은 기본적으로 PLOT, 즉 인명, 지명, 기관명 그리고 기술용어를 텍스트에서 식별하고 이들 간의 의미적 관계를 추출하는 기술 지식 추출 엔진과 이들 엔진들에 대한 모니터링 및 오류 분석을 위한 테스트 베드 기능을 포함한다. 또한 기술 지식 추출 엔진이 활용할 수 있는 학습 집합을 효율적으로 구축할 수 있는 테스트컬렉션 구축 기능을 지원한다. 추가적으로 추출된 기술 지식에 대한 가시적 관리를 위한 시맨틱 트리플 통합 관리 기능이 지원된다. 본 논문에서 소개하는 워크벤치를 기반으로 기술 지식 추출 성능 개선과 함께 추출된 지식의 효율적 관리 및 분석이 가능하다. This paper introduces a workbench system called SINDI-WALKS for acquiring valuable knowledge from scientific literature such as papers and patents. The system basically includes scientific knowledge extraction engines that identify PLOTs, i.e. Persons, Locations, Organizations and Terms in texts and extract semantic relations between them. Also, it provides test beds for monitoring the execution of the engines and inspecting the errors of them. An annotation tool is additionally supported in order to construct training sets for improving the performance of the core engines. Finally, various administrative functions are also provided to visually manage the extracted semantic triples. The proposed workbench in this paper can facilitate the scientific knowledge extraction and exploitation.

      • KCI우수등재

        3차원 수직 · 수평 건축공간분석을 위한 ERAM모델의 보행에너지 가중치 산정 연구

        최성필(Choi, Sung-Pil),최재필(Choi, Jae-Pil) 대한건축학회 2018 대한건축학회논문집 Vol.34 No.6

        The aim of this study is to propose a method for calculating the weight of walking energy in ERAM model by calculating it for the analysis of vertical and horizontal spaces in a building. Conventional theories on the space analysis in the field of architectural planning predict the pedestrian volume of network spaces in urban street or in two-dimensional plane within a building, however, for vertical and horizontal spaces in a building, estimates of the pedestrian volume by those theories are limited. Because in the spatial syntax and ERAM model have been applied weights such as the spatial depth, adjacent angles, and physical distances available only to the two-dimensional same layer or plane. Therefore, the following basic assumptions and analysis conditions in this study were established for deriving a predictor of pedestrian volume in vertical and horizontal spaces of a building. The basic premise of space analysis is not to address the relationship between the pedestrian volume and the spatial structure itself but to the properties of spatial structure connection that human beings experience. The analysis conditions in three-dimensional spaces are as follows : 1) Measurement units should be standardized on the same scale, and 2) The connection characteristics between spaces should influence the accessibility of human beings. In this regard, a factor of walking energy has the attributes to analyze the connection of vertical and horizontal spaces and satisfies the analysis conditions presented in this study. This study has two implications. First, this study has shown how to quantitatively calculate the walking energy after a factor of walking energy was derived to predict the pedestrian volume in vertical and horizontal spaces. Second, the method of calculating the walking energy can be applied to the weights of the ERAM model, which provided the theoretical basis for future studies to predict the pedestrian volume of vertical and horizontal spaces in a building.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼