RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        바이오 분야 학술 문헌에서의 분야별 관계 추출 데이터셋 반자동 구축에 관한 연구 - 알츠하이머병 유관 유전자 간 상호 작용 중심으로 -

        최성필,유석종,조현양,Choi, Sung-Pil,Yoo, Suk-Jong,Cho, Hyun-Yang 한국도서관정보학회 2016 한국도서관정보학회지 Vol.48 No.1

        본 논문에서는 생의학 분야의 특정 세부 분야에 특화된 관계 추출 학습 말뭉치를 효율적으로 구축할 수 있는 시스템을 소개한다. 이 시스템은 대상 분야에 해당하는 용어집(유전자, 단백질, 질환 명칭 등)을 입력하면, 대용량 상호 작용 데이터베이스를 통해서 이들 용어 간의 연관 관계를 1차적으로 생성하고 생성된 연관 관계 집합을 다시 학술 데이터베이스에서 검색하여 최종적으로 연관 관계 포함 문장을 추출하는 형태로 수행된다. 개발된 시스템의 유용성 검증을 위해서 알츠하이머병 분야에서의 유전자 간 상호 작용 학습 말뭉치를 구축하는데 본 시스템을 적용하였고, 140개의 유전자 집합을 입력하여 이 분야에 특화된 학습 집합인 유전자 쌍 및 상호 작용 포함 문장 3,510 건을 추출하였다. 본 논문에서 제안한 시스템을 활용함으로써 기존에 완전 수작업으로 수행되던 연관 관계 추출용 학습 말뭉치 구축의 효율성을 높일 수 있고 다양한 세부 분야에 적합한 학습 말뭉치 구축에 도움을 줄 수 있다. This paper introduces a software system and process model for constructing domain-specific relation extraction datasets semi-automatically. The system uses a set of terms such as genes, proteins diseases and so forth as inputs and then by exploiting massive biological interaction database, generates a set of term pairs which are utilized as queries for retrieving sentences containing the pairs from scientific databases. To assess the usefulness of the proposed system, this paper applies it into constructing a genic interaction dataset related to Alzheimer's disease domain, which extracts 3,510 interaction-related sentences by using 140 gene names in the area. In conclusion, the resulting outputs of the case study performed in this paper indicate the fact that the system and process could highly boost the efficiency of the dataset construction in various subfields of biomedical research.

      • KCI등재

        구조화된 저널리즘 서비스를 위한 과학 칼럼 정보 지식화 프레임워크 설계

        최성필,김혜선,김지영,Choi, Sung-Pil,Kim, Hye-Sun,Kim, Ji-Young 한국문헌정보학회 2015 한국문헌정보학회지 Vol.49 No.1

        This paper proposes a noble service architecture based on scientific infographic as well as semi-automatic knowledge process for 'KISTI's Scent of Science' database, which has been highly credited as a science journalism service in Korea. Unlike other specialized scientific databases for domain experts and scientists, the database aims at providing comprehensible and intuitive information about various important scientific concepts which may seem not to be easily understandable to general public. In order to construct a knowledge-base from the database, we deeply analyze the traits of the database and then establish a semi-automatic approach to identify and extract various scientific intelligence from its contents. Furthermore, this paper defines a scientific infographic service platform based on the knowledge-base by offering its detailed structure, methods and characteristics, which shows a progressive future direction for science journalism service. 본 논문에서는 과학 저널리즘의 대표적인 성공 사례로 평가되고 있는 KISTI의 과학향기 칼럼에 대한 반자동 지식화 방안과 이를 기반으로 과학기술 인포그래픽 기반의 서비스 체제를 제안한다. 전문가나 특정 분야 과학자를 대상으로 하는 전문 정보와는 달리 과학향기 콘텐트는 일반 대중을 대상으로 알기 쉬운 과학 상식을 제공하고 있다. 이러한 특성을 바탕으로 과학향기 데이터베이스를 지식화하기 위한 방법론 즉, 지식 유형, 지식 추출 방법 및 절차 등을 세부적으로 살펴본다. 또한 과학향기 지식베이스를 기반으로 과학기술 인포그래픽 서비스 체제를 새롭게 정의하고 이에 대한 세부적인 구성도, 방법론 및 특징 등을 기술한다. 이를 통해서 미래의 과학 저널리즘 서비스가 나아가야 할 발전적 방향을 제안한다.

      • KCI등재

        술어-논항 튜플 기반 근사 정렬을 이용한 문장 단위 바꿔쓰기표현 유형 및 오류 분석

        최성필,송사광,맹성현,Choi, Sung-Pil,Song, Sa-Kwang,Myaeng, Sung-Hyon 한국정보처리학회 2012 정보처리학회논문지B Vol.19 No.2

        본 논문에서는 Predicate-Argument Tuple (PAT)를 기반으로 텍스트 간 심층적 근사 정렬(Approximate Alignment)을 통한 문장 단위 바꿔쓰기표현(sentential paraphrase) 식별 모델을 제안한다. 두 문장 간의 PAT 기반 근사 정렬 결과를 바탕으로, 두 문장의 의미적 연관성을 효과적으로 표현하는 다양한 정렬 자질(alignment feature)들을 정의함으로써, 바꿔쓰기표현 식별 문제를 지도 학습(supervised learning) 기반의 자동 분류 모델로 접근하였다. 실험을 통해서 제안 모델의 가능성을 확인할 수 있었으며, 시스템의 오류 분석을 통해 제안 방법이 아직 해결하지 못하는 다양한 바꿔쓰기표현 유형들을 식별함으로써 향후 시스템의 성능 개선 방향을 도출하였다. This paper proposes a model for recognizing sentential paraphrases through Predicate-Argument Tuple (PAT)-based approximate alignment between two texts. We cast the paraphrase recognition problem as a binary classification by defining and applying various alignment features which could effectively express the semantic relatedness between two sentences. Experiment confirmed the potential of our approach and error analysis revealed various paraphrase patterns not being solved by our system, which can help us devise methods for further performance improvement.

      • KCI등재

        자동 색인을 위한 한국어 형태소 분석기의 실제적인 구현 및 적용

        최성필,서정현,채영숙,Choi, Sung-Pil,Seo, Jerry,Chae, Young-Suk 한국정보처리학회 2002 정보처리학회논문지B Vol.9 No.5

        본 논문에서는 정보검색 시스템에서 필수적인 자동 색인을 위한 한글 형태소 분석기를 구현하였다. 현존하는 대용량의 데이터에 대한 자동 색인을 효율적으로 수행하기 위해서 새로운 개념이나 아이디어의 도입 및 적용에 초점을 맞추기보다는 기존에 연구되었던 다양한 어절 분석 기법들을 바탕으로 어절분석 속도의 최대화, 형태소 분석기의 모듈화 및 구조화에 초점을 맞추었다. 따라서 본 논문에서 개발된 시스템의 특징은 이론적인 측면보다는 소프트웨어 공학적인 측면이 훨씬 더 강조된다 품사 사전의 구조화가 우선적으로 수행되었으며, 이에 따라서 체언 및 용언 분석 모듈, 수사 분석 모듈 둥이 구현되었다. 또한 형태소의 패턴을 이용한 미등록어 분석 기능이 개발되었다. 개발된 전체 시스템은 정보 검색 엔진인 K-2000 시스템의 색인 모듈로 장착되어서 적용되었다. In this paper, we developed Korean Morphological Analyzer for an automatic indexing that is essential for Information Retrieval. Since it is important to index large-scaled document set efficiently, we concentrated on maximizing the speed of word analysis, modularization and structuralization of the system without new concepts or ideas. In this respect, our system is characterized in terms of software engineering aspect to be used in real world rather than theoretical issues. First, a dictionary of words was structured. Then modules that analyze substantive words and inflected words were introduced. Furthermore numeral analyzer was developed. And we introduced an unknown word analyzer using the patterns of morpheme. This whole system was integrated into K-2000, an information retrieval system.

      • KCI우수등재

        3차원 수직·수평 연결 네트워크 건축 공간분석을 위한 보행에너지 가중 Visibility ERAM 모델 구축

        최성필(Choi, Sung-Pil),박근송(Piao, Gen-Song),최재필(Choi, Jae-Pil) 대한건축학회 2018 대한건축학회논문집 Vol.34 No.11

        The purpose of this study is to establish a walking energy weighted ERAM model that can predict the pedestrian volume by the connection structure of the vertical and horizontal spaces within a three-dimensional building. The process of building a walking-energy weighted ERAM model is as follows. First, the spatial graph was used to reproduce three-dimensional buildings with vertical and horizontal spatial connection structures. Second, the walking energy was measured on the spatial graph. Third, ERAM model was used to apply weights with spatial connection properties in random walking environment, and the walking energy weights were applied to the ERAM model to calculate the walk energy weighted ERAM values and visualize the distribution of pedestrian flow. To verify the validation of the established model, existing and proposed spatial analysis models were compared to real space. The results of this study are as follows : The model proposed in this study showed as much elaborated estimation of pedestrian traffic flow in real space as in traditional spatial analysis models, and also it showed much higher level of forecasting pedestrian traffic flow in real space than existing models.

      • KCI등재

        SINDI-WALKS : 과학기술지식발견 워크벤치

        최성필(Sung-Pil Choi),전홍우(Hong-Woo Chun),정창후(Chang-Hoo Jeong),정한민(Hanmin Jung) 한국정보과학회 2012 정보과학회 컴퓨팅의 실제 논문지 Vol.18 No.12

        본 논문은 학술 논문이나 특허 등과 같은 과학기술 문헌에 내재된 기술 지식을 추출하고 체계적으로 관리할 수 있는 통합 워크벤치인 SINDI-WALKS를 소개한다. 이 시스템은 기본적으로 PLOT, 즉 인명, 지명, 기관명 그리고 기술용어를 텍스트에서 식별하고 이들 간의 의미적 관계를 추출하는 기술 지식 추출 엔진과 이들 엔진들에 대한 모니터링 및 오류 분석을 위한 테스트 베드 기능을 포함한다. 또한 기술 지식 추출 엔진이 활용할 수 있는 학습 집합을 효율적으로 구축할 수 있는 테스트컬렉션 구축 기능을 지원한다. 추가적으로 추출된 기술 지식에 대한 가시적 관리를 위한 시맨틱 트리플 통합 관리 기능이 지원된다. 본 논문에서 소개하는 워크벤치를 기반으로 기술 지식 추출 성능 개선과 함께 추출된 지식의 효율적 관리 및 분석이 가능하다. This paper introduces a workbench system called SINDI-WALKS for acquiring valuable knowledge from scientific literature such as papers and patents. The system basically includes scientific knowledge extraction engines that identify PLOTs, i.e. Persons, Locations, Organizations and Terms in texts and extract semantic relations between them. Also, it provides test beds for monitoring the execution of the engines and inspecting the errors of them. An annotation tool is additionally supported in order to construct training sets for improving the performance of the core engines. Finally, various administrative functions are also provided to visually manage the extracted semantic triples. The proposed workbench in this paper can facilitate the scientific knowledge extraction and exploitation.

      • KCI등재

        기술 문헌 분석 테스트베드 툴킷 개발

        최성필(Sung-Pil Choi),송사광(Sa-kwang Song),정한민(Hanmin Jung) 한국콘텐츠학회 2012 한국콘텐츠학회논문지 Vol.12 No.8

        본 논문은 논문, 특허, 연구보고서 등과 같은 다양한 과학 기술 문헌에 포함된 기술 지식을 효과적으로 추출하는데 필요한 텍스트 분석 엔진들의 효과적인 모니터링 및 성능 최적화를 위한 테스트베드 도구를 소개한다. 이 도구는 과학 기술 분야의 전문 용어를 비롯한 인명, 지명, 기관명 등을 자동으로 인식하는 기술 개체 인식 엔진을 위한 테스트베드와 인식된 기술 개체 간의 의미적 연관 관계를 자동으로 추출하는 기술개체 간 관계 추출 테스트베드로 구성되어 있다. 이를 활용함으로써 사용자 및 개발자들은 기술 문헌 분석 엔진의 실행 모니터링은 물론 오류 분석을 효율적으로 수행할 수 있다. This paper introduces a test-bed toolkit for evaluating and enhancing text analysis engines which extract technological knowledge from articles, patents, reports and so forth. The toolkit consists of two test-beds for technical entity recognition and relation extraction engines, which are capable of identifying technical entities and predicting semantic relation types between the entities. With using the introduced toolkits, users and developers can efficiently perform the execution monitoring and error analysis of the technical text analysis engines.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼