http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
GenBank를 활용한 이종의 콘텐트 연계 프로토타입 시스템 개발 연구
안부영,신용주,김대환,Ahn, Bu-Young,Shin, Young-Ju,Kim, Dea-Hwan 한국과학기술정보연구원 과학기술정보센터 2009 Journal of Information Science Theory and Practice Vol.40 No.4
Among biological information, GenBank, provided by the National Center for Biotechnology Information (NCBI)of the United States, is a representative database on genetic information and is the most widely used by researchers around the world. Korea Institute of Science and Technology Information (KISTI) visits NCBI on a regular basis and downloads the latest version of GenBank to reorganize the information gathered there into a database. This database is provided for Korean researchers of science and technology through the Bio-KRISTAL search engine, developed by KISTI. This study aims to design a service model that links information on papers, patents, and biodiversity and other contents of NDSL, an integrated service on scientific and technological information run by KISTI, with GenBank's reference and organism fields and to develop a prototype system. For this purpose, this paper explores the possibility of a linkage and convergence service between heterogeneous content by: (a) collecting GenBank data from NCBI's FTP site; (b) dividing GenBank text files into basic and reference genetic information and restructuring them into a database; (c) extracting article and patent information from the GenBank reference fields to generate new tables; and (d) leveraging data mapping technology to implement a prototype system where GenBank and NDSL data are interlinked and provided. 생명정보 중에서 미국의 국립생명공학정보센터(NCBI)에서 제공하는 GenBank는 전 세계적으로 연구자들이 가장 많이 사용하는 대표적인 유전자정보 데이터베이스이다. 한국과학기술정보연구원(KISTI)은 GenBank의 최신 버전을 데이터베이스로 재구축하여 Bio-KRISTAL 검색엔진을 이용하여 국내 생명과학 연구자들에게 제공하고 있다. 본 논문에서는 GenBank 데이터베이스를 활용하여 과학기술정보 통합서비스인 NDSL의 논문정보, 특허정보, 생물다양성정보 등의 콘텐트와 GenBank reference 필드와 organism 필드를 상호 연계하는 서비스 모델을 설계하고 프로토타입 시스템을 개발하였다. 이를 위하여 1) NCBI FTP 사이트에서 GenBank 데이터를 수집하여, 2) GenBank 텍스트 파일을 유전자 기본정보와 참고정보로 나누어 데이터베이스로 재구축하여, 3) GenBank reference 필드에서 논문 및 특허 정보 추출을 통한 새로운 테이블을 생성하여, 4) 데이터 맵핑 기술을 이용하여 GenBank 데이터와 NDSL 데이터가 상호 연계되어 서비스되는 프로토타입 시스템을 구현하여 이종의 콘텐트간 연계 및 융합 서비스의 가능성을 확인하였다.
Genbank 분석을 통한 NDSL 연계 서비스 모형 설계 연구
안부영 ( Bu-young Ahn ),이정훈 ( Jung-hun Lee ),김대환 ( Dea-hwan Kim ),신용주 ( Yong-ju Shin ),최선희 ( Seon-heui Choi ),신진섭 ( Jin-seob Shin ) 한국정보처리학회 2008 한국정보처리학회 학술대회논문집 Vol.15 No.2
최근 들어 분자생물학의 급속한 발전과 2001년 인간유전체사업의 완료로 인해 전세계적으로 엄청난 양의 유전정보가 공개되었다. 유전자 서열정보는 그 양이 방대하고 다양하기에 데이터베이스 구축 및 분석을 위하여 고성능 컴퓨터 및 정보기술 기법이 필요하다. 그래서 컴퓨터를 활용하여 생물학적 데이터를 수집, 관리, 저장, 평가, 분석하는 연구분야인 생명정보학(바이오인포매틱스)이라는 학문이 지속적으로 발전하고 있다. 이런 생명정보학 발전에 발맞추어 한국과학기술정보연구원(KISTI)에서는 정보기술을 기반으로 한 생명정보 인프라를 구축하여 생명과학 연구자들에게 제공하고 있다. 본 논문에서는 생명정보 데이터베이스중에서 연구자들이 가장 많이 이용하는 유전자 데이터베이스인 Genbank를 활용 및 분석하여 KISTI에서 운영하는 학술논문 제공 사이트인 NDSL(http://scholar.ndsl.kr)과 연계 가능한 서비스 모델을 개발하기 위하여 1) NCBI FTP 사이트에서 Genbank 데이터를 수집하고, 2) Genbank 텍스트 파일을 유전자 기본정보와 참고 데이터베이스로 재구축하며, 3) Genbank refrence 필드에서 논문 및 특허 정보 추출을 통한 새로운 테이블을 생성하여 NDSL과 연계 가능한 서비스 모델을 제안하였다.