http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
안융기(Yoongki Ahn),김은상(Eunsang Kim),박근수(Kunsoo Park) 한국정보과학회 2009 한국정보과학회 학술발표논문집 Vol.36 No.1
스트링 매칭 문제는 컴퓨터의 초기부터 현재까지 지속적으로 연구되는 중요한 주제이다. 유니코드는 전세계의 문자를 한데 정리하여 단일한 부호값을 부여하는 프로젝트이다. 하지만 유니코드 스트링은 알파벳의 개수가 너무 많아서 메모리의 사용량이 알파벳의 개수에 비례하는 스트링 매칭 알고리즘을 적용하기에 어렵다. 이 논문에서는 2바이트 유니코드 스트링에서 100자 이하의 패턴에 대해서는 Sunday의 퀵서치 알고리즘보다 더 적은 메모리를 사용하면서 더 좋은 성능을 내는 알고리즘을 제안한다.
Fast Matching Method for DNA Sequences
김진욱(Jin Wook Kim),김은상(Eunsang Kim),안융기(Yoongki Ahn),박근수(Kunsoo Park) 한국정보과학회 2009 정보과학회논문지 : 시스템 및 이론 Vol.36 No.4
DNA 서열은 각 종을 나타내는 근본적인 정보이며, 다른 종 간의 DNA 서열 비교는 중요한 작업이다. DNA 서열은 길이가 매우 길며 또 종의 종류도 다양하기 때문에, DNA 서열 비교에서는 빠른 매칭 뿐만 아니라 효율적인 저장도 중요한 요소이다. 즉, 인코딩 된 DNA 서열에 적합한 빠른 문자열 매칭 방법이 필요하다. 본 논문에서는 매칭 시 디코딩이 필요하지 않은 인코딩 된 DNA 서열을 위한 빠른 매칭 알고리즘을 제시한다. 제시하는 알고리즘은 네 문자 한 바이트 인코딩을 이용하며 서픽스 기법과 다중 패턴 매칭 기법을 접목하고 있다. 실험 결과로는 본 논문에서 제시하는 방법이 AGREP보다 약 다섯 배 빠름을 보이는데, 이는 알려진 알고리즘들 중에서 가장 빠른 결과이다. DNA sequences are the fundamental information for each species and a comparison between DNA sequences of different species is an important task. Since DNA sequences are very long and there exist many species, not only fast matching but also efficient storage is an important factor for DNA sequences. Thus, a fast string matching method suitable for encoded DNA sequences is needed. In this paper, we present a fast string matching method for encoded DNA sequences which does not decode DNA sequences while matching. We use four-characters-to-one-byte encoding and combine a suffix approach and a multi-pattern matching approach. Experimental results show that our method is about 5 times faster than AGREP and the fastest among known algorithms.