http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
김은상(Eunsang Kim),김진욱(Jin Wook Kim),박근수(Kunsoo Park) 한국정보과학회 2010 정보과학회 컴퓨팅의 실제 논문지 Vol.16 No.10
문자열 완전일치 검색 알고리즘은 지금까지 많은 연구가 되어왔지만, EUC-KR 등 다중바이트 문자집합에 대해서는 연구된 것이 부족한 상황이다. 이 논문에서는 기존의 KMP 알고리즘을 사용할 때 EUC-KR과 같은 다중바이트 문자집합 텍스트에서 오검색이 발생할 수 있음을 보이며, 문자 단위의 접두사 함수를 적용하여 오검색이 발생하지 않도록 개선한 KMP 알고리즘을 제안한다. 또한, 널리 사용되고 있는 편집기인 Vim과 Emacs의 검색 알고리즘 및 기존의 오토마타 방식의 연구 결과에 비해 논문에서 제안한 알고리즘이 더 빠른 속도를 보이는 실험 결과를 제시한다. An extensive research on exact string matching has been done, but there have been few researches on the matching in multi-byte character set texts such as EUC-KR. This paper shows that false matches may occur in multi-byte character set texts such as EUC-KR when using KMP algorithm, and presents a refined KMP algorithm without false matches applying a characterbased prefix function. And also, Experimental results show that our algorithm is faster than string matching algorithms of widely used editors, Vim and Emacs, and the existing automata-based algorithm.
FDR 센서를 활용한 제체 누수특성의 실내 모형 실험 연구
김규범 ( Gyoo-bum Kim ),임은상 ( Eunsang Im ),류호철 ( Ho-cheol Ryu ),황찬익 ( Chan-ik Hwang ),김형종 ( Hyeong-jong Kim ) 대한지질공학회 2018 지질공학 Vol.28 No.4
제체의 누수를 탐지하는 방법으로서 물리탐사, 온도 계측, 광섬유 등 다양한 방법이 개발되어 왔다. 본 연구에서는 FDR 센서의 유전율상수를 이용한 누수 탐지의 가능성을 파악하기 위하여 취약부와 미취약부로 구성된 물리모형을 제작하였으며 유전율상수, 온도 및 간극수압 센서를 설치하였다. 누수가 형성됨에 따라 유전율상수는 미취약부보다 취약부에서 빠르게 변화되었다. 또한, 취약부에서 간극수압, 온도 및 유전율 상수를 비교하면 유전율 상수의 반응이 가장 빠르고 하류 계측 지점에서도 쉽게 인지되는 특성을 보였다. 이와 같은 특성을 고려할 때, 제체 하류 구간에서 분포형으로 유전율을 측정한다면 누수 탐지에 빠르고 효율적으로 대처할 수 있을 것으로 파악되었다. Various methods, such as geophysical exploration, temperature measurement, and fiber optics, have been developed for detecting the seepage at a dam. In this study, in order to investigate the possibility of leakage detection using dielectric constant of FDR sensor, a physical model consisting of weak and no-weak zones is fabricated and the sensors for dielectric constant, temperature and pore water pressure measurements are installed. As a leakage happens, the dielectric constant changes more rapidly through a weak zone than no-weak zone. In addition, comparing three factors (dielectric constant, temperature, and pore water pressure), the response of dielectric constant to seepage is fast and it is easily recognized even at the end measurement point. Considering these features, it is concluded that it could be possible to cope with the leakage detection quickly and efficiently if the dielectric constant is measured at the downstream slope of a dam.
Fast Matching Method for DNA Sequences
김진욱(Jin Wook Kim),김은상(Eunsang Kim),안융기(Yoongki Ahn),박근수(Kunsoo Park) 한국정보과학회 2009 정보과학회논문지 : 시스템 및 이론 Vol.36 No.4
DNA 서열은 각 종을 나타내는 근본적인 정보이며, 다른 종 간의 DNA 서열 비교는 중요한 작업이다. DNA 서열은 길이가 매우 길며 또 종의 종류도 다양하기 때문에, DNA 서열 비교에서는 빠른 매칭 뿐만 아니라 효율적인 저장도 중요한 요소이다. 즉, 인코딩 된 DNA 서열에 적합한 빠른 문자열 매칭 방법이 필요하다. 본 논문에서는 매칭 시 디코딩이 필요하지 않은 인코딩 된 DNA 서열을 위한 빠른 매칭 알고리즘을 제시한다. 제시하는 알고리즘은 네 문자 한 바이트 인코딩을 이용하며 서픽스 기법과 다중 패턴 매칭 기법을 접목하고 있다. 실험 결과로는 본 논문에서 제시하는 방법이 AGREP보다 약 다섯 배 빠름을 보이는데, 이는 알려진 알고리즘들 중에서 가장 빠른 결과이다. DNA sequences are the fundamental information for each species and a comparison between DNA sequences of different species is an important task. Since DNA sequences are very long and there exist many species, not only fast matching but also efficient storage is an important factor for DNA sequences. Thus, a fast string matching method suitable for encoded DNA sequences is needed. In this paper, we present a fast string matching method for encoded DNA sequences which does not decode DNA sequences while matching. We use four-characters-to-one-byte encoding and combine a suffix approach and a multi-pattern matching approach. Experimental results show that our method is about 5 times faster than AGREP and the fastest among known algorithms.
안융기(Yoongki Ahn),김은상(Eunsang Kim),박근수(Kunsoo Park) 한국정보과학회 2009 한국정보과학회 학술발표논문집 Vol.36 No.1
스트링 매칭 문제는 컴퓨터의 초기부터 현재까지 지속적으로 연구되는 중요한 주제이다. 유니코드는 전세계의 문자를 한데 정리하여 단일한 부호값을 부여하는 프로젝트이다. 하지만 유니코드 스트링은 알파벳의 개수가 너무 많아서 메모리의 사용량이 알파벳의 개수에 비례하는 스트링 매칭 알고리즘을 적용하기에 어렵다. 이 논문에서는 2바이트 유니코드 스트링에서 100자 이하의 패턴에 대해서는 Sunday의 퀵서치 알고리즘보다 더 적은 메모리를 사용하면서 더 좋은 성능을 내는 알고리즘을 제안한다.
서정주(Jungjoo Seo),김진일(Jinil Kim),김은상(Eunsang Kim),김영호(Daniel Kim),정하웅(Hawoong Jeong),김성렬(Sung-Ryul Kim),박근수(Kunsoo Park) 한국정보과학회 2013 정보과학회 컴퓨팅의 실제 논문지 Vol.19 No.1
웹을 구성하는 웹 페이지들과 페이지들 사이의 하이퍼링크들은 방향성을 지니는 그래프로 표현될 수 있으며, 웹 그래프가 가지는 독자적인 링크 구조의 특성은 다양한 분야의 연구에서 활용되고 있다. 현재 검색 엔진들이 수집한 웹 페이지들은 그 규모가 수십억 개로 방대한 양을 이루고 있다. 본 논문에서는 약 3억 개의 국내 웹 페이지들을 수집하고, 이들 간의 약 137억 개의 하이퍼링크들을 추출하여 생성한 웹 그래프의 구조에 대해 분석한다. 또한 그래프 알고리즘을 이용하여 웹 그래프를 구성하는 요소들로 나눈 후 전체적인 구조를 도식화한 보우타이 다이어그램을 도출한다. 국내 웹 페이지들은 링크의 진입 차수와 연결 요소들의 크기 분포에서 멱법칙을 따르며, 웹 페이지의 진출 차수는 특정 차수 이상에서 멱법칙을 따른다. 또한 웹 그래프는 평균 연결 거리가 매우 짧은 약 12 정도로 small-world network의 성질을 가지고 약 40%의 웹 페이지 쌍 사이에 경로가 존재하며, 국내 웹 그래프는 해외의 경우보다 연결도가 더 높다. The World Wide Web consisting of web pages and hyperlinks amongst them can be represented as a directed graph. The structural and evolutional properties of the Web graph are useful in a variety of research area such as sociology and computer science. In this paper, we crawled 0.3 billion Web pages and 13.7 billion hyperlinks amongst them from Korean Web and built the Web graph by extracting the link structure. We show the bow-tie diagram which visualizes the overall structure of the Web graph. In-degrees and sizes of connected components of web pages of Korean web follow power law distributions whereas out-degrees shows power law distribution when the degree is higher than a particular value. Also, 40% of pairs of the Korean web graph have a path between them with average distance around 12 demonstrating that the Korean web graph shows a small-world phenomenon. The Korean web graph shows a higher degree of connectivity compared to the global web graph.
노강호(Kangho Roh),김진욱(Jin Wook Kim),김은상(Eunsang Kim),박근수(Kunsoo Park),조환규(Hwan-Gue Cho) 한국정보과학회 2010 정보과학회논문지 : 시스템 및 이론 Vol.37 No.2
문자열에 대한 편집 거리 문제는 하나의 문자열을 다른 문자열로 변환할 때 필요한 최소한의 연산의 개수를 구하는 문제이다. 편집 거리 문제는 오랫동안 연구가 진행되어 왔으며, 영어와 같이 1차원 문자열에 대해서는 최적해를 찾는 여러 가지 알고리즘이 개발되어 왔다. 그러나 한글 또는 한자와 같이 좀 더 복잡한 언어에 대한 편집 거리에 대해서는 많은 연구가 진행되지 못했다. 본 논문에서는 한글이 갖는 특징을 반영한 편집 거리를 정의하고, 한글 문자열에 대한 편집 거리를 구하는 알고리즘을 제안한다. The edit distance problem is finding the minimum number of edit operations to transform a string into another one. It is one of the important problems in algorithm research and there are some algorithms that compute an optimal edit distance for the one-dimensional languages such as the English alphabet. However, there are a few researches to find the edit distance for the more complicated language such as the Korean or Chinese alphabet. In this paper, we define the measure of the edit distance for the Korean alphabet and present an algorithm for the edit distance problem for the Korean alphabet.