http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
박일남,배병걸,임은진,강승식,Park, Il-Nam,Bae, Byung-Gurl,Im, Eun-Jin,Kang, Seung-Shik 한국정보처리학회 2012 정보처리학회논문지B Vol.19 No.4
In the information retrieval systems like vector model implementation and document clustering, document similarity calculation takes a great part on the overall performance of the system. In this paper, GPU parallelism has been explored to enhance the processing speed of document similarity calculation in a CUDA framework. The proposed method increased the similarity calculation speed almost 15 times better compared to the typical CPU-based framework. It is 5.2 and 3.4 times better than the methods by using CUBLAS and Thrust, respectively. 정보검색 분야에서 벡터 모델, 문서 클러스터링 등은 입력 문서 개수가 증가할수록 유사도 계산 속도가 시스템의 성능에 많은 영향을 미치고 있다. 본 논문에서는 문서 유사도 계산 성능을 향상시키기 위하여 유사도를 계산하는 연산을 CPU 대신에 GPU를 이용하는 CUDA 프레임워크에서 병렬처리 기법으로 구현하는 방법을 제안하였다. 이 방법은 보편적인 방식인 CPU 환경에서 구현했을 때와 비교할 때 최대 15배까지 성능이 향상되었다. 또한, 기존의 CUDA 라이브러리인 CUBLAS와 Thrust를 사용한 방법보다도 각각 5.2배, 3.4배의 성능 개선 효과가 있음을 확인하였다.
박일남 ( Il-nam Park ),장우석 ( Wu-seok Jang ),강승식 ( Seung-shik Kang ) 한국정보처리학회 2010 한국정보처리학회 학술대회논문집 Vol.17 No.1
본 논문에서는 세종 말뭉치 데이터를 활용할 때 한글코드의 변환 및 말뭉치에서 필요한 정보 추출 등 한국어 말뭉치에서 통계 정보를 추출하는데 사용되는 여러 가지 기능들을 한데 묶어, 말뭉치 작업의 사용자 편의성을 개선시키기 위한 도구를 설계, 구현하였다. 이 말뭉치 활용 도구는 세종 말뭉치의 원시, 형태, 형태의미, 구문 말뭉치들을 다양한 옵션에 따라 사용자가 원하는 데이터를 추출할 있을 뿐만 아니라 일반적인 한글 텍스트 파일에 공통적으로 사용되는 코드 변환, 파일 합병, 빈도 계산 등을 제공하기 때문에 말뭉치 작업을 하는 사용자들이 편리하게 사용할 수 있게 하였다.
정답 템플릿 작성 방식에 의한 한국어 서답형 문항 자동채점 시스템
박일남(Il-Nam Park),강승식(Seung-Shik Kang),노은희(Eun-Hee Noh),김명화(Myung-Hwa Kim),성태제(Tae-Je Seong) 한국정보과학회 2013 정보과학회 컴퓨팅의 실제 논문지 Vol.19 No.12
본 논문에서는 단어-구 수준의 한국어 서답형 문항을 컴퓨터 기반 채점 방식으로 처리하는 방법을 제안한다. 수천 명의 채점자가 채점 기준표를 보면서 수작업으로 채점하는 방식을 컴퓨터를 이용한 자동채점 소프트웨어로 대치하기 위하여 수동 채점을 목적으로 작성된 채점 기준표를 자동채점을 위한 XML 기반의 정답 템플릿으로 기술한다. 정답 템플릿을 기준으로 정답 일치 채점, 개념 기반 채점, 단서어 기반 오류 처리의 과정을 통해 학생 답안에 점수를 부여하는 자동채점 시스템을 설계하고 개발하였다. 자동채점 시스템의 성능을 평가하기 위해 자동 채점 결과와 실제 채점자가 부여한 점수를 비교, 분석하였다. 그 결과에 의하면 실험에 사용한 11개 문항의 평균 카파 계수는 0.83으로 실제 채점자와 비교했을 때 자동채점 시스템은 수작업 채점과 일치도가 매우 높은 성능을 나타내었다. This paper proposes a computer-based automatic scoring method for Korean short answer questions. The purpose of this research is to replace a traditional method of human raters by scoring guide-line with an automatic scoring by computer software. We transformed a hand-written scoring guide-line to a machine-readable answer template that is an XML format. Automatic scoring system consists of four steps: model answer scoring, concept-based scoring, cueword-based scoring, and manual scoring. Kappa coefficient showed an average 0.83 between automatic and manual scoring method.
문자 해시와 이원 탐색 트리를 이용한 어절 빈도 계산 알고리즘의 성능 개선
박일남 ( Il-nam Park ),강승식 ( Seung-shik Kang ) 한국정보처리학회 2010 한국정보처리학회 학술대회논문집 Vol.17 No.2
인터넷 검색 사이트는 사용자들이 검색한 단어들의 순위를 매기는 실시간 검색 순위 서비스를 제공하는데 검색되는 단어들의 순위를 매기기 위해서는 각 단어들의 분포도를 알 수 있는 어절 빈도 계산을 수행해야 한다. 어절 빈도는 BST(Binary Search Tree)를 수행하여 계산할 수 있는데, 사용자에 의하여 검색되는 단어들은 길이와 그 형태가 다양하여 빈도 계산시에 BST 의 깊이가 깊어져서 계산 시간이 오래 걸리게 된다. 본 논문에서는 문자 해시를 이용하여 깊이가 깊은 BST 의 탐색 속도를 개선하는 알고리즘을 제안하였다. 이 방법으로 빈도 계산 속도를 비교하였을 때 문자 해시의 범위에 의해 1KB 의 추가적인 기억공간의 사용하여 9.3%의 성능 개선 효과가 있었고, 해시 공간을 10KB 추가로 사용할 때는 24.3%, 236KB 일 때는 40.6%로의 효율로 BST 의 빈도 계산 속도를 향상 시킬 수 있었다.
조주식 ( Ju Sik Cho ),박일남 ( Il Nam Park ),허종수 ( Jong Soo Heo ),이영석 ( Young Seak Lee ) 한국환경농학회 2004 한국환경농학회지 Vol.23 No.2
The adsorption and desorption of Pb, Cd, Co, Zn, Cr, Co, Ni, and Mo on the waste Undaria sp. were studied. Except for Pb, the mono adsorption rate for all heavy metals were lower than that of the heavy metals mixed. However, the adsorption capacity of the heavy metals by 1 g of biosorbent in mixed heavy metals increased. According to FT-IR analysis of the biosorbent after heavy metal biosorption, the replacement of the functional group by the heavy metals ions could be confirmed and the inverted peaks became larger after heavy metals adsorption. The adsorption equilibrium of heavy metals was reached in about 1 hour. The equilibrium parameters were determined based on Langmuir and Freundlich isotherms. The affinity of metals on the biosorbent decreased in the following order: Pb>Cu>Cr>Cd>Co. The desorption rate decreased in the following sequence: NTA>H₂SO₄>HCl>EDTA. The desorption rate of heavy metals by NTA increased with increase in the concentration from 0.1 to 0.3% but the desorption rate became constant beyond 0.3%. Therefore, it represented that desorption rate of heavy metals was suitable under optimized condition (30℃, pH 2 and 0.3% NTA solution) and was fast with 80% or more the uptake occurring within 10 min of contact time.