http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
박능수,최영호,Park Neungsoo,Choi Yungho 한국정보처리학회 2005 정보처리학회논문지 A Vol.12 No.3
대규모 신호처리 변환을 신속하게 처리하기 위해서는 캐시 메모리를 효과적으로 이용하는 것이 중요하다. 대규모 DFT 계산에서는 stride 액세스로 인한 캐시 충돌 적중 실패로 인하여 캐시 성능이 상당히 떨어지게 되고 이로 인해 전체적인 성능이 저하하게 된다. 본 논문에서는 메모리 계층 구조를 고려한 동적 데이터 재배열(Dynamic Data Layout) 방법을 개발하였다. 제시된 방법은 stride를 가지는 계산 단계(computation stage) 사이에 데이터를 동적으로 재구성을 하여 캐시 적중 실패를 줄이는 것이다. 또한 트리 구조 FFT 계산 방법에서 FFT 크기와 데이터 stride 액세스를 기초로 하여 가능한 모든 인수분해 트리 중에서 최소 실행시간을 가지는 최적의 인수 분해트리를 찾아내는 탐색 알고리즘을 개발하였다. 성능 향상을 확인하기 위하여 제시된 방법을 기존의 FFT 알고리즘에 적용하여 Pentium 4, Alpha 21264, $Athlon^{TM}$ 64, UltraSPARC III에서 실험하였다. 실험 결과에 따르면 기존의 FFT 패키지들과 비교하여 제시된 방법을 적용한 FFT가 최대 3.37배의 성능 향상을 얻을 수 있었다. The efficient utilization of cache memories is a key factor in achieving high performance for computing large signal transforms. Nonunit stride access in computation of large DFTs causes cache conflict misses, thereby resulting in poor cache performance. It leads to a severe degradation in overall performance. In this paper, we propose a dynamic data layout approach considering the memory hierarchy system. In our approach, data reorganization is performed between computation stages to reduce the number of cache misses. Also, we develop an efficient search algorithm to determine the optimal tree with the minimum execution time among possible factorization trees considering the size of DFTs and the data access stride. Our approach is applied to compute the fast Fourier Transform (FFT). Experiments were performed on Pentium 4, $Athlon^{TM}$ 64, Alpha 21264, UtraSPARC III. Experiment results show that our FFT achieve performance improvement of up to 3.37 times better than the previous FFT packages.
Native 코드 기반 자바스크립트 애플리케이션의 플랫폼 독립성을 위한 연구
남현우 ( Hyunwoo Nam ),박능수 ( Neungsoo Park ) 한국정보처리학회 2014 한국정보처리학회 학술대회논문집 Vol.21 No.1
최근 크로스 플랫폼을 지원하기 위한 애플리케이션 개발 언어로서 자바스크립트가 채택되어 사용되고 있다. 하지만 스크립트 기반 애플리케이션에서도 C, C++ 라이브러리를 활용해야 하거나 성능적인 이슈를 해결하기 위하여 Native 코드를 사용하는 경우가 있다. 따라서 Native 코드가 적용된 자바스크립트 애플리케이션 패키지는 여전히 Native 코드 사용으로 인하여 CPU 및 OS 와 같은 플랫폼에 의존성이 발생하였다. 따라서 본 연구에서는 이를 해결하기 위한 관련 기술들을 분석하고, 이를 통해 성능을 보장하면서도 크로스 플랫폼 지원이 가능한 시스템 설계 방안에 대하여 제시한다.
웹 페이지 소스코드 보호를 위한 에뮬에이터 기반 웹 애플리케이션 설계
남현우(Hyunwoo Nam),박능수(Neungsoo Park) 한국정보과학회 2018 정보과학회 컴퓨팅의 실제 논문지 Vol.24 No.8
웹 애플리케이션은 소스코드 형태로 배포하고 실행되기 때문에 소스코드 유출이 쉽다는 문제가 있다. 해결 방안으로는 소스코드 난독화 방법이 주로 사용되나 복호화가 가능하다는 단점이 있다. 또 다른 방안으로는 소스코드 유출이 불가능한 Native Binary를 사용하는 ActiveX와 같은 웹 플러그인 기술들이 있으나 플랫폼 의존성 문제가 존재한다. 따라서 본 논문은 소스코드 보호가 가능한 Native Binary를 플랫폼 의존성 없이 실행할 수 있도록 에뮬레이터 기반의 웹 애플리케이션을 제안한다. 구체적으로 다양한 관련 연구들을 분석하였고 이를 통해 에뮬레이터 기반 웹 실행엔진 및 인터페이스 모듈을 설계하였다. 또한 네이티브 바이너리 실행을 위한 웹 에뮬레이터의 가능성과 한계점에 대하여 논하였다. A web page source code that is deployed and executed in the web applications as it is, makes it a significant vulnerability that can easily be leaked. One protection method is code obfuscation that is widely applied to protect the source code, but it can easily be decoded by certain tools. Another method is using a web plug-in like ActiveX. It is in a native binary form that prevents leaks of source code, but is also platform-dependent. Therefore, we propose an emulator-based web application approach that can execute source-code-protected native binaries without platform dependency. Through investigation and analysis of related works, emulator-based web execution engine and interface module were designed. We also discuss the possibilities and limitations of the web emulator for native binary execution.
고성학 ( Sunghak Ko ),박능수 ( Neungsoo Park ),오진태 ( Jintae Oh ),장종수 ( Jongsoo Jang ) 한국정보처리학회 2012 한국정보처리학회 학술대회논문집 Vol.19 No.1
Anti-DDoS 시스템은 분산 공격에 따라 발생하는 대량의 보안 이벤트 로그를 효과적으로 처리하여야 한다. 본 연구는 Anti-DDoS시스템에서 로그 기록에 간여 하는 모듈 간 인터페이스의 연결 및 속도 등을 분석하고 간략한 모델로 표현하였다. 이러한 모델을 기반으로 그 성능을 분석하고 시뮬레이션을 구현하였다. 구현된 시뮬레이션을 이용해 부하량 변화에 따른 로그 기록 상태를 측정하여 현재의 로그기록 시스템의 성능을 분석하였으며, 보다 효율적인 로그 기록 시스템을 구성하기 위한 대안을 제시하고자 한다.
OpenCL을 활용한 이기종 파이프라인 컴퓨팅 기반 Spark 프레임워크
김대희(Daehee Kim),박능수(Neungsoo Park) 대한전기학회 2018 전기학회논문지 Vol.67 No.2
Apache Spark is one of the high performance in-memory computing frameworks for big-data processing. Recently, to improve the performance, general-purpose computing on graphics processing unit(GPGPU) is adapted to Apache Spark framework. Previous Spark-GPGPU frameworks focus on overcoming the difficulty of an implementation resulting from the difference between the computation environment of GPGPU and Spark framework. In this paper, we propose a Spark framework based on a heterogenous pipeline computing with OpenCL to further improve the performance. The proposed framework overlaps the Java-to-Native memory copies of CPU with CPU-GPU communications(DMA) and GPU kernel computations to hide the CPU idle time. Also, CPU-GPU communication buffers are implemented with switching dual buffers, which reduce the mapped memory region resulting in decreasing memory mapping overhead. Experimental results showed that the proposed Spark framework based on a heterogenous pipeline computing with OpenCL had up to 2.13 times faster than the previous Spark framework using OpenCL.