RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        데이터 재구성 기법을 이용한 고성능 FFT

        박능수,최영호,Park Neungsoo,Choi Yungho 한국정보처리학회 2005 정보처리학회논문지 A Vol.12 No.3

        대규모 신호처리 변환을 신속하게 처리하기 위해서는 캐시 메모리를 효과적으로 이용하는 것이 중요하다. 대규모 DFT 계산에서는 stride 액세스로 인한 캐시 충돌 적중 실패로 인하여 캐시 성능이 상당히 떨어지게 되고 이로 인해 전체적인 성능이 저하하게 된다. 본 논문에서는 메모리 계층 구조를 고려한 동적 데이터 재배열(Dynamic Data Layout) 방법을 개발하였다. 제시된 방법은 stride를 가지는 계산 단계(computation stage) 사이에 데이터를 동적으로 재구성을 하여 캐시 적중 실패를 줄이는 것이다. 또한 트리 구조 FFT 계산 방법에서 FFT 크기와 데이터 stride 액세스를 기초로 하여 가능한 모든 인수분해 트리 중에서 최소 실행시간을 가지는 최적의 인수 분해트리를 찾아내는 탐색 알고리즘을 개발하였다. 성능 향상을 확인하기 위하여 제시된 방법을 기존의 FFT 알고리즘에 적용하여 Pentium 4, Alpha 21264, $Athlon^{TM}$ 64, UltraSPARC III에서 실험하였다. 실험 결과에 따르면 기존의 FFT 패키지들과 비교하여 제시된 방법을 적용한 FFT가 최대 3.37배의 성능 향상을 얻을 수 있었다. The efficient utilization of cache memories is a key factor in achieving high performance for computing large signal transforms. Nonunit stride access in computation of large DFTs causes cache conflict misses, thereby resulting in poor cache performance. It leads to a severe degradation in overall performance. In this paper, we propose a dynamic data layout approach considering the memory hierarchy system. In our approach, data reorganization is performed between computation stages to reduce the number of cache misses. Also, we develop an efficient search algorithm to determine the optimal tree with the minimum execution time among possible factorization trees considering the size of DFTs and the data access stride. Our approach is applied to compute the fast Fourier Transform (FFT). Experiments were performed on Pentium 4, $Athlon^{TM}$ 64, Alpha 21264, UtraSPARC III. Experiment results show that our FFT achieve performance improvement of up to 3.37 times better than the previous FFT packages.

      • KCI등재

        데이터 재구성 기법을 이용한 고성능 FFT

        박능수,최영호 한국정보처리학회 2005 정보처리학회논문지. 컴퓨터 및 통신시스템 Vol.12 No.3

        The efficient utilization of cache memories is a key factor in achieving high performance for computing large signal transforms. Nonunit stride access in computation of large DFTs causes cache conflict misses, thereby resulting in poor cache performance. It leads to a severe degradation in overall performance. In this paper, we propose a dynamic data layout approach considering the memory hierarchy system. In our approach, data reorganization is performed between computation stages to reduce the number of cache misses. Also, we develop an efficient search algorithm to determine the optimal tree with the minimum execution time among possible factorization trees considering the size of DFTs and the data access stride. Our approach is applied to compute the fast Fourier Transform (FFT). Experiments were performed on Pentium 4, AthlonTM 64, Alpha 21264, UltraSPARC III. Experiment results show that our FFT achieve performance improvement of up to 3.37 times better than the previous FFT packages. 대규모 신호처리 변환을 신속하게 처리하기 위해서는 캐시 메모리를 효과적으로 이용하는 것이 중요하다. 대규모 DFT 계산에서는 stride 액세스로 인한 캐시 충돌 적중 실패로 인하여 캐시 성능이 상당히 떨어지게 되고 이로 인해 전체적인 성능이 저하하게 된다. 본 논문에서는 메모리 계층 구조를 고려한 동적 데이터 재배열(Dynamic Data Layout) 방법을 개발하였다. 제시된 방법은 stride를 가지는 계산 단계(computation stage) 사이에 데이터를 동적으로 재구성을 하여 캐시 적중 실패를 줄이는 것이다. 또한 트리 구조 FFT 계산 방법에서 FFT 크기와 데이터 stride 액세스를 기초로 하여 가능한 모든 인수분해 트리 중에서 최소 실행시간을 가지는 최적의 인수 분해트리를 찾아내는 탐색 알고리즘을 개발하였다. 성능 향상을 확인하기 위하여 제시된 방법을 기존의 FFT 알고리즘에 적용하여 Pentium 4, Alpha 21264, AthlonTM 64, UltraSPARC III에서 실험하였다. 실험 결과에 따르면 기존의 FFT 패키지들과 비교하여 제시된 방법을 적용한 FFT가 최대 3.37배의 성능 향상을 얻을 수 있었다.

      • KCI등재

        WebGPU를 이용한 AES 알고리즘 가속화

        박능수,남현우 대한전기학회 2022 전기학회논문지 Vol.71 No.7

        Modern web browsers use HTML5 to implement native web applications. However, it is hard to directly utilize the GPU for general-purpose computation in a web browser. Even though standard technologies such as WebGL and WebCL are applicable to use the GPU in a web browser, they can be applied only in the 3D graphics field or cannot due to the discontinuation of development. Recently major web browser vendors are developing a WebGPU standard for general-purpose computation. This paper presents a method to implement a Web application, including general-purpose computing, with WebGPU and SPIR-V. The computation-communication overlap technique is also applied to improve the overall performance. Experimental results showed that the web application performance using WebGPU increases as the size of encrypted data increases. It showed that WebGPU-based parallel computing could be applicable for web applications that require high-performance computation.

      • Lyapunov 직접법에 의한 전력계통 전압 안정도 해석

        文永鉉,盧台勳,朴能洙 연세대학교 산업기술연구소 1992 논문집 Vol.24 No.1

        This paper presents an approach to voltage stability analysis in power systems by using the Lyapunov direct method. Recently it has been attempted to apply the direct method to voltage stability analysis by introducing an energy function. However, the energy function approach seems to be alienated since it could not produce even the voltage collapse conditions which agrees with the results from conventional linearization approaches or sensitivity analysis approaches. In this paper, a new approach of the direct method is proposed with a Lyapunov function, which is established by including the kinetic energy and the voltage dependency of real power loads. The proposed Lyapunov function is not suitable to calculate stability region or stability to calculate stability region or stability margin. However, it is very useful to calculate the voltage collapse conditions. This paper gives rigorous derivations of voltage collapse conditions by using the Lyapunov function, which yields the exactly same results as the conventional linearization approach and sensitivity analysis. On the other hand, the voltage collapse phenomenon is interpreted in the physical sense, and the causes of voltage collapse are analyzed with the use of the proposed Lyapunov function. It is also noted that a new method is developed to calculate the power capacity limit of transmission lines in the view point of voltage stability.

      • KCI등재
      • KCI등재

        적응적 라우터를 위한 큐 구조 설계

        최영호,박능수,송용호 한국정보처리학회 2005 정보처리학회논문지. 컴퓨터 및 통신시스템 Vol.12 No.4

        This paper proposes DAMQWR and VCDAMQ architectures that exploit the full capabilities of adaptive routing. DAMQWR enables messages in congested channels to route through non-congested channels by using recruit registers while VCDAMQ dynamically assigns resources among virtual channels, resulting in better network traffic control. Through extensive simulations and analysis, this paper evaluates their effects on overall network cost and performance. These proposed queue architectures, VCDAMQ and DAMQWR, are shown to appropriately support adaptive routing capability by dynamically and efficiently managing queue and network resources, increasing network performance. The results show that up to 20% higher throughput can be obtained in comparison to traditional DAMQ designs. 본 논문은 적응적 망 경로 선택 기능을 최대한 활용하기 위하여 두 가지 새로운 큐 구조 DAMQWR와 VCDAMQ를 제안하였다. DAMQWR은 리쿠르트 레지스터를 사용하여 정체된 채널의 메시지를 비 정체 채널로 라우팅을 유도할 수 있게 하여주며 VCDAMQ는 가상 채널상의 교통량을 동적으로 지원하도록 함으로써 망의 흐름을 보다 원활하게 하여 준다. 시뮬레이션과 분석을 통하여 제안된 큐 구조의 특성과 성능을 평가하였고 그 결과 제안되어진 큐 구조들인 VCDAMQ와 DAMQWR 구조가 메모리 및 망의 자원을 효과적으로 사용하여 적응적 라우터에 가장 적합함을 알 수 있었으며, 실험결과에서 기존의 DAMQ에 비하여 최대 20%까지 망의 통신 성능이 향상됨을 보였다. 攀※본 연구는 정보통신부 및 정보통신연구진흥원의 대학 IT연구센터 육성지원사업의 연구결과로 수행되었음.† 정 회 원:건국대학교 전기공학과 교수 (주저자)†† 종신회원:건국대학교 컴퓨터공학부 교수 (교신저자)††† 정 회 원:한양대학교 정보통신대학 미디어통신공학 교수 논문접수:2005년 3월 21일, 심사완료:2005년 7월 29일

      • KCI등재

        적응적 라우터를 위한 큐 구조 설계

        최영호,박능수,송용호,Choi, Yung-Ho,Park, Neung-Soo,Song, Yong-Ho 한국정보처리학회 2005 정보처리학회논문지 A Vol.12 No.4

        본 논문은 적응적 망 경로 선택 기능을 최대한 활용하기 위하여 두 가지 새로운 큐 구조 DAMQWR와 VCDAMQ를 제안하였다. DAMQWR은 리쿠르트 레지스터를 사용하여 정체된 채널의 메시지를 비 정체 채널로 라우팅을 유도할 수 있게 하여주며 VCDAMQ는 가상 채널상의 교통량을 동적으로 지원하도록 함으로써 망의 흐름을 보다 원활하게 하여 준다. 시뮬레이션과 분석을 통하여 제안된 큐 구조의 특성과 성능을 평가하였고 그 결과 제안되어진 큐 구조들인 VCDAMQ와 DAMQWR 구조가 메모리 및 망의 자원을 효과적으로 사용하여 적응적 라우터에 가장 적합함을 알 수 있었으며, 실험결과에서 기존의 DAMQ에 비하여 최대 $20\%$까지 망의 통신 성능이 향상됨을 보였다. This paper proposes DAMQWR and VCDAMQ architectures that enloit the full capabilities of adaptive routing. DAMQWR enables messages in congested channels to route through non-congested channels by using recruit registers while VCDAMQ dynamically assigns resources among virtual channels, resulting in better network traffic control. Through extensive simulations and analysis, this paper evaluates their effects on overall network cost and performance. These proposed queue architectures, VCDAMQ and DAMQWR are shown to appropriately support adaptive routing capability by dynamically and efficiently managing queue and network resources, increasing network performance. The results show that up to $20\%$ higher throughput can be obtained in comparison to traditional DAMQ designs.

      • KCI등재

        Evaluation of the Image Backtrack-Based Fast Direct Mode Decision Algorithm

        최영호,박능수 한국정보처리학회 2012 Journal of information processing systems Vol.8 No.4

        B frame bi-directional predictions and the DIRECT mode coding of the H.264video compression standard necessitate a complex mode decision process, resulting in a long computation time. To make H.264 feasible, this paper proposes an image backtrackbased fast (IBFD) algorithm and evaluates the performances of two promising fast algorithms (i.e., AFDM and IBFD). Evaluation results show that an image backtrackbased fast (IBFD) algorithm can determine DIRECT mode macroblocks with 13% higher accuracy, as compared with the AFDM. Furthermore, IBFD is shown to reduce the motion estimation time of B frames by up to 23% with a negligible quality degradation

      • KCI등재

        커널 기반 가상머신을 이용한 시스템 무결성 모니터링 시스템

        남현우,박능수,Nam, Hyun-Woo,Park, Neung-Soo 한국정보처리학회 2011 정보처리학회논문지 C : 정보통신,정보보안 Vol.18 No.3

        가상화 계층은 커널 보다 높은 권한 계층에서 수행되어 운영체제가 사용하고 있는 자원 정보를 모니터링 하는데 적합하다. 하지만 기존 가상화 기반 모니터링 시스템은 CPU나 메모리 사용률과 같은 기초적인 정보만을 제공하고 있다. 본 논문에서 메모리, 레지스터 GDT, IDT 그리고 시스템 콜과 같은 동적인 시스템 커널 객체를 모니터링하기 위하여 전가상화 방식의 모니터링 시스템을 제안한다. 모니터링 시스템을 검증하기 위해 커널의 수정 없이 바로 리눅스 커널에 적용된 전가상화 방식의 KVM을 기반으로 시스템을 구현하였다. 구현된 시스템은 KVM 내부 객체에 접근하기 위한 KvmAccess 모듈, 그리고 가상머신 모니터링 결과를 외부 모듈에서도 사용할 수 있도록 API를 제공하였다. 구현된 모니터링 시스템의 성능을 측정한 결과 1초 주기로 시스템을 모니터링을 하더라도 0.37% 정도의 CPU 점유율을 차지하여 그 성능 부하가 아주 작았다. The virtualization layer is executed in higher authority layer than kernel layer and suitable for monitoring operating systems. However, existing virtualization monitoring systems provide simple information about the usage rate of CPU or memory. In this paper, the monitoring system using full virtualization technique is proposed, which can monitor virtual machine's dynamic kernel object as memory, register, GDT, IDT and system call table. To verify the monitoring system, the proposed system was implemented based on KVM(Kernel-based Virtual Machine) with full virtualization that is directly applied to linux kernel without any modification. The proposed system consists of KvmAccess module to access KVM's internal object and API to provide other external modules with monitoring result. In experiments, the CPU utilization for monitoring operations in the proposed monitering system is 0.35% when the system is monitored with 1-second period. The proposed monitoring system has a little performance degradation.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼