RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI우수등재

        멀티헤드 어텐션 병렬화를 통한 트랜스포머 기반 객체추적 모델의 실행속도 향상

        김인모,김명선 대한전자공학회 2023 전자공학회논문지 Vol.60 No.4

        With the recent advance of deep learning-based object tracking technology, it is being used in various application fields such as sports game analysis, video security, and augmented reality. Users require high object tracking accuracy as well as high QoS according to fast object tracking speed. In this study, we improve the object tracking speed of CSWinTT(transformer-based object-tracking model), which is currently considered as the best object tracking solution. The head operations of the Multi-Head Attention(MHA) in the encoder layer of this model occupy the most execution time in the entire inference procedure of the transformer. Each head has a different input value, but is executed in a serial manner. To overcome this, in this study, each head operation is executed in parallel. For parallel operation, the MHA consisting of one module is divided into sub-modules by the number of heads, and each separated sub-module is executed in a multi-threading environment. The pure Python environment does not guarantee a complete multi-threaded run. We thus improve to a C++ implementation environment to enable complete multi-threading. In addition, kernels transmitted asynchronously by each thread can be executed as concurrently as possible inside the GPU. As a result of checking the effect of MHA parallel execution through various experiments, the average execution time of the encoder decreased by 56.8% and the average FPS increased by 63.3% compared to the existing method while maintaining almost the same inference accuracy. 최근 딥러닝 기반 객체추적 기술이 발전함에 따라 스포츠 경기 분석, 영상 보안, 증강현실 등 다양한 응용 분야에서 객체추적 기술이 사용되고 있다. 사용자들은 높은 객체추적 정확도뿐만 아니라 빠른 객체추적 속도에 따른 높은 QoS를 요구한다. 본 연구에서는 현재 객체추적 솔루션 중 최고로 꼽히는 트랜스포머기반 CSWinTT 모델의 객체추적 속도를 향상시킨다. 이 모델의 인코더 레이어 내 Multi-Head Attention(MHA)의 head연산들은 전체 트랜스포머 추론 과정에서 가장 많은 실행시간을 차지하고, 각 head들은 각각 다른 입력 값을 가지지만 직렬로 실행된다. 이를 개선하기 위하여 본 연구에서는 각각의 head연산들을 병렬적으로 실행시킨다. 병렬 실행을 위하여 하나의 모듈로 이루어진 MHA연산을 head 개수만큼 서브 모듈로 분리하고, 분리된 각각의 모듈을 멀티쓰레드 환경에서 실행한다. 이때 순수 Python 환경에서는 불가능한 멀티쓰레드 환경을 C++ 실행 환경으로 개선하여 가능하게 한다. 또한 각 쓰레드들이 비동기적으로 전달하는 커널들을 GPU 내부에서 최대한 동시에 실행될 수 있도록 한다. 다양한 실험을 통해 MHA 병렬실행의 효과를 확인한 결과, 추론정확도는 거의 동일하게 유지하면서 기존 실행환경에 비하여 인코더의 평균 실행시간은 56.8% 감소하였고, 평균 FPS는 63.3% 증가하였다.

      • KCI우수등재

        적응형 미니배치 데이터 재분배를 통한 멀티 GPU 환경에서 딥러닝 학습 응용의 효율성 향상

        김인모,김명선 대한전자공학회 2022 전자공학회논문지 Vol.59 No.9

        More than one DNN model learning applications are usually executed inside a GPU cluster composed of several GPUs. In this environment, competition between applications to occupy GPU resources is inevitable if the total amount of GPU resources is less than that of resources required by all learning applications. Depending on the degree of competition that occurred at this time and the degree to which each learning application uses each GPU, some applications may complete learning in a short time and some must proceed for a much longer time than this. This study proposes an algorithm that solves the allocation of GPUs to learning applications in such an unfair way. Based on the current GPU resource utilization status of each application, the ratio of the predicted learning completion time and the learning completion time when each application uses GPU exclusively is calculated and defined as the current Slow-Down of the current application. The ratio of mini-batch data per GPU of each learning application is periodically adjusted and a fair allocation of GPU resources is achieved so that the Slow-Down values of currently executed learning applications become similar. As a result of confirming through various experiments, the maximum Slow-Down decreased by more than 53%, and the overall GPU utilization also increased by 25%.

      • KCI등재

        N-Input NAND Gate에서 입력조건에 따른 Voltage Transfer Function에 관한 연구

        김인모,송상헌,김수원 대한전기학회 2004 전기학회논문지C Vol.53 No.10-C

        In this paper, we analytically examine the voltage transfer function dependent on input conditions for an N-Input NAND Gate. The logic threshold voltage, defined as a voltage at which the input and the output voltage become equal, changes as the input condition changes for a static NAND Gate. The logic threshold voltage has the highest value when all the N-inputs undergo transitions and it has the lowest value when only the last input connected to the last NMOS to ground, makes a transition. This logic threshold voltage difference increases as the number of inputs increases. Therefore, in order to provide a near symmetric voltage transfer function, a multistage N-Input Gate consisting of 2-Input Logic Gates is desirable over a conventional N-Input Gate.

      • KCI등재
      • KCI우수등재

        소프트웨어 기반 임베디드 시스템용 적대적 공격 검출 시스템

        주상현,김인모,김명선 대한전자공학회 2022 전자공학회논문지 Vol.59 No.7

        최근 DNN의 추론을 잘못된 분류가 되도록 유도하는 것을 목적으로 하는 적대적 공격은 그 종류가 매우 다양해지고 더욱 정교해지고 있다. 이러한 영향으로 DNN 모델들은 더욱 적대적 공격에 쉽게 노출되고 있다. 로봇이나 자율주행 시스템과 같은 임베디드 시스템도 예외가 아니고 적대적 공격으로 인한 오분류의 결과는 치명적인 결과로 이어질 수 있다. 하지만 임베디드 시스템은 DNN 연산 장치의 성능과 메모리 용량이 제한적이어서 적대적 공격을 빠른 속도로 판별하는 것이 매우 어렵다. 이를 극복하고자 전용 하드웨어를 개발하면 개발 비용 상승과 공격 방식과 타겟 DNN 모델의 변경에 유연하게 대처하는 것은 어렵다. 이러한 문제를 해결하기 위해서 본 연구에서는 임베디드 시스템을 위한 소프트웨어 기반 적대적 공격 검출 기법을 제안한다. 이 기법은 검출에 필요한 추가적인 메모리를 최소화하고자 검출 대상 은닉층을 선별하여 사용한다. 또한 타겟 DNN이 추론을 수행할 때 병렬적으로 검출을 진행하고 이 둘 간의 실행시간 격차를 최소화한다. 실험 결과 제안된 기법 적용 전 대비 실행시간의 차이는 최대 99.6% 감소하였고 적대적 공격 탐지 정확도를 유지하면서 메모리 사용량은 최대 83.9% 감소하였다.

      • KCI등재

        터커 분해 및 은닉층 병렬처리를 통한 임베디드 시스템의 다중 DNN 가속화 기법

        김지민,김인모,김명선 한국정보통신학회 2022 한국정보통신학회논문지 Vol.26 No.6

        With the development of deep learning technology, there are many cases of using DNNs in embedded systems such as unmanned vehicles, drones, and robotics. Typically, in the case of an autonomous driving system, it is crucial to run several DNNs which have high accuracy results and large computation amount at the same time. However, running multiple DNNs simultaneously in an embedded system with relatively low performance increases the time required for the inference. This phenomenon may cause a problem of performing an abnormal function because the operation according to the inference result is not performed in time. To solve this problem, the solution proposed in this paper first reduces the computation by applying the Tucker decomposition to DNN models with big computation amount, and then, make DNN models run in parallel as much as possible in the unit of hidden layer inside the GPU. The experimental result shows that the DNN inference time decreases by up to 75.6% compared to the case before applying the proposed technique. 딥러닝 기술의 발달로 무인 자동차, 드론, 로봇 등의 임베디드 시스템 분야에서 DNN을 활용하는 사례가 많아지고 있다. 대표적으로 자율주행 시스템의 경우 정확도가 높고 연산량이 큰 몇개의 DNN들을 동시에 수행하는 것이 필수적이다. 하지만 상대적으로 낮은 성능을 갖는 임베디드 환경에서 다수의 DNN을 동시에 수행하면 추론에 걸리는 시간이 길어진다. 이러한 현상은 추론 결과에 따른 동작이 제때 이루어지지 않아 비정상적인 기능을 수행하는 문제를 발생시킬 수 있다. 이를 해결하기 위하여 본 논문에서 제안한 솔루션은 먼저 연산량이 큰 DNN에 터커 분해 기법을 적용하여 연산량을 감소시킨다. 그다음으로 DNN 모델들을 GPU 내부에서 은닉층 단위로 최대한 병렬적으로 수행될 수 있게 한다. 실험 결과 DNN의 추론 시간이 제안된 기법을 적용하기 전 대비 최대 75.6% 감소하였다.

      • KCI등재

        인공강우가 한련초에 대한 Glyphosate isopropylamine과 Glufosinate-ammonium의 효과에 미치는 영향

        김형우,이상현,송유진,김인모,진명수,이증주,최성환 한국잔디학회 2023 Weed & Turfgrass Science Vol.12 No.4

        The effect of artificial rainfall treatment on the effectiveness of glyphosate isopropylamine (glyphosate) and glufosinate ammonium (glufosinate) was investigated on Eclipta prostrata. As a result of the investigation on the 21 day after application, it was confirmed that 100% control was achieved when treated with 1230 g ai ha-1 of glyphosate after 1 hour of artificial rainfall and glufosinate 540 g ai ha-1 after 2 hours of artificial rain. At this time, the LT50 values were 0.35 and 0.20 hours, respectively. It was confirmed that artificial rainfall 1 hour after application did not affect the variation in herbicide effectiveness when treated with standard amounts of glyphosate and glufosinate on Eclipta prostrata. As a result of analyzing free amino acids according to artificial rainfall time after treatment with a test agent known as an amino acid biosynthesis inhibitor, a clear decrease in content was confirmed. At 0.25 hours of artificial rainfall after glyphosate application, phenylalanine decreased by 31.9% and tyrosine decreased by 50% compared to control. After glufosinate application, asparagine increased by 102.4% in 0.25 hours of artificial rainfall, but decreased by 84.8% in the case without rainfall treatment. These results are expected to be used as reference material for efficient weed management considering agricultural meteorological environments such as recent rainfall patterns.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼