RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 음성지원유무
        • 학위유형
        • 주제분류
          펼치기
        • 수여기관
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 지도교수
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • Deep Neural Network Training Accelerator Architecture Design : Acceleration of Backward Propagation using Sparsity of Neurons

        이건희 서울대학교 대학원 2020 국내박사

        RANK : 233435

        Deep neural network has become one of the most important technologies in the various fields in computer science which tried to follow the human sense. In some fields, their performance defeats that of human sense with the help of the deep neural network. Since the fact that general purpose GPU can speed up deep neural network, GPU became the main device used for deep neural network. As the complexity of deep neural network becomes high that deep neural network requires more and more computing resources. However, general-purpose GPU consumes a lot of energy that the needs of specific hardware for deep neural network are rising. And nowadays, the specific hardwares are focusing on inference. With complicated network models, training a model consumes enormous time and energy using conventional devices. So there are increasing needs specific hardwares for DNN training. The dissertation exploits deep neural network training accelerator architecture. The training process of a deep neural network (DNN) consists of three phases: forward propagation, backward propagation, and weight update. Among these, backward propagation for calculating gradients of activations is the most time consuming phase. The dissertation proposes hardware architectures to accelerate DNN training, focus- ing on the backward propagation phase. The dissertation makes use of the sparsity of the neurons incurred by ReLU layer or dropout layer to accelerate the backward propagation. The first part of the dissertation proposes a hardware architecture to accelerate DNN backward propagation for convolutional layer. We assume using rectified linear unit (ReLU), which is the most widely used activation function. Since the output as well as the derivative of ReLU is zero for negative inputs, the gradient for activation is also zero for negative values. Thus, it is not needed to calculate the gradient of input activation if the input activation value is zero. Based on this observation, we design an efficient DNN accelerating hardware that skips the gradient computations for zero activations. We show the effectiveness of the approach through experiments with our accelerator design. The second part of the dissertation proposes a hardware architecture for fully connected layer. Similar to ReLU layer, dropoout layer has explicit zero gradient for the dropped activation without gradient computation. Dropout is one of the regulariza- tion techniques which can solve the overfitting problem. During the DNN training, the dropout disconnect connections between neurons. Since the error does not propagated through the disconnected connections, we can detect zero gradient becomre computation. Making use of this characteristics, the dissertation proposes a hardware which can accelerate the backward propagation of fully connected layer. Further, the dissertation showed the effectiveness of the approach through simulation. 심층신경망은 컴퓨터 과학의 다양한 분야 중 인간의 감각을 쫓는 분야에서 가장 중요한 기술이 되어왔다. 몇몇 분야에서는 이미 심층신경망의 도움으로 인간의 감 각을 뛰어넘은 분야도 존재한다. GPGPU를 이용한 심층신경망의 가속이 가능해진 이후, GPU는 심층신경망에 있어 가장 주요한 장치로 사용되고 있다. 심층신경망 의 복잡도가 높아짐에 따라 연산에 더 많은 컴퓨팅 자원을 요구하고 있다. 그러나 GPGPU는 에너지 소모가 크기에 효율적인 심층신경망 전용 하드웨어 개발에 대한 요구가 증가하고 있다. 현재까지 이러한 전용 하드웨어는 주로 심층신경망 추론에 집중되어 왔다. 복잡한 심층신경망 모델은 학습에 긴 시간이 들고 많은 에너지를 소 모한다. 이에 심층신경망 학습을 위한 전용 하드웨어에 대한 요구가 늘어가고 있다. 본 학위논문은 심층신경망 학습 가속기 구조를 탐색하였다. 심층신경망의 학습 은 순전파, 역전파, 가중치 갱신 이렇게 세 단계로 이루어져 있다. 이 중 액티베이 션의 그래디언트를 구하는 역전파 단계가 가장 시간이 오래 걸리는 단계이다. 본 학위논문에서는 역전파 단계에 중점을 둔 심층신경망 학습을 가속하는 하드웨어 구조를 제안한다. ReLU 레이어 혹은 dropout 레이어로 인해 생긴 뉴론의 성김을 이용하여 심층신경망 학습의 역전파를 가속한다. 학위논문의 첫 부분은 합성곱 신경망의 역전파를 가속하는 심층신경망 학습 하 드웨어이다. 가장 많이 쓰이는 활성화 함수인 ReLU를 이용하는 신경망을 가정했다. 음수 입력값에 대한 ReLU 활성화 함수의 도함수가 0이 되어 해당 액티베이션의 그 래디언트 또한 0이 된다. 이 경우 그래디언트 값에 대한 계산 없이도 그래디언트 값이 0이 되는 것을 알 수 있기에 해당 그래디언트는 계산하지 않아도 된다. 이러한 특성을 이용하여 0값인 액티베이션에 대한 그래디언트 계산을 건너 뛸 수 있는 효율적인 심층신경망 가속 하드웨어를 설계했다. 또한 실험을 통해 본 하드웨어의 효율성을 검증했다. 학위논문의 두번째 부분은 완전연결 신경망의 학습을 가속하는 하드웨어 구조 제안이다. ReLU 레이어와 비슷하게 dropout 레이어 또한 그래디언트 계산 없이도 그 결과가 0임을 알 수 있다. Dropout은 심층신경망의 과적합을 해결하는 일반화 기법 중 하나로, 심층신경망 학습 과정 동안에만 무작위로 신경망의 연결을 끊어 놓는다. 신경망이 끊어진 경로로는 역전파 단계에서 에러가 전파되지 않기에 해당 그래디언트 값 또한 0임을 미리 알 수 있다. 이 특성을 이용하여 완전연결 신경망의 역전파를 가속할 수 있는 하드웨어를 설계했다. 또한 시뮬레이션을 통해 본 하드웨 어의 효율성을 검증했다.

      • 자기보고식 심리검사에서 심층신경망 모형의 적용 가능성 탐색

        이창묵 건국대학교 대학원 2019 국내박사

        RANK : 233407

        최근 인공신경망은 여러 기계학습 방법 중 가장 많은 관심을 받고 있으며 여러 분야에서 다양한 연구가 진행되면서 우수한 성능을 보여주고 있다. 심리측정 분야에서도 관심을 기울이기 시작하면서 기존 인공신경망의 연구 성과와 방법을 적용해서 기존 연구에서 해결이 어려웠던 문제에 대한 새로운 해법을 찾고자 하는 연구가 점차 시도되고 있다. 한편으로는 심리적 속성을 측정하는 문항 자료에 대해 신경망의 연구 방법을 적용하려는 노력도 진행되어서 검사 문항으로 심리적 속성을 측정하여 결과를 산출하는 과정을 구현하고자 인지진단모형에서 사용되는 Q행렬을 바탕으로 이상적 응답 반응을 생성해서 인공신경망을 훈련시키는 아이디어가 제안되었다. 본 연구는 이와 같은 선행 연구를 바탕으로 심리측정 분야에서 인공신경망의 새로운 활용 가능성을 탐색하고 향후 관련 연구의 기반을 제공하려는 목적으로 수행되었다. 이에 임상 분야에서 사용되는 자기보고식 심리검사인 MMPI의 결과 프로파일을 예측하는 심층신경망 모형을 설정하면서 그 절차와 유의점을 정리하고 심층신경망의 분류 결과를 일반화 선형 모형, 랜덤 포레스트의 결과와 비교하여 심리 검사 결과에 대한 예측 성능을 검증하였으며 훈련 자료 수의 변화에 따른 분류 결과의 정확성 변화를 확인하였다. MMPI의 8개 임상 척도를 대상으로 척도별 문항에 대한 정보를 Q행렬로 정리하여 이상적 응답반응을 103, 103.5, 104, 104.5개의 4가지 조건으로 생성하였으며 이것을 훈련 자료로 하여 신경망과 다른 모형들을 훈련시켰다. 검증과 평가를 위해서는 MMPI-2 규준 집단의 각 문항에 대한 긍정반응 비율을 바탕으로 가상의 응답 자료를 생성하였으며 이 과정에 긍정반응 비율을 그대로 사용해서 생성한 자료와 함께 각 척도 점수의 상승을 가정한 척도별 상승 집단의 가상 응답 자료를 별도로 생성하였다. 훈련된 인공신경망은 기존 방법의 결과와 유사한 예측 결과를 나타내었으며 일반화 선형 모형과 랜덤 포레스트보다 모든 면에서 정확한 분류 결과를 보여주었다. 훈련 자료가 일정 이상 커지게 되면 오히려 결과가 하락하는 다른 모형과 달리 전환 학습을 거치게 되면 보다 큰 자료에서도 정확성을 높일 수 있었다. 그러나 인공신경망 모형은 높은 정밀도를 보여준 반면 낮은 재현율의 문제가 있었으며 인공신경망 모형의 분류 특성은 확실한 척도 상승만 분류할 필요가 있을 때 더 적합할 것으로 판단할 수 있었다. 또한 높은 정확도에도 불구하고 훈련 자료에 포함되지 못한 응답 패턴으로 인한 문제도 있는 것으로 보였으며 좀 더 큰 규모의 자료를 충분히 효율적으로 학습시킬 수 있는 절차에 대한 고려가 필요할 것으로 보였다. 이 결과를 토대로 한 결론은 다음과 같다. 첫째, 인공신경망으로 문항 응답에서 검사 결과를 예측한 결과는 학습의 기준으로 사용한 기존의 방법과 유사하였으며 향후 성능을 더 높일 여지가 있었고 실제 자료를 사용한 연구를 통해 기존 방법보다 더 정확한 결과를 산출하는 것도 가능할 것이므로 이런 과정을 통해 새로운 심리 측정 모형으로써 다양한 연구에 적용하는 것이 가능할 것이다. 둘째, 일반화 선형 모형과 랜덤 포레스트의 결과와 비교했을 때, 인공신경망의 결과가 가장 우수했으며 자료의 다차원적인 특성으로 인한 높은 복잡성을 고려할 때 인공신경망 모형이 기존의 방법보다 더 적합할 수 있을 것으로 판단되었다. 셋째, 이상적 응답 반응의 패턴 전부를 생성할 수 없는 경우 일부만 생성하여 훈련시키는 방법을 사용하여 최소한의 정확도를 확보할 수 있었다. 그러나 훈련 자료 수의 증가에 대한 효과가 미미한 결과가 나온 것에 대해서는 모형과 분석 절차에 대한 추가 검토가 필요할 것이다. 인공신경망은 향후 실제 자료를 사용한 검증 과정을 거치고 다양한 아이디어를 통해 분석 절차를 보완하면서 모형을 개선하는 과정을 통해 타당한 심리 측정 모형으로 적용될 수 있을 것으로 기대한다. Among the different kinds of machine learning methods, artificial neural networks have received great attention, and they have shown excellent performance in studies in various fields. In psychometrics, they have been used to identify new solutions to problems that have not been solved. In addition, another efforts are conducted to apply artificial neural networks on items of psychological tests that intended to measure psychological attributes. These studies aimed to train a neural network using an ideal response pattern generated by a Q matrix in the cognitive diagnostic model. Based on these prior studies, the present study explored the potential possibility for employing artificial neural networks in psychometrics and to provide a groundwork for future studies, We created a deep neural network model that predicts the outcome profile of the Minnesota Multiphasic Personality Inventory (MMPI), a self-report tool that is used widely in clinical psychology, and summarized the procedure and significance. Additionally, the predictive performance of the model was verified by comparing its results to those obtained from a generalized linear model and random forest, and the fluctuation in the accuracy of the classification results, as the change in the number of training sets, was verified. The information on the relationship between the items and the MMPI’s 8 clinical scales were plotted using a Q matrix and the ideal response patterns in the following four conditions were generated: 103, 103.5, 104, and 104.5. These ideal patterns were used as training sets to train the neural network and other models. For the test and validation phase, we generated simulation data based on the positive response rate for each item of the MMPI-2’s norm groups. Additionally, the floating groups’ simulation data for each scale, assumed by each scale’s score, were generated separately. The trained neural network reported predicted outcomes that were similar to those obtained from the calculation methods used earlier, and it exhibited better accuracy performance as compared to the generalized linear model and random forest. Contrary to the other models, which exhibited poor results with a larger volume of training data, the neural network implemented after transfer learning exhibited good accuracy with larger data. However, though the artificial neural network model exhibited high accuracy, it revealed “low value of recall” issues. Specifically, the classification characteristics of the neural network could be judged more appropriate when the definite floating scales are classified. In addition, despite the high accuracy, there was a consideration with the response patterns that were not included in the training sets and it should be considered that the procedures to ensure large amount data can be learned efficiently. The following conclusions could be drawn from these results: First, the artificial neural network’s predicted results for the test items were similar to those obtained by using previous calculation methods, and there was scope for better performance. Future studies using real data could yield more accurate results. The artificial neural network could be used a new psychological measurement model in future studies. Second, neural network exhibited better predictive performance as compared to the generalized linear model and random forest. Further, considering the high complexity of the multi-dimensional characteristics in the present psychological data, the artificial neural network model was more feasible than the methods used before. Third, if all the possible patterns of the ideal responses could not be usable, minimum accuracy could be achieved by training only a fraction of these patterns. However, the model and procedures need to be examined further because of the results that are less affected by the increase in the number of training sets. Following validation using actual data, and by applying various ideas to complement the analysis process and improve the model structure, the artificial neural network could be employed as a valid psychological measurement method through the validating process using actual data.

      • 심층신경망 기반 특허 거래 예측에 관한 연구: 멀티모달 전이학습과 DeepSurv 생존분석의 이중 접근

        이재원 연세대학교 일반대학원 2026 국내석사

        RANK : 233375

        지식 기반 경제에서 기술 혁신은 기업의 경쟁력 확보와 국가 경제 성장의 핵심 동력으로 작용한다. 특허는 지식재산권 보호 수단을 넘어 기업의 기술 자산 가치를 반영하는 핵심 지표이자 기술 사업화의 출발점이다. 이러한 특허의 경제적 가치는 단순히 법적 권리로서의 존속 자체로만 평가될 수 없으며, 금전적 대가가 수반되는 거래를 통해 비로소 실현된다. 그러나 특허의 거래 정보의 경우, 비공개적 성격으로 인해 접근이 제한적이기 때문에, 기존 연구들은 대부분 권리이전 이력, 특허 패밀리 수, 인용 수 등과 같은 대용치에 의존하였다. 이로 인해 특허 거래의 발생 여부와 발생 시점을 직접적으로 예측한 연구는 매우 제한적이었다. 본 학위논문은 이러한 연구 공백을 보완하기 위해, 기술보증기금의 실제 특허 거래 사례 데이터를 활용하여 특허 거래 발생 여부와 발생 시점이라는 두 차원에서 분석하는 새로운 심층신경망 기반 프레임워크를 제안한다. 이를 위해 본 논문은 두 개의 독립적 연구로 구성된다. 첫 번째 연구에서는 멀티모달-전이학습 기반 특허 거래 예측 모형을 개발하였다. 특허 초록과 요약과 같은 특허의 텍스트 정보로부터 KorPatBERT 임베딩을 추출하고, 청구항 수, 출원인 수, IPC 관련 변수 등 특허의 구조화된 정보와 결합하여 멀티모달 입력을 구축하였다. 권리이전 이력을 활용한 사전학습과 실제 거래 사례 기반의 미세조정을 통해 거래 여부를 예측한 결과, 멀티모달-전이학습 모형은 단일 모달리티 및 비전이학습 기반 모형 대비 우수한 성능을 보였으며, 이는 실제 거래 데이터의 희소성을 효과적으로 보완할 수 있음을 확인하였다. 두 번째 연구에서는 신경망 기반 생존분석을 활용한 특허 거래 시점 예측을 수행하였다. 특허 출원일부터 거래 발생까지의 기간을 사건으로 정의하고, 권리이전 이력 없이 소멸한 특허를 중도절단 사례로 처리하여 생존분석 데이터셋을 구축하였다. 이후 콕스 비례위험모형(Cox Proportional Hazards, CPH), 랜덤 생존 포레스트(Random Survival Forest, RSF), DeepSurv 모형을 비교한 결과, DeepSurv가 가장 우수한 예측 성능을 보임을 확인하였다. 가장 우수한 성능을 보인 DeepSurv 모형에 대한 해석력을 강화하기 위해, SHAP 기법을 적용하여 거래 발생 시점 예측에 영향을 미치는 핵심 설명변수를 규명하였다. 종합적으로 본 학위논문은 멀티모달-전이학습과 신경망 기반 생존분석이라는 두 가지 접근을 활용하여, 특허 거래를 다차원적으로 이해하고 예측할 수 있는 새로운 분석 체계를 제시한다. 학문적으로는 특허 거래 대용치에 의존해온 기존 연구들과 달리 희소한 실제 거래 사례를 데이터로 활용한 정량적 연구라는 점에서 의의가 있으며, 멀티모달-전이학습과 생존분석 기법을 특허 거래 문제에 접목함으로써 새로운 연구 지평을 열었다는 점에서 기여를 가진다. 실무적으로는 기업과 기술 중개기관이 보유한 특허 자산의 거래 가능성을 조기에 평가하고, 거래 발생 시점을 예측함으로써 기술 사업화 전략과 자원 배분 의사결정에 실질적인 기여를 할 수 있을 것으로 기대된다. In a knowledge-based economy, technological innovation serves as a key driver of corporate competitiveness and national economic growth. Patents, beyond functioning as instruments of intellectual property protection, represent a crucial indicator of technological asset value and the starting point of technology commercialization. However, the economic value of patents cannot be reduced to mere application counts or legal status; rather, it is materialized through transactions in which ownership transfers involve monetary consideration. Due to the confidential nature of actual transaction data, prior studies have largely relied on proxies such as ownership transfer records, patent family size, or citation counts. Consequently, direct prediction of both the occurrence and timing of patent transactions has been rare. This dissertation addresses this research gap by proposing a novel deep neural network–based framework that leverages actual patent transaction data from the Korea Technology Finance Corporation (KOTEC) to analyze two dimensions: whether a transaction occurs and when it occurs. The dissertation consists of two independent but complementary studies. The first study develops a multimodal transfer learning model for predicting patent transaction occurrence. Textual information from patent abstracts and summaries was embedded using KorPatBERT, and then combined with structured metadata such as the number of claims, inventors, applicants, and IPC-related variables to construct multimodal inputs. A pretraining step using ownership transfer histories, followed by fine-tuning on actual transaction cases, demonstrated that the multimodal transfer learning model outperformed unimodal and non-transfer learning models. This finding confirms the effectiveness of transfer learning in addressing the scarcity of actual transaction data. The second study applies neural network–based survival analysis to predict the timing of patent transactions. The period from patent application to transaction occurrence was defined as the event, while patents that expired without any ownership transfers were treated as censored cases. Cox proportional hazards (CoxPH), Random Survival Forest (RSF), and DeepSurv models were compared, and DeepSurv achieved the best predictive performance. To enhance interpretability, SHAP analysis was conducted on the DeepSurv model, identifying key explanatory variables influencing transaction timing. Overall, this dissertation introduces a new analytical framework that combines multimodal transfer learning and neural survival analysis to provide a multidimensional understanding of patent transactions. Academically, it contributes to the literature by moving beyond proxy-based approaches and presenting one of the few quantitative studies using actual transaction data. Methodologically, it expands the research horizon by applying multimodal transfer learning and survival analysis techniques to the domain of patent transactions. Practically, the findings provide firms and technology intermediaries with tools to assess the transaction potential of patent assets at an early stage and to predict transaction timing, thereby supporting more effective technology commercialization strategies and resource allocation decisions.

      • 심층강화학습을 통한 지형 특징 기반 실시간 전역 경로계획

        고형우 인하대학교 대학원 2025 국내석사

        RANK : 233359

        무인이동체의 활용이 증가함에 따라 무인이동체의 자율 유도제어 기술, 특히 3차원 지형에 서의 실시간 경로계획 기법의 중요성이 부각되고 있다. 기존의 샘플링 기반 경로계획 기법 들은 높은 계산 복잡도로 인해 실시간성 확보가 어렵고, 최적화 기반 기법들은 지역 최적해 에 빠지기 쉬우며 다양한 초기 조건에서 낮은 재현성을 보인다는 한계가 있다. 또한 대부분 의 기존 연구들은 지형의 특징을 국소적 관점에서만 활용하여 전역적으로 최적인 경로 생 성이 어렵다는 문제가 있다. 본 연구에서는 이러한 한계들을 극복하기 위해 심층강화학습 기반의 실시간 3차원 전역 경로계획 기법을 제안한다. 제안한 방법은 Height map으로 표현된 3차원 지형 정보를 입 력으로 받아 어텐션 메커니즘이 통합된 CNN을 통해 지형의 전역적 특징을 효과적으로 추 출한다. 추출된 특징은 SAC 알고리즘을 통해 연속적인 행동 공간에서 최적의 경로점을 순 차적으로 생성하는 정책 학습에 활용된다. 특히 경로의 정밀성과 실행 가능성을 향상시키기 위해 경로점 간 보간점 기반의 Path ratio를 도입하여 실제 비행 가능한 부드러운 경로 생 성을 보장한다. 또한 채널/공간 어텐션을 통해 경로 생성에 중요한 지형 특징에 선택적으로 집중할 수 있게 하여 학습 효율성을 높였다. PSO 알고리즘과의 비교를 위하여 진행한 몬테카를로 시뮬레이션을 통해 제안된 방법의 우수성을 검증하였다. 실험 결과 제안한 방법이 경로의 최적성을 유지하면서도 뛰어난 연산 효율성 향상을 달성했으며, 특히 지형 복잡도 증가에도 불구하고 일정한 처리 시간을 유지 함을 보여준다. 이는 실제 무인이동체 운용 환경에서 요구되는 실시간 경로 재계획이 가능 한 수준의 성능임을 의미한다. 또한 다양한 초기 조건에서의 안정적인 경로 생성과 해의 완 전성 보장은 제안한 방법의 실용성과 신뢰성을 입증한다. 본 연구는 심층강화학습을 활용한 실시간 3차원 경로계획의 새로운 프레임워크를 제시하였다는 점에서 의의가 있으며, 향후 다양한 무인이동체 응용 분야에서 활용될 수 있을 것으로 기대된다. With the increasing utilization of unmanned vehicles, autonomous guidance and control technologies, particularly real-time path planning techniques in three-dimensional terrain, have become increasingly important. Existing sampling-based path planning methods face limitations in achieving real-time performance due to high computational complexity, while optimization-based approaches are prone to local optima and show poor reproducibility across various initial conditions. Furthermore, most existing studies generate suboptimal global paths as they only utilize terrain features from a local perspective. This study proposes a deep reinforcement learning-based real-time 3D global path planning method to overcome these limitations. The proposed approach effectively extracts global terrain features through a CNN integrated with attention mechanisms, using height map representations of 3D terrain as input. These extracted features are then utilized in policy learning through the SAC algorithm to sequentially generate optimal waypoints in continuous action space. To enhance path precision and feasibility, we introduce an interpolation-based path ratio that ensures the generation of smooth, flyable trajectories. Additionally, channel/spatial attention mechanisms are employed to selectively focus on crucial terrain features for path generation, thereby improving learning efficiency. The superiority of the proposed method was verified through Monte Carlo simulations comparing it with the PSO algorithm. Experimental results demonstrate that our approach achieves remarkable computational efficiency while maintaining path optimality, notably maintaining consistent processing time despite increasing terrain complexity. This performance level enables real-time path replanning capabilities required in actual unmanned vehicle operations. Furthermore, the stable path generation across various initial conditions and guaranteed solution completeness validate the practicality and reliability of our proposed method. This study is significant in presenting a novel framework for real-time 3D path planning using deep reinforcement learning and is expected to find applications across various unmanned vehicle domains.

      • 심층 강화학습을 통한 대형 화물 운송의 스윕 경로 분석 자동화에 관한 연구

        손호준 연세대학교 대학원 2020 국내석사

        RANK : 233343

        Swept path analysis is an analysis method that calculates the movements and paths of each part of the vehicle when the vehicle moves. Swept path analysis calculates the path that each wheel passes and the space that the vehicle can pass during the turn. Oversized cargo has various considerations in land transportation. In particular, because the cargo is very large, it is important to identify transportation interferences due to the shape of the road, such as width and curvature of the road. If the width of the road is shorter than the width of the module or the length of the module is too long to cross the curve, the cargo must be transported by another route. Existing swept path analysis software enables path analysis for oversized cargo transportations. However, although path analysis for vehicles such as trucks and trailers is possible, there is no analysis platform for SPMT, which is an omnidirectional vehicle commonly used for oversized cargo transportation. In addition, the current process of swept path analysis is very passive. Analyze the trajectories by drawing roads and manually placing the vehicle. In order to identify the feasibility of oversized cargo transportation on a specific curved road, it is necessary to manually check the trajectory by changing the layout of the vehicle. Deep reinforcement learning is an area of machine learning. This is a way to utilize deep neural network structure in existing reinforcement learning algorithm. The agent recognizes the current state from the environment and selects the next action to maximize the reward by the deep neural network. Deep reinforcement learning is useful when states are expressed in higher dimensions. This method is also used in the field of simulation-based optimization. However, no deep reinforcement learning has been applied to swept path analysis. In this study, we design a system that can analyze SPMT, an omnidirectional vehicle as well as a vehicle provided by the existing swept path analysis software. The system is also used to automate swept path analysis for oversized cargo transportation on an deep reinforcement learning basis. Ultimately, we develop an artificial intelligence system that directly identifies whether the vehicle can pass through the road. To verify the developed system, we compare the trajectories of the same vehicle with the existing swept path analysis software. Additionally, the ground truth is the result of identifying the feasibility of transportation through manual operation. Through this ground truth data, we verify the performance of the artificial intelligence system that identifies the feasibility of oversized cargo transportation. The purpose of this paper is to increase the efficiency of the process for identifying the feasibility of oversized cargo transportation. Swept Path Analysis는 차체가 선회 동작을 할 때 차체 각 파트들의 움직임과 경로를 계산하고 분석하는 해석방법이다. Swept Path Analysis를 통해 회전 중에 각 바퀴가 지나가는 경로를 계산하고 회전 중에 차체가 지나갈 수 있는 공간이 계산된다. 대형 화물은 육상 운송 시에 다양한 고려사항이 발생한다. 특히 화물이 매우 크기 때문에 도로의 폭과 커브의 곡률 등 도로 형상에 의한 운송 간섭요소 파악이 중요하다. 도로의 폭이 화물을 포함한 모듈의 폭보다 짧거나 모듈 길이가 길어서 커브 길을 지나가지 못하는 경우에는 다른 경로로 화물을 운송해야 한다. 기존의 Swept Path Analysis 소프트웨어을 통해 대형 화물 운송에 대한 경로 해석이 가능하다. 그러나 트럭과 트레일러 등의 차체에 대한 경로 해석은 가능할지라도 대형 화물 운송에 범용적으로 쓰이는 Omnidirectional 차체인 SPMT에 대해서는 해석 플랫폼이 존재하지 않는다. SPMT는 홀로노믹(홀로노믹)한 모션을 취하기 때문에 다른 차체들과 궤적 해석 과정이 다를 것이다. 또한, 현재의 Swept Path Analysis의 프로세스는 매우 수동적이다. 도로를 도면에 그리고 차체를 수동으로 배치하여 궤적을 해석한다. 특정 곡선 도로에 대한 대형 화물의 운송 가능성을 파악하기 위해서는 수동적으로 차체의 배치를 바꾸면서 궤적을 확인해야 한다. 심층 강화학습은 기계학습의 한 영역이다. 이것은 기존의 강화학습 알고리즘에 심층 신경망 구조를 활용하는 방법이다. 에이전트가 환경으로부터 현재의 상태를 인식하여 심층 신경망에 의해 다음 행동 중 보상을 최대화 하는 행동을 선택한다. 상태가 고차원으로 표현될 때 심층 강화학습은 유용하다. 이 방법은 시뮬레이션 기반 최적화 분야에서도 활용된다. 그러나 Swept Path Analysis에 심층 강화학습을 적용한 사례는 없다. 본 연구에서는 기존의 Swept Path Analysis 소프트웨어에서도 제공하는 차체 뿐 아니라 Omnidirectional 차체인 SPMT에 대한 해석도 가능한 시스템을 설계한다. 또한 해당 시스템을 사용하여 심층 강화학습 기반으로 대형 화물 운송에 대한 Swept Path Analysis를 자동화한다. 궁극적으로, 도로 형상 이미지에 대해서 해당 도로를 차체가 지나갈 수 있는지 곧바로 판별하는 인공지능 시스템을 개발한다. 개발한 시스템을 검증하기 위해 기존의 Swept Path Analysis 소프트웨어와 동일 차체에 대한 궤적을 비교한다. 또한 수동 조작을 통한 운송 가능성 파악 결과를 Ground Truth로 한다. 이를 통해 본 연구를 통해 자동화된 운송 가능성 판별 성능을 검증한다. 본 시스템을 통해서 대형 화물의 운송 가능성을 파악하는 프로세스가 효율적으로 개선되는 것을 목표로 한다.

      • 폐수처리공정에서의 인공지능기반 알고리즘 성능 향상 연구

        김재일 경상국립대학교 대학원 2024 국내박사

        RANK : 233342

        Considering wastewater properties from the rapid development of industrial growth, it is necessary to have an optimal treatment system for this wastewater to mitigate the environmental impact of discharges and comply with environmental regulatory standards. The quality of industrial wastewater effluent varies depending on factors such as wastewater source and treatment process (physical, chemical, biological). Governing equations and data-based prediction models are used to determine treatment facilities' process characteristics and behavior. However, a lot of analysis is required to comply with environmental regulations. Therefore, a typical wastewater treatment facility's operation relies on experienced people and their knowledge. The 4th Industrial Revolution, the next generation industrial revolution, consisting of the convergence of information and communication technology (ICT), has already been introduced to Korea and worldwide in various fields such as artificial intelligence (AI), the Internet of Things (IoT), and big data. However, in the domestic environmental technology field, the research and development of artificial intelligence technology is insufficient compared to other fields. Although various methods of applying artificial intelligence technology to wastewater treatment facilities are being proposed abroad, research and development in Korea have not yet been conducted on various water treatment systems. Also, there is a lack of standardized data-based model development cases and guidelines that can be optimally applied. Therefore, to apply artificial intelligence technology to wastewater treatment facilities, it is necessary to utilize the results derived from various studies and their comparison and analysis. Recently, the prediction models that can forecast the effluent water quality from wastewater treatment have been actively developed from AI-based machine learning and deep learning models and can be widely applied to wastewater treatment processes. In this study, we compared and analyzed the performance of machine learning algorithms (SVM, RF, ANN) and deep learning algorithms (LSTM) using the daily flow rate and BOD concentration of effluent from the wastewater treatment process. In addition, we compared and analyzed the performance of a similar wastewater treatment process. The applicability of transfer learning was analyzed in two wastewater treatment processes. This study assessed the performance of single and modified algorithms based on machine learning and deep learning for wastewater treatment process. More specifically, this study adopted support vector machine (SVM), random forest (RF), and artificial neural network (ANN) for machine learning as well as long short-term memory (LSTM) for deep learning. The performance of these (single) algorithms were compared with that of modified ones processed through hyperparameter tuning, ensemble learning (only for machine learning), and multi-layer stacking (i.e., two layers of LSTM units). The daily effluent of wastewater treatment process observed between 2017 and 2022 in the Cheong-Ju National Industrial Complex was used as input to all tested algorithms, which was evaluated with respect to mean squared error. For the model performance evaluation, discharge and biochemical oxygen demand are selected as dependent variables out of nine measured parameters. Results showed that the performance of any machine learning algorithms was superior to their competitor LSTM. This is mainly attributed to a small amount of input data provided to the LSTM algorithm and unstable effluent wastewater characteristics. Meanwhile, hyperparameter tuning improved the performance of all tested algorithms. However, ensemble learning for machine learning and two-layer stacking for LSTM generally resulted in performance degradation as compared to that of single algorithms, regardless of dependent variables. Therefore, this calls for a careful design and evaluation of modified algorithms, specifically for model architecture and performance improvement processes. This study assessed the feasibility of transfer learning from one wastewater treatment process to another using two popular deep learning algorithms. Specifically, convolutional neural network (CNN) and long short-term memory (LSTM), which consisted of four and three hidden layers, respectively, were used as benchmark algorithms for transfer learning. Input data for both deep learning and transfer learning were provided from two wastewater treatment plants with identical treatment trains in series (located in Jinju and Cheongju City) over the five-year period from 2018 to 2022. Performance evaluation was also done not only against two deep learning algorithms but also against those adopting two transfer learning strategies, one for freezing all hidden layers developed from the pre-trained model and the other for training the last hidden layer only among multiple ones, with respect to Mean Squared Error (MSE). We found that the performance of both CNN and LSTM was relatively comparative regardless of dependent variables, discharge and biochemical oxygen demand (BOD), whereas the prediction accuracy of both algorithms was slightly higher for discharge than for BOD due to its low variability. When transfer learning which froze all hidden layers of the existing model was applied to two benchmark algorithms, the predictive performance of both algorithms was found to slightly improved only for discharge. Also, there was no measurable variation in the prediction accuracy of benchmark algorithms using the other transfer learning approach. Potential applications of transfer learning include the rapid reuse of the existing models (developed from source domains) for target domains which are hard to develop new prediction models due to the lack of data in deep learning. The results derived from machine learning, deep learning, and transfer learning in wastewater treatment can be used to develop data-based model development standardization guidelines. This might be due to that the primary data could be used in future intelligent wastewater treatment algorithms and scenarios.

      • 컨볼루션 신경망을 기반으로 한 의료 이미지의 NR-IQA 연구

        쉬멍 동신대학교 일반대학원 2024 국내박사

        RANK : 233342

        컨볼루션 신경망을 기반으로 한 의료 이미지의 NR-IQA 연구 쉬 멍 동신대학교 대학원 컴퓨터학과 (지도교수 이태원) 이미지 품질 평가는 지난 십여 년 동안 관련 이미지 전송 하드웨어, 이미지 소프 트웨어, 이미지 수집 기술, 이미지 재구성 또는 이미지 처리 알고리즘 등에서 중요 한 역할을 하고 있다. 의료 이미지는 특수한 이미지 형성 방식을 가지고 있으며, 다 양한 이미지 형식에서 많은 다른 특징과 내용이 존재하여 현실 세계에서 완벽한 의 료 참조 이미지를 찾을 수 없게 된다. 이러한 여러 요소를 고려하여 인간의 주관적 인 평가에 맞으며 강력한 일반화 능력을 갖춘 의료 이미지 품질 평가 모델을 설계 하는 것은 중요한 응용 가치를 가지고 있다. 이 논문에서는 공개 데이터셋에서 다양한 의료 이미지 데이터를 수집하였으며, 일 반적으로 사용되는 데이터셋 확장 방법과는 다른 왜곡 확장 방법을 사용하였으며. 가우시안 잡음, 소금-후추 잡음, 점 잡음, 포아송 잡음 등의 잡음 유형이 포함되었 다. 교사 및 대학원 평가 그룹에 의해 평가, 점수 처리 및 이상치 제거를 거친 후, 868개의 점수 라벨이 부여된 이미지를 모델의 훈련 및 테스트 샘플로 사용하였다. 전이 학습 기반의 컨볼루션 신경망 의료 영상 품질 평가 모델 은 다양한 분류 감 지 CNN을 기반으로 구성되었으며, 전이 학습을 활용하여 네트워크 모델을 수정하 고 구조를 조정하여 분류 감지 작업을 의료 영상 품질 평가 작업으로 전환하였다. 이를 통해 의료 영상 품질 평가 데이터셋의 학습과 검증을 수행하였다. 다양한 네트워크 모델을 비교하여 여러 실험 지표를 평가하였다. 실험 결과, 테스 트에서 모델의 예측 점수와 주관적인 평가 점수 사이의 피어슨 상관 계수가 최대 0.9690, 스피어만의 순위 상관계수가 최대 0.9625, 켄달 순위 상관 계수가 최대 0.6599로 나타났으며, 평균 제곱 오차가 4.7330로 가장 낮게 나타났으며, 평균 절대 오차가 3.4010로 가장 낮게 나타났으며, 이는 모델의 높은 견고성과 유효성을 검증 하였다. 본 연구에서 개발한 의료 영상 품질 평가 모델은 강력하고 효과적이며, 일반화 능 력도 뛰어나다는 것을 확인하였다. 이 모델은 인간의 주관적인 평가와도 일치하며, 향후 연구에서 더욱 발전할 가능성을 가지고 있다. 주제어: 전이 학습, 의료 영상, 무 참조 이미지 품질 평가, 컨볼루션 신경망, 심층 학습

      • 딥 러닝을 활용한 한국 아파트 단위평면 분석 방법론 개발

        안의순 서울대학교 대학원 2021 국내박사

        RANK : 233340

        이 연구에서는 한국 아파트 단위평면에서 나타나는 주거공간의 배치를 분석할 수 있는 방법론을 딥 러닝 방법론을 활용하여 개발하였다. 단위평면에 대한 정량화된 분석을 자동으로 수행하여 한국 아파트 전수에 대한 분석이 가능한 방법론을 개발하고자 하였다. 한국에서 아파트가 주거의 주류가 된 이후, 폭발적으로 늘어난 아파트 전수에 대한 연구가 어려워지면서, 단위평면에 대한 연구는 다양한 기준에 따라 파편화되었다. 공간구문론을 포함한 공간분석은 건축 공간의 구조에 대한 정량적인 분석이 가능한 방법론으로, 한국 아파트의 주거 공간을 객관적이고 재현가능하게 분석할 수 있는 기반을 제공하였다. 그러나 공간분석 방법론에서도 개별 사례마다 수작업이 필요하다는 한계로 인하여, 1990년대 말 이후로는 한국 아파트 전수에 대한 공간분석 연구는 이루어지지 않았다. 이러한 한계를 극복하기 위하여, 연구자의 의도를 스스로 데이터에서 귀납적으로 학습하고 이를 한국 아파트 전수에 적용하여 분석을 수행할 수 있는 방법론을 개발하고자 하였다. 이러한 분석 방법론을 개발하기 위하여, 이 연구에서는 기계학습 방법론 중 하나인 딥 러닝을 활용하였다. 딥 러닝은 심층 신경망 모형을 활용하여 복잡한 개념을 처리할 수 있다는 장점이 있다. 2장에서는 건축 공간에 딥 러닝 방법론을 적용한 선행 연구를 고찰하여, 건축 공간을 2차원 행렬 형태로 표현하여 CNN (convolutional neural network, 합성곱 신경망) 모형을 성공적으로 적용할 수 있음을 확인하였다. 또한, 딥 러닝 모형이 건축 공간 데이터에서 학습한 규칙은 잠재공간 분석이나 역합성곱 신경망 학습 등의 방법론을 통하여 분석이 가능함을 파악하였다. 그러나, 다른 건축 공간을 대상으로 학습한 딥 러닝 모형을 한국 아파트에 그대로 적용할 수는 없었다. 따라서 한국 아파트에 딥 러닝을 적용하여 분석하기 위해서는 한국 아파트 전수에 대한 데이터셋을 구축하는 것이 필요함을 확인하였다. 3장에서는 딥 러닝을 활용하여 한국 아파트 단위평면의 주거공간 배치를 분석하는 방법론을 수립하였다. 먼저, 공간분석과 딥 러닝에 대한 고찰을 반영하여, 건축 공간을 2차원 격자 구조로, 각 지점의 주거공간 특성을 깊이 차원으로 재현한 2차원 이미지 형태로 주거공간 배치를 모형화하였다. 다음으로, 딥 러닝 모형이 학습한 주거공간 배치유형과 단위평면의 각 영역 사이의 관계를 시각화할 수 있는 CAM (class activation mapping) 방법론을 주거공간 배치 특성 분석을 위한 방법론으로 선정하였다. 이를 통하여, 각 유형별 단위평면의 주거공간 배치에서 나타나는 계획 특성을 시각화할 수 있다. CAM 방법론은 연구자가 사전에 설정한 분류 기준에 따른 비교만 가능한 한계가 있다. 이 연구에서는 CAM 방법론을 확장하여, 딥 러닝 모형이 학습한 주거공간 배치 특성을 기준으로 평면 사례를 귀납적으로 유형화하고 그 특성을 시각화하는 BAM (bicluster activation map) 방법론을 수립하였다. BAM 방법론은, 바이클러스터링 분석을 통하여 딥 러닝 모형 내부의 잠재표현 계층의 각 노드와 이를 활성화하는 단위평면 사례를 짝지어 유형화한 주거공간 배치유형을 도출하고, 단위평면의 각 영역에 대하여 해당 배치유형의 모형이 활성화되는 영역을 시각화한다. 또한, 이렇게 개발된 단위평면 분석 방법론을 한국 아파트 단위평면의 진화과정 분석에 적용하여 검증하기 위한 방법론을 수립하였다. 한국 아파트 단위평면 데이터셋에 대한 시기 구분 작업을 학습한 딥 러닝 모형을 활용하여, 시기 구분과 관련된 주거공간 배치 특성을 기준으로 단위평면을 유형화하고, 그 분석 결과를 한국 아파트 선행 연구와 비교하여 분석 방법론의 실효성을 확인하고자 하였다. 4장에서는 한국 아파트 단위평면의 진화과정 분석과 이를 통한 분석 방법론 검증에 필요한 한국 아파트 단위평면 데이터셋을 구축하였다. 공개된 단위평면 및 연관 자료를 수집하고, 수집된 평면도에서 현관, LDK (거실 및 주방, 식당), 침실, 발코니, 화장실 등 주거공간의 배치를 인식하여, 한국 아파트 전수에 대한 데이터셋을 구축할 수 있었다. 일관된 분석을 위하여 주 향 및 현관의 방향, 축척이 통일되도록 정규화하고, 서로 다른 크기의 평면에 대하여 동일한 분석 영역을 설정하였다. 준공 시기, 시도별 권역 등 자료도 딥 러닝 모형의 입력값으로 적합하도록 정규화하였다. 특히 준공 시기는 여러 선행 연구에서 5년 또는 10년 단위로 시기를 구분하는 것을 반영하여, 수집된 단위평면 사례의 준공연도 범위인 1969년부터 2019년까지 51년을 5년 단위 10개 시기로 설정하였다. 이러한 과정을 거쳐, 약 5만 개 단위평면과 연관 자료를 데이터셋으로 구축하였다. 5장에서는 이 연구에서 개발한 분석 방법론을 적용하여 한국 아파트의 단위평면에서 나타나는 시기에 따른 주거공간 배치 변화를 분석하였다. 먼저, 3장에서 선정한 딥 러닝 모형인 VGG-GAP 모형을 4장에서 구축한 한국 아파트 단위평면 데이터셋에 맞게 수정한 후, 단위평면을 시기에 따라 분류하는 작업을 수정된 모형에 학습시켰다. 이러한 과정을 거쳐, 주거공간 배치 분석 모형은 단위평면 50,252개 중 29,027개 평면에 대해서는 5년 단위 시기로 정확히 예측하고, 16,457개 평면은 직전 시기 또는 직후 시기로 예측하여, 총 90.51%의 단위평면에 대하여 5년 이내 오차로 준공 시기를 예측할 수 있음을 확인하였다. 다음으로, 딥 러닝 모형 내부의 잠재표현 계층에 학습된 시기별 주거공간 배치 특성을 3장에서 수립한 BAM 방법론을 통하여 분석하였다. 약 5만 개 평면과 512개 잠재표현 노드에 대한 바이클러스터링 분석을 통하여 16개 주거공간 배치유형을 도출하였다. 각 배치유형은 준공 시기를 기준으로 평면 사례와 이에 활성화되는 잠재표현 노드를 함께 군집화하였다. 그러나 인접한 시기의 유형 사이에서 활성화 강도의 상관관계가 높게 나타나, 배타적인 1:1 관계로 해석하기 어려운 특성도 확인하였다. 각 배치유형에 속한 단위평면 사례는 시기별로 다양하게 분포되어 나타났다. 그러나 지역별, 규모별로는 일부 유형을 제외하면 큰 차이를 보이지 않았다. BAM 시각화를 통하여 각 배치유형별 단위평면 사례에서 해당 유형별 모형이 활성화되는 영역을 분석한 결과, 주거공간 배치유형이 여러 시기의 한국 아파트 단위평면에서 나타나는 다양한 계획 특성을 학습하였음을 확인할 수 있었다. 6장에서는 5장에서 도출된 주거공간 배치유형을 주동 형식별 단위평면 사례에 적용하여 한국 아파트의 진화과정을 해석하고, 그 결과를 선행 연구와 비교하였다. 이러한 과정을 통하여, 이 연구에서 개발한 분석 방법론을 검증하고, 궁극적으로는 딥 러닝을 활용한 귀납적 분석 방법론을 건축 공간 연구에 활용할 수 있는 가능성을 검토하였다. 1980년대부터 2010년대까지, 판상형과 혼합형 주동의 복도형, 계단실형 평면, 탑상형 주동의 중앙부 및 단부 평면, 원룸형 도시형생활주택 평면 등 다양한 한국 아파트 단위평면 사례를 대상으로, 해당 시기의 여러 배치유형별 모형의 활성화 영역을 BAM 시각화를 적용하여 분석하였다. 이러한 분석을 통하여, 주거공간 배치유형이 1990년대 판상형 주동의 계단실형 단위평면에서 나타나는 주거공간 배치 특성을 잘 학습하였음을 확인하였다. 또한, BAM 시각화를 통하여 복도형 평면이나 탑상형 주동의 평면 등에서 나타나는 고유한 주거공간 배치를 도출할 수 있었다. 그러나 주거공간 배치에 명확하게 구분할 수 있는 차이점이 있는 경우 그 차이점에 집중하여 전반적인 주거공간 배치를 무시하는 한계를 보였다. 이러한 분석을 통하여 도출된 한국 아파트의 진화과정은 계단실형 주동의 일반화, 판상형 주동에서 소수 유형으로의 수렴, 대형에서 소형 평면으로의 하향화 (trickle-down), 탑상형 주동의 도입, 발코니 면적 극대화 및 발코니 확장의 일반화 등 선행 연구의 발견과 대체로 일치하였다. 이러한 결과를 통하여, 이 연구에서 개발한 단위평면 분석 방법론을 통한 한국 아파트의 진화과정 분석이 가능함을 확인하였다. 이 연구에서 개발한 단위평면 분석 방법론은 개별 사례에 대한 연구자의 수작업이 필요하지 않기 때문에, 한국 아파트에 대한 전수조사가 가능하다는 점에 가장 큰 의의가 있다. 또한, 주거공간 배치와 준공 시기만 주고 학습한 딥 러닝 모형이 한국 아파트의 다양한 평면 유형을 인식할 수 있음을 보임으로써, 이 연구의 방법론이 평면 계획과 직접적인 관련이 없는 추상적인 기준에 따른 분석도 잘 수행할 수 있음을 확인하였다. 이 연구를 통하여, 한국 아파트의 주거공간 배치를 다양한 기준으로 분석하고, 아파트가 아닌 다른 건축 공간에 대하여 분석 대상을 확장하며, 단위평면의 생성적 설계 방법론을 개발하는 등, 후속 연구를 위한 이론적 토대를 구축하였다. This study aims to develop a methodology for analyzing the configuration of residential spaces in Korean apartment unit plans using deep learning. The goal for the methodology is to be capable of performing quantitative analysis on the total number of Korean apartments. Since apartments became the mainstream housing type in Korea, the explosive increase of apartments made it hard to study. As a result, the study on apartment unit plans has been fragmented by various criteria. Spatial analysis, including spatial syntax, is a quantitative analysis methodology for the structure of an architectural space. It provided the basis for an objective and reproducible analysis of Korean apartments. However, even in spatial analysis methodology, manual work required for analyzing each case is the limiting factor. Because of that, There has been no spatial analysis study on the total cases of Korean apartments since the late 1990s. To overcome this limitation, this study attempted to develop a methodology that can inductively learn the researcher's intention from data and apply it to perform analysis on the whole of Korean apartments. To develop such an analysis methodology, deep learning, one of the machine learning methodologies, was used in this study. Deep learning has the advantage of being able to learn complicated concepts using a deep neural network model. In Chapter 2, this study reviewed previous research that applied deep learning methodology to architectural spaces. The review confirmed that CNN (convolutional neural network) models could be applied successfully to architectural space by representing it as a two-dimensional matrix. Also, studies showed that the rules that the deep learning model learned from the data could be analyzed through LDA (latent space analysis) or deconvolutional neural networks. However, the deep learning model learned for other architectural spaces could not be directly applied to Korean apartments. Therefore, to apply deep learning to Korean apartments for analysis, the review suggested that it is necessary to construct a dataset for the total number of Korean apartments. In Chapter 3, the thesis developed an analysis methodology on the configuration of residential spaces in Korean apartment unit plans using deep learning. First, reflecting the review on spatial analysis and deep learning, the spatial configuration model was developed in the form of a two-dimensional image. The image represents the space as a two-dimensional grid and describes the residential characteristics of each point in the depth dimension. Next, this study selected as the deep learning methodology for analyzing the spatial configuration. The CAM (class activation mapping) methodology visualizes the relationship between the configuration types from the deep learning model and the layout of the unit plans. With the CAM method, it is possible to visualize the planning characteristics of each configuration type. The limitation of CAM is that it can only be applied to the classification set in advance by the researchers. This study extended it into the BAM (bicluster activation map) methodology that visualizes the relationship between inductively classified types and the unit plans. BAM classifies the configuration types of residential space by pairing nodes of the latent layer inside the deep learning model with unit plans that activate it using biclustering analysis. Then, this study designed a process to examine the analysis methodology developed in this study. Using a deep learning model that trained on the classification of Korean apartment unit plan dataset, the unit plans were classified based on the characteristics of the spatial configuration that differentiate the period. Finally, This study compared the result with findings from previous studies and examined the effectiveness of the analysis methodology. In Chapter 4, this study constructed the Korean apartment unit plan dataset, which is necessary for analyzing the evolution of the Korean apartment unit plans and verifying the analysis methodology through the process. The unit plans and associated data were collected from publically accessible data. The configuration of residential spaces, such as entrance, LDK (integration of living room, kitchen, and dining room), bedroom, balcony, and restroom, was extracted from the plans. Through the process, a dataset for the total available data of Korean apartments was constructed. Next, the study regularized the unit plans for consistent analysis. The main facing, the position of the entrance, and the scale of the plan were normalized. Also, the analysis area for comparison between unit plans of different sizes was set. Associated data such as completion year and regional jurisdiction were normalized to fit as input data of the deep learning model. In particular, reflecting the number of previous studies that set the time period a decade or a half, the completion year, from 1969 to 2019, was divided into ten periods of 5 years. Through this process, about 50 thousand unit plans and associated data were constructed into the dataset. Chapter 5 analyzed the changes through time in the spatial configuration of the Korean apartment unit plans applying the methodology developed in this study. The VGG-GAP model, the model selected in Chapter 3, was modified to fit the dataset built in Chapter 4. Then the model was trained on the classification of the unit plans by time periods. Through this process, the spatial configuration analysis model predicted 90.51% of 50,252 plans within 5-year error. Next, the learned representation of the spatial configuration by the periods was analyzed using the BAM methodology developed in Chapter 3. The biclustering analysis between about 50 thousand unit plans and 512 latent representation nodes derived 16 spatial configuration types. Each type co-clustered unit plans and latent nodes that are activated by those. However, the correlation of the activation was high between the types of similar periods, which means that the relationship can not be interpreted as mutually exclusive. The unit plans of each spatial configuration type were differentiated by the time period. However, there was no significant difference in most types by region and size. BAM visualization on the model for each type showed that the models of different types learned various characteristics in the unit plans of Korean apartments at different time periods. In Chapter 6, this study reconstructed the evolutionary process of Korean apartments by applying the spatial configuration type derived in Chapter 5 to the unit plans from different periods and various building types. Then, the results were compared with previous studies to verify the analysis methodology developed in this study. Ultimately, the study investigated the possibility of utilizing an inductive analysis methodology based on deep learning for research on architectural space. The subject of the analysis is the unit plans of various building types from the 1980s to the 2010s, including corridor-type and staircase-type plans from flat-type and mixed-type buildings, different plans from tower-type buildings, and one-room-type (studio) urban-type housing plans. The activation areas for each type of the period were analyzed by BAM visualization on the plans. The results from the analysis showed that the types and their counterpart partial model learned the configuration in the staircase-type unit plans from the 1990s. Also, BAM derived unique configurations of the corridor-type plans and various plans from tower-type buildings. However, it showed the limit of ignoring the overall configuration when there are clearly distinguishable differences in the plans of the configuration type. The evolutionary process of Korean apartments derived the analysis mostly consistent with the findings of previous studies, including standardization of the staircase-type planning, domination of fewer plan types in flat-type buildings, trickle-down of the configuration from large to small plans, introduction of tower-type building, maximization of balcony area, and standardization of the "balcony extension" (modification of the balcony as indoor space). The results confirmed the possibility of utilizing the analysis methodology developed in this study for the research in the evolution of Korean apartments. The unit plan analysis methodology developed in this study does not require a manual process for individual cases. The significance of this study is that the methodology enables analysis of every unit plans of Korean apartments. Also, by demonstrating that the deep learning model learned only by unit plans and completion year can learn configuration types of various Korean apartments, the methodology showed that it could analyze abstract criteria that are not directly related to the spatial configuration. This study offers new possibilities by establishes the theoretical foundation for further research, including but not limited to, analyzing the spatial configuration of Korean apartments based on various criteria, expansion of analysis methodology for architectural spaces other than apartments, and developing generative design methodology of Korean apartment unit plans.

      • 머신러닝 기반 풍력발전기 블레이드 상태 예측 모델 개발

        안진희 건양대학교 일반대학원 2026 국내박사

        RANK : 233339

        As the global trend toward carbon neutrality accelerates the scale-up and offshore installation of wind power facilities, ensuring the maintenance and safety of blades—a core component—has emerged as an imperative task. However, the actual operating environment of wind farms involves mixed background noise, resulting in a low Signal-to-Noise Ratio. Furthermore, the scarcity of defect data for training deep learning models has limited the direct application of existing diagnostic technologies to the field. To overcome these environmental constraints and enhance diagnostic reliability, this thesis proposes a hybrid defect diagnosis framework that hierarchically combines unsupervised learning-based signal separation and supervised learning-based Deep Neural Networks. The core approach of this study is materialized as a data-driven pipeline that fuses noise reduction in field data with precise pattern learning from experimental data. In the first phase of the proposed system, a two-stage signal processing process linking Non-negative Matrix Factorization and K-means clustering was applied to resolve the high-noise issue in operational data. This effectively separated background noise from valid signals based on statistical characteristics without relying on complex physical modeling, thereby significantly improving the input quality for the diagnostic model. In the second phase, a defect diagnosis model based on DNN was constructed utilizing wind tunnel experimental data, securing robust detection performance even in imbalanced data environments. In conclusion, this study establishes a practical defect detection methodology applicable to wind power sites with limited data and high environmental variables by employing a dual-track strategy that complementarily utilizes noisy field data and precise experimental data. This is expected to contribute to building an intelligent maintenance system optimized for the domestic wind power environment. 전 세계적인 탄소중립 기조에 발맞춰 풍력 발전 설비의 대형화 및 해상 설치가 가속화됨에 따라, 핵심 부품인 블레이드의 유지보수와 안전성 확보가 필수적인 과제로 부상하였다. 그러나 실제 풍력 발전 단지의 운용 환경은 고도의 배경 잡음이 혼재되어 신호 대 잡음비가 낮고, 딥러닝 모델 학습을 위한 결함 데이터가 희소하여 기존 진단 기술의 현장 적용에는 근본적인 한계가 존재하였다. 이에 본 논문에서는 이러한 환경적 제약을 극복하고 진단의 신뢰성을 제고하기 위해, 비지도 학습 기반의 신호 분리 기술과 지도 학습 기반의 심층신경망을 계층적으로 결합한 결함 진단 프레임워크를 제안한다. 본 연구의 핵심 접근 전략은 현장 데이터의 잡음 제거와 실험 데이터의 정밀 패턴 학습을 융합하는 데이터 주도적 파이프라인으로 구체화된다. 제안된 시스템의 1단계에서는 실제 운용 환경 데이터에 내재된 고잡음 문제를 해결하기 위해 비음수 행렬 분해와 K-평균 군집화를 연계한 2단계 신호 처리 프로세스를 적용하였다. 이를 통해 복잡한 물리적 모델링 없이 데이터의 통계적 특성에 기반하여 배경 잡음과 유효 신호를 효과적으로 분리하였으며, 진단 모델의 입력 품질을 개선하였다. 이어지는 2단계에서는 풍동 실험 데이터를 활용하여 심층신경망 기반의 결함 진단 모델을 구축함으로써 데이터 불균형 환경에서도 견고한 탐지 성능을 확보하였다. 결론적으로 본 연구는 잡음이 심한 현장 데이터와 정밀한 실험 데이터를 상호 보완적으로 활용하는 이원화된 전략을 제시함으로써, 데이터 확보가 어렵고 환경 변수가 많은 풍력 발전 현장에서도 실효성 있는 결함 탐지 방법론을 확립하였다. 이는 향후 국내 풍력 발전 환경에 최적화된 지능형 유지보수 체계를 구축하는 데 기여할 것으로 기대된다.

      • 심층 강화학습 기반 유무인기 복합 전투 체계에서의 순차적 임무할당 연구

        문보훈 건국대학교 대학원 2025 국내석사

        RANK : 233327

        본 학위논문은 유·무인기 복합체계(MUM-T) 운용자를 위한 의사결정지원시스템에서 효율적인 임무할당 결과를 도출하기 위한 방법으로, 임무패턴 결정과 임무객체 할당 과정을 포함한 순차적 임무할당 프로세스에 심층 강화학습 알고리즘을 적용한 학습 기반의 순차적 자율 임무할당 방법론을 제시한다. MUM-T 운용자를 위한 의사결정지원시스템은 초기 임무 계획 및 재계획이 필요한 상황에서 신속하고 적절한 의사결정 결과를 도출해야 한다. 효과적인 임무 할당을 위해 무인기의 비행 및 촬영 형태에 따른 임무 패턴 선정이 필요하며, 임무 환경의 실시간 변화에 대응할 수 있는 준최적해가 신속히 도출되어야 한다. 본 연구에서는 유·무인기 복합체계의 임무 할당 문제를 순차적인 구조로 분할하여, 각 단계에서 학습 기반 방법론으로 해결하고자 한다. 초기 순서인 임무패턴결정 과정에서는 비행 및 촬영 형태에 따른 임무 패턴을 결정하고, 다음 단계인 임무객체할당에서는 선택된 임무 패턴들을 각 플랫폼에 배정하고, 스케줄링하여 임무가 원활히 수행되도록 조정한다. 이를 위해 비행 및 촬영 형태별 임무 패턴 라이브러리를 구축하였고, 임무패턴 선택을 위한 기준으로 비행 및 촬영 효과도를 산출하였다. 임무객체할당 문제는 신경망 기반 조합 최적화 문제로 설계하여 각 유·무인기의 임무와 순서를 결정하고, 전체 작전의 효과도를 포함한 임무 할당 결과를 운용자에게 제공한다. 효율적인 임무할당 결과 도출을 위해 각 임무할당 과정을 순차적 의사결정 문제로 모델링하였으며, 폴리시 그래디언트 기반 심층 강화학습을 통해 훈련된 정책 신경망에 의해 처리하였다. 유·무인 협업 전투 시나리오에서 제안된 프로세스를 설계하고, 수치 시뮬레이션을 통해 다른 접근법들과 비교하여 학습 기반 접근법의 의사결정지원시스템 적용 효용성을 확인하였다. This thesis describes the learning-based sequential autonomous mission allocation framework using a deep reinforcement learning algorithm that can assist decision-making systems for MUM-T operators, mainly focusing on the efficient allocation of missions in a sequential process, including mission pattern selection and mission object assignment. The MUM-T operators' decision-support system must make rapid and proper decisions in situations where there is initial mission planning and replanning. In effective mission allocation, the selection of mission patterns based on flight and imaging modes is very important, with generating near-optimal solution ability to adapt quickly under real-time changes in mission environments. In this study, the mission allocation problem in a MUM-T system is divided into a sequential structure, and each stage is addressed using a learning-based approach. In the initial stage, which handles mission pattern selection, mission patterns are determined according to flight and imaging types. In the subsequent stage, which is responsible for mission object assignment, the selected patterns are allocated to each platform and scheduled to ensure smooth mission execution. To support this process, a mission pattern library was constructed based on flight and imaging types, and flight and imaging effectiveness were calculated as criteria for mission pattern selection. The mission object assignment problem was formulated as a neural network-based combinatorial optimization problem to determine each MUM-T platform's missions and their sequence, providing mission allocation results, including the overall operational effectiveness, to the operator. For each arriving efficient mission allocation result, each mission allocation process has been modeled as a problem of sequential decision making: it is managed by a policy network, trained by using a policy-gradient-based deep reinforcement learning algorithm. It is applied to the proposed process of MUM-T cooperative combat and is numerically simulated with utility, compared to other approaches, for proving the effectiveness of the approach in use.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼