RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 음성지원유무
        • 학위유형
        • 주제분류
          펼치기
        • 수여기관
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 지도교수
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 식물플랑크톤 군집의 화학분류적 분석법 개선 및 한국 주변해 생태계 연구의 적용

        현명진 과학기술연합대학원대학교 한국해양과학기술원(KIOST) 2024 국내박사

        RANK : 249647

        This dissertation explores the community structure and function of phytoplankton, which play a critical role in ecological dynamics and biogeochemical cycles. Among various methodologies to assess phytoplankton community structure, chemotaxonomic analysis stands out for its ability to allocate chlorophyll-a concentrations, indicative of phytoplankton biomass, into major taxonomic groups. This work critically examines methodologies for chemotaxonomic analysis, which have evolved since the 1980s but still possess inherent drawbacks. To enhance the accuracy of the CHEMTAX method, the study applied a refined approach to both time-series and spatial data, successfully reducing bias and improving reliability. The constrained pigment ratio ranges, established through a linear model correlating Next-Generation Sequencing (NGS) datasets with pigment datasets, effectively mitigated the underdetermined biasThe approach shows high agreement with the results from Bayesian Compositional Estimator (BCE), known for its robustness against underdetermined bias, confirming the efficacy of the proposed method. Additionally, the linear model aids in addressing the identifiability problem in CHEMTAX, revealing how its inclusion of groups with undetectably low composition distorts results. This refined CHEMTAX analysis have been applied to time-series dataset acquired in S-ORS (Socheongcho Ocean Research Station). It elucidates the mechanism of the spring phytoplankton bloom in the Yellow Sea using data from Socheongcho Ocean Research Station (S-ORS). The analysis indicates that phytoplankton surface bloom is primarily initiated by the onset of vertical stratification due to increased sea surface temperature. Dynamic Factor Analysis (DFA) reveals varying responses among phytoplankton groups, with Bacillariophyceae thriving in turbulent environments before the bloom, Chlorophytes dominating during the bloom in stabilized water columns, and Cryptophyceae exhibiting intermediate traits. The refined CHEMTAX analysis is also adapted in large-scale spatial data analysis. The dataset for spatial analysis is acquired based on joint research with KIOST and NASA, examines the spatial distribution of phytoplankton around Korea. The spatial distributional pattern across the environmental gradient is firstly assess through RDA (redundancy analysis), and the spatial distributional pattern with an exception of environmental effects is determined by GLMM (Generalized Linear Mixed model), a type of spatial analysis. Based on the spatial effects, clustering analysis is done to figure which datapoints have similar distributional mechanisms. As result, there were striking distinction between the East, Yellow, and South Sea are detected, which is not detected through beta- diversity between samples. This study's advancements in chemotaxonomy pave the way for future research linking phytoplankton community structures with ecological functions, including primary production, food webs, carbon cycling, and particulate organic carbon dynamics. Future directions involve integrating remote sensing data and automating HPLC peak analysis to handle large datasets more effectively. Additionally, refining existing chemotaxonomic algorithms to address limitations in the gradient descent algorithm of CHEMTAX and the uncertainty in BCE is a priority. As suggested, incorporating spatial or temporal factors into pigment ratio algorithms could further improve the efficacy and reliability of chemotaxonomic approaches in marine ecosystem studies. 식물플랑크톤은 생태계와 생지화학적 순환에 중요한 역할을 하기 때문에, 이들의 군집구조와 기능에 대한 연구는 중요한 기초연구이다. 식물플랑크톤의 군집구조를 정량하는 방법에는 여러가지가 있지만, 화학분류적 접근법은 식물플랑크톤 생체량의 지표인 엽록소 a의 농도를 주요 분류군별로 할당할 수 있다는 이점이 있다. 따라서 1980년대부터 화학분류적 방법은 발전이 되어왔지만, 각각의 알고리즘이 특정 단점을 가지고 있으며, 아직 완성형 알고리즘은 없는 실정이다. 이 중에서도 가장 널리 사용되는 CHEMTAX 알고리즘은 underdetermined 편향에 취약한 경사하강법을 이용한 알고리즘이라는 한계가 있다. 따라서 본 연구는 색소 농도 데이터와 Next-generation sequencing (NGS) 데이터간의 선형 모델링을 기반으로 underdetermined 편향을 억제하는 새로운 접근법을 검토하였다. 이 접근법의 결과로 얻은 색소 비율 (final ratio)는 underdetemined system에 상대적으로 강한(robust) Bayesian Compostional Estimator (BCE)의 결과와 높은 일치도를 보이며, 해당 편향을 효과적으로 억제한 것을 확인하였다. 또한 이 선형모델은 대부분의 화학분류 알고리즘에서 공통적으로 문제가 되는 식별가능성(identifiability) 문제를 해결하는 근거로서 활용될 수 있음을 보였다. 이와 같이 개선된 CHEMTAX 방법을 활용하여 소청초 해양과학기지(S-ORS)에서 획득한 시계열 데이터를 분석하여 황해의 춘계 식물플랑크톤 대증식 메커니즘을 규명하였다. 계절변화에 따른 표층수온의 상승에 의해 유발된 수직 성층의 강화는 식물플랑크톤의 표층 대증식을 개시하는 주요 원인으로 밝혀졌다. 하지만 시계열 분석 기법 중 하나인 Dynamic Factor Analysis(DFA)로 분석한 결과 분류군별로는 다른 메커니즘이 작용하고 있었다. 규조류 (Bacillariophyceae)는 수직혼합이 활발한 환경에 대한 선호를 보였으며, 이에 따라 성층 및 표층 대증식 전에 빠른 생체량의 증가를 보였다. 이에 반해 녹조류(Chlorophytes)는 안정된 수층을 선호하였으며, 은편모조류(Cryptophyceae)는 두 분류군의 중간 특성을 가지고 있었다. 표층의 녹조류 대증식은 인산염을 빠르게 소모하여, 인-제한 환경을 조성하였으며, 이에 따라 후기천이분류군으로의 천이가 일어났다. 개선된 CHEMTAX 방법론을 광역 공간데이터 해석에도 적용해 보았다. 데이터는 2016년 미국 국립 항공 우주국 (NASA)와 한국해양과학기술원(KIOST)의 공동연구에서 얻은 데이터를 활용하여 한국 주변해역의 식물플랑크톤 군집 변동을 광역적으로 연구하였다. 우선 RDA(redundancy analysis)를 통하여 환경요소들에 따른 식물플랑크톤의 공간 분포 패턴을 1차로 밝히고, 공간분석법인 GLMM (Generalized Linear Mixed Model)을 통하여 환경적 영향이 제거된 공간 분포 패턴을 밝혔다. 이러한 공간분포 패턴은 식물플랑크톤의 분포 메커니즘을 반영하기 때문에, 군집분석을 통하여, 유사한 공간패턴을 나타내는 정점을 확인하였다. 그 결과 동해, 남해, 황해에서 뚜렷한 식물플랑크톤 분포 메커니즘의 차이를 확인하였다. 이러한 연구는 기존에 일반적으로 수행되던 베타 다양성 분석에서는 뚜렷하게 나타나지 않는 패턴을 확인한 점으로 의미가 있다. 이러한 기술모델 (desriptive model) 기반 생태 해석은 우선 CHEMTAX의 정확도가 개선되었기 때문에 가능한 분석으로서, 본 연구는 방법론의 개선과 현장 데이터로의 적용을 테스트 해보았고, 합리적인 생태적 해석을 얻을 수 있었다는 점에서 큰 의미가 있다. 이러한 연구들은 추후 먹이망, 탄소순환, 일차생산 등 생태학적 기능과 연결하는 연구로 연결될 수 있으며, 식물플랑크톤의 색소 기반 연구인 만큼, 원격탐지를 통한 데규모 연구로 이어질 수 있는 장점이 있다. 또한 추가적인 알고리즘의 개선을 위한 연구도 병행하여 진행하고 있다.

      • Optimal Network-Aware Cloud Scheduling Over High Performance Network

        이상권 과학기술연합대학원대학교 한국과학기술정보연구원(KISTI) 2024 국내박사

        RANK : 249631

        대규모의 과학 장비가 등장하면서 과학 데이터의 크기는 이전에 비해 거대 해졌다. 과학 연구의 협업을 위해 이러한 데이터를 상용 네트워크 망을 통해 전송하게 되면 낮은 대역폭과 잦은 패킷로스로 인해 성능이 저하되는 문제가 있다. 이러한 점을 해결하기 위해 과학데이터 전송의 고속도로 역할을 하는 전용망을 만들어 사용하고 있다. 전용망은 상용 네트워크와 망분리를 하고 고성능의 네트워크 카드가 장착된 데이터 전송 전용 노드를 사용한다. 최근에는 데이터 전송 전용 노드의 컴퓨팅 자원을 계산 작업에도 활용하고자 컨테이너 오케스트레이션을 통해 클라우드로 구성하였다. 컨테이너 오케스트레이션을 통해 큰 규모의 공유 컴퓨팅 자원을 활용할 수 있고 자원의 확장이 용이하다는 장점이 있다. 다만 네트워크 성능으로 인한 문제점이 생겨날 수 있다. 예를 들어, 분산 딥러닝에서 학습 데이터 셋의 크기가 증가되거나 잦은 연산과 전송을 요구하는 복잡한 모델을 사용하게 되면 네트워크 성능이 학습 시간에 필요한 시간을 증가시킬 수 있다. 또한 IoT 기술 및 과학 장비의 발전으로 이전에 비해 데이터의 크기가 증가되었는데 이러한 데이터를 서로 다른 데이터 센터간 전송 시 단일 노드로 전송하는 것이 아닌 다수의 노드를 클러스터로 구성해 보다 빠르게 전송하는 방법을 사용한다. 이 방법은 노드들 간의 네트워크 성능이 전송 시간에 영향을 주기 때문에 네트워크는 중요한 요소가 된다. 본 논문에서는 앞에서 언급한 컨테이너 오케스트레이션으로 구성된 클러스터의 네트워크에 대한 연구를 하였다. 사용자가 작업을 생성하면 컨테이너 오케스트레이션은 스케줄러를 통해 이미지 지역성, 사용가능한 CPU 그리고 메모리의 비율을 점수화 하여 적합한 노드들을 선발하여 작업이 실행되도록 한다. 현재의 스케줄러는 네트워크 성능을 고려하지 않기 때문에 본 논문에서는 네트워크 모니터링 도구를 통해 수집된 네트워크 성능 데이터를 바탕으로 점수화 하여 노드를 선발하는 스케줄러를 적용하여 성능을 실험하였다. 클러스터간 데이터 전송과 분산 딥러닝 모델에 제안한 스케줄러 적용하여 노드간 네트워크 성능으로 인한 문제를 해결하였다. 주요단어(Key words): 분산 딥러닝, 데이터 전송, 클라우드, 컨테이너 오케스트레이션 The size of scientific data has become larger than before with the advent of large-scale scientific equipment. When such data is transmitted through a commercial network for collaboration in scientific research, performance is degraded due to low bandwidth and frequent packet loss. To solve this problem, a dedicated network is being created and used to serve as a highway for scientific data transmission. The dedicated data transmission nodes equipped with high- performance network interface card. Recently, it was configured as a cloud through container orchestration to utilize the computing resources of nodes dedicated to data transmission for calculation tasks. Container orchestration has the advantage of being able to utilize large-scale shared computing resources and making it easy to expand resources. However, problems may arise due to the network performance. For example, in distributed deep learning, when the size of a training data set increases or a complex model requiring frequent computation and transmission is used, the time required for training may increase depending on network performance. In addition, with the development of IoT technology and scientific equipment, the size of data has increased compared to before. When transmitting such data between different data centers, instead of transmitting it to a single node, multiple nodes are clustered to make it faster. In this method, the network becomes an important factor because network performance between nodes affects transmission time. In this thesis, we studied the network of clusters composed of the orchestration mentioned above. When a user creates a task, container orchestration scores image locality, available CPU, and memory ratio through the scheduler and selects appropriate nodes to execute the task. Since the current scheduler does not consider network performance, this thesis tested the performance by applying a scheduler that selects nodes by scoring them based on network performance data collected through a network monitoring tool. By applying the proposed scheduler to cluster- to-cluster data transmission and distributed deep learning model, problems caused by network performance between nodes were solved. Key words: Distributed deep learning, Data transmission, Cloud, Container orchestration

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼