RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재
      • KCI등재

        함수형 공간 자료를 위한 추정 및 예측모형과 응용

        양호진(Hojin Yang) 한국자료분석학회 2022 Journal of the Korean Data Analysis Society Vol.24 No.5

        미세먼지는 인체에 유해한 화합물 등으로 구성되어 눈에 보이지 않는 입자로 공기 중에 떠다니며 대기 오염을 유발하거나 인체에 흡입되어 각종 질병을 유발한다. 기상청 개방포털에 의하면 미세먼지는 전국 28개 관측소에서 측정되어 이와 관련한 예보 및 경보 시스템 등에 널리 사용 된다. 본 연구에서는 측정된 미세먼지 자료를 함수형 공간 자료 모형에 의하여 추출된 자료라 가정하고 공간 통계학적 접근 방법과 함수형 자료 분석 방법을 결합하여 고정효과인 전국 평균 함수를 추정하고 예측할 수 있는 기법을 소개하고자 한다. 기존의 연구는 측정된 미세먼지를 설명하는 방법이 경시적 자료 분석법에 집중하였는데 이는 관측소의 위치가 균일하게 분포 되어 있지 않은 현실적 상황과 관측소간 거리의 차이 따라 종속성이 존재할 수 있다는 공간 자료의 특성을 고려하지 않은 접근법이다. 따라서 기존 분석법과 관련한 부분을 함수형 자료로 대체하여 적용하고 크리깅과 같은 공간 통계학적 방법을 적용하여 2021년 한 해 동안 획득된 미세먼지 자료를 분석하고자 한다. 구체적으로 전국 28개 관측소에서 얻어진 자료로부터 전국 미세먼지 평균을 이상치에 덜 민감한 가중평균을 통해 고정효과를 추정하고자 한다. 이를 위하여 경험적 베리오그램 분석을 통하여 공분산 과정을 추론하고 최적의 가중치들을 계산하고자 한다. 또한 어떠한 관측 장소에서도 미세먼지 농도를 예측할 수 있는 크리깅 방법을 소개하고 적용해보고자 한다. Particulate matter consisting of the chemical compounds harmful to human body and floating in the air as the invisible dust has been affecting on the air pollution or the various disease by inhaling into the human body. According to the Korea Meteorological Administration’s open portal, the particulate matter is measured at 28 sites and is widely used in forecasting and warning systems related to the particulate matter. In this paper, we will introduce an approach that can estimate the fixed effect and predict the future value by incorporating the spatial approach with the functional approach, assuming that the nature of the measurement for the particulate matter is a functional nature. While the existing studies have focused on the longitudinal data approaches, these approaches did not consider the characteristics of the spatial data that can have dependency between the sites and of the irregularity that the sites are not uniformly distributed across the spatial domain. To address this issue, we consider extending the existing approach to the functional data approach and applying the spatial approach such as kriging. Specifically, we consider the weighted mean being insensitive to extreme observations to account for the fixed effect from the real data obtained from 28 sites for 2021 year. To do this, we estimate the covariance process and compute the optimal weight through the empirical variogram analysis. Also, we apply a kriging method that can predict the value associated with the particulate matter at any given observational site.

      • KCI등재

        이항 회귀모형의 연결함수 오지정 문제에서 확률화된 분위수 잔차 사용에 대한 연구

        양호진(Hojin Yang),이동혁(Donghyuk Lee) 한국자료분석학회 2022 Journal of the Korean Data Analysis Society Vol.24 No.5

        반응변수가 베르누이 혹은 이항분포를 따를 때 공변량들로 관심사건이 발생할 확률을 예측하는 모형에 흔히 로지스틱 회귀모형이 사용된다. 이는 로지스틱 연결함수를 사용한 일반화 선형모형의 일종으로 실제 자료를 생성시키는 연결함수가 로지스틱 연결함수가 아닐 때 연결함수 오지정(link misspecification) 문제가 발생한다. 회귀모형을 진단하는 방법으로 잔차를 활용할 수 있지만, 반응변수가 범주형이면 잔차들의 활용도가 일반적인 선형회귀분석에 비하여 떨어지게 된다. 이를 보완하기 위하여 확률화된 분위수 잔차(randomized quantile residual)를 사용할 수 있는데 이들은 모형이 정확할 때 정규분포를 따르도록 정의되었다. 본 연구에서는 연결함수 오지정 문제를 진단하기 위한 확률화된 분위수 잔차의 활용도를 살펴보았다. 실제 자료를 생성시키는 연결함수가 로지스틱 연결함수가 아닐 때 로지스틱 회귀모형을 사용한 경우, 확률화된 분위수 잔차들의 정규성 검정을 통하여 연결함수의 오지정 유무를 진단할 수 있는지 다양한 모의실험을 통하여 검증하였다. 이를 통하여 로지스틱 연결함수가 실제 연결함수를 잘 근사하지 못하여 실제 연결함수가 적합된 로지스틱 연결함수와 차이가 클 때 확률화된 분위수 잔차들은 정규분포를 따르지 않게 됨을 확인하였다. Logistic regression model is usually used when the response is Bernoulli or binomial to predict the probability of event of interest. Specifically, the logistic model is a generalized linear model(GLM) where the assumed link function is the inverse CDF of the logistic distribution. The link misspecification often occurs when the true link is not the logistic link function. In addition, residuals in the binomial GLM model are of less practical use for diagnostics because the response is not continuous. Randomized quantile residuals are an alternative option because they are defined to follow the standard normal distribution. In this study, we investigated the usage of the randomized quantile residual to diagnose the link misspecification. When the logistic regression is fitted to the data where the true data generating process is irrelevant to the logistic link function, we consider the normality test on the randomized quantile residuals from the misspecified logistic regression model and explore whether the link misspecification can be detected or not via extensive simulation studies. We have found that the randomized quantile residual is far from the normality especially when the fitted logistic link function fails to approximate the true link function so that their gap is big.

      • KCI등재

        함수형 시공간 기법을 활용한 지표면 온도의 변화점 분석

        양호진(Hojin Yang) 한국자료분석학회 2024 Journal of the Korean Data Analysis Society Vol.26 No.1

        기상 관측소에서는 기온, 강수, 습도 등 다양한 기상 변수들을 수집하고 있다. 이들은 특정 연도와 공간에서 규칙적이며 반복적인 시간 간격의 자료로서 수집되어 진다. 그러나 이상적으로 이들 변수는 관측 시간과 관계없이 연속함수 형태로 존재하고 규칙적인 시점에만 일부 표본으로 관측되는 것이 기상 자료의 특징이다. 이는 무한차원의 공간에서 연속함수로 존재하는 랜덤함수로부터 이산 시점에서 함숫값의 형태로 자료가 관측된다고 가정하는 함수형 자료 관점과 매우 밀접한 것으로 판단되며 이들은 기존의 접근 방법과 다른 통계적 기법을 필요로 한다. 본 연구에서는 전국 48개의 관측소에서 1981년부터 2022년까지 총 42년간 측정된 평균 지표면 온도를 함수형 자료로 가정하면서 전국 관측소에 대한 공간 평균의 변화점 존재 여부를 분석하고자 한다. 구체적으로 공간공분산과 시간공분산 각각을 추정한 후 공간공분산의 구조로부터 공간 정보를 통합할 수 있는 가중치를 추출하고 시간공분산의 구조로부터 시간 정보를 통합할 수 있는 고유함수와 고유치를 추출하였다. 이들을 활용하여 특정 시점 전후 간의 평균차에 관한 부분 합으로서 통계량을 표현하는 방법과 근사 분포를 소개한다. Weather stations collect various meteorological variables such as temperature, precipitation, and humidity. These variables have been measured at the regular and repetitive time points at the specific location in the year. However, ideally, the characteristic of the climate data is that these variables exist in the form of a continuous function regardless of the time points observed. This characteristic is considered to be close to the functional data perspective, which assumes that data are observed in the form of function values at discrete points from a random function that exists as a continuous function in an infinite-dimensional space, and they require statistical techniques that are different from existing approaches. In this study, we aim to analyze land surface temperature data to determine that there is a change point in the spatial average for almost domestic observatories, assuming that they measured over a total of 42 years from 1981 to 2022 at 48 sites is functional data. Specifically, after estimating the spatial and temporal covariances, the weight for integrating spatial information was extracted from the spatial covariance structure, and the eigenfunctions and eigenvalues for integrating temporal information were extracted from the temporal covariance structure. Based on this, we introduce a method of expressing statistics as a partial sum of the mean difference before and after a specific point in time, as well as an approximate distribution.

      • KCI등재

        함수형 자료 기법을 활용한 평균 기온의 변화점 분석

        양호진(Hojin Yang),정상훈(Sanghun Jeong),박대우(Daewoo Pak) 한국자료분석학회 2021 Journal of the Korean Data Analysis Society Vol.23 No.4

        전 지구적 현상으로 평균기온이 상승해오고 있는 것으로 알려져 있다. 우리나라 평균기온 역시 상승해오고 있기 때문에 부산과 인근 지역 평균기온 변화 패턴도 크게 다르지 않을 것으로 생각된다. 그러나 어떤 시점부터 평균기온이 상승했는가 하는 질문에는 쉽게 답을 할 수 없을 것이다. 기온을 비롯한 기후요소들은 서서히 영향을 받아 변화하는 특성 때문에 변화했다는 것은 인지 할 수 있지만 어떤 시점에서 급진적인 변화가 이루어졌는가를 판단하는 연구는 많지 않은 편이다. 본 연구에서 실제적으로 부산 인근 지역의 평균기온의 변화 시점을 발견하는 데 초점을 맞추고자 한다. 구체적으로 기상청의 자동화 장치에 의하여 수집된 평균기온 자료를 기존에 널리 사용되어온 시계열 분석 방법이 아니라 함수형 자료(functional data) 관점에서 분석하고자 하며 분석 결과를 통해 시계열 분석 방법과의 차이점을 확인한다. 함수형 자료 관점에서 분석하기 위해 각 자료에 대한 기저 함수를 유도하며 함수형 자료 분석(functional data analysis)에서 자주 사용되는 functional principal components(FPCs) 추정하고 이에 기반 한 변화점 탐지 모형을 적용하여 자료를 분석한다. 그 결과 변화점 이후의 추세와 이상치로 취급할 수 있는 특정 년도를 발견하였다. It is known that the average temperature has been increased as a global phenomenon. Since the average temperature in Korea has also been increased, it is expected that the pattern of changes in the average temperature in Busan and neighboring areas will not differ significantly. However, the question of when the average temperature has increased cannot be easily answered. It can be easily recognized that climate factors including temperature, have changed due to the characteristics that are gradually changed, but there are not many studies that determine at what point the radical change occurred. In this paper, we will focus on finding the time of change of the average temperature in Busan. Specifically, we intend to analyze the average temperature data collected by the Meteorological Agency s automated device by treating them as functional objects, not as time series. And we confirm the difference of result between functional data analysis and time series analysis. In order to derive the basis function for each data, we estimate functional principal components, which are often used in functional data analysis, and analyze the data by applying a change point detection model. As a result, we found a particular year that could be treated as an outlier and a trend after the change point.

      • KCI등재

        GIS 자료를 활용한 대도시 지역 기상관측소 관측환경 평가

        양호진 ( Ho Jin Yang ),김재진 ( Jae Jin Kim ) 대한원격탐사학회 2015 大韓遠隔探査學會誌 Vol.31 No.2

        본 연구에서는 전산 유체 역학(CFD) 모델을 이용하여 건물과 지형이 대도시 내의 산지에 위치한 기상관측소의 관측환경에 미치는 영향을 조사하였다. 대상 지역의 관측소주변 흐름 특성을 조사하기 위해, GIS 자료로부터 건물과 지형 자료를 구현하였다. 구현한 자료를 CFD 모델 입력 자료로 사용하였고 관측소를 중심으로 16방위의 유입류을 가정하여 수치실험을 실시하였다. 유입된 흐름과 관측 지점에서 모의된 흐름을 비교한 결과, 전반적으로 관측소 주변에 건물과 고지형이 존재할 경우, 모의된 풍향과 풍속이 유입류와 크게 차이가 나타났다. 건물과 지형의 풍하층에서 발생하는 2차 순환범위 내에 관측소가 포함될 경우, 더욱 큰 차이가 나타났다. 전산유체역학 모델은 주변 지형환경에 따른 관측지역의 상세흐름 변화를 평가 하는데 매우 유용한 도구임을 확인하였다. In this study, effects of buildings and topography on observation environment of weather stations located on mountainous terrain in metropolitan areas are investigated using a computational fluid dynamics (CFD) model. In order to investigate the characteristics of flow pattern around the weather stations, geographic information system (GIS) data are used to construct surface boundary input data of the CFD model. In order to evaluate effects of buildings and topography on wind speed and direction at three weather stations located in Deajeon, Busan, and Gwangju., target areas around the weather stations are selected and 16 cases with different inflow directions for each target area are considered. The simulated wind speed and direction at the weather stations are compared with those of inflow. As a whole, wind speed at the weather stations decreases due to drag effects of the buildings and topography in the upwind regions. This study shows that GIS data and the CFD model are successfully applicable to evaluation of observation environment for weather stations.

      • KCI등재

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼