RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      교통사고 비정형 데이터 분석과 LSTM을 이용한 예측 모델 개발

      한글로보기

      https://www.riss.kr/link?id=T15896651

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      Abstract There are many lives lost due traffic accidents, and which have not decreased despite advances in technology. In order to prevent traffic accidents, it is necessary to accurately forecast how they will change in the future. Recently, the ...

      Abstract

      There are many lives lost due traffic accidents, and which have not decreased despite advances in technology. In order to prevent traffic accidents, it is necessary to accurately forecast how they will change in the future.
      Recently, the era of big data has arrived with the 4th industrial revolution. Traffic accident data is also big data, playing a big role in establishing policy tasks for traffic safety, and it is expected that more big data will be generated and processed and analyzed to contribute to traffic accident prevention in the future. In this paper, the process of generating big data from the occurrence of traffic accidents and the traffic accident data as big data currently being analyzed are divided into unstructured data and structured data to devise information utilization plans.
      First, as unstructured data, 199,996 traffic accident-related reports collected from 2007 to 2012 by Busan Traffic Broadcasting Station were obtained, and the main key-words related to traffic accidents were derived and analyzed using text mining techniques.
      Second, as a structured data, the NPA conducted a total survey of 1,549,151 traffic accidents that received and processed nationwide for 6 years from 2014 to 2020. In addition, a model that forecast the frequency of traffic accidents by age and time, which is time-series data, was developed using LSTM among deep-learning algorithms.
      By converting traffic accident structured data into time series data, we predicted how traffic accidents will change in the future using the AI ​​algorithm LSTM. As a result of the prediction, the age group increases by one year each year, and the frequency of traffic accidents among drivers born between 1960 and 1963 is the highest, and a similar trend is shown for all age groups. However, it was predicted that the 19-year-old who is driving for the first time has a high frequency of traffic accidents. In the analysis by time period, it was predicted that it appeared higher in the time of work than in the time of work, and gradually decreased after 19:00.
      However, in the course of research, even in situations where movement and economic activity ceases due to the COVID-19 outbreak worldwide, the difference between the predicted value of LSTM in 2020 and the actual value is 6.0%, similar to the decrease in road traffic, but by age group and time period. As a prediction, it was proved that traffic accidents occurred with a certain pattern.
      Based on these research results, it is expected that more research resulSecond, as a structured data, the NPA conducted a total survey of 1,549,151 traffic accidents that received and processed nationwide for 6 years from 2014 to 2020. In addition, a model that forecast the frequency of traffic accidents by age and time, which is time-series data, was developed using LSTM among deep-learning algorithms.
      By converting traffic accident structured data into time series data, we predicted how traffic accidents will change in the future using the AI ​​algorithm LSTM. As a result of the prediction, the age group increases by one year each year, and the frequency of traffic accidents among drivers born between 1960 and 1963 is the highest, and a similar trend is shown for all age groups. However, it was predicted that the 19-year-old who is driving for the first time has a high frequency of traffic accidents. In the analysis by time period, it was predicted that it appeared higher in the time of work than in the time of work, and gradually decreased after 19:00.
      However, in the course of research, even in situations where movement and economic activity ceases due to the COVID-19 outbreak worldwide, the difference between the predicted value of LSTM in 2020 and the actual value is 6.0%, similar to the decrease in road traffic, but by age group and time period. As a prediction, it was proved that traffic accidents occurred with a certain pattern.
      Based on these research results, it is expected that more research results will be derived if the traffic accident big data of structured data and unstructured data are combined.

      더보기

      국문 초록 (Abstract)

      요 약 교통사고로 인한 많은 인명피해가 발생하고 있으나, 첨단 기술의 발전에도 불구하고 교통사고 발생은 줄어들지 않고 있다. 교통사고를 사전에 예방하기 위해서는 향후 사고가 어...

      요 약

      교통사고로 인한 많은 인명피해가 발생하고 있으나, 첨단 기술의 발전에도 불구하고 교통사고 발생은 줄어들지 않고 있다. 교통사고를 사전에 예방하기 위해서는 향후 사고가 어떻게 변화하여 갈 것인지를 정확하게 예측할 필요가 있다.
      최근에는 4차 산업혁명으로 빅데이터의 시대가 도래되었다. 교통사고 자료도 빅데이터로서 교통안전을 위한 정책과제 수립에 큰 역할을 담당하고 있으며, 앞으로도 더 많은 빅데이터가 생성되고 가공 분석되어 교통사고 예방에 기여를 할 것으로 기대된다. 본 논문에서는 교통사고 발생부터 빅데이터의 생성과정과 현재 분석되는 빅데이터로서의 교통사고 자료를 비정형데이터와 정형데이터로 구분하여 정보 활용방안을 강구하였다.
      먼저 비정형데이터로서 교통사고 자료은 TBN 부산교통방송국에서 2007년부터 2012년까지 6년간 수집된 199,996건의 교통사고 관련 제보를 확보하여, 텍스트 마이닝(Text Mining) 기법으로 분석하고 교통사고와 연관된 단어들을 추출하고 사용 빈도가 높은 단어들을 이용하여 각각의 제보단어들의 특성을 파악하고자 하였다.
      그리고 정형데이터로서 경찰청에서 2014년부터 2020년까지 7년간 전국에서 접수, 처리되어 수집되는 교통사고 자료 1,549,151건을 도로교통공단 TAAS시스템을 통해 필요한 자료를 추출하고 데이터 마이닝(Data Mining)기법으로 분석하고 전통적 회귀모형에서 다루지 못했던 교통사고와 연령대별, 시간대별 분포와의 상관관계를 분석하기 위하여 딥러닝 알고리즘 중 시계열 자료를 분석하는데 최적의 모형인 LSTM 교통사고 예측모델을 구축하였다.
      교통사고 관련 제보는 비정형데이터로서 교통사고를 유발한 가해자나 피해자의 관점이 아닌, 교통사고 발생 지점과 구간, 시간대에 있었던 타 운전자의 관점에서 생성된 교통정보를 시각화하고 해석하여, 기존의 정형 데이터에서 분석하지 못한 정보를 도출할 수 있었다. 이러한 분석으로 교통제보의 트랜드를 파악하고, 운전자가 제보하는“도로명”,“지점명”,“시간대”를 추출하였으며, 교통사고 발생으로 다른 운전자에게 가장 많은 영향을 미치는 지점과 구간의 파악이 가능하였다. 향후 실제 교통사고 데이터와 결합하여 교통제보와의 상관성 분석 등을 통해 비정형 데이터의 활용방안을 모색할 계획이다.
      교통사고 정형데이터를 시계열 데이터로 변환하여 AI 알고리즘 LSTM을 이용하여 향후 교통사고가 어떻게 변화하여 갈 것인지를 예측하였다. 예측결과 연령대는 매년 1년씩 증가하며 1960~1963년에 태어난 운전자의 교통사고 발생 빈도수가 가장 높게 나타나며, 모든 연령대에서 비슷한 추세를 나타나고 있다. 다만, 운전을 처음 하는 19세는 고정적으로 교통사고 발생 빈도수가 높은 것으로 예측되었다. 시간대별 분석에서도 출근시간대보다는 퇴근시간대에 높게 나타나고 19시 이후에는 점차 줄어드는 것으로 예측하였다.
      하지만, 연구과정에서 전 세계적으로 코로나-19사태로 사람의 이동과 경제활동이 멈추는 상황에서도 2020년 LSTM 예측값과 실제값과의 차이는 6.0%로 도로교통량 감소와 비슷하게 나타나고 있으나, 연령대별, 시간대별 예측으로 일정한 패턴을 가지고 교통사고가 발생하고 있음을 증명하였다.
      향후 이러한 교통사고 발생 추세를 감안하여 특정 연령대의 교통안전예방 활동, 초보운전자의 사고 예방을 위하여 학교 교육에서 교통안전교육 의무화 등 교통안전정책에 변화가 있어야 될 것이다. 이러한 연구 결과를 바탕으로 정형데이터와 비정형데이터의 교통사고 빅데이터를 결합한다면 더 많은 연구 성과가 도출될 것으로 기대한다.

      더보기

      목차 (Table of Contents)

      • I. 서 론 1
      • 1. 연구의 배경 및 목적 1
      • 2. 연구의 내용 및 범위 4
      • Ⅱ. 관련 이론 및 연구 고찰 6
      • 1. 교통사고 원인과 요인 6
      • I. 서 론 1
      • 1. 연구의 배경 및 목적 1
      • 2. 연구의 내용 및 범위 4
      • Ⅱ. 관련 이론 및 연구 고찰 6
      • 1. 교통사고 원인과 요인 6
      • 2. 교통사고 관련 자료 수집 10
      • 3. 교통사고 관련 자료 분석 24
      • 4. 교통사고 관련 이론 고찰 36
      • 5. 기존 연구 문헌 고찰 58
      • Ⅲ. 교통사고 비정형 데이터 분석 67
      • 1. 비정형 데이터 전처리 67
      • 2. 텍스트 마이닝 수행절차 69
      • 3. 교통사고 비정형 데이터 분석 71
      • 4. 소결론 77
      • Ⅳ. 교통사고 정형 데이터 예측 모델 개발 79
      • 1. 정형 데이터 전처리 79
      • 2. 데이터 마이닝 수행절차 83
      • 3. LSTM 관련 이론 고찰 85
      • 4. 모델링 및 학습 91
      • 5. 교통사고 정형데이터 예측 모델 97
      • 6. 예측 모델의 검증 101
      • 7. 소결론 104
      • Ⅴ. 결론 106
      • 참고문헌 109
      • 영문초록 116
      • 부록 118
      더보기

      참고문헌 (Reference) 논문관계도

      1 이일현, "EasyFlow 회귀분석", 한나래, 2014

      2 윤일수, 한음, "“빅데이터와 교통”", 교통기술과 정책, Vol. 11, No. 1, pp. 64-67, 2014

      3 김대식, "김대식의 인간 vs 기계", 동아시아, 2016

      4 경찰청, "“교통사고 조사 규칙”", 경찰청, http://www.police.go.kr, 2020

      5 이성훈, "“빅데이터 활용 현황”", 한국정보기술학회지, 2012

      6 김동완, "빅데이터의 분야별 활용사례", 동아대학교 경영연구소 경영논총, pp. 39-52, 2013

      7 교통연구원, "“2014년 교통사고 비용 추정”", KOTI, pp. 46-49, 2016

      8 장원재, "교통부문 Deep Learning 활용 방안", 한국교통연구원. 이슈페이퍼 2019-10, 2019

      9 이창기, "“딥러닝과 자연어 처리 응용”", 소프트웨어정책연구소, 2017

      10 국경완, "인공지능 기술 및 산업 분야별 적용 사례", 정보통신기획평가원, pp. 15-27, 2019

      1 이일현, "EasyFlow 회귀분석", 한나래, 2014

      2 윤일수, 한음, "“빅데이터와 교통”", 교통기술과 정책, Vol. 11, No. 1, pp. 64-67, 2014

      3 김대식, "김대식의 인간 vs 기계", 동아시아, 2016

      4 경찰청, "“교통사고 조사 규칙”", 경찰청, http://www.police.go.kr, 2020

      5 이성훈, "“빅데이터 활용 현황”", 한국정보기술학회지, 2012

      6 김동완, "빅데이터의 분야별 활용사례", 동아대학교 경영연구소 경영논총, pp. 39-52, 2013

      7 교통연구원, "“2014년 교통사고 비용 추정”", KOTI, pp. 46-49, 2016

      8 장원재, "교통부문 Deep Learning 활용 방안", 한국교통연구원. 이슈페이퍼 2019-10, 2019

      9 이창기, "“딥러닝과 자연어 처리 응용”", 소프트웨어정책연구소, 2017

      10 국경완, "인공지능 기술 및 산업 분야별 적용 사례", 정보통신기획평가원, pp. 15-27, 2019

      11 나희, 박병호, "“로터리 사고발생 위치별 사고모형 개발”", 도로학회논문집, Vol. 14, No.4, pp. 83-91, 2012

      12 이동우, 이성훈, "“빅데이터의 국내외 활용 고찰 및 시사점”", 한국디저털정책학회, pp 229-233, 2013

      13 배중철, 최병호, 이승택, "“교통사고 조사 및 분석체계 구축방안 연구”", 교통안전공 단, 2005

      14 류종득, "“딥 러닝을 이용한 고속도로 예측모델 개발”", 아주대학교 박사학위 논문, 2018

      15 경찰청, "“경찰 접수 교통사고 현황 통계 정보 보고서”", 경찰청, 2019

      16 교통사고공학연구소, "“안전칼럼, 교통사고를 일으키는 3가지 요인”", 교통사고공학연 구소, http://taei.re.kr, 2013

      17 이승훈, "“최근 인공지능 개발 트랜드와 미래의 진화방향”", LG경제연구원. pp. 30-31, 2017

      18 안준모, 한호선 , 최정원, 이미영 , "텍스트마이닝 방법론을 활용한 기업 부도 예측 연구", 생산성 논집, Vol. 29, No. 1, 2015

      19 이신원, "“K-means 클리스터링에서 초기 중심 선정 방법 비교”", 인터넷정보학회, Vol.13, No. 6, pp. 1-8, 2012

      20 박철균, 배상진, "텍스트마이닝 기법의 기술정보분석 적용 가능성 연구", 한국기술 혁신학회 학술대회, pp. 75-88, 2003

      21 안성원, 조성배, "뉴스 텍스트 마이닝과 시계열 분석을 이용한 주가예 측", 한국정 보과학회, pp. 364-369, 2010

      22 고기완, "“인간의 뇌를 닮아가는 반도체...인공지능 시대 주도”", 한국경제TV, 2020

      23 강경우, "“텍스트 마이닝을 이용한 화물자동차 사고개요 분석”", 대한교통학회 학술대 회지, Vol. 73, pp. 338-343, 2015

      24 성낙문, "“고속도로 인터체인지에서의 교통사고 예측모델 개발”", 대한토목학회학술논 문지, Vol. 22, No. 4, pp. 617-625, 2002

      25 여화수, "“교통 빅데이터를 활용한 교통상태 예측시스템의 미래”", 월간교통, 2017

      26 문지원, "“K-means 군집분석을 이용한 U-도시 유형분류에 관한 연구”", 성균관대학교 석사학위 논문, 2007

      27 한정수, "“딥러닝 기법을 활용한 교통사고위험예측 모델개발 연구”", 고려대학교 정책 대학원 석사학위 논문, 2019

      28 국토교통부, "“사람이 중심이 되는 2020년 교통사고 사망자 줄이기 대책.”", 국토교통 부, https://blog.naver.com/mltmkr/221898003614, 2020

      29 이시환, "“교통사고 원인분석 체계의 개선방안 및 활용에 관한 연구”", 서울시립대학교 석사학위논문, 2006

      30 정재풍, "“교통사고건수에 대한 포아송 회귀와 음이항 회귀모형 적합”", 고려대학교 대 학원 석사학위 논문, 2014

      31 정완, "딥러닝을 활용한 자율주행 자동차의 사회적 딜레마 해결방안”", 단국대학교 대 학원 석사학위 논문, 2017

      32 김민승, 최지혜, 최정환, 이찬호, 이정희, 성태응, "“Hybrid CNN-LSTM 알고리즘을 활용한 도시철도 내 피플 카운팅 연구”", 지능정보연구, pp131-145, 2020

      33 최윤환, "“고속도로 연결로 구간의 사고예측계수 개발 및 활용방안 연구”", 아주대학교 박사학위 논문, 2012

      34 윤윤진, 조정우, "“교통정보 및 지리정보체계를 반영한 구급차량 출동 범위 분석”", 대한교통학회 72회 학술발표회, 2015

      35 선현석, 임창원, 이영섭, "“텍스트 마이닝 알고리즘을 이용한 기상청 기상연감 자료 분석”", 한국통계학회, Vol. 30, No. 4, pp. 603-613, 2017

      36 한국교통연구원, "“교통사고 피해자 실태조사 결과 및 피해자 지원제도 개 선 방안”", 국회교통안전포럼, 2018

      37 박태영, 지영미, 이영섭, "“기상 특보 발표가 기상청 콜센터 상담 건수에 미치는 영 향분석”", 한국기상학회, Vol. 27, No. 4, 2017

      38 이권순, "“철도물류 활성화를 위한 DMT(Dual Mode Trailer) 수송시스템 개발기획”", 동아대학교 산학혁렵단, 2007

      39 노유진, 배상훈, "“텍스트 마이닝을 적용한 한국교통방송제보 비정형 데이터 분석”", 한국 ITS학회 논문지, pp87-97, http://dx.doi.org/10.12815/kits.2017.16.1.00, 2018

      40 김선배, 송민구, "“빅데이터 분석방법을 이용한 예측모형의 신뢰도 향상에 관한 연 구”", 디지털 융복합연구, Vol. 11, No. 6, pp. 103-112, 2013

      41 장권영, "“교통사고 조사서비스 품질이 고객만족도와 조직성과에 미치는 영향”", 치안 정책연구, Vol. 29, No. 2, pp. 249-286, 2015

      42 김용석, "“신호위반 단속카메라의 영향권을 고려한 사고감소효과 평가방법 연구”", 서 울시립대학교 박사학위 논문, pp. 33-36, 2014

      43 강정식, 이지훈, 신창훈, 박수남, "“하이브리드 ARIMA-신경망 모델을 통한 컨테이 너 물동량 예측에 관한 연구", 한국항해항만학회지, pp81-88, 2008

      44 박승수, 최윤정, "“웹컨텐츠 분류를 위한 텍스트마이닝과 데이터마이닝의 통합 방법 연구”", 한국인지과학회, 13(3), pp.33-35, 2002

      45 윤병조, 차윤철, "“차량용 영상기록장치를 활용한 교통사고의 운전자 행태분석에 관 한 연구”", 대한토목학회논문집 vol 35, pp. 1321-1378, 2015

      46 노윤환, 조영석, 이경준, 윤상경, "“부산지역 교통관련 기사를 이용한 비정형 데이터 의 정형화와 시각적 해석”", 한국데이터정보학회지, pp. 1431-1438, 2014

      47 Li, Ye., "“Overlapping K-means 알고리즘을 이용한 키워드 기반 저널 중복 클러스 터링 연구”", 연세대학교 석사학위 논문, 2016

      48 김정현, 이수범, 김태희, "“도로 및 교통특성에 따른 계획 단계의 도시부 도로 교통 사고 예측모형 개발”", 대한교통학회지, Vol. 21, No. 4, pp. 133-144, 2003

      49 박규영, "“도로안전시설물의 교통사고 감소효과 평가 및 사고감소계수 추정모형 구 축”", 서울시립대학교, pp. 5, 2006

      50 김상엽, 황경성, 허태영, 최재성, 조원범, 김용석, "“차량속도를 이용한 도로구간분할 에 따른 고속도로 사고빈도 모형 개발 연구”", 대한교통학회지, Vol. 28, No. 2, pp. 151-159, 2010

      51 한국교통연구원, "“빅데이터기반 도로교통사고 원인분석 및 대책수립을 위한 연구 로 드맵 개발”,", 한국교통연구원. 이슈페이퍼 2017-10, 2017

      52 김정민, 류광열, "“교통사고 데이터의 마이닝을 위한 연관규칙 학습기법과 서브그룹 발견기법의 비교”", 지능정보연구 21(4), 2015

      53 김근형, 오성열, "온라인 고객리뷰 분석을 통한 시장세분화에 텍스트마 이닝 기술을 적용하기 위한 방법론", 한국콘텐츠학회논문지,Vol. 9, No.8, pp.272-284, 2009

      54 세계도시동향, "“스마트폰을 활용한 도로포장 파손위치 자동인식시스템 운영 및 신포 장재 기술개발 지원”", 서울연구원, 2012

      55 김동현, 이세진, "“도시구조물 분류를 위한 3차원 구형 특징 표현과 심층 신뢰 신경 망 기반의 환경 형상 학습”", 로봇학회논문지, Vol. 11, No. 3, pp. 115-126, 2015

      56 노정현, 이근희, "“확률모수를 이용한 교통사고 예측모형 개발-수도권 및 부산광역 시 4지 교차로를 대상으로”", 한국 ITS학회 논문지, Vol. 14, No. 5, pp. 101-111, 2015

      57 이원휘, "“K-means 알고리즘을 이용한 대용량 문서 클러스터링에서 개선된 초기 중 심 선정 방법의 제안”", 전북대학교 박사학위 논문, 2010

      58 권순재, 탁은식, 장현희, 김성현, "“K-means Clustering 알고리즘과 헤도닉 모형을 활용한 서울시 연립 다세대 군집분류 방법에 관한 연구”", 한국지능정보시스템학회지, Vol. 23, No. 3, pp. 95-118, 2017

      59 한국과학기술원, "“선제적 교통사고 예방을 위한 교통안전관리용 빅데이터 활용 교통 사고 위험요인 분석 기술개발 최종보고서”", 국토교통부, 2016

      60 오주택, 황정원, 한음, 최진형, 윤일수, "“비선형 회귀분석, 인공 신경망, 구조방정식 을 이용한 지방부 4지 신호교차로 교통사고 예측모형 성능 비교 연구", 대한교통학회지, Vol. 32, No. 3, pp. 266-279, 2014

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼