RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      공문서의 기계가독형(Machine Readable) 전환 방법 제언 = Suggestions on how to convert official documents to Machine Readable

      한글로보기

      https://www.riss.kr/link?id=A107269145

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      In the era of big data, analyzing not only structured data but also unstructured data is emerging as an important task. Official documents produced by government agencies are also subject to big data analysis as large text-based unstructured data. From the perspective of internal work efficiency, knowledge management, records management, etc, it is necessary to analyze big data of public documents to derive useful implications. However, since many of the public documents currently held by public institutions are not in open format, a pre-processing process of extracting text from a bitstream is required for big data analysis. In addition, since contextual metadata is not sufficiently stored in the document file, separate efforts to secure metadata are required for high-quality analysis. In conclusion, the current official documents have a low level of machine readability, so big data analysis becomes expensive.
      번역하기

      In the era of big data, analyzing not only structured data but also unstructured data is emerging as an important task. Official documents produced by government agencies are also subject to big data analysis as large text-based unstructured data. Fro...

      In the era of big data, analyzing not only structured data but also unstructured data is emerging as an important task. Official documents produced by government agencies are also subject to big data analysis as large text-based unstructured data. From the perspective of internal work efficiency, knowledge management, records management, etc, it is necessary to analyze big data of public documents to derive useful implications. However, since many of the public documents currently held by public institutions are not in open format, a pre-processing process of extracting text from a bitstream is required for big data analysis. In addition, since contextual metadata is not sufficiently stored in the document file, separate efforts to secure metadata are required for high-quality analysis. In conclusion, the current official documents have a low level of machine readability, so big data analysis becomes expensive.

      더보기

      국문 초록 (Abstract)

      빅데이터 시대에 정형데이터 뿐만 아니라 비정형데이터를 분석하는 것이 중요한 과제로 대두되고 있다. 정부기관이 생산하는 공문서도 텍스트 기반의 대형 비정형데이터로 빅데이터 분석의 대상이 된다. 기관 내부의 업무효율, 지식관리, 기록관리 등의 관점에서 공문서 빅데이터를 분석하여 유용한 시사점을 도출해 나가야 할 것이다. 그러나, 현재 공공기관이 보유중인 공문서의 상당수가 개방포맷이 아니어서 빅데이터 분석을 하려면 비트스트림에서 텍스트를 추출하는 전처리 과정이 요구된다. 또한, 문서파일 내에 맥락 메타데이터가 충분히 저장되어 있지 못하여 품질 높은 분석을 하려면 별도의 메타데이터 확보 노력이 필요하다. 결론적으로 현재의 공문서는 기계가독(machine readable) 수준이 낮아 빅데이터 분석에 비용이 많이 들게 된다.
      이 연구에서는 향후 공문서가 기계가독 수준을 높이기 위해서는 공문서의 개방포맷화, 기안문 서식의 표준태그화, 자기 기술(self-descriptive) 메타데이터 확보, 문서 텍스트 태깅 등이 선행될 필요가 있다는 점을 제안한다. 첫째, 문서가 스스로를 설명하기 위해 추가되어야 하는 메타데이터 항목들을 제시하고 이 메타데이터들이 기계가독형이 되도록 문서파일에 저장하는 방법을 제안한다. 둘째, 문서 내용 분석 시 자연어 처리에만 의존하지 않고 행정 맥락에 따라 중요한 키워드를 미리 국제표준 태그로 마킹하여 기계가독형이 되도록 하는 방안을 제안한다.
      번역하기

      빅데이터 시대에 정형데이터 뿐만 아니라 비정형데이터를 분석하는 것이 중요한 과제로 대두되고 있다. 정부기관이 생산하는 공문서도 텍스트 기반의 대형 비정형데이터로 빅데이터 분석...

      빅데이터 시대에 정형데이터 뿐만 아니라 비정형데이터를 분석하는 것이 중요한 과제로 대두되고 있다. 정부기관이 생산하는 공문서도 텍스트 기반의 대형 비정형데이터로 빅데이터 분석의 대상이 된다. 기관 내부의 업무효율, 지식관리, 기록관리 등의 관점에서 공문서 빅데이터를 분석하여 유용한 시사점을 도출해 나가야 할 것이다. 그러나, 현재 공공기관이 보유중인 공문서의 상당수가 개방포맷이 아니어서 빅데이터 분석을 하려면 비트스트림에서 텍스트를 추출하는 전처리 과정이 요구된다. 또한, 문서파일 내에 맥락 메타데이터가 충분히 저장되어 있지 못하여 품질 높은 분석을 하려면 별도의 메타데이터 확보 노력이 필요하다. 결론적으로 현재의 공문서는 기계가독(machine readable) 수준이 낮아 빅데이터 분석에 비용이 많이 들게 된다.
      이 연구에서는 향후 공문서가 기계가독 수준을 높이기 위해서는 공문서의 개방포맷화, 기안문 서식의 표준태그화, 자기 기술(self-descriptive) 메타데이터 확보, 문서 텍스트 태깅 등이 선행될 필요가 있다는 점을 제안한다. 첫째, 문서가 스스로를 설명하기 위해 추가되어야 하는 메타데이터 항목들을 제시하고 이 메타데이터들이 기계가독형이 되도록 문서파일에 저장하는 방법을 제안한다. 둘째, 문서 내용 분석 시 자연어 처리에만 의존하지 않고 행정 맥락에 따라 중요한 키워드를 미리 국제표준 태그로 마킹하여 기계가독형이 되도록 하는 방안을 제안한다.

      더보기

      참고문헌 (Reference)

      1 국가법령정보센터, "행정 효율과 협업 촉진에 관한 규정 시행령 및 시행규칙"

      2 이상훈, "한국정부 수립 이후 행정체제의 변동과 국가기록관리체제의 개편(1948년~64년)" 한국기록학회 (21) : 169-246, 2009

      3 임진희, "클라우드 환경에서 공문서 파일포맷의 선택 전략" 한국기록학회 (66) : 5-35, 2020

      4 행정자치부, "청와대비서실의 보고서작성법"

      5 안대진, "제4차 산업혁명 기술의 기록관리 적용 방안" 한국기록학회 (54) : 211-248, 2017

      6 남서진, "정부기능분류체계(BRM)의 재정비를 위한 사례연구 - ‘문화재’ 정책영역을 중심으로 -" 한국기록관리학회 17 (17): 129-163, 2017

      7 최주호, "전자기록물의 메타데이터 추출 및 비교 검증 기술 연구" 한국기록관리학회 12 (12): 7-32, 2012

      8 김인택, "인공지능을 활용한 지능형 기록관리 방안" 한국기록관리학회 17 (17): 225-250, 2017

      9 동아일보, "인공지능 시대 정부 문서, 근본을 바꿀 때다"

      10 오진관, "원문정보공개 지원을 위한 민감정보 필터링 요건에 관한 연구" 한국기록관리학회 17 (17): 51-71, 2017

      1 국가법령정보센터, "행정 효율과 협업 촉진에 관한 규정 시행령 및 시행규칙"

      2 이상훈, "한국정부 수립 이후 행정체제의 변동과 국가기록관리체제의 개편(1948년~64년)" 한국기록학회 (21) : 169-246, 2009

      3 임진희, "클라우드 환경에서 공문서 파일포맷의 선택 전략" 한국기록학회 (66) : 5-35, 2020

      4 행정자치부, "청와대비서실의 보고서작성법"

      5 안대진, "제4차 산업혁명 기술의 기록관리 적용 방안" 한국기록학회 (54) : 211-248, 2017

      6 남서진, "정부기능분류체계(BRM)의 재정비를 위한 사례연구 - ‘문화재’ 정책영역을 중심으로 -" 한국기록관리학회 17 (17): 129-163, 2017

      7 최주호, "전자기록물의 메타데이터 추출 및 비교 검증 기술 연구" 한국기록관리학회 12 (12): 7-32, 2012

      8 김인택, "인공지능을 활용한 지능형 기록관리 방안" 한국기록관리학회 17 (17): 225-250, 2017

      9 동아일보, "인공지능 시대 정부 문서, 근본을 바꿀 때다"

      10 오진관, "원문정보공개 지원을 위한 민감정보 필터링 요건에 관한 연구" 한국기록관리학회 17 (17): 51-71, 2017

      11 이화여자대학교 산학협력단, "온톨로지 기반 태그를 기반으로한 정보 검색 기법" 교육과학기술부 한국연구재단

      12 정보소통광장, "새싹따릉이 시범운영 세부 추진계획"

      13 국가기록원, "문서 파일포맷과 서식 개선 방안-서울시 사례를 중심으로"

      14 하승록, "기록정보 LOD 구축을 위한 의미 상호연결 자동화 실험 연구" 한국기록관리학회 17 (17): 177-200, 2017

      15 정미리, "공문서 컴포넌트 오픈포맷 채택이 기록관리에 미치는 영향 분석" 한국기록관리학회 16 (16): 29-55, 2016

      16 행정안전부, "공공서식 디자인 재설계 방안 연구"

      17 오세라, "공개포맷에 기반한 전자기록 보존 포맷 재설계 방향 연구" 한국기록관리학회 16 (16): 79-120, 2016

      18 CCDSD, "REFERENCE MODEL FOR AN OPEN ARCHIVAL INFORMATION SYSTEM(OAIS)"

      19 DLM Forum Foundation, "MoReq2010"

      20 정보통신기획평가원, "2021년도 제1차 정보통신·방송 기술개발사업 및 표준개발지원사업 신규지원 대상과제 공고"

      더보기

      동일학술지(권/호) 다른 논문

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2026 평가예정 재인증평가 신청대상 (재인증)
      2020-01-01 평가 등재학술지 유지 (재인증) KCI등재
      2017-01-01 평가 등재학술지 유지 (계속평가) KCI등재
      2013-01-01 평가 등재 1차 FAIL (등재유지) KCI등재
      2010-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2007-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      2006-01-01 평가 등재후보 1차 PASS (등재후보1차) KCI등재후보
      2005-08-25 학회명변경 영문명 : Korean Association Of Archival Studies -> Korean Society Of Archival Studies KCI등재후보
      2004-01-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 1.23 1.23 1.15
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      1.19 1.14 1.767 0.21
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼