RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        국어교육과 디지털 리터러시 ; 문서 자동 요약의 현황과 과제

        강인수 ( In Su Kang ) 국어교육학회 2010 國語敎育學硏究 Vol.39 No.-

        인간이 다루어야 할 정보가 기하급수적으로 증가하는 문제를 다루기 위해 전산언어학 및 자연어처리 커뮤니티에서는 문서 요약의 자동화 기법이 연구되고 있다. 1950년대부터 시작된 자동 문서 요약 연구는 여러 유형의 문서를 다루면서 단일/다중 문서 요약, 질의 관련 다중 문서 요약 등의 다양한 태스크에 적용하기 위한 추출 및 추상 방식 요약 기법을 시도해 왔다. 이 논문은 추출 방식을 중심으로 텍스트 자동 요약 기술의 현황을 제시하고 요약 평가 방법과 대규모 자동 요약 대회에 대한 개괄 및 향후 과제에 대해 기술한다. Information that human should read grows exponentially. To deal with this problem, computational linguistics and natural language processing communities have attempted to automate summarizing text. Since its start in 1950`s, automated text summarization has handled single-/multi-document summarization using extracting and abstracting techniques, and nowadays specialized its tasks to query-focused multi-document summarization. This paper gives the current state of automatic text summarization techniques focusing on robust, practical extraction-based methods, and describes evaluation methodologies and large-scale summarization evaluation conferences. Finally, future issues are discussed.

      • KCI우수등재

        가짜 뉴스 탐지를 위한 텍스트 요약 탐색

        변지에,이승언,카란딥 싱,차미영 한국정보과학회 2022 정보과학회논문지 Vol.49 No.11

        Fake news detection models need to gather and ingest massive information from heterogeneous sources rapidly for solid verification. This paper demonstrates the feasibility of applying text summarization, to uncover useful information or evidence for fake news detection. Two popular deep learning-based summarization techniques, extractive and abstractive, were used to generate condensed textual information from lengthy news content. Experiments on popular rumor debunking datasets show that two lines of summarized text can extract critical information, while improving the classification performance and substantially reducing inference time. Text summarization can also bring explainability by providing evidence from three levels: words, sentences, and documents. 가짜 뉴스 탐지는 방대한 양의 이종 데이터를 빠르게 수집하여 확실한 검증을 요한다. 이 논문은 텍스트 요약 기술이 뉴스의 중요한 정보나 단서를 찾아내어 가짜뉴스 탐지 문제에 기여할 수 있음을 제시한다. 잘 알려진 벤치마크 데이터셋에서 검증해본 결과 주요한 두 가지 텍스트 요약 기법이 - 추출요약 및 추상요약 - 모두 가짜뉴스 탐지 문제 해결에 각기 도움을 줌을 확인할 수 있었다. 더 나아가 방대한 뉴스 데이터로부터 텍스트 요약은 문장, 단어, 문서의 단계에서 주요 정보를 압축함으로써 근거 자료로 활용되는데 있어 모델의 설명 가능성도 보여준다.

      • KCI우수등재

        개체명 사실 판별을 통한 기계 요약의 사실 불일치 해소

        신정완,노윤석,송현제,박세영 한국정보과학회 2022 정보과학회논문지 Vol.49 No.3

        Factual inconsistency in abstractive summarization is a problem that a generated summary can be factually inconsistent with a source text. Previous studies adopted a span selection that replaced entities in the generated summary with entities in the source text because most inconsistencies are related to incorrect entities. These studies assumed that all entities in the generated summary were inconsistent and tried to replace all entities with other entities. However, this was problematic because some consistent entities could be replaced and masked, so information on consistent entities was lost. This paper proposes a method that sequentially executes a fact discriminator and a fact corrector to solve this problem. The fact discriminator determines the inconsistent entities, and the fact corrector replaces only the inconsistent entities. Since the fact corrector corrects only the inconsistent entities, it utilizes the consistent entities. Experiments show that the proposed method boosts the factual consistency of system-generated summaries and outperforms the baselines in terms of both automatic metrics and human evaluation. 기계 요약의 사실 불일치 문제란 요약 모델이 생성한 요약문이 원문과 사실이 일치하지 않는 문제다. 사실 불일치는 개체명에서 주로 발생하므로 기존 연구들은 요약문의 잘못된 개체명을 교정하여 사실적 불일치를 해결하였다. 하지만, 명시적인 개체명 사실 불일치 판별 없이 모든 개체명을 순차적으로 교정하거나 모두 마스킹하여 교정을 시도하였다. 모든 개체명을 교정하는 연구는 원문과 일치하는 개체명도 교정을 시도하는 문제점과 마스킹되어 사실 정보임에도 불구하고 정보를 손실시키는 문제가 발생한다. 본 논문에서는 기존 연구들의 단점을 해결하기 위해 개체명 사실 여부를 판별한 뒤 사실 불일치 개체명에 대해서만 교정을 하는 방법을 제안한다. 이를 통해 사실 불일치 개체명이 발생시키는 오류를 방지할 수 있으며, 반대로 사실 일치 개체명에 대한 정보를 최대한 활용할 수 있다. 실험을 통해 제안한 방법이 기존 연구들보다 요약문의 사실 불일치를 잘 해소함을 보였다.

      • KCI등재

        텍스트 요약 품질 향상을 위한 의미적 사전학습 방법론

        전민규(Mingyu Jeon),김남규(Namgyu Kim) 한국스마트미디어학회 2023 스마트미디어저널 Vol.12 No.5

        최근 사용자에게 의미있는 정보만을 자동으로 간추리는 텍스트 자동 요약이 꾸준히 연구되고 있으며, 특히 인공신경망 모델인 트랜스포머를 활용한 텍스트 요약 연구가 주로 수행되고 있다. 다양한 연구 중 특히 문장 단위 마스킹을 통해 모델을 학습시키는 GSG 방식이 가장 주목을 받고 있지만, 전통적인 GSG는 문장의 의미가 아닌 토큰의 중복 정도에 기반을 두어 마스킹 대상 문장을 선정한다는 한계를 갖는다. 따라서 본 연구에서는 텍스트 요약의 품질을 향상시키기 위해, 문장의 의미를 고려하여 GSG의 마스킹 대상 문장을 선정하는 SbGSG(Semantic-based GSG) 방법론을 제안한다. 뉴스기사 370,000건과 요약문 및 레포트 21,600건을 사용하여 실험을 수행한 결과, ROUGE와 BERT Score 측면에서 제안 방법론인 SbGSG가 전통적인 GSG에 비해 우수한 성능을 보임을 확인하였다. Recently, automatic text summarization, which automatically summarizes only meaningful information for users, is being studied steadily. Especially, research on text summarization using Transformer, an artificial neural network model, has been mainly conducted. Among various studies, the GSG method, which trains a model through sentence-by-sentence masking, has received the most attention. However, the traditional GSG has limitations in selecting a sentence to be masked based on the degree of overlap of tokens, not the meaning of a sentence. Therefore, in this study, in order to improve the quality of text summarization, we propose SbGSG (Semantic-based GSG) methodology that selects sentences to be masked by GSG considering the meaning of sentences. As a result of conducting an experiment using 370,000 news articles and 21,600 summaries and reports, it was confirmed that the proposed methodology, SbGSG, showed superior performance compared to the traditional GSG in terms of ROUGE and BERT Score.

      • KCI우수등재

        한국어 국회 회의록 생성 요약 말뭉치 구축 및 모델 개발

        함영균,강예지,박서윤,정용빈,서현빈,이이슬,서혜진,서샛별,김한샘 한국정보과학회 2024 정보과학회논문지 Vol.51 No.3

        The mainstream of summary research has been targeting documents, but recently, interest in meeting summary research has significantly increased. As part of the National Institute of Korean Language’s big data construction project, a study on the summary of the National Assembly minutes, which have not yet been studied in Korea, was conducted and a summarization dataset for the National Assembly minutes was constructed. Qualitative intrinsic human evaluation was conducted to verify the quality of the constructed dataset. In addition, by conducting quantitative and qualitative evaluations of datasets built through the generative summarization model, the evaluation of the National Assembly Minutes Summarization dataset and the research direction of future generative and minutes summaries were sought.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼