RISS 검색 - 국내학술지논문

1
범용 블록체인 동작 검증을 위한 바이너리 호환 하이브리드 에뮬레이션

김우승(Wooseung Kim),김현진(Hyunjin Kim),전효진(Hyeojin Jhon),김홍준(Hongjoon Kim),김용민(Yongmin Kim) 한국정보과학회 2021 한국정보과학회 학술발표논문집 Vol.2021 No.6
- 원문보기
2
블록체인을 위한 바이너리 호환 에뮬레이션 기술 동향 및 분류

김우승(Wooseung Kim),김홍준(Hongjoon Kim),전효진(Hyeojin Jhon),김현진(Hyunjin Kim),김용곤(Yonggon Kim) 한국정보과학회 2020 한국정보과학회 학술발표논문집 Vol.2020 No.12
- 원문보기
3
애플리케이션 바이너리에 기반한 블록체인 시뮬레이션의 확장성 개선 방안

전효진(Hyeojin Jhon),김현진(Hyunjin Kim),김우승(Wooseung Kim),김홍준(Hongjoon Kim),김용곤(Yonggon Kim) 한국정보과학회 2020 한국정보과학회 학술발표논문집 Vol.2020 No.12
- 원문보기
4
텍스트 블록 주변의 문맥을 이용한 HTML 문서 본문 추출

송원문(Wonmoon Song),김우승(Wooseung Kim),김명원(Myungwon Kim) 한국정보과학회 2013 정보과학회논문지 : 소프트웨어 및 응용 Vol.40 No.3
- 원문보기
다양한 웹 저작 도구 및 새로운 웹 표준의 출현과 웹에 대한 접근성이 보다 편리해지면서 매우 다양한 종류의 웹 콘텐츠들이 아주 빠르게 생산되고 있다. 이와 같은 환경에서, 사용자의 요구에 적합한 웹 서비스를 제공하기 위해서는 웹 문서로부터 광고와 같은 비 본문 영역 등을 제거하고 본문에 적합한 정보만을 정확하고 빠르게 추출하는 것이 중요하다. 이에 본 논문에서는 HTML 형태의 웹 문서로부터 본문 영역을 정확하게 추출하는 방법을 제안한다. 제안한 방법에서는 문서내의 각각의 텍스트 블록들이 본문 영역에 해당하는지 분류하기 위하여 의사결정트리를 생성하고 이용하였으며 분류를 위한 특징으로는 텍스트 블록의 단어 및 링크 밀도와 HTML 태그 분포 및 텍스트 블록간 거리 등을 포함하는 문맥 정보를 사용하였다. 공개된 데이터 및 본 연구팀에서 직접 수집한 데이터를 이용한 실험을 통해 기존의 방법에 비해 F-Measure가 약 19% 향상되었음을 보였다. Due to various Web authoring tools, the new web standards, and improved web accessibility, a wide variety of Web contents are being produced very quickly. In such an environment, in order to provide appropriate Web services to users" needs it is important to quickly and accurately extract relevant information from Web documents and remove irrelevant contents such as advertisements. In this paper, we propose a method that extracts main contents accurately from HTML Web documents. In the method, a decision tree is built and used to classify each block of text whether it is a part of the main contents. For classification we use contextual features around text blocks including word density, link density, HTML tag distribution, and distance between text blocks. We experimented with our method using a published data set and a data set that we collected. The experiment results show that our method performs 19% better in F-measure compared to the existing methods.

상세검색

RISS 보유자료

상세검색

해외전자자료

연관 검색어 추천