RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      다차원 텍스트 큐브를 이용한 호텔 리뷰 데이터의 다차원 키워드 검색 및 분석 = Multi-Dimensional Keyword Search and Analysis of Hotel Review Data Using Multi-Dimensional Text Cubes

      한글로보기

      https://www.riss.kr/link?id=A104238661

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      웹의 발달로 텍스트 등으로 이루어진 비정형 데이터의 활용에 대한 관심이 높아지고 있다. 웹 상에서 사용자들이 작성한 대부분의 비정형 데이터는 사용자의 주관이 담겨져 있어 이를 적절히 분석할 경우 사용자의 취향이나 주관적인 관점 등의 아주 유용한 정보를 얻을 수 있다. 이 논문에서는 이러한 비정형 텍스트 문서를 다양한 차원으로 분석하기 하는데 OLAP(온라인 분석 처리)의 다차원 데이터 큐브 기술을 활용한다. 다차원 데이터 큐브는 간단한 문자나 숫자 형태의 정형적인 데이터에 대해 다차원 분석하는데 널리 사용되었지만, 텍스트 문장으로 이루어진 비정형 데이터에 대해서는 활용되지 않았다. 이러한 텍스트 데이터베이스에 포함된 정보를 다차원으로 분석하기 위한 방법으로 텍스트 큐브 모델이 최근에 제안되었는데, 이 텍스트 큐브는 정보 검색에서 널리 사용하는 용어 빈도수(Term Frequency)와 역 인덱스(Inverted Index)를 측정값으로 이용하여 텍스트 데이터베이스에 대한 다차원 분석을 지원한다. 이 논문에서는 이러한 다차원 텍스트 큐브를 활용하여 실제 서비스되고 있는 호텔 정보 공유 사이트의 리뷰 데이터 분석에 활용하였다. 이를 위해 호텔 리뷰 데이터에 대한 다차원 텍스트 큐브를 생성하였으며, 이를 이용하여 다차원 키워드 검색 기능을 제공하여 사용자 중심의 의미있는 정보 검색이 가능한 시스템을 설계 및 구현하였다. 또한, 본 논문에서 제안하는 시스템에 대해 다양한 실험을 수행하였으며 이를 통해 제안된 시스템의 실효성을 검증하였다.
      번역하기

      웹의 발달로 텍스트 등으로 이루어진 비정형 데이터의 활용에 대한 관심이 높아지고 있다. 웹 상에서 사용자들이 작성한 대부분의 비정형 데이터는 사용자의 주관이 담겨져 있어 이를 적절...

      웹의 발달로 텍스트 등으로 이루어진 비정형 데이터의 활용에 대한 관심이 높아지고 있다. 웹 상에서 사용자들이 작성한 대부분의 비정형 데이터는 사용자의 주관이 담겨져 있어 이를 적절히 분석할 경우 사용자의 취향이나 주관적인 관점 등의 아주 유용한 정보를 얻을 수 있다. 이 논문에서는 이러한 비정형 텍스트 문서를 다양한 차원으로 분석하기 하는데 OLAP(온라인 분석 처리)의 다차원 데이터 큐브 기술을 활용한다. 다차원 데이터 큐브는 간단한 문자나 숫자 형태의 정형적인 데이터에 대해 다차원 분석하는데 널리 사용되었지만, 텍스트 문장으로 이루어진 비정형 데이터에 대해서는 활용되지 않았다. 이러한 텍스트 데이터베이스에 포함된 정보를 다차원으로 분석하기 위한 방법으로 텍스트 큐브 모델이 최근에 제안되었는데, 이 텍스트 큐브는 정보 검색에서 널리 사용하는 용어 빈도수(Term Frequency)와 역 인덱스(Inverted Index)를 측정값으로 이용하여 텍스트 데이터베이스에 대한 다차원 분석을 지원한다. 이 논문에서는 이러한 다차원 텍스트 큐브를 활용하여 실제 서비스되고 있는 호텔 정보 공유 사이트의 리뷰 데이터 분석에 활용하였다. 이를 위해 호텔 리뷰 데이터에 대한 다차원 텍스트 큐브를 생성하였으며, 이를 이용하여 다차원 키워드 검색 기능을 제공하여 사용자 중심의 의미있는 정보 검색이 가능한 시스템을 설계 및 구현하였다. 또한, 본 논문에서 제안하는 시스템에 대해 다양한 실험을 수행하였으며 이를 통해 제안된 시스템의 실효성을 검증하였다.

      더보기

      다국어 초록 (Multilingual Abstract)

      As the advance of WWW, unstructured data including texts are taking users' interests more and more. These unstructured data created by WWW users represent users' subjective opinions thus we can get a very useful information such as users' personal tastes or perspectives from them if we analyze appropriately. In this paper, we try to provide various analysis efficiently for unstructured text documents by taking advantage of OLAP(On-Line Analytical Processing) multidimensional cube technology. OLAP cubes have been widely used for the multidimensional analysis for structured data such as simple alphabetic and numberic data but they didn't have used for unstructured data consisting of long texts. In order to provide multidimensional analysis for unstructured text data, however, Text Cube model has been recently proposed. It incorporates term frequency and inverted index as measurements to search and analyze text databases which play key roles in information retrieval. The primary goal of this paper is to apply this text cube model to a real data set maintained in an Internet site sharing hotel information and to provide multidimensional analysis for users' reviews on hotels written as texts. To achieve this goal, we first build text cubes for the hotel review data. By using the text cubes, we design and implement a system which provides multidimensional keyword search features to search and to analyze review texts on various dimensions. This system will be able to help users to get valuable guest-subjective summary information easily. Furthermore, this paper evaluated the proposed systems through various experiments and it revealed the effectiveness of the system.
      번역하기

      As the advance of WWW, unstructured data including texts are taking users' interests more and more. These unstructured data created by WWW users represent users' subjective opinions thus we can get a very useful information such as users' personal tas...

      As the advance of WWW, unstructured data including texts are taking users' interests more and more. These unstructured data created by WWW users represent users' subjective opinions thus we can get a very useful information such as users' personal tastes or perspectives from them if we analyze appropriately. In this paper, we try to provide various analysis efficiently for unstructured text documents by taking advantage of OLAP(On-Line Analytical Processing) multidimensional cube technology. OLAP cubes have been widely used for the multidimensional analysis for structured data such as simple alphabetic and numberic data but they didn't have used for unstructured data consisting of long texts. In order to provide multidimensional analysis for unstructured text data, however, Text Cube model has been recently proposed. It incorporates term frequency and inverted index as measurements to search and analyze text databases which play key roles in information retrieval. The primary goal of this paper is to apply this text cube model to a real data set maintained in an Internet site sharing hotel information and to provide multidimensional analysis for users' reviews on hotels written as texts. To achieve this goal, we first build text cubes for the hotel review data. By using the text cubes, we design and implement a system which provides multidimensional keyword search features to search and to analyze review texts on various dimensions. This system will be able to help users to get valuable guest-subjective summary information easily. Furthermore, this paper evaluated the proposed systems through various experiments and it revealed the effectiveness of the system.

      더보기

      참고문헌 (Reference)

      1 최수민, "인터넷 검색서비스 주요이슈 및 정책방향" 7-9, 2013

      2 함유근, "비즈니스 모델 구성 요소로 본 국내 IT 기업의 특징과 과제: 국내 및 해외 IT 기업 사례 간의 비교 분석 연구" 한국엔터프라이즈아키텍처학회 9 (9): 91-106, 2012

      3 이수안, "맵리듀스를 이용한 데이터 큐브의 상향식 계산을 위한 반복적 알고리즘" 한국엔터프라이즈아키텍처학회 9 (9): 455-565, 2012

      4 Yintao Yu, "iNextCube: Information Network-Enhanced Text Cube" VLDB 2009

      5 "http://en.wikipedia.org/wiki/Online_Analytical_ Processing"

      6 Yoke Yie Chen, "User -Centered Sentiment Analysis on Customer Product Review" 12 : 32-38, 2011

      7 "TripAdvisor"

      8 D. Zhang, "Topic Cube: Topic modeling for OLAP on multidimensional text databases" SDM 2009

      9 Bolin Ding, "TopCells: Keyword-Based Search of Top-k Aggregated Documents in Text Cube" ICDE 2010

      10 Lin, X., "Text cube: Computing ir measures for multidimensional text database analysis" ICDM 2008

      1 최수민, "인터넷 검색서비스 주요이슈 및 정책방향" 7-9, 2013

      2 함유근, "비즈니스 모델 구성 요소로 본 국내 IT 기업의 특징과 과제: 국내 및 해외 IT 기업 사례 간의 비교 분석 연구" 한국엔터프라이즈아키텍처학회 9 (9): 91-106, 2012

      3 이수안, "맵리듀스를 이용한 데이터 큐브의 상향식 계산을 위한 반복적 알고리즘" 한국엔터프라이즈아키텍처학회 9 (9): 455-565, 2012

      4 Yintao Yu, "iNextCube: Information Network-Enhanced Text Cube" VLDB 2009

      5 "http://en.wikipedia.org/wiki/Online_Analytical_ Processing"

      6 Yoke Yie Chen, "User -Centered Sentiment Analysis on Customer Product Review" 12 : 32-38, 2011

      7 "TripAdvisor"

      8 D. Zhang, "Topic Cube: Topic modeling for OLAP on multidimensional text databases" SDM 2009

      9 Bolin Ding, "TopCells: Keyword-Based Search of Top-k Aggregated Documents in Text Cube" ICDE 2010

      10 Lin, X., "Text cube: Computing ir measures for multidimensional text database analysis" ICDM 2008

      11 Scaffidi, C., "Red Opal: Product-Feature Scoring from Reviews" 2007

      12 Nenad Jukic, "Online Analytical Processing (OLAP) for Decision Support" 259-276, 2008

      13 Jaehak Yu, "Network Traffic Analysis on Multi-dimensional Data Cube" 11 : 100-105, 2010

      14 Adrien Guille, "Information Diffusion in Online Social Networks: A Survey" 42-42, 2013

      15 Seungkyu Choi, "Impact of ERP System Adoption on Corporate Performance in the Korean Listed Company" 10 (10): 211-222, 2013

      16 Qingliang Miao, "Domain-sensitive Opinion Leader Mining from Online Review Communities" 2013

      17 Gray, J., "Datacube: A relational aggregation operator generalizing group by, cross-tab, and sub-total" ICDE 1996

      18 Hoseok Jung, "A Multi-dimensional Analysis of Soccer Video using Data Cube" 21-24, 2011

      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2023 평가예정 재인증평가 신청대상 (재인증)
      2020-01-01 평가 등재학술지 선정 (재인증) KCI등재
      2019-12-01 평가 등재후보로 하락 (계속평가) KCI등재후보
      2016-02-29 학회명변경 한글명 : 한국ITA학회 -> 한국엔터프라이즈아키텍처학회
      영문명 : Korea Institute of information technology Architecture -> Korea Institute of Enterprise Architecture
      KCI등재
      2016-01-01 평가 등재학술지 유지 (계속평가) KCI등재
      2016-01-01 학술지명변경 한글명 : 정보기술아키텍처 연구 -> 정보화연구 KCI등재
      2012-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      2011-01-01 평가 등재후보 1차 PASS (등재후보1차) KCI등재후보
      2010-01-01 평가 등재후보 1차 FAIL (등재후보1차) KCI등재후보
      2008-01-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.68 0.68 0.61
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.56 0.5 0.571 0.26
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼