http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
뉴스 사설에 대한 문장 단위의 다차원 신뢰도 주석을 통한 신뢰도 코퍼스 구축
양원석(Wonsuk Yang),김정호(Jung-Ho Kim),정진우(Jin-Woo Chung),박종철(Jong C. Park) 한국HCI학회 2019 한국HCI학회 학술대회 Vol.2019 No.2
문서의 신뢰도 및 설득력에 대한 언어학적 분석을 위한 다양한 종류의 코퍼스 구축이 있어왔지만, 아직 문서 형태의 텍스트에 대한 문장 단위의 신뢰도 주석이 진행된 적은 없다. 본 연구는 문장 단위의 신뢰도 주석을 위해 인지성(Awareness), 검증성(Verifiability), 논란성(Disputability), 수용성(Acceptance), 신뢰성(Credibility)에 해당하는 5 개의 신뢰도 관련 지표를 제안하였고, 이에 따라 3,431 개의 문장 단위 주석을 수행하였다. 본 연구를 통해 구축한 코퍼스는 인지성을 제외한 4 개의 지표간 상관관계가 언어학적 직관에 일치하는 특징을 보였으며 다차원적인 신뢰도 주석을 통해 독자의 신뢰라는 개념에 대하여 보다 심층적인 이해를 가져올 것으로 기대한다. 또한 상품 신뢰 가능성의 자동 판단, 소비 의사 확인 및 증진, 문서 신뢰도 증강을 위한 자동 첨삭 등을 목적으로 독해과정에서의 신뢰 양태 변화에 대한 예측 모델을 구축하는 과정에 높은 활용성을 보일 것으로 기대한다.
지준섭(Junseop Ji),양원석(Wonsuk Yang),박종철(Jong C. Park) 한국HCI학회 2020 한국HCI학회 학술대회 Vol.2020 No.2
문장의 수용성과 설득력에 대한 분석은 논증 품질에 대한 심층 연구를 위해 필수적이며, 컴퓨터 보조작문의 중요한 축을 이룬다. 그런데 특정 문장이 참(True)인지 판별하는 문장의 수용성 개념은 문장 사이의 함의 관계와 밀접한 연관성이 있다. 그러나 함의 관계와 수용성의 연관성에 대한 실험적 관찰은 지금까지 없었다. 본 연구에서는 문장 쌍 단위의 함의 관계 주석 및 문장 단위의 수용성 주석을 위해 뉴스기사에서 문장을 추출하였고, 이 결과 총 1399 개의 수용성 주석과 총 420 개의 함의 관계 주석을 확보하였다. 그리고 이를 통해 문장 사이의 함의 관계와 수용성이 서로 밀접한 관계가 있음을 발견하였다. 그러나 동시에 문장 사이의 함의 관계가 수용성을 결정하는 단독 결정 요인이 아니라는 점 역시 확인하였다. 본 연구는 이에 대한 심층 분석을 제공한다.
분산 표상 기법을 이용한 단어의 비표준 의미 사용 탐지
이희제(Huije Lee),박한철(Hancheol Park),양원석(Wonsuk Yang),박종철(Jong C. Park) 한국HCI학회 2018 한국HCI학회 학술대회 Vol.2018 No.1
본 연구에서는 분산 표상 기법으로 텍스트에서 사전상의 의미로 사용되지 않은 어휘(이하, 비표준의미 어휘)를 탐지하는 모델을 제안한다. 어휘의 어형은 동일하나 비표준 의미로 사용되는 경우를 판단하는 것은 자동화된 텍스트 분석 및 오역의 문제를 해결하는 데 중요한 요소이다. 본 연구에서는 분산 표상기법으로 생성된 문맥 및 대상 단어 벡터를 이용하여, 대상 단어가 주어진 문맥 내에서 적합한지를 검증하고 대상 단어가 비표준 의미로 사용되었는지 여부를 판단한다. 본 연구에서는 기존 연구에서의 문맥 벡터생성 방식이 지니는 문제점을 해결하기 위해, 통합적인 문맥 정보를 표상하는 방법과 문맥 내 단어들의 가중치를 주는 방법을 제안한다. 제안하는 방법은 트위터 데이터를 이용한 실험에서 기존에 제안된 모델보다 더 높은 성능을 보였다.