http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
홍문표 ( Mun Pyo Hong ) 한국독일언어문학회 2014 독일언어문학 Vol.0 No.65
In der vorliegenden Arbeit wird ein alternativer Ansatz zur Sentimentanalysevorgeschlagen. Unter dem Begriff ‘Sentiment’ wird in dieser Arbeit die alspositiv oder negativ geaußerte Haltung des Sprechers verstanden. Beispielsweisezeigt ein Satz wie “Das Hotel ist sehr preiswert und Ich kann es jedemempfehlen” ein positives Sentiment. Dagegen kann z.B. in einem Satz wie“Die Angestellten sind sehr unfreundlich und ich wurde nie wiederkommen” eine negative Stimmung konstatiert werden.Eines der großten Probleme der bisherigen Ansatze mit Unigramm alsein Hauptmerkmal fur die Sentimentanalyse ist dass kein Kontext berucksichtigtwerden kann. Das Sentiment eines Satzes ist nicht nur von der Polaritat der Worter im Satz, sondern auch von der syntaktischen Struktur des Satzesabhangig.Moilanen/Pulman (2007) schlugen einen Ansatz vor, der syntaktischeReprasentationen fur die Sentimentanalyse direkt heranzieht. Ihr Ansatzkann fur kurze Satze erfolgreich angewendet werden, da normalerweise einParser fur kurze Satze eine hohe Prazision bei der Analyse aufweist. Wennein Satz allerdings viele grammatische Fehler oder Tippfehler enthalt, washaufig der Fall bei SNS Texten ist, kann der Ansatz schnell scheitern.Um diese Problematik zu losen, wird in dieser Arbeit ein alternativerAnsatz vorgeschlagen, der das Bigramm als ein Hauptmerkmal fur maschinellesLernen verwendet. In diesem Ansatz kann der lokale Kontext eines Wortesmitberucksichtigt werden, was dazu fuhrt, dass lokale Negationen erfolgreichbei der Sentimentanalyse behandelt werden.Das Experiment zeigte, dass unser Ansatz im Vergleich zum herkommlichenUnigramm-basierten Ansatz die Genauigkeit der Sentimentanalyse von 76.5%auf 84.7% um 8.2% erhohen kann.
자동논조분석 시스템 개발을 위한 독일어 텍스트의 논조별 어휘출현양상 연구
홍문표 ( Mun Pyo Hong ) 한국독어독문학회 2009 獨逸文學 Vol.111 No.-
Die vorliegende Arbeit beschaftigt sich mit der Frequenz und Charakteristik der Worter, die in einem positiven/negativen Text vorkommen. Dafur wurde ein Sentiment-getaggtes Korpus in der `Handy`-Domane erstellt. Anhand des `Antconc` Programs wurden die Frequenz der Worter bzw. Bigram ermittelt. In `positiven` Texten wurden meistens solche Adjektive verwendet, die positive Stimmungen uberbringen. Bei dem Fall `klein`, das einen hohen Rang in der Frequenzliste der positiven Gruppe besetzt, konnte jedoch nicht behauptet werden, dass dieses Wort unbedingt zur positiven Wortgruppe gehort, weil es auch in negativen Texten relativ haufig vorkommt. Im Gegensatz dazu wurde das Wort `groß`, das eine ahnliche Funktion wie `klein` zu haben scheint, nur in positiven Texten gefunden. Allerdings muss es noch mit großerem Korpus bestatigt werden. In `negativen` Texten wurden auch Adjektive am meisten gebraucht, aber Substantive und Verben wurden im Vergleich zu den positiven Korpus viel mehr benutzt. Die Anzahl der wiederholt benutzten Worter war auch geringer als bei den positiven Texten. Man scheint bei der Verfassung der negativen Texten eine reichere Wahl der Worter zu treffen. Damit das Ergebnis der vorliegenden Arbeit direkt fur die Entwicklung eines automatischen Sentimentanalyse Systems herangezogen werden kann, muss es mit groβerem Korpus bestatigt werden.