http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
"AntConc"를 활용한 독일어 전문용어후보 자동추출방안
홍문표 ( Mun Pyo Hong ) 한국독일언어문학회 2015 독일언어문학 Vol.0 No.68
Sogar fur die erfahrensten Ubersetzer stellen technische Terme oft die großten Schwierigkeiten bei der Ubersetzung technischer Dokumente dar. Die Schwierigkeiten der Ubersetzung beruhen zum Teil darauf, dass es keinen passenden Begriff in der Zielsprache gibt, so dass es schwierig ist, diesen Begriff in der Zielsprache zu verbalisieren. Sie beruhen zum Teil auch darauf, dass dem Ubersetzer oft das Fachwissen fur die Ubersetzung fehlt. Aus diesem Grunde wird dem Ubersetzer oft empfohlen, die Termdatenbank fur eine Domane im Voraus zu erstellen, um die korrekte und konsistente Ubersetzung der Terme zu gewahrleisten. Um eine Termdatenbank zu bilden, muss man aber zuerst die Terme aus technischen Texten extrahieren. Wenn der Umfang der zu ubersetzenden Texte zu groß ist, dann ist es oft sehr muhsam und teuer, alle Terme zu entdecken. Viele Ubersetzer sind oft fur die Termextraktion und die Termdatenbankerstellung auf kommerzielle Produkte angewiesen. Die vorliegende Arbeit stellt eine neue Methode vor, die fur die Extraktion der Termkandidaten aus technischen Dokumenten angewendet werden kann. Diese Methode verwendet eine Freeware namens “AntConc”, die sich im Internet einfach und kostenlos herunterladen lasst. Eine Funktion der Software ist die Extraktion der Schlusselworter aus einem Text. Der Algorithmus der Funktion stutzt sich auf das Log-likelihood Ratio Rechnen. Die zugrundeliegende Idee dieser Methode ist, dass ein Wort ein sehr wahrscheinlicher Termkandidat ist, wenn es relativ oft in einem Fachtext vorkommt, wahrend es in einem allgemeinen Korpus aber relativ wenig vorkommt. Die Relativfrequenz wird hier durch das Log-likelihood Ratio Rechnen kalkuliert. Das Experiment zeigt, dass der vorgeschlagene Ansatz etwa 52.4% Korrektheit aufweist. Den kommerziellen Systemen, die die sogenannte cutting-edge Technologie heranziehen, unterliegt unser Ansatz in der Korrektheit der Extraktion. Aber dieser Ansatz benotigt keine andere Ressourcen oder Tools als AntConc und ist vor allem kostenlos verwendbar, so dass er von jedem Ubersetzer einfach benutzt werden kann.