Korpusbasierte Verfahren zur Generierung lexikalischer Ressourcen für das Opinion Mining. Statistische Ansätze und deren Einsatzmöglichkeiten





Professorship/Faculty: Fakultät Wirtschaftsinformatik und Angewandte Informatik: Abschlussarbeiten
Author(s): Reinel, Dirk
Publisher Information: Bamberg : University of Bamberg Press
Year of publication: 2018
ISBN: 978-3-86309-593-2
978-3-86309-594-9
Source/Other editions: Parallel erschienen als Druckausg. in der University of Bamberg Press, 2018 (22,00 EUR)
Pages / Size: xix, 157 Seiten : Illustrationen, Diagramme
Language(s): German
Series ; Volume: Schriften aus der Fakultät Wirtschaftsinformatik und Angewandte Informatik der Otto-Friedrich-Universität Bamberg
Supervisor(s): Henrich, Andreas
Remark: 
Dissertation, Otto-Friedrich-Universität Bamberg, 2018
Link to order the print version: http://www.uni-bamberg.de/ubp/
Abstract: 
Die ständig zunehmende Anzahl nutzergenerierter textueller Daten im World Wide Web, wie beispielsweise Kundenrezensionen, und die Begehrlichkeiten diese Daten hinsichtlich der darin ausgedrückten Meinungen zu Unternehmen, Produkten, Dienstleistungen etc. maschinell auszuwerten, erfordern gut funktionierende, angepasste Methoden des Opinion Mining. Die Grundlage für viele dieser Methoden bilden lexikalische Ressourcen in Form von Lexika meinungstragender Wörter und Phrasen. Diese Lexika existieren bisher allerdings nur für ausgewählte Sprachen, haben diverse inhaltliche Lücken, und sind automatisch (für verschiedene Sprachen) nur mit großem Aufwand zu erzeugen.
In dieser Arbeit wird deshalb ein neues Verfahren vorgestellt, das dazu beitragen soll, die benannten Probleme – durch den Einsatz statistischer Methoden – zu überwinden. Zudem wurde, mittels dieses Verfahrens, der Prototyp eines neuen Lexikons mit meinungstragenden Wörtern und Phrasen für die deutsche Sprache generiert und anschließend evaluiert. Dafür wurde im Rahmen eines Experiments mit 20 Teilnehmern ein Basis-Referenzlexikon für die deutsche Sprache manuell erzeugt.
Klassische Einsatzgebiete der Opinion Mining Algorithmen und Ressourcen, und damit des vorgestellten Verfahrens, sind Systeme zur Erfassung von Kundenmeinungen zu verschiedenen Unternehmensbereichen zur Unterstützung des Beschwerde- und Reputationsmanagements. Allerdings sind die Möglichkeiten des neu entwickelten Verfahrens nicht auf diese klassischen Anwendungsfelder begrenzt. Auch der interdisziplinäre Einsatz, z.B. zur Untersuchung von Sprachvarietäten im Forschungsfeld der Sprachstatistik, ist denkbar.

The constantly increasing number of user-generated textual data on the World Wide Web, such as customer reviews, and the desire to automatically analyze this data with regard to the opinions expressed therein regarding companies, products, services, etc., require well-functioning, adapted opinion mining methods. Lexical resources – i.e. lexicons of opinion-bearing words and phrases – form the basis for many of these methods. However, these lexicons only exist for selected languages, have various content gaps, and can only be generated automatically (for different languages) with great effort.
In this thesis a new method is presented to help overcome the above described problems by using statistical methods. In addition, the prototype of a new lexicon including opinion-bearing words and phrases for the German language was generated by using this method. In order to evaluate this automatically generated resource, an experiment with 20 participants was performed to manually create a reference lexicon for the German language.
Traditional application areas of opinion mining algorithms and resources, and thus of the presented approach, are systems for recording customer opinions on various areas of companies in support of complaint and reputation management. However, the possibilities of the newly developed method are not limited to these classic fields of application. Interdisciplinary use, e.g. to study language varieties in the research field of language statistics, is also conceivable.
Catchwords: Electronic Commerce ; Produktbewertung ; Data Mining
DDC Classification: 004 Datenverarbeitung; Informatik
RVK Classification: ST 302
DOI: 10.20378/irbo-52349
Licence: German Act on Copyright
URN: urn:nbn:de:bvb:473-opus4-523492
Document Type: Doctoralthesis
URI: https://fis.uni-bamberg.de/handle/uniba/44092
Release date: 4. July 2018

File SizeFormat  
SWIAI31ReinelDissopuskse_A3a.pdf5.43 MBAdobe PDFView/Open

Items in DSpace are protected by copyright