Ziel dieser Arbeit ist es, ein Modell zu entwickeln, welches die Stimmung von Tweets automatisch vorhersagt, ohne die manuelle Bewertung eines Menschen. Dieses Modell kann von Entscheidungsträgern in Unternehmen verwendet werden, um sie bei ihrer Entscheidung zu unterstützen.
Die Welt verändert sich rasant in einer noch nie dagewesenen Geschwindigkeit. Seien es die Themen E-Commerce, künstliche Intelligenz oder auch die digitale Interaktion und Kommunikation untereinander, die nicht zuletzt durch COVID-19 befeuert wurde. Es gibt immer mehr digitale Assistenten, die es ermöglichen, eine Kommunikation mit anderen Menschen aufzubauen. Solch einen Service, der sich dies zunutze macht, ist beispielsweise auch der Kurznachrichtendienst Twitter. Twitter sorgt dafür, dass Nutzer miteinander kommunizieren können, ganz egal wo sie sich gerade geografisch befinden. Diese Kommunikation, die auch Meinungen bzw. Stimmungen von Nutzern enthalten, werden für Unternehmen immer interessanter, da sie dadurch indirekt das Feedback der Kundschaft für ein Produkt bekommen. Das Problem besteht in der großen Anzahl an Daten, die allein durch einen Menschen nicht mehr zu verarbeiten bzw. auszuwerten sind. Das ist der Punkt, wo das Forschungsgebiet der natürlichen Sprache ins Spiel kommt, um es konkreter auszudrücken, die Sentimentanalyse.
Inhaltsverzeichnis
- 1 Einleitung
- 2 Grundlagen der Sentimentanalyse
- 2.1 Hintergrund
- 2.2 Datengrundlage
- 2.3 Charakteristiken der natürlichen Sprache
- 2.4 Verschiedene Ansätze
- 2.4.1 Lexika
- 2.4.2 Maschinelles Lernen
- 3 Datenvorverarbeitung
- 3.1 Datensatz
- 3.2 Methoden
- 4 Erstellung der Modelle
- 4.1 Naiver Bayes
- 4.2 Logistische Regression
- 4.3 Lineare Support Vector Maschine
- 5 Evaluation der Modelle
- 5.1 Ergebnis
- 5.2 Vergleich
- 6 Fazit
Zielsetzung und Themenschwerpunkte
Die Arbeit zielt darauf ab, ein Modell zu entwickeln, das die Stimmung von Tweets automatisch vorhersagt. Dieses Modell soll Unternehmen bei ihren Entscheidungen unterstützen. Die Arbeit beleuchtet dabei die Grundlagen der Sentimentanalyse, die Datenvorverarbeitung, die Erstellung von Modellen mit unterschiedlichen Methoden und deren Evaluation.
- Sentimentanalyse als Werkzeug zur automatischen Stimmungserkennung in Tweets
- Datenvorverarbeitung als Grundlage für die Modellierung
- Verschiedene Ansätze der Sentimentanalyse (Lexika, Maschinelles Lernen)
- Entwicklung und Evaluation von Modellen zur Stimmungsprognose
- Potenziale und Limitationen der Sentimentanalyse im Kontext von Big Data und Business Analytics
Zusammenfassung der Kapitel
- Kapitel 1: Einleitung: Diese Einleitung führt in das Thema der Sentimentanalyse und ihrer Bedeutung im Kontext von Big Data und Business Analytics ein. Sie beleuchtet die rasante Entwicklung der digitalen Welt und den Einfluss von Social Media Plattformen wie Twitter auf die Kommunikation.
- Kapitel 2: Grundlagen der Sentimentanalyse: Dieses Kapitel bietet einen umfassenden Überblick über die Grundlagen der Sentimentanalyse. Es behandelt den Hintergrund, die Datengrundlage, die Charakteristiken der natürlichen Sprache und verschiedene Ansätze der Sentimentanalyse.
- Kapitel 3: Datenvorverarbeitung: Hier wird die Datenvorverarbeitung erläutert. Der Datensatz wird beschrieben und die Methoden der Datenvorverarbeitung werden vorgestellt.
- Kapitel 4: Erstellung der Modelle: In diesem Kapitel werden die drei ausgewählten Modelle - Naiver Bayes-Klassifikator (NB), logistische Regression und lineare Support Vector Maschine (SVM) - vorgestellt.
- Kapitel 5: Evaluation der Modelle: Dieses Kapitel beschäftigt sich mit der Evaluation der Modelle. Die Ergebnisse der einzelnen Modelle werden präsentiert und miteinander verglichen.
Schlüsselwörter
Sentimentanalyse, natürliche Sprache, Twitter, Big Data, Business Analytics, Datenvorverarbeitung, naiver Bayes, logistische Regression, Support Vector Maschine, Modellentwicklung, Evaluation.
- Quote paper
- Julian Springer (Author), 2020, Sentimentanalyse. Entwicklung eines Modells zur Stimmungserkennung in Tweets, Munich, GRIN Verlag, https://www.grin.com/document/946230