Die vorliegende Arbeit beschäftigt sich mit der Auswertung drei wesentlicher Methoden zur Analyse von Textmaterial. Diese Methoden stammen allesamt von Wissenschaftlern mit dem Ziel, zukünftig valide Prognosen über den Einfluss einer Neuveröffentlichung zu treffen. Die erste Ausarbeitung mit dem Titel „When is a Liability not a Liability? Textual analysis, Dictionairies, and 10-Ks“ (Loughran,
McDonald 2009) befasst sich mit der Auswertung von Texten mittels
Wörterbüchern. Die zweite Arbeit namens “Using news articles to predict stock price movements” (Gidófalvi 2001) untersucht den Einfluss von Finanz- und Unternehmensnachrichten auf 12 Aktienkurse des NASDAQ-Index. Dabei wird als Algorithmus der naive Bayes-Textklassifikator verwendet, der aufgrund seiner einfachen und praktischen Anwendbarkeit häufig von Wissenschaftlern zur Klassifizierung von Nachrichten benutzt wird. Schließlich beschäftigt sich die dritte Ausarbeitung mit dem Titel „Kursrelevanzprognose von Ad-hoc-Meldungen“ (Schulz, Spilipoulou, Winkler 2003) mit dem Einfluss mitteilungspflichtiger
Unternehmensnachrichten auf deren Aktienkurse, um zukünftige Prognosen vorherzusagen.
Das Ziel dieser Ausarbeitung ist die Analyse der konzeptionellen Vorgehensweise der drei Veröffentlichungen. Es soll dargelegt werden, wie die Methodik der Modelle als auch die Metrik der Auswertung der Ergebnisse bei allen drei Arbeiten sind. Dabei soll anhand der Systematiken anderer Wissenschaftler eine Beurteilung und
gegebenenfalls Erweiterung der einzelnen Modelle erfolgen.
Inhaltsverzeichnis
- 1 Einleitung
- 1.1 Das Wesen des Text Minings
- 1.2 Aufbau und Zielsetzung der Arbeit
- 1.3 Bisherige Literatur
- 2 When is a Liability not a Liability? Textual analysis, Dictionairies, and 10-Ks
- 2.1 Einführung
- 2.2 Analyse des Datensatzes
- 2.2.1 Schriftlicher Datensatz
- 2.2.2 Zeitraum des Datensatzes
- 2.3 Analyse der Evaluation
- 2.3.1 Erstellung der Wörterbücher
- 2.3.2 Analyse der Termgewichtung
- 2.3.3 Leistungsvergleich Fin-Neg Liste und Harvard Dictionary
- 2.4 Kritik am Aufbau der Arbeit
- 2.5 Zusammenfassung
- 3 Using News Articles to Predict Stock Price Movements
- 3.1 Einführung
- 3.2 Datensatz
- 3.2.1 Datenaufbereitung
- 3.2.2 Indikator zur Bestimmung der Bewegungsklassen
- 3.3 Anwendung des naiven Bayes-Textklassifikators
- 3.4 Auswertungsmetrik
- 3.4.1 Auswertung des Indikators der Bewegungsklassen
- 3.4.2 Auswertung der Gruppenzuordnung von Nachrichten
- 3.4.3 Auswertung des Zeitintervalls des Nachrichteneinflusses
- 3.5 Zusammenfassung
- 4 Kursrelevanzprognose von Ad-hoc-Meldungen
- 4.1 Einführung
- 4.2 Datenbasis
- 4.2.1 Ermittlung der Datenbasis
- 4.2.2 Beschränkte Datenbasis und Sample Selection Bias
- 4.2.3 Eingeschränkte Einsetzbarkeit
- 4.3 Kursrelevanz von Ad-hoc Meldungen
- 4.3.1 Ermittlung der Kursrelevanz von Ad-hoc Meldungen
- 4.3.2 Problem der Schätzung der erwarteten Rendite
- 4.3.3 Branchenübergreifende Bewertung und die Arbitrage Pricing Theorie
- 4.3.4 Die Verwendung von Intraday-Kursen als bessere Indikatoren
- 4.4 Klassifikation und Evaluation von Ad-hoc Meldungen
- 4.4.1 Vorgehensweise und Ergebnisse
- 4.4.2 Klassifikationsfehler als einziges Maß für die Güte des Modells
- 4.4.3 Problematische Klassifizierung nach Wahrscheinlichkeiten
- 4.4.4 Das Handelsvolumen als weiterer Indikator für Kursrelevanz
- 4.5 Zusammenfassung
Zielsetzung und Themenschwerpunkte
Diese Seminararbeit befasst sich mit dem Bereich des Text Minings, einem Teilgebiet des Data Minings, das sich mit der Extraktion von Informationen aus Texten beschäftigt. Die Arbeit analysiert verschiedene Ansätze des Text Minings und untersucht deren Anwendung in der Finanzwirtschaft.
- Einsatz von Text Mining Methoden in der Finanzwirtschaft
- Analyse von Finanzberichten und Nachrichten zur Vorhersage von Aktienkursbewegungen
- Entwicklung und Evaluation von Algorithmen zur Textklassifizierung und Sentimentanalyse
- Bewertung der Kursrelevanz von Ad-hoc-Meldungen
- Herausforderungen und Chancen des Text Minings in der Finanzwelt
Zusammenfassung der Kapitel
Das erste Kapitel führt in das Thema Text Mining ein und erläutert die grundlegenden Konzepte und Anwendungsgebiete. Das zweite Kapitel untersucht die Verwendung von Text Mining zur Analyse von Finanzberichten, wobei ein Schwerpunkt auf der Identifizierung von Risiken und Chancen im Kontext von Bilanzierungsentscheidungen liegt. Das dritte Kapitel befasst sich mit der Vorhersage von Aktienkursbewegungen anhand von Nachrichtenartikeln, wobei der naive Bayes-Klassifikator als Text Mining-Tool eingesetzt wird. Im vierten Kapitel wird die Kursrelevanz von Ad-hoc-Meldungen analysiert und es werden verschiedene Ansätze zur Klassifizierung und Evaluation dieser Meldungen vorgestellt.
Schlüsselwörter
Text Mining, Data Mining, Finanzwirtschaft, Aktienkursvorhersage, Sentimentanalyse, Finanzberichtsanalyse, Ad-hoc-Meldungen, Bayes-Klassifikator, Kursrelevanz, Algorithmen, Evaluation, Datenbasis, Risikoanalyse, Chancenidentifikation.
- Quote paper
- Nicole Tode (Author), Tarek Abuzarour (Author), Fabian Lang (Author), 2010, Text Mining - Drei Methoden zur Textanalyse, Munich, GRIN Verlag, https://www.grin.com/document/202971