Der seit Beginn des 21. Jahrhunderts einsetzende Trend der Individuumsorientierung hält als gesellschaftliche Strömung auch Einzug in den ökonomischen Sektor. Der Bedarf an individuellen Diensten und Produkten, die an die persönlichen Bedürfnisse und Interessen des Kunden angepasst sind, wächst. Die Philosophie ”Der Kunde ist König” ist nicht mehr nur alleine in der ”alten Ökonomie” eine grundlegende Voraussetzung für wirtschaftlichen Erfolg. Besonders seit der Entdeckung des Internets und seiner Möglichkeiten durch Betriebe und Unternehmen entwickelt sich ein Kampf um den Kunden. Dieser ist nämlich in der Lage, von einer Sekunde zur nächsten einen anderen Online-Dienst zu nutzen. Um den Kunden zu halten, muss ein Mehr-Wert generiert werden, so dass sich dieser wohl und verstanden fühlt und gerne wieder zurückkehrt. Die Anpassung von Informationen, Werbung und Angeboten an die persönlichen Interessen des Kunden fördert dieses Gefühl. Doch dazu müssen dessen Interessen erst einmal bekannt sein. Effektive Methoden zur Profilgenerierung sind gefragt. Dabei sollen die gesammelten Daten nicht nur umfangreich und korrekt sein, sondern der Kunde soll während dieses Prozesses auch möglichst wenig zeitlich involviert bzw. belastet werden.
Um beide Anforderungen zu erfüllen, kommen Dialogsysteme zum Einsatz, an die bzgl. Komplexität und Performanz abhängig vom Einsatzgebiet verschiedene Ansprüche gestellt werden. Von einfachen, zustandsbasierten Systemen bis zu Agenten, die für die Dialogführung auf Techniken der künstlichen Intelligenz (KI) zurückgreifen, unterliegt das komplette Spektrum dieser Verfahren intensiven Forschungsbemühungen, die von industrieller Seite interessiert beobachtet und begrüßt werden. Jedoch stellt sich bei den meisten technischen Verfahren, die im Dialog mit dem Menschen agieren sollen, das Problem, natürliche Sprache zu verarbeiten oder sogar zu verstehen. Neben der Tatsache, dass die Verarbeitung natürlicher Sprache ein Teilgebiet der KI ist, stellt darin der Problemkreis der Disambiguierung, d.h. das Auflösen von Mehrdeutigkeiten, die größten Schwierigkeiten für einen umfangreichen Einsatz sprachverarbeitender Systeme in der Praxis dar, wie beispielsweise in den Bereichen information retrieval oder machine translation.
Inhaltsverzeichnis
- 1 Einführung
- 1.1 Motivation
- 1.2 Aufgabenstellung und Abgrenzung
- 1.3 Aufbau der Arbeit
- 2 Bestehende Ansätze, Verfahren und Systeme
- 2.1 Profilerhebung
- 2.1.1 Implizite Verfahren
- 2.1.2 Explizite Verfahren
- 2.1.3 Erweiterte Ansätze
- 2.1.4 Zusammenfassung und Diskussion
- 2.2 Dialogsysteme
- 2.2.1 Kategorisierung
- 2.2.2 Typische Systemkomponenten
- 2.2.3 Zusammenfassung und Diskussion
- 2.3 Disambiguierung
- 2.3.1 Ambiguität
- 2.3.2 Disambiguierung von Wortbedeutungen - ein Überblick
- 2.3.3 Einsatzgebiete von Disambiguierungsverfahren
- 2.3.4 Kategorisierung
- 2.3.5 Stochastische Verfahren
- 2.3.6 KI-basierte, nicht-stochastische Verfahren
- 2.3.7 Hybridverfahren
- 2.3.8 Evaluierung
- 3 Ausgangssituation
- 3.1 Darstellung des Profilerhebungssystems
- 3.1.1 Konzeptbeschreibung
- 3.1.2 Aufbau und Struktur des Benutzerprofils
- 3.2 Architektur des Profilerhebungssystems
- 3.2.1 Language Analysis
- 3.2.2 Profile Manager
- 3.2.3 Target Group Matching
- 3.2.4 Dialog Manager
- 3.3 GermaNet
- 3.3.1 Architektur
- 3.3.2 Relationen
- 3.3.3 Einsatzmöglichkeit
- 3.4 Ablauf/Kontrollfluss
- 3.5 Zusammenfassung und Diskussion
- 4 Anforderungsanalyse
- 4.1 Funktionale Anforderungen
- 4.2 Nicht-funktionale Anforderungen
- 5 Entwicklung der Disambiguierungskomponente
- 5.1 Betrachtung und Auswahl bestehender Ansätze
- 5.1.1 Situationsspezifische Betrachtung
- 5.1.2 Semantische Verwandtschaft/Ähnlichkeit - Begriffe
- 5.1.3 Semantische Verwandtschaft/Ähnlichkeit - Verfahren
- 5.1.4 Semantische Verwandtschaft/Ähnlichkeit - Bewertung
- 5.1.5 Auswahl und Einordnung des Verfahrens
- 5.2 Algorithmus zur Disambiguierung
- 5.2.1 Vorausgehende Überlegungen
- 5.2.2 Beschreibung des Algorithmus
- 5.3 Systemdesign
- 5.4 Implementierung
- 5.4.1 Konfiguration
- 5.4.2 Packages und Klassen
- 5.4.3 Methoden
- 5.4.4 Datenmodelle
- 5.5 Evaluierung
- 5.6 Zusammenfassung und Diskussion
- 6 Zusammenfassung und Ausblick
Zielsetzung und Themenschwerpunkte
Diese Diplomarbeit beschäftigt sich mit der Weiterentwicklung eines Dialog Managers für ein Profilerhebungssystem, das darauf ausgelegt ist, Mehrdeutigkeiten in natürlich-sprachlichen Dialogen mit Kunden aufzulösen. Das Ziel ist die Entwicklung eines Verfahrens, das Kundeneingaben während des Dialogs disambiguiert und somit zu einer präziseren Profilbildung beiträgt.
- Profilerhebung und die Herausforderungen der Disambiguierung in natürlich-sprachlichen Dialogen
- Verschiedene Ansätze und Verfahren der Profilerhebung, Dialogsystem-Architekturen und Disambiguierungsmethoden
- Entwicklung eines Disambiguierungsalgorithmus, der auf semantischer Verwandtschaft basiert
- Integration des Algorithmus in das bestehende Profilerhebungssystem und Evaluierung seiner Effektivität
- Zusammenfassung der Erkenntnisse und Ausblick auf zukünftige Forschungsrichtungen
Zusammenfassung der Kapitel
Die Arbeit beginnt mit einer Einführung in die Thematik, wobei die Motivation und Aufgabenstellung der Arbeit erläutert werden. Anschließend werden bestehende Ansätze, Verfahren und Systeme im Bereich der Profilerhebung, Dialogsysteme und Disambiguierung ausführlich dargestellt. Das dritte Kapitel beschreibt die Ausgangssituation, wobei das Profilerhebungssystem, seine Architektur und die verwendete Wissensbasis GermaNet im Detail vorgestellt werden. Darauf folgt die Anforderungsanalyse, die die funktionalen und nicht-funktionalen Anforderungen an die zu entwickelnde Disambiguierungskomponente definiert. In Kapitel fünf wird die Entwicklung der Disambiguierungskomponente behandelt, wobei die Auswahl und Bewertung verschiedener Verfahren, die Entwicklung des Algorithmus, die Implementierung und die Evaluierung der Komponente dargestellt werden. Die Arbeit endet mit einer Zusammenfassung der Ergebnisse und einem Ausblick auf zukünftige Forschungsrichtungen.
Schlüsselwörter
Profilerhebung, Dialog Manager, Disambiguierung, natürlich-sprachliche Verarbeitung, Semantik, Wissensbasierte Systeme, GermaNet, Benutzerprofile, Kundendialog, Mehrdeutigkeit, Algorithmen.
- Quote paper
- Thorsten Eiseler (Author), 2005, Weiterentwicklung eines Dialog Managers für ein Profilerhebungssystem: Auflösung von Mehrdeutigkeiten im benutzeradaptiven, natürlich-sprachlichen Dialog mit dem Kunden, Munich, GRIN Verlag, https://www.grin.com/document/48491