Basierend auf einer Literaturrecherche sollen in dieser Arbeit Anwendungsgebiete und Technologien aus dem Themenfeld der Künstlichen Intelligenz (KI) im Kontext Kundenservice aufgezeigt werden. Der Fokus liegt auf Anfragen, die von Kunden in menschlicher Sprache formuliert werden und bislang von Service-Center-Agenten beantwortet werden. Die gesuchten Technologien zielen darauf ab, dass Kundenanfragen entweder vollständig oder teilweise durch KI gelöst werden. Auch Methoden, die dem Agenten dabei helfen, das Kundenanliegen schneller zu beantworten, können Ergebnis der Recherche sein. Technische Lösungen zur Optimierung der Steuerung eines Service-Centers wie beispielsweise Algorithmen, die zur Einsatzplanung genutzt werden können, stehen nicht im Fokus dieser Arbeit.
Erkenntnisse dieses Arbeit sollen neben einer wissenschaftlich fundierten Literaturrecherche auch eine Hilfestellung für technische Entscheider und technisch affine Operations-Verantwortliche im Umfeld von Service-Centern darstellen, um die digitale Transformation innerhalb der Branche meistern zu können.
I.Inhaltsverzeichnis
II.Abbildungsverzeichnis
III.Abkürzungsverzeichnis
1 Ziel der Arbeit und Abgrenzung zu weiteren Themenfeldern
1.1 Kontaktkanäle
1.2 Tätigkeiten in einem Contact-Center
1.3 Serviceerbringer und Contact-Center
2 Künstliche Intelligenz und maschinelles Lernen
3 Verarbeitung natürlicher Sprache mit KI
3.1 Speech to Text und Automatic Speech Recognition
3.2 Sprachgenerierung – Sprachausgabe – Text to Speech
3.3 Übersetzung
3.4 Textzusammenfassung
3.5 Named Entity Recognition
3.6 Intent Recognition oder Klassifizierung (Satzklassifikation) von Kundenanfragen
3.7 Sprecher-Erkennung / Sprecher-Verifizierung / Sprecher-Authentifizierung
3.8 Emotion Recognition Software
3.9 Chatbots
4 Weitere KI-Anwendungen
4.1 Robotic Process Automation
4.2 Optical Character Recognition
4.3 Cluster-Analyse (Clustering)
5 Grenzen von KI
6 Beispiele und Einsatzgebiete von KI
7 Fazit
IV. Verzeichnis der Anhänge
V. Anhang
8 Literaturverzeichnis
II. Abbildungsverzeichnis
Abbildung 1 - Einordnung von Begriffen im Kontext der Künstlichen Intelligenz angelehnt an Dukino et al. 2020, S
Abbildung 2 - Funktionen innerhalb des Natural-Language-Processings (Kreutzer und Sirrenberg 2019, S. 32)
Abbildung 3 - Übersetzungsgenauigkeit bei maschinellen Übersetzungen (Kabel 2020, S. 59)
Abbildung 4 - Darstellung einer Trainingsmaske im Tool Prodi.gy, das zusammen mit ein SpaCy-NER-Modell verwendet wird um Informationen wie Produktname, Typbezeichnung zu erkennen (Eigene Darstellung)
Abbildung 5 - Verbindung kognitiver Services zu einem Chatbot (Kohne et al, 2020 S. 61)
III. Abkürzungsverzeichnis
ASR Automatic Speech Recognition
bzw. beziehungsweise
CNN Convolution Neural Networks
FAQ Frequently Asked Questions
GRU Gated Recurrent Unit
KI Künstliche Intelligenz
LDA Latent Dirichlet Allocation
LSTM Long Short-Term Memory
ML Machine Learning / Maschinelles Lernen
NER Named Entity Recognition
NLP Natural Language Processing
NLU Natural Language Understanding
NMT Neural Machine Translation
OCR Optical Character Recognition
RBMT Rules based machine translation
RNN Recurrent Neural Networks
RPA Robotic Process Automation
S. Seite
SMT Statistische maschinelle Übersetzung
STT Speech-To-Text
T2S Text To Speech
TTS Text to Speech
usw. und so weiter
z. B. zum Beispiel
S.
1 Ziel der Arbeit und Abgrenzung zu weiteren Themenfeldern
Basierend auf einer Literaturrecherche sollen Anwendungsgebiete und Technologien aus dem Themenfeld der Künstlichen Intelligenz (KI) im Kontext Kundenservice aufgezeigt werden. Der Fokus liegt auf Anfragen, die von Kunden in menschlicher Sprache formuliert werden und bislang von Service-Center-Agenten beantwortet werden. Die gesuchten Technologien zielen darauf ab, dass Kundenanfragen entweder vollständig oder teilweise durch KI gelöst werden. Auch Methoden, die dem Agenten dabei helfen, das Kundenanliegen schneller zu beantworten, können Ergebnis der Recherche sein. Technische Lösungen zur Optimierung der Steuerung eines Service-Centers wie beispielsweise Algorithmen, die zur Einsatzplanung genutzt werden können, stehen nicht im Fokus dieser Arbeit. Begriffe dieser Themenabgrenzung werden in den nachfolgenden Unterkapiteln erläutert.
Erkenntnisse dieses Arbeit sollen neben einer wissenschaftlich fundierten Literaturrecherche auch eine Hilfestellung für technische Entscheider und technisch affine Operations-Verantwortliche im Umfeld von Service-Centern darstellen, um die digitale Transformation innerhalb der Branche meistern zu können.
1.1 Kontaktkanäle
Laut TGMC Management Consulting (2019, S. 4) sind relevante Kontaktkanäle im Kundenservice die Telefonie (Inbound- und Outbound-Calls 54 % und 13 %), E-Mail-Bearbeitung (16 %) sowie die weiterführende Bearbeitung von Schriftgut (7 %) und Chats (2%).
1.2 Tätigkeiten in einem Contact-Center
Arbeit in einem Contact-Center lässt sich gut in die Klasse der Sachbearbeitung einordnen. Es handelt sich um Arbeit von Menschen in überwiegend strukturierten, standardisierten, wiederkehrenden und regelbasierten Abläufen, die einen hohen Routineanteil besitzt. Die Aufgaben besitzen geringe bis erhöhte kognitive Denkanforderungen sowie geringe bis erhöhte Interaktions-Anforderungen, letztere durch die direkte Arbeit mit Menschen. (Ganz et al. 2021, S. 13)
1.3 Serviceerbringer und Contact-Center
Der Begriff Serviceerbringer soll hierbei im Kontext eines Customer-Service für Verbraucher verstanden werden, wie er beispielsweise in Call-Centern oder Contact-Centern erbracht wird. Ein Kundenservice, der an Maschinen oder unmittelbar an betroffener Hardware zu erbringen ist, wird von dieser Arbeit nicht erfasst.
2 Künstliche Intelligenz und maschinelles Lernen
Künstliche Intelligenz (KI) bezeichnet die Fähigkeit einer Maschine, kognitive Aufgaben auszuführen, die wir mit dem menschlichen Verstand verbinden. Dazu gehören Möglichkeiten zur Wahrnehmung sowie die Fähigkeiten zur Argumentation, zum selbstständigen Lernen und damit zum eigenständigen Finden von Problemlösungen. (Kreutzer und Sirrenberg 2019, S. 4)
Ein Teilbereich von KI ist Maschinelles Lernen (Machine Learning oder ML), das wiederum Neuronale Netze und Deep Learning als Untermengen enthält. (Dukino et al. 2020, S. 50) Eine tiefergehende Beschreibung von neuralen Netzen und Deep Learning ist für das Verständnis der vorliegenden Ausarbeitung nicht notwendig, sodass im Anschluss nur der Begriff des maschinellen Lernens näher beschrieben wird um die Begriffe im weiteren Textteil grob einordnen zu können.
Im Bereich ML werden Programme entwickelt, die aus Daten lernen. Trainingsdaten werden genutzt, um den Algorithmus aufzubauen. Dieser wird dann auf bisher unbekannte Daten angewendet. Mithilfe von Feedbackdaten kann der Algorithmus weiter verbessert werden. (Cornelius 2019, S. 51–54) ML ist im Zusammenhang mit der Verarbeitung natürlicher Sprache bedeutsam. Geräusche und Stimmen voneinander zu trennen und den Sound der Stimme in notierte Sprache zu wandeln funktioniert nur, wenn man unzählige Beispiel-Soundfiles einsetzt, um Computern zu lehren, welcher Laut welchen Buchstaben bedeutet. Auch die Analyse von niedergeschriebenen Nutzeräußerungen erfordert unzählige Textbeispiele, um die Algorithmen zu trainieren. (Kabel 2020, S. 32)
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1 - Einordnung von Begriffen im Kontext der Künstlichen Intelligenz angelehnt an Dukino et al. 2020, S. 50
3 Verarbeitung natürlicher Sprache mit KI
Die Arbeit im Kundenservice basiert auf schriftlichen oder mündlichen Interaktionen in menschlicher Sprache. Für diesen Bereich hat sich im Rahmen der Literaturrecherche besonders Natural Language Processing (NLP) als bedeutendes Element von KI im Service-Center-Umfeld gezeigt. Teilweise findet man in der Literatur eine Unterteilung von Natural Language Understanding (NLU) und Natural Language Processing. NLU ist hierbei als Teilmenge von NLP zu verstehen, wie es die nachfolgende Abbildung von Kreutzer und Sirrenberg (2019, S. 32) zeigt.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2 - Funktionen innerhalb des Natural-Language-Processings (Kreutzer und Sirrenberg 2019, S. 32)
NLP beschreibt die Fähigkeit von Computern, mit gesprochenem oder geschriebenem Text zu arbeiten, indem die Bedeutung aus dem Text extrahiert oder Text erzeugt wird, der lesbar, stilistisch natürlich und grammatikalisch korrekt ist. Computer werden damit in die Lage versetzt, nicht nur auf formalisierte Programmiersprachen sondern auch auf natürliche menschliche Sprache zu reagieren. NLP ist eine der KI-Disziplinen, die in vergangener Zeit die größten Durchbrüche feiern konnte. Aufgrund der komplexen Semantik der menschlichen Sprache sowie der Vielzahl an Synonymen und Ambiguitäten gehört NLP zu den „harten Problemen“ der Informatik – eine Performance auf demselben Niveau wie des Menschen kann noch nicht erzielt werden. (Gentsch 2018, S. 31–32)
3.1 Speech to Text und Automatic Speech Recognition
Besonders aktuell ist das Thema der Spracherkennung (engl. speech recognition), welches sich mit der automatischen Transkription menschlicher Sprache befasst und aktuell einen der größten Treiber der Künstlichen Intelligenz im Endkundengeschäft darstellt. (Gentsch 2018, S. 31–32)
Bei Speech to Text (STT) bzw.Automatic Speech Recognition (ASR) wird das gesprochene Wort direkt in einen digitalen Text überführt. Im Kundenservice wäre denkbar, Transkripte der Kundengespräche anzufertigen. (Kreutzer und Sirrenberg 2019, S. 28–29)
Bei STT wird aus technischer Sicht ein mehrstufiges Verfahren durchlaufen. Eine maschinell lernbasierte akustische Analyse wandelt zunächst Sprache in Phonemdaten um. Ein Phonem ist die kleinste bedeutungsunterscheidende sprachliche Einheit (z. B. b in „Bein“ im Unterschied zu p in „Pein“). Firmen wie Google oder Amazon haben einen riesigen Korpus an Audiodateien als Lerndaten gesammelt und in Phoneme umgeschrieben um Audiodaten transkribieren zu können. Sobald eine Sprachaudiodatei in Phoneme umgewandelt wurde, wird das wahrscheinlichste Wort, das ein Phonem bilden konnte, erkannt. Für ein Wort kann beispielsweise (1a) HHHEE_LL_LLLOOO, (2a) HHHUU_LL_LLLOOO und (3a) AAAUU_LL_LLLOOO erkannt werden. Nachdem wiederholte Buchstaben und Leerzeichen bereinigt wurden, sehen die Wörter wie (1b) Hello, (2b) Hullo und (3b) Aullo aus. Von diesen ist das möglichste Wort im Wörterbuch „Hello“, das dann gewählt wird. Sobald einzelne Wörter in einer Nutzeräußerung herausgearbeitet sind, wird ein richtiger Satz mit Hilfe von Sprachmodellen „korrigiert“. Folgende Ausgabe könnte von einem ASR sein (A) „How pan I help you“ oder (B) „How van I help your“ sein. Ein Sprachmodell betrachtet jedes Wort und die Wahrscheinlichkeit, dass ein Wort einem anderen Wort folgt. Daraus errechnet es die Wahrscheinlichkeit von „I pan“ und „I van“. Basierend auf den Ergebnissen korrigiert es „pan“ und „van“ zum Wort „can“. Somit wird der Satz auf „How can I help you“ korrigiert. (Kabel 2020, S. 52–53)
3.2 Sprachgenerierung – Sprachausgabe – Text to Speech
Text to Speech (T2Soder TTS) bezeichnet die Sprachsynthese und somit das Gegenstück zu Speech to Text. Hierbei wird aus geschriebener Sprache eine Schallinformation erzeugt, also gesprochene Sprache. Text to Speech kann in Ergänzung zu allen Verfahren eingesetzt werden, die auf geschriebenem Text basieren und diese um Sprachausgabe erweitern. (Kohne et al. 2020, S. 53)
3.3 Übersetzung
Maschinenübersetzungen sind ebenfalls bedeutende Felder von NLP und auch für mehrsprachigen Kundenservice interessant. Folgendes Beispiel zeigt die Schwierigkeit in der Verarbeitung menschlicher Sprache durch Maschinen: Jedes Wort im Satz „Time flies like an arrow“ ist eindeutig. Wenn man aber „Time“ mit „Fruit“ und „arrow“ mit „banana“ ersetzt, lautet der Satz: „Fruit flies like a banana“. Während „flies“ im ersten Satz noch das Verb „fliegen“ beschreibt, wird daraus im zweiten Satz das Nomen „(Frucht-)Fliegen“, und aus der Präposition „like“ – „wie“ wird im zweiten Satz das Verb „mögen“. Während ein Mensch die Wortbedeutungen intuitiv richtig erkennt, werden beim NLP verschiedene ML-Techniken kombiniert, um die gewünschten Ergebnisse zu erreichen. Nachdem ein System mithilfe sehr großer Datenmengen trainiert wurde, können Wortbedeutungen mit höheren Wahrscheinlichkeiten bestimmt werden. (Gentsch 2018, S. 31–32)
Sprachübersetzung wurde anfänglich mit Grammatikregeln, sogenannter „Rules based machine translation“ (RBMT) gelöst. IBM begann in den 1990er-Jahren mit der Lösung maschineller Übersetzungen mit statistischen Methoden. Statistische maschinelle Übersetzung (SMT) hängt dabei nicht von linguistischen Regeln ab, sondern von Mustern, die von den Daten selbst dargestellt werden. Neuronale Maschinenübersetzer (Neural Machine Translation bzw. NMT) sind die neuesten Übersetzungsmechanismen, bei denen relativ tiefe neuronale Netzwerkmodelle verwendet werden, um Sätze von einer Sprache in eine andere zu übersetzen. Vergleicht man die früher teilweise mangelhaften Ergebnisse von Google Translate von vor wenigen Jahren und heute, erkennt man die qualitativen Verbesserungen aufgrund des technologischen Fortschritts in diesem Sektor. (Kabel 2020, S. 42–58) Die nachfolgende Grafik zeigt, wie gut die beschriebenen Methoden inzwischen im Vergleich zum Menschen performen. (Kabel 2020, S. 59)
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 3 - Übersetzungsgenauigkeit bei maschinellen Übersetzungen (Kabel 2020, S. 59)
3.4 Textzusammenfassung
Eine Textzusammenfassung wird entweder durch extraktive Textverdichtung oder abstrakte Textverdichtung erreicht. Bei der extraktiven Methode werden Sätze automatisch gruppiert und der relevanteste Satz in jeder Gruppe als Zusammenfassung ausgewählt. Bei der abstrahierenden Methode hingegen müssen die als Zusammenfassung ausgewählten Sätze nicht Teil der ursprünglichen Botschaft sein, indem ein mittels Deep Learning Korpus von Sätzen mit einer verfügbaren Zusammenfassung oder Überschrift trainiert wird. (Kabel 2020, S. 57)
Ein Anwendungsgebiet im Kundenservice für Textzusammenfassungen kann darin bestehen, den Agenten eine Zusammenfassung der schriftlichen Kundenanfrage zu geben. Umgekehrt wäre auch denkbar, aus einer ausführlichen Wissensdatenbank Zusammenfassungen zu bestimmten Fragestellungen automatisch generieren zu lassen.
3.5 Named Entity Recognition
In jedem Textdokument gibt es bestimmte Begriffe (Entitäten) die relevanter sind und einen einzigartigen Kontext im Vergleich zum Rest des Textes haben. Diese Entitäten werden als benannte Entitäten (Named Entities) bezeichnet und repräsentieren Objekte der realen Welt wie Personen, Orte, Organisationen, usw.. Die Erkennung von benannten Entitäten (Named Entity Recognition bzw. NER) ist eine beliebte Technik die verwendet wird, um Entitäten zu identifizieren und zu segmentieren sowie sie anschließend unter verschiedenen vordefinierten Klassen zu klassifizieren oder zu kategorisieren. (Sarkar 2019, S. 536)
Von KI erkannte Entitäten können genutzt werden, um aus unstrukturierten Texten strukturierte Informationen zu entnehmen, die in Formularen oder Folgeprozessen weiterverarbeitet werden müssen. So kann beispielsweise einem Service Center Agenten Hilfestellung gegeben werden, wenn im Rahmen einer Service-Anfrage die vom Kunden genannte Gerätebezeichnung, die Bestellnummer oder das Kaufdatum zur Prüfung der Garantieansprüche besonders wichtig sind oder wenn sie sogar für die Folgeprozesse vorab technisch verarbeitet und dadurch passgenaue Hilfestellung gegeben wird.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 4 - Darstellung einer Trainingsmaske im Tool Prodi.gy, das zusammen mit ein SpaCy-NER-Modell verwendet wird um Informationen wie Produktname, Typbezeichnung zu erkennen (Eigene Darstellung)
3.6 Intent Recognition oder Klassifizierung (Satzklassifikation) von Kundenanfragen
Im Kundenservice entstehen hohe Aufwände für die sinnvolle Zuordnung, Weiterleitung und Bearbeitung von Kundenanfragen . (Deckert und Meyer 2020, S. 21–22) Um den Kundenwunsch zunächst verstehen und daraus Folgeprozesse ableiten zu können, muss die Absicht in der Kundenaussage, der sogenannte Intent, eindeutig identifiziert bzw. klassifiziert werden. Es handelt sich dabei meist um eine endliche Anzahl von wenigen dutzend Fragestellungen bzw. Lösungskategorien der jeweiligen Branche. (Kabel 2020, S. 129–130) Satzklassifikation bezeichnet die Aufgabe, einem Satz oder Dokument eine passende Kategorie aus einer vordefinierten Menge von Kategorien zuzuordnen. (Narendranath et al. 2020)
Zur Intent-Erkennung gibt es inzwischen zahlreiche Deep-Learning Methoden die hierfür eingesetzt werden können. Methoden wie Word Embeddings, Convolution Neural Networks (CNN), Recurrent Neural Networks (RNN), Long Short-Term Memory (LSTM) Network, Gated Recurrent Unit (GRU), Attention Mechanism oder Capsule Networks würde den Rahmen dieser Ausarbeitung sprengen. Sie sollen hier jedoch für weiterführende Recherchen zumindest Erwähnung finden. (Liu et al. 2019)
Mittels maschinellen Lernverfahren lernt das System stetig mit jeder neuen Kundenanfrage. Dazu werden Anfragen und ihre zugehörigen Antworten archiviert, um anschließend in die Analyse einzufließen. Das Ergebnis der Analyse kann in folgende drei Kategorien eingeteilt werden: (1) Bekannte und sehr häufig auftretende Anfragen – werden automatisch vom System beantwortet, es besteht kein Aufwand mehr für den Kundenservice, (2) Ähnliche Anfragen – werden vom System erkannt und dem Kundenservice mit einem Vorschlag zur Beantwortung bereitgestellt, wodurch der Aufwand zur Beantwortung minimiert und (3) Neue Anfragen – diese werden umgehend an den Kundenservice weitergeleitet, welcher an dieser Stelle dann auch die Zeit dafür erhält sich ausführlich mit der Anfrage zu beschäftigen und sie trotz alledem zügig beantworten kann, da die Standardanfragen ihn nicht mehr davon abhalten. (Dukino et al. 2020, S. 44)
[...]
- Quote paper
- Monika Arbter-Hubrich (Author), 2021, Aktuelle KI-Trends. KI-Trends im wissensbasierten After Sales Customer-Service, Munich, GRIN Verlag, https://www.grin.com/document/1149094
-
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X.