In dieser Arbeit werden der Aufbau und die Verwendung von neuronalen Netzen erläutert sowie die Anwendung in der Praxis des Kreditrisikomanagements dargestellt. Eine Modellsimulation wird zeigen, zu welchen Ergebnissen das angewandte künstliche neuronale Netz bei zwei unterschiedlichen Datensätzen – einem Trainings- und einem Validierungsdatensatz – kommt. Neben den Vorteilen und Nachteilen eines solchen Modells wird auch auf den Hauptnachteil künstlicher neuronaler Netze, deren "Black Box"-Charakter, eingegangen und aufgezeigt, wie dieser Nachteil durch Fuzzy-Systeme kompensiert werden kann.
Die Vergabe von Krediten an Unternehmen und Privatpersonen birgt für den Gläubiger immer das Risiko des Kreditausfalls. Um Kreditrisiken einzuschätzen und steuern zu können, muss Kreditrisikomanagement betrieben werden. Neben den in der Praxis weit verbreiteten Methoden der Diskriminanzanalyse oder der logistischen Regression finden bei der Risikoeinschätzung zunehmend auch künstliche neuronale Netze Anwendung. Diese basieren auf dem Modell der Neuronen des biologischen Nervensystems.
Inhaltsangabe
Tabellenverzeichnis
Abbildungsverzeichnis
Abkürzungsverzeichnis
Symbolverzeichnis
1. Einleitung
2. Kreditrisikomanagement
2.1. Aufgaben und Ziele des Kreditrisikomanagements
2.2 Kreditwürdigkeitsanalyse im Rahmen des Kreditrisikomanagements
2.2.1 Anforderungen an die Modelle
2.2.2 Identifikation der eingehenden Merkmale
2.2.3 Modellbildung
2.2.4 Modell-Validierung
3. Künstliche neuronale Netze
3.1 Entwicklung künstlicher neuronaler Netze
3.2 Aufbau von künstlichen neuronalen Netzen
3.2.1 Bausteine und Strukturen künstlicher neuronaler Netze
3.2.2 Lernregeln
4. Anwendung künstlicher neuronaler Netze im Kreditrisiko-management
4.1 Theoretische Basis für die Anwendung in der Praxis
4.2 Eignung künstlicher neuronaler Netze für die Kreditrisikomessung
4.2.1 Vorteile künstlicher neuronaler Netze
4.2.2 Nachteile der künstlichen neuronalen Netze
4.2.3 Erfüllung der Modellanforderungen im Rahmen der Kreditwürdigkeitsprüfung
4.3 Anwendung in der Praxis
5. Beispiel einer Kreditrisikoberechnung mit einem selbstprogrammierten künstlichen neuronalen Netz
5.1 Datensimulation
5.1.1 Qualitative Daten
5.1.2 Quantitative Daten
5.2 Modellerstellung
5.3 Bewertung der Ergebnisse
5.3.1 Trainingsdaten
5.3.2 Validierungsdaten
6. Reduktionsmöglichkeit der Black Box Problematik
6.1 Fuzzy-Systeme
6.2 Neuro-Fuzzy-Systeme zur Reduktion der Black Box
7. Zusammenfassung und Ausblick
Anhang
Literaturverzeichnis
Quellenverzeichnis
Tabellenverzeichnis
Tabelle 1: Anforderungen an mathematische Modelle
Tabelle 2: Auswahl von Gütekriterien statistischer Modelle
Tabelle 3: Eignung künstlicher neuronaler Netze für die Kreditwürdigkeitsprüfung in Bezug auf mathematische und qualitative Anforderungen
Tabelle 4: Ausgewählte Kriterien zur Kreditwürdigkeitsprüfung
Tabelle 5: Ausprägungen der ausgewählten qualitativen Kriterien in Deutschland
Tabelle 6: Übertragung der Kriterien aus Tab. 5 auf eine quantitative Skala
Tabelle 7: Bruttogeldvermögensverteilung in der deutschen Bevölkerung 2013
Tabelle 8: Einkommensverteilung in Deutschland 2013
Tabelle 9: Ausgabenverteilung in Deutschland
Tabelle 10: Betrag und Anzahl der neu aufgenommenen Kredite von 2014 bis 2011
Tabelle 11: Dauer der Beschäftigung der Arbeitnehmer beim aktuellen Arbeitgeber (Stand 2014)
Tabelle 12: Dauer der Kontobeziehung von Privatkunden bei der aktuellen Bank
Tabelle 13: Annahmen Kreditausfall
Tabelle 14: Korrelationen der Kriterien mit der Ausfallwahrscheinlichkeit
Tabelle 15: Vergleich des berechneten und erwarteten Ergebnisses des künstlichen neuronalen Netzes
Tabelle 16: Risikogewichte im Standardansatz für Forderungen an Staaten, Banken und Unternehmen
Tabelle 17: Lernalgorithmen künstlicher neuronaler Netze
Abbildungsverzeichnis
Abbildung 1: Aufbau eines künstlichen neuronalen Netzes
Abbildung 2: Aufbau eines künstlichen Neurons
Abbildung 3: Aufbau eines biologischen Neurons
Abbildung 4: Altersverteilung in der deutschen Bevölkerung 2014
Abbildung 5: Kriterienausprägungen der Kreditnehmer 1 bis 35
Abbildung 6: Ergebnis der Berechnungen des neuronalen Netzes
Abbildung 7: Gewichtvektor des neuronalen Netzes
Abbildung 8: Darstellung des neuronalen Netzes
Abbildung 9: Struktur eines Fuzzy-Systems
Abbildung 10: Darstellung eines hybriden Neuro-Fuzzy-Systems
Abbildung 11: Darstellung des berechneten Gewichtvektors
Abbildung 12: Darstellung der gezeigten Operatoren in R (7)
Abkürzungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
Symbolverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
1. Einleitung
Die Vergabe von Krediten an Unternehmen und Privatpersonen birgt für den Gläubiger immer auch das Risiko des Kreditausfalls, d.h. ein Kreditnehmer kommt seinen Zahlungsverpflichtungen nicht mehr nach (Deutsche Bundesbank 1998, KWG §19.1). Das Kontrollieren und Vermeiden bzw. Begrenzen der Kreditrisiken einzelner Kreditnehmer und des gesamten Kreditportfolios gehört zu den Hauptaufgaben kreditgebender Unternehmen (vgl. Gleißner und Romeike 2008, S. 8f.). Damit Risiken adäquat eingeschätzt und gesteuert werden können, muss Kreditrisikomanagement betrieben werden. Dieses besteht aus drei Komponenten: die Ermittlung der Kreditrisiken, deren Steuerung und deren Überwachung (vgl. Springer Gabler Verlag, Stichwort Kreditrisikomanagement).
Ein Kreditrisikomanagement, das sowohl den potentiellen Gefahren eines Kreditausfalls Rechnung trägt, aber dennoch nicht so restriktiv ist, dass es Geschäftsmöglichkeiten beschränkt, ist Voraussetzung für eine rentable Risikostrategie und eine gewinnbringende Produktpolitik. Es ist dabei an enge aufsichtsrechtliche und gesetzliche Vorschriften gebunden (vgl. Knöchlein 2010).
Basis für ein funktionierendes Kreditrisikomanagement ist die Ermittlung der Kreditrisiken, für die die Ausfallwahrscheinlichkeiten der zu vergebenen Kredite berechnet werden. Neben Einzelfallanalysen, bei denen der Kreditantrag detailliert analysiert und jede einzelne Komponenten genau betrachtet wird (z.B. bei Hauskäufen, sehr hohen Darlehen), werden bei „Massenkrediten“, die einheitlich an eine große Menge von Kunden gegeben werden, oder bei der Beurteilung durch die Schufa statistisch-mathematische Verfahren angewendet (vgl. Schufa 2015). Mittels dieser Verfahren wird einheitlich die Kreditwürdigkeit potentieller Kreditnehmer eingeschätzt und Ausfallwahrscheinlichkeiten von (potentiellen) Forderungen bewertet.
Neben den in der Praxis weit verbreiteten Methoden der Diskriminanzanalyse oder der logistischen Regression finden zunehmend auch künstliche neuronale Netze Anwendung bei der Risikoeinschätzung. Sie basieren auf dem Modell der Neuronen des biologischen Nervensystems (vgl. Eisenbach 2005, S. 18). Sie sind ideal geeignet, Funktionswerte zu approximieren, die von vielen verschiedenen Merkmalen beeinflusst werden (vgl. Baumann 2010, S. S. 6).
In der vorliegenden Arbeit werden der Aufbau und die Verwendung von neuronalen Netzen erläutert sowie die Anwendung in der Praxis des Kreditrisikomanagements dargestellt. Eine Modellsimulation wird zeigen, zu welchen Ergebnissen das angewandte künstliche neuronale Netz bei zwei unterschiedlichen Datensätzen – einem Trainings- und einem Validierungsdatensatz – kommt. Neben den Vorteilen eines solchen Modells wird auch auf die Nachteile eingegangen, die die Praktikabilität künstlicher neuronaler Netze bis zum heutigen Zeitpunkt erheblich einschränken. Da der Hauptnachteil künstlicher neuronaler Netze deren „Black Box“-Charakter ist, wird abschließend in Kapitel 6 kurz darauf eingegangen, wie Fuzzy-Systeme ermöglichen können, diesen Nachteil zu kompensieren.
2. Kreditrisikomanagement
2.1. Aufgaben und Ziele des Kreditrisikomanagements
Das Kontrollieren und Managen von Kreditrisiken einzelner Kreditnehmer sowie des gesamten Kreditportfolios gehört zu den Hauptaufgaben von Banken (vgl. Gleißner und Romeike 2008, S. 9f.). Ein gut funktionierendes System zur Kreditrisikomessung ist dafür Voraussetzung (vgl. Knöchlein 2010, S. 6).
Ziel des Kreditrisikomanagements ist nicht nur die Reduktion von Kreditrisiken, um Verluste zu vermeiden und höhere Erträge zu erwirtschaften, sondern auch im Falle auftretender Kreditausfälle verschiedene Steuerungsmaßnahmen bereitzustellen, mit denen die angestrebten Unternehmensziele dennoch erreicht werden können (vgl. Sautter und Droste, S. 229). Dabei sollen durch die Prognostizierung der Ausfallwahrscheinlichkeiten kostenverursachende Fehler bei der Kreditvergabe vermieden werden. Hierbei werden zwei Fehlerarten unterschieden: Der „Fehler 1. Art“, bei dem ein eigentlich nicht kreditwürdiger Kunde einen Kredit erhält und der „Fehler 2. Art“, bei dem einem eigentlich kreditwürdigen Kunden kein Kredit gewährt wird. Die Kosten des Fehlers 2. Art sind Opportunitätskosten, die aus den entgangenen Zinseinnahmen resultieren. Kostenintensiver ist der Fehler 1. Art, der auf einer Fehleinschätzung beruht, die zu einem Zahlungsausfall in Höhe von Zins- und Tilgungszahlungen führen kann (vgl. Schelling 2009, S. 22).
Die Identifikation, Steuerung und Überwachung der Risiken sind für eine gute Risikostrategie essentiell. Die Identifikation der Kreditrisiken erfolgt durch mathematische Methoden zur Analyse des Datenbestandes und der Ermittlung der Ausfallwahrscheinlichkeit eines Kredites (vgl. Runge 2004, S. 9ff.). Mithilfe von Bonitätseinstufungen der Kunden werden Ausfallwahrscheinlichkeiten zugeordnet. Hier gilt: Je besser das jeweilige „Rating“, desto niedriger die Ausfallwahrscheinlichkeit. Daran werden in der Risikosteuerung die Kreditvergabeentscheidungen und Konditionengestaltungen ausgerichtet. So kann der Anteil potentieller Kreditausfälle im Gesamtportfolio vermindert werden. Im Rahmen der Risikoüberwachung werden die Prognosen den tatsächlich eingetretenen Ereignissen gegenüber gestellt. Bei gröberen Abweichungen werden die Berechnungsmodelle entsprechend modifiziert (vgl. Rudolph et al. 2012, S. 232f.).
Da Kreditausfälle nicht nur erheblichen Einfluss auf die Gewinn- und Verlustsituation und damit auf die Solvenz des jeweiligen Gläubigers haben, sondern auch das Finanzsystem im Allgemeinen destabilisieren können (vgl. Knöchlein 2010, S. 17), müssen eine Reihe aufsichtsbehördlicher Anforderungen bzgl. der Eigenkapitalausstattung eingehalten werden. Ein gut funktionierendes Kreditrisikomanagement ist Voraussetzung dafür, den in den Richtlinien von Basel I, II und III (vgl. Basler Ausschuss für Bankenaufsicht 2004) sowie in §10 KWG für Kreditinstitute vorgeschriebenen Eigenkapitalbedarf zur Verlustabdeckung transparent und nachvollziehbar zu ermitteln (vgl. Deutsche Bundesbank 1998).
Das zu hinterlegende Eigenkapital berechnet sich auf der Basis von Formel 2.1 (vgl. Runge 2004, S. 4f.):
Eigen kapital hinterlegung=Kreditäquivalent×Risikogewicht×8% (2.1)
Die zu verwendenden Risikogewichte sind in Tabelle 16 (siehe Anhang) abgebildet.
Grundsätzlich muss 8% der Summe der vergebenen Kredite hinterlegt werden. Durch die zusätzliche Berücksichtigung des Risikogewichts, d.h. der Ratingklasse bzw. Bonität des jeweiligen Kreditnehmers, muss der Kreditgeber je nach Ausfallwahrscheinlichkeit mehr oder weniger Eigenkapital hinterlegen.
Darüber hinaus wird von Basel II gefordert, dass klare Rahmenbedingungen und Richtlinien für den Bereich des Kreditgeschäfts und hohe Standards bei der Kreditvergabe angesetzt werden und eine regelmäßige Überwachung der Risikoermittlung gewährleistet wird (vgl. Basler Ausschuss für Bankenaufsicht 1988).
Das Kreditrisikomanagement ist daher nicht nur zur Erreichung der gewinnorientierten Unternehmensziele, sondern auch zur Erfüllung und Einhaltung aufsichtsrechtlicher Anforderungen notwendig.
2.2 Kreditwürdigkeitsanalyse im Rahmen des Kreditrisikomanagements
Zentrales Element der Kreditrisikoanalyse ist es, das Ausfallrisiko eines jeweiligen Kredits und des Kreditportfolios zu ermitteln. Dabei wird das Risiko als „auf unzureichenden Informationen beruhende Gefahr, dass zwischen einem tatsächlichen erzielten Wert und einem erwarteten zukünftigen Referenzwert eine negative Abweichung auftreten wird“ (Schierenbeck 1999, S. 15) definiert. Ein Kreditausfall liegt vor, wenn es entweder sehr unwahrscheinlich ist, dass der Kreditnehmer die Zahlungsverpflichtungen (Tilgung und Zins) voll erfüllen kann oder der Schuldner mehr als 90 Tage im Zahlungsverzug ist (vgl. Basler Ausschuss für Bankenaufsicht 2004, S. 106).
Um die Kreditwürdigkeiten potentieller Kreditnehmer einschätzen und die Ausfallwahrscheinlichkeiten von Forderungen bewerten zu können, werden statistisch-mathematische Verfahren eingesetzt. Dafür werden vorher identifizierte qualitative (personen- oder firmenabhängige Merkmale wie z.B. Beruf bzw. Branche) sowie quantitative (historische Finanzdaten wie z.B. Vermögen, Schulden bzw. Verbindlichkeiten, Jahresabschlusszahlen, Branchenanalysen) Bewertungskriterien personen- bzw. unternehmensspezifisch gewichtet und bewertet. So wird das Ausfallrisiko individuell und objektiv ermittelt, sodass der Gläubiger nicht nur eine Entscheidungsgrundlage für eine etwaige Verlängerung oder die Vergabe eines Kredits, sondern auch für die resultierenden Konditionen wie Zinssätze oder Kreditlinien erhält (vgl. Thonabauer und Raaji, S. 25f.)(HorschundSchulteÉ.
Mithilfe mathematisch-statistischer Methoden wie z.B. der logistischen Regressionsanalyse können die Informationen, die eine Bank bereits von Kreditnehmern gesammelt hat, analysiert und mögliche bestehende Zusammenhänge mit der Ausfallwahrscheinlichkeit erkannt werden (vgl. Kamp und Weichert 2006, S. 10). Die Unternehmensziele der Ertragssteigerung und Kostensenkung werden sowohl dadurch erreicht, „gute Kunden“ zu identifizieren und an diese Kredite zu vergeben, als auch dadurch, Ausfallkosten durch Vermeidung der Kreditvergabe an „schlechte“ Kunden einzusparen (vgl. Gleißner und Romeike 2008, S. 8).
2.2.1 Anforderungen an die Modelle
Die zur internen Bewertung der Ausfallwahrscheinlichkeiten verwendeten Modelle müssen neben allgemeinen mathematischen Anforderungen auch zahlreichen regulatorischen Anforderungen genügen, die vor allem in Basel II bzw. III, dem Bundesdatenschutzgesetz und im KWG verankert sind (vgl. Basler Ausschuss für Bankenaufsicht 2004; Deutsche Bundesbank 1998). Beispielsweise ist vorgeschrieben, dass bei der Berechnung so wenige Daten wie möglich eingehen sollen, um die Komplexität der Modelle zu reduzieren. Außerdem ist die Verwendung bestimmter sensibler personenbezogener Daten (z.B. Geschlecht, Religion, Hautfarbe, Staatsangehörigkeit) verboten. Darüber hinaus müssen Finanzinstitute die Anwendung und das Funktionieren der Systeme durch Aufsichtsbehörden kontrollieren lassen (vgl. Schröder 2014, S. 113ff., 123). Dabei ist sicherzustellen, dass die Modelle nachvollziehbar sind und begründet werden kann, warum welche Kriterien mit welcher Gewichtung eingehen.
Die mathematischen Anforderungen an die verwendeten Modelle sind in Tab. 1 dargestellt:
Abbildung in dieser Leseprobe nicht enthalten
Tab. 1: Anforderungen mathematische an Modelle (eigene Abbildung, in Anlehnung an (Henking et al. 2006) )
Abbildung in dieser Leseprobe nicht enthalten
2.2.2 Identifikation der eingehenden Merkmale
Zur Erstellung eines Modells für die Berechnung der Ausfallwahrscheinlichkeit bzw. Kreditwürdigkeit müssen zunächst die Kriterien, für die ein Zusammenhang mit der Ausfallwahrscheinlichkeit vermutet wird, auf der „long list“ zusammengetragen (vgl. Henking et al. 2006, Kap. 7.6.2).
In einem zweiten Schritt wird die Zielgröße, der Kreditausfall, definiert. Oft wird dafür die Definition von Basel II/III verwendet (siehe Kap. 2.2). Anschließend wird der „Prognosehorizont“ bestimmt – der Zeitraum, für den eine Aussage über die Kreditrückzahlung getroffen werden soll (vgl. Datschetzky und Thonabauer 2004, S. 70).
Um gute Prognosen für Ausfälle zu erhalten, muss das Modell auf einer ausreichend großen Stichprobe, der Entwicklungsstichprobe, basieren (vgl. hier und im Folgenden Henking et al. 2006, Kap. 7.6.2). Neben dieser sollte zusätzlich eine mit der Entwicklungsstichprobe disjunkte Validierungsstichprobe genommen werden, um nach der erfolgreichen Modellerstellung die Güte des Modells überprüfen zu können. Die Daten hierfür können aus internen (z.B. Personenstammdaten oder Kreditantragsdaten, bei denen der Kreditgeber seine wirtschaftliche Situation offen legen muss) oder externen (z.B. von der Schufa oder Datenverkäufen) Quellen stammen. Für eine realistische Prognose ist die Qualität der gesammelten Daten entscheidend, d.h. die Daten müssen möglichst fehlerfrei und plausibel sein.
Nach der Stichprobenerhebung erfolgt die Durchführung univariater Analysen zur Identifikation der relevanten Merkmale, die einen Einfluss auf die spätere Kreditwürdigkeit haben. Die Ausprägungen der Merkmale von der „long list“ werden in Bezug auf die Rückzahlungsfähigkeit untersucht. Auf dieser Basis wird die Trennfähigkeit der einzelnen Merkmale, also die Eignung eines Merkmals als Indikators für die Ausfallwahrscheinlichkeit, ermittelt. Der berechnete Zusammenhang wird anschließend auf Plausibilität untersucht. Die als gute Indikatoren für die Ausfallwahrscheinlichkeit identifizierten Merkmale werden auf der „short list“ zusammengefasst.
Dabei ist jedoch zu beachten, dass kein Merkmal durch andere nahezu komplett erklärt wird, d.h. multikollinear ist (vgl. Schröder 2014, S. 28f.). Außerdem müssen auch starke Indikatoren für die Ausfallwahrscheinlichkeit eines Kreditnehmers ausgeschlossen werden, wenn sie aus geschäftspolitischen oder rechtlichen Gründen nicht einbezogen werden dürfen. Daneben können bestimmte Merkmale in das Modell aufgenommen werden, obwohl sie eine niedrige Trennfähigkeit aufweisen, aber trotzdem in das Modell einbezogen werden sollen.
2.2.3 Modellbildung
Bei der Konstruktion des Modells wird bezüglich des verwendeten Verfahrens zwischen parametrischen – wie die logistische Regression oder die lineare Diskriminanzanalyse – und nicht-parametrischen unterschieden. Nichtparametrische Verfahren sind beispielsweise das Entscheidungsbaumverfahren oder die in dieser Arbeit bearbeiteten künstlichen neuronale Netze (vgl. Nösslinger und Thonabauer 2004, S. 59ff.).
Parametrische Tests sind verteilungsgebunden und ziehen Parameter wie den Mittelwert oder die Varianz einer Stichprobe heran und setzen das Vorliegen einer bestimmten Verteilung der Stichprobendaten (z.B. Normalverteilung) voraus. Dies ist bei den nicht-parametrischen (verteilungsfreien) Tests nicht der Fall, denn diese sind unabhängig von bestimmten Verteilungen oder Skalierungen der Daten (vgl. Schäfer 2009, S. 1f.)
Allen Modellen gemeinsam ist die Berechnung der Ausfallwahrscheinlichkeiten, die im weiteren Verlauf der Kreditrisikosteuerung als Basis zur Bildung von Ratingklassen dienen, anhand derer die Kreditvergabeentscheidung sowie die Konditionengestaltung ausgerichtet werden.
2.2.4 Modell-Validierung
Die Überprüfung der Modelle erfolgt im Rahmen einer quantitativen und qualitativen Validierung. Die auf den Ausfallraten basierende Trennschärfe zwischen kreditwürdigen und nicht kreditwürdigen Kreditnehmern sowie die Genauigkeit der Voraussagen werden mithilfe der in der Vorbereitung für die univariate Analyse gezogenen Validierungsstichprobe überprüft (vgl. Deutsche Bundebank 2003, S. 62ff.).
Gütemaße, die für solche Überprüfungen verwendet werden, wie beispielsweise die Fehler- bzw. Trefferquote, sind in Tabelle 2 abgebildet.
Abbildung in dieser Leseprobe nicht enthalten
Tab. 2: Auswahl von Gütekriterien statistischer Modelle (eigene Abbildung, in Anlehnung an Deutsche Bundebank 2003)
Neben der quantitativen Analyse werden auch qualitative Kriterien wie die Plausibilität der Daten und der eingehenden Merkmalsbeziehungen herangezogen werden. Bei einer schlechten Bewertung in einem der beiden Bereiche muss das Modell nochmal angepasst werden, um verwendet werden zu dürfen. Neben dieser einmaligen Validierung im Anschluss an die Modellerstellung werden die Modelle jährlich auf Portfolioebene getestet. Im Rahmen dieses Monitoring werden bei stark abweichenden Ausfallraten oder schlechter werdenden Trennschärfen Anpassungen vorgenommen. In größeren Abständen – i.d.R. alle drei Jahre – wird daher ein mehr in die Tiefe gehendes „Backtesting“ durchgeführt, um die Einsatzfähigkeit und Qualität der verwendeten Modelle zu gewährleisten. Auch von Aufsichtsbehörden werden in regelmäßigen Abständen Überprüfungen der Modelle durchgeführt (Gespräch vom 04.11.15).
3. Künstliche neuronale Netze
3.1 Entwicklung künstlicher neuronaler Netze
Die Entscheidung, welches Modell für die Ermittlung der Ausfallwahrscheinlichkeiten gewählt wird, hängt u.a. von seiner Praktikabilität im spezifischen Anwendungsfall und seiner Prognosequalität ab. Die Anwendung künstlicher neuronaler Netze wäre dafür besonders geeignet, wenn sehr viele Parameter vorhanden und die statistische Verteilung der Parameter sowie die Zusammenhänge zwischen den Parametern unbekannt sind (vgl. Werner, S. 3).
Die künstlichen neuronalen Netze sollen die Vorteile von Computern und dem menschlichen Gehirn verknüpfen. Die Schnelligkeit der Computer beim Lösen von Algorithmen wird mit der Fähigkeit des menschlichen Gehirns, Dinge zu erkennen und zu erlernen und dann auch trotz fehlerhaften „Inputs“ die Informationen richtig zu verarbeiten, kombiniert (vgl. Pacelli und Azzollini, S. 105ff.).
Erstmals haben sich im Jahr 1943 Warren McCulloch und Walter Pitts mit einem künstlichen Neuronenmodell beschäftigt. Auf dieser Idee basierend wurden immer bessere Lernalgorithmen und Modelle entwickelt. Bereits 1958 wurde der erste Neurocomputer („Mark I Perceptron“) erfolgreich programmiert. Mit der Entwicklung des Backpropagations-Lernalgorithmus im Jahre 1986 intensivierte sich die Forschung auf diesem Thema und die Anwendbarkeit derartiger Modelle wird kontinuierlich weiterentwickelt (vgl. Kriesel, S. 9ff.).
Das Besondere an neuronalen Netzen ist, dass sie selbstständig lernen und sich anpassen können. Nach einmaliger Programmierung und einem Training mithilfe von Trainingsdaten können sie nicht nur die erlernten, sondern auch ähnliche Aufgaben ohne weitere menschliche Eingriffe lösen. Außerdem können neuronale Netze auch bei unvollständigem oder falschem Input noch korrekte Ergebnisse erzielen (vgl. Kriesel, S. 4).
Diese Eigenschaften machen neuronale Netze interessant für die Anwendung in der Statistik, Wirtschaftswissenschaft – hier u.a. in der Prognose von Aktienkursen oder im Kreditrisikomanagement –, Technik, Medizin und vielen weiteren Gebieten. Ihre Hauptanwendungsgebiete sind die Mustererkennung, bei der z.B. Texte oder Gesichter erkannt oder Daten klassifiziert werden sollen, die Vorhersage – beispielsweise in der Medizin zur Vorhersage von Krankheiten auf Basis der Symptome – sowie die Problemoptimierung (vgl. Strecker und Schwickert 1997, S. 4).
3.2 Aufbau von künstlichen neuronalen Netzen
3.2.1 Bausteine und Strukturen künstlicher neuronaler Netze
Der Aufbau künstlicher neuronaler Netze basiert auf dem biologischer neuronaler Netze. Künstliche neuronale Netze bestehen aus zahlreichen Neuronen, die in mindestens drei Schichten aufgeteilt sind (siehe Abb. 1):
- die Eingabeschicht,
- eine oder mehrere verdeckte Schichten (Hidden Layers) und
- eine Ausgabeschicht.
Die Neuronen der Eingabeschicht sind die Komponenten des Eingabevektors, der die Signale der Außenwelt (Daten, Muster) in das Netz einspielt, und die Neuronen der letzten Schicht geben Signale an die Außenwelt (Output) ab (vgl. Gouvêa und Gonçalves 2007, S. 15f.).
Künstliche Neuronen bestehen wie ihre biologischen Vorbilder aus einem Zellkörper und mehreren Dendriten (siehe Abb. 2 und 3).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 1: Aufbau eines künstlichen neuronalen Netzes (Quelle: google.de/wirtschaftslexikon)
Abbildung in dieser Leseprobe nicht enthalten
Abb. 2: Aufbau eines künstlichen Neurons (Quelle: Michael Baumann 2011 , veränderte Abbildung)
Abbildung in dieser Leseprobe nicht enthalten
Abb. 3: Aufbau eines biologischen Neurons (Quelle: Michael Baumann, 2011)
Wie aus den Abbildungen hervorgeht, sind die Neuronen durch gerichtete Kanten verbunden. Diese Verbindungen sind mit Gewichten versehen, die den Einfluss des Wertes des vorangehenden Neurons auf das betrachtete Neuron spezifiziert. Diese Gewichte werden durch den Gewichtsvektor dargestellt. Je größer der Betrag des Verbindungsgewichts ist, desto stärker beeinflusst das vorangehende Neuron das nachfolgende. Dabei können drei Einflüsse unterschieden werden (vgl. Oberhofer und Zimmerer 1996, S. 8):
- Das Gewicht ist positiv ( ): Das Neuron übt einen exzitatorischen bzw. erregenden Einfluss auf das Neuron aus.
- Das Gewicht ist negativ ( ): Das Neuron übt einen inhibitorischen bzw. hemmenden Einfluss auf das Neuron aus.
- Das Gewicht ist Null ( : Zwischen den beiden Neuronen existiert keine Verbindung oder es besteht kein Einfluss.
Diesen Gewichten kommt eine zentrale Bedeutung zu, da diese während des Lernprozesses angepasst werden und in ihnen das Wissen eines neuronalen Netzes gespeichert ist (vgl. Oberhofer und Zimmerer 1996, S. 14).
Anhand der Struktur dieser Verbindungen können zwei Netztypen unterschieden werden: Netze ohne Rückkopplung (Feedforward-Netze) – die Informationen werden nur in eine Richtung weitergegeben, es existieren keine Verbindungen, die von einem Neuron wieder zurück zu diesem Neuron führen – und rekkurente Netze, bei denen Rückkopplungen existieren, die von Neuronen einer Schicht zu anderen Neuronen derselben oder einer vorangegangenen Schicht führen (vgl. Gouvêa und Gonçalves 2007, S. 16).
Wie werden nun die Informationen in dem neuronalen Netz weitergegeben?
[Abbildung in dieser Leseprobe nicht enthalten] bezeichne die Komponenten des Eingabevektors und die Verbindungsgewichte zwischen den Neuronen. Die Informationen des Eingangsvektors, die über die Eingabeschicht in das neuronale Netz gelangen, werden mit ihren jeweiligen Gewichtungen an jedem nachfolgenden Neuron zusammengefasst. Dies ergibt an jedem Neuron einen bestimmten Aktivitätslevel (vgl. Oberhofer und Zimmerer 1996, S. 11f.).
Innerhalb des Zellkörpers kann zwischen dem Netzinput und dem Aktivitätslevel unterschieden werden. Der gesamte Input eines Neurons, der Netzinput, berechnet sich aus der Summe aller Inputs, die das Neuron empfängt. Diese wiederum sind abhängig von dem gewichteten Aktivitätslevel des vorangehenden Neurons , wobei das Gewicht der Verbindung zwischen dem sendenden und empfangenden Neuron ist (vgl. Oberhofer und Zimmerer 1996, S. 12):
Abbildung in dieser Leseprobe nicht enthalten
Der Aktivitätslevel des empfangenden Neurons wird zur Weitergabe an das darauffolgende Neuron mithilfe der Outputfunktion zum Output überführt. Diese Funktion hängt wiederum von einer nicht-linearen Transformationsfunktion und einem bestimmten Schwellenwert ab. Die dafür verwendete Transformationsfunktion soll den Output auf einen Wertebereich zwischen und begrenzen, wofür beispielsweise eine logistische Funktion gewählt werden kann. Durch die Transformation des Aktivitätslevels berechnet sich ein Wert, der mit dem Schwellenwert verglichen wird (vgl. hier und im Folgenden Franke et al. 2004, S. 394ff.):
Abbildung in dieser Leseprobe nicht enthalten
Den resultierenden Output gibt das sendende Neuron anschließend an jedes seiner nachfolgenden Neuronen in Form des Aktivitätslevels[Abbildung in dieser Leseprobe nicht enthalten] weiter.
Um die Darstellung mit dem Schwellenwert zu vereinfachen, wird oft der Ausdruck des Netzinputs so modifiziert, dass eine neue Variable mit dem Gewicht[Abbildung in dieser Leseprobe nicht enthalten] und den zugehörigen Merkmalswert[Abbildung in dieser Leseprobe nicht enthalten] mit einbezogen werden. Diese neue Verbindung bzw. Variable nennt sich „Bias“ oder „Intercept“. So kann das neuronale Netz auch den Schwellenwert der Neuronen immer wieder anpassen und optimieren. Dadurch gilt folgendes Äquivalent:
Abbildung in dieser Leseprobe nicht enthalten
3.2.2 Lernregeln
Bevor künstliche neuronale Netze selbstständig Anpassungen vornehmen und eigenständig Aufgaben lösen können, werden sie in der Trainingsphase mit dem vorgegebenen Lernmaterial (Trainingsdaten) auf die Aufgabe vorbereitet und trainiert. Nachdem in der Validierungsphase das Modell überprüft wurde, werden in der Anwendungsphase die künstlichen neuronalen Netze auf Datensätze angewendet, deren Outputs noch nicht bekannt sind (vgl. Oberhofer und Zimmerer 1996, S. 14).
Damit das neuronale Netz lernen kann, wird eine Lernregel programmiert, anhand derer sich das Netz selbst modifiziert. Normalerweise betreffen diese Algorithmen die Verbindungsgewichte und geben vor, welche Gewichte sich wie stark verändert sollen. Diese Regeln können in mehrere Kategorien eingeteilt werden (vgl. Kriesel, S. 53ff.):
Die erste Gruppe des Lernens ist das überwachte Lernen (supervised learning), bei der dem Netz für jeden Input das richtige Output vorgegeben wird und anhand der Differenz des richtigen Outputs und dem berechneten Output des neuronalen Netzes eine Korrektur der Gewichte erfolgt. Bei der Methode des bestärkenden Lernens (reinforcement learning) bekommt das Netz lediglich die Information, ob sein Output richtig oder falsch war. Beim unüberwachten Lernen (unsupervised learning) passt das Netz ganz ohne vorgegebenen Output die Gewichte an und betrachtet dabei Ähnlichkeiten der Inputdaten (Eisenbach 2005, S. 23).
Innerhalb dieser groben Kategorien gibt es unterschiedliche Lernregeln, die in Tab. 17 (siehe Anhang) aufgeführt sind. In dieser Arbeit soll das „Backpropagation“-Verfahren als Lernregel zugrunde gelegt werden, da die heutigen neuronalen Netze hauptsächlich auf diesem Lernalgorithmus basieren.
Da innerhalb der Neuronen der Hidden Layer (die verdeckten Schichten) keine direkte Bestimmung von Fehlern möglich ist, wird anhand von drei Schritten die Modifikation der Gewichte durch eine Rückwärtsausbreitung der Fehlerterme vollzogen (vgl. Eisenbach 2005, S. 23f.):
1. Forward-Pass: Hier werden Reize an die Input-Neuronen gegeben und der Output des neuronalen Netzes berechnet.
2. Fehlerbestimmung: Nun werden die gewünschten Output-Werte mit den tatsächlich ermittelten Werten verglichen. Bei Überschreiten der Fehler einer vorgegebenen Güteschwelle geht das Verfahren mit dem dritten Schritt weiter, ansonsten bricht es ab.
3. Backward-Pass: Es folgt die Ausbreitung der Fehlerterme in entgegengesetzter Richtung bis zur Input-Schicht – zunächst zwischen dem Output- und dem letzten Hidden-Layer, dann zwischen dem letzten und vorletzten Hidden-Layer usw.). Die Gewichte werden dabei schrittweise zur Reduktion der Fehlerterme modifiziert. Dies wird so lange wiederholt, bis ein lokales oder globales Minimum oder die maximale Wiederholungsanzahl erreicht ist.
4. Anwendung künstlicher neuronaler Netze im Kreditrisiko-management
4.1 Theoretische Basis für die Anwendung in der Praxis
Nachdem in den vorangegangenen Kapiteln auf das Kreditrisikomanagement und die damit einhergehende Berechnung von Kreditausfallwahrscheinlichkeiten eingegangen wurde sowie die theoretischen Grundlagen für die Anwendung künstlicher neuronaler Netze beschrieben wurden, wird nun verknüpfend darauf eingegangen, wie künstliche neuronale Netze bei der Berechnung der Ausfallwahrscheinlichkeiten Anwendung finden.
Bereits in den 90er Jahren wurden künstliche neuronale Netze im finanziellen und ökonomischen Sektor zur Lösung ökonomischer Probleme herangezogen (vgl. Vellido et al.), vor allem für Klassifikationsprobleme zur „Bank failure prediction“ (vgl. Tam und Kiang) und zur „stocks classification“ (vgl. Kryzanowski et al.). Dabei konnte beobachtet werden, dass neuronale Netzwerke wesentlich bessere und genauere Ergebnisse als die herkömmlichen Methoden erzielten, vor allem, wenn die Beziehungen zwischen den Variablen unbekannt sind (vgl. Angelini et al. 2007, S. 745ff.).
Um ein auf künstlichen neuronalen Netzen basierendes Modell für die Kreditwürdigkeitsprüfung zu erstellen, wird der Merkmalsvektor[Abbildung in dieser Leseprobe nicht enthalten] mit den Kriterien1,...,j und einem beliebigen korrespondierenden Gewichtsvektor [Abbildung in dieser Leseprobe nicht enthalten] eingegeben. Wie bereits in Kapitel 3.2.1 erklärt, geben die Neuronen das Output an die nachfolgenden Neuronen weiter, wenn dessen modifizierter Aktivitätslevel (Formel 3.4) größer als 0 ist:
Abbildung in dieser Leseprobe nicht enthalten
Die Transformationsfunktion kann beliebig gewählt werden, muss jedoch den Wertebereich zwischen und halten. Im Rahmen dieser Arbeit wird – wie häufig in der Praxis – als Transformationsfunktion die logistische Regressionsfunktion angenommen (vgl. und im Folgenden Franke et al. 2004, S. 357f. und Kap. 20):
Abbildung in dieser Leseprobe nicht enthalten
Zur Berechnung der Ausfallwahrscheinlichkeiten werden nun Neuronen in einem oder mehreren Hidden Layer(s) kombiniert. Zur Komplexitätsreduktion werden in dieser Arbeit nur künstliche neuronale Netze mit nur einer verdeckten Schicht betrachtet:
Abbildung in dieser Leseprobe nicht enthalten
Dabei ist [Abbildung in dieser Leseprobe nicht enthalten] die Ausfallwahrscheinlichkeit mit dem Parametervektor der Gewichte [Abbildung in dieser Leseprobe nicht enthalten]. Die Gewichte [Abbildung in dieser Leseprobe nicht enthalten] bezeichnen dabei die „Bias“-Gewichte zu den Eingangsneuronen und[Abbildung in dieser Leseprobe nicht enthalten] die Verbindungsgewichte, die von diesen ausgehen: von dem Eingangsvektor zu den Neuronen der ersten verdeckten Schicht. Die Gewichte der Verbindungen zwischen den verdeckten Neuronen und der Ausgabeschicht werden analog mit bezeichnet, wobei davon ausgegangen wird, dass sich in der Ausgabeschicht nur ein Neuron befindet – der Output ist somit ein numerischer Wert.
Zur Schätzung der Ausfallwahrscheinlichkeit muss die log-likelihood-Funktion für die individuelle Ausfallwahrscheinlichkeit eines Kreditantragsstellers gebildet werden:
Abbildung in dieser Leseprobe nicht enthalten
Die Likelihood-Funktion beträgt daher
Abbildung in dieser Leseprobe nicht enthalten
oder äquivalent
Abbildung in dieser Leseprobe nicht enthalten
Und die entsprechende log-likelihood-Funktion ist:
Abbildung in dieser Leseprobe nicht enthalten
oder äquivalent
Abbildung in dieser Leseprobe nicht enthalten
Die log-likelihood-Funktion (Formel 3.11/3.12) wird maximiert, um den Schätzer[Abbildung in dieser Leseprobe nicht enthalten] für die einzelnen Komponenten des Gewichtsvektors zu erhalten. Mit diesem Schätzer kann schließlich die Ausfallwahrscheinlichkeit berechnen werden:
Abbildung in dieser Leseprobe nicht enthalten
4.2 Eignung künstlicher neuronaler Netze für die Kreditrisikomessung
4.2.1 Vorteile künstlicher neuronaler Netze
Weil künstliche neuronale Netze keine speziellen Annahmen bezüglich der Daten fordern und auch sonst keine formalen Spezifikationen benötigt werden, ist die Verwendung von neuronalen Netzen beispielsweise bei Daten, deren Verteilungen und Merkmalskorrelationen unbekannt sind, sehr viel einfacher als die zurzeit verwendeten parametrischen Modellen, für die man die entsprechenden Verteilungen zuvor bestimmen muss. Darüber hinaus können sie beliebige und komplexe Zusammenhänge zwischen zwei oder mehr Variablen abbilden. Nicht nur in der Trainingsphase, sondern auch während des endgültigen Einsatzes können sich die Netze den Daten und den sich mit der Zeit ändernden Zusammenhänge anpassen. Durch ihre Lernfähigkeit werden so immer genauere Ergebnisse erzielt, selbst, wenn die Eingabedaten unvollständig oder ungenau sind (vgl. Eisenbach 2005, S. 31).
Damit sind neuronale Netze in ihrer Anwendung flexibler und anpassungsfähiger sowie auch bei ungenauen Datensätzen hilfreicher als andere Modelle wie z.B. die logistische Regressionsanalyse.
4.2.2 Nachteile der künstlichen neuronalen Netze
Den Vorteilen, auch ungenaue Daten in sinnvolle Outputs zu verwandeln, stehen jedoch erhebliche Nachteile gegenüber. Bei Verwendung vieler Parameter steigt mit der Größe des Eingabevektors auch die Größe und Komplexität des Netzes. Durch die vielen Verbindungen werden entsprechend mehr Trainingsdurchläufe benötigt, was einen unverhältnismäßig hohen Zeitaufwand erfordert und eine Verwendung in der Praxis einschränkt. Außerdem ist es nicht möglich, bereits bekannte Sachverhalte zu implementieren, sodass das neuronale Netz alle Zusammenhänge selber erkennen und berechnen muss (vgl. Eisenbach 2005, S. 31f.).
Eigen ist allen nicht-parametrischen Verfahren und damit auch den künstlichen neuronalen Netzen der Nachteil des „Overfittings“ – die Gefahr, dass sich die Modelle zu stark an die Trainingsdaten anpassen und nicht mehr generalisierungsfähig sind (vgl. Eisenbach 2005, S. 26). So stellte die Abteilung „Retail Rating Methodologies“ der Deutschen Bank bei der Anwendung künstlicher neuronaler Netze fest, dass die Trennschärfe bei den Trainingsdaten hervorragend war, bei den Validierungsdaten jedoch schlechter wurde (Gespräch vom 04.11.15). Das ist vor allem der Fall, wenn die Trainingsdaten zu große Unterschiede untereinander aufweisen oder zu viele Trainingsläufe durchgeführt wurden und die Neuronen die Ergebnisse nur „auswendig“ lernen (vgl. Werner, S. 10).
All diese „kleineren“ Probleme ließen es dennoch zu, künstliche neuronale Netze in die Praxis einzubinden. Ein bisher ungelöstes Problem bereitet jedoch große Schwierigkeiten bei der Interpretation und Erklärung der Ergebnisse: Das Verhalten der künstlichen neuronalen Netze als „Black Box“.
Nach Eingabe der Daten erhält der Anwender Ergebnisse aus der Berechnung des künstlichen neuronalen Netzes, aber es ist nicht nachvollziehbar, wie diese Ergebnisse zustande gekommen sind. Die Informationen und das „Wissen“ neuronaler Netze sind in den Verbindungsgewichten kodiert und auf das ganze Netzwerk verteilt. Künstliche neuronale Netze geben zwar auf jeden Input einen Output aus, aber es kann nicht begründet oder erklärt werden, welche Berechnung sich die Netze „ausgedacht“ haben (vgl. Werner, S. 11).
Das Black Box-Verhalten künstlicher neuronaler Netze verhindert zum größten Teil die Anwendung nicht nur im Kreditrisikomanagement, sondern auch in den eingangs erwähnten Bereichen, in denen sie nützlich sein könnten.
Im Kreditrisikomanagement ist nicht nur die Erklärbarkeit der Methoden, sondern auch der Ergebnisse Voraussetzung hinsichtlich der daraufhin zu treffenden bankinternen Entscheidungen (z.B. Bestimmung der Konditionen einzelner Kredite) und bezüglich der Offenlegungsvorschriften seitens der Aufsichtsinstitute wie BaFin oder die EZB. Sowohl die Methoden als auch die eingehenden Daten, deren Zusammenhänge und Gewichtungen sind detailliert darzulegen und zu erklären (vgl. Basler Ausschuss für Bankenaufsicht 2004). Da auf Basis der ermittelten Kreditrisiken der zu hinterlegende Eigenkapitalbedarf der Bank berechnet wird, muss nachvollziehbar sein, wie die Ergebnisse zustande gekommen sind. Solange eine derart detaillierte Interpretation der Ergebnisse und Berechnungen bei künstlichen neuronalen Netzen nicht möglich ist, ist eine praktische Anwendung in der Kreditrisikoberechnung nicht möglich.
4.2.3 Erfüllung der Modellanforderungen im Rahmen der Kreditwürdigkeitsprüfung
Damit künstliche neuronale Netze im Kreditrisikomanagement verwendet werden können, müssen sie den regulatorischen sowie mathematischen Anforderungen entsprechen, was im Folgenden geprüft wird.
Mathematische Kriterien
Die in Tab. 1 (Kapitel 2.2.1) bereits definierten mathematischen Modellanforderungen der „Zielgröße Ausfallwahrscheinlichkeit“, „Vollständigkeit“, „Objektivität“, „Akzeptanz“ und „Widerspruchsfreiheit“ sowie andere wichtige Aspekte zur Anwendung und Praktikabilität eines Modells sind in Tab. 3 für das künstliche neuronale Netz bewertet.
Die folgende Übersicht zeigt, dass die mathematischen Modellanforderungen von künstlichen neuronalen Netzen grundsätzlich erfüllt werden.
Abbildung in dieser Leseprobe nicht enthalten
Tab. 3: Eignung künstlicher neuronaler Netze für die Kreditwürdigkeitsprüfung in Bezug auf mathematische und qualitative Anforderungen (eigene Abbildung)
Regulatorische Anforderungen
Von den Aufsichtsbehörden wird gefordert, dass sowohl der Rechenweg als auch die Ergebnisse der Modelle, die als Basis für die Berechnung der Eigenkapitalhinterlegung dienen, sehr gut nachvollziehbar und interpretierbar sein müssen sowie die Kriteriengewichtungen logisch und begründbar sind (vgl. Basler Ausschuss für Bankenaufsicht 2004). Da dies aufgrund des Black Box-Charakters der künstlichen neuronalen Netze nicht sichergestellt werden kann, führt dieses Problem dazu, dass diese Form der Modelle für die Kreditrisikoberechnung aus regulatorischer Sicht bislang nicht akzeptiert wird (Gespräch vom 04.11.15).
4.3 Anwendung in der Praxis
Zur Berechnung der Kreditwürdigkeiten und Ausfallwahrscheinlichkeiten werden aufgrund der oben dargestellten Nachteile vor allem parametrische Modelle wie die logistische Regression verwendet, seltener aber auch nicht-parametrische Verfahren wie das Entscheidungsbaumverfahren verwendet (Gespräch vom 04.11.15). Mit der Zeit finden auch künstliche neuronale Netze zunehmende Verwendung in diesem Bereich, wenngleich ihre Verbreitung vor allem wegen der Problematik der „Black Box“ – die ausgeführten Berechnungen der neuronalen Netze sind nicht transparent – noch nicht sehr fortgeschritten ist.
Inwiefern künstliche neuronale Netze in der Praxis Anwendung finden, zeigt das Team „Retail Rating Methodologies“ der Deutschen Bank AG, Frankfurt: Als Benchmarking-Methode. Das bedeutet, dass mit ihnen parallel zu den eigentlich verwendeten Modellen die Ausfallwahrscheinlichkeiten und damit die Kreditwürdigkeiten für die gleichen Datensätze berechnet werden. Die Ergebnisse dienen aber nicht als Grundlage für die weiteren Entscheidungen bezüglich der Kreditvergabe und der Konditionen, sondern werden mit den Ergebnissen der anderen verwendeten Methoden verglichen. Wenn die errechneten Ausfallwahrscheinlichkeiten der künstlichen neuronalen Netze signifikant besser sind, werden die angewandten Modelle überprüft und entsprechend angepasst (Gespräch vom 04.11.2015).
Auch wenn künstliche neuronale Netze im Rahmen der eigentlichen Kreditrisikoanalyse in der Praxis trotz ihrer Vorteile keine Anwendung finden, zeigt dieses Beispiel der Deutschen Bank AG, dass man sich die Vorteile künstlicher neuronaler Netze durchaus zu Nutze machen kann. Auch wenn sie „nur“ dazu dienen, andere Modelle zu überprüfen und anzupassen.
Wie eine solche Berechnung der Ausfallwahrscheinlichkeiten einzelner Kreditnehmer aussehen könnte und wie genau die Ergebnisse sind, wird in Kapitel 5 anhand eines Datenbeispiels gezeigt.
5. Beispiel einer Kreditrisikoberechnung mit einem selbstprogrammierten künstlichen neuronalen Netz
5.1 Datensimulation
Im Folgenden soll anhand eines selbst programmierten Beispiels gezeigt werden, wie die Ausfallwahrscheinlichkeiten bzw. Kreditwürdigkeiten der einzelnen Kreditantragssteller mithilfe eines künstlichen neuronalen Netzes berechnet werden können. Die Berechnungen wurden mit der Open Source Software „R“ durchgeführt. Eine detaillierte Beschreibung und die Erklärung der verwendeten Operatoren kann dem Anhang entnommen werden (Anhang).
Da für dieses Beispiel der Berechnung von Kreditwürdigkeiten aus Datenschutzgründen kein „realer“ Datensatz weder von Banken noch von der Schufa zur Verfügung gestellt wurde, werden die Ausprägungen der potentiell in das Modell eingehenden Kriterien („long list“) der Kreditnehmer simuliert. Dabei handelt es sich um eine Auswahl typischer für die Kreditwürdigkeitsprüfung verwendeten qualitativen und quantitativen Kriterien. Als Kreditnehmer werden hier ausschließlich Privatpersonen betrachtet.
Wie in den Modellen üblich, ist die abhängige Variable, die Zielvariable, die Ausfallwahrscheinlichkeit. Der Ausfallbegriff wird analog zur Definition des Baseler Ausschusses von 2004 angenommen: Bei einem Zahlungsverzug von 90 Tagen oder wenn die Rückzahlung als sehr unwahrscheinlich eingestuft wird (beispielsweise bei Antrag einer Insolvenz des Kreditnehmers) (vgl. Basler Ausschuss für Bankenaufsicht 2004, S. 106). Wenn ein Kredit ausgefallen ist, bekommt er die Zahl 1 zugeteilt (die Ausfallwahrscheinlichkeit beträgt 100%), wenn der Kredit vertragsgemäß zurückgezahlt wurde, die Zahl 0. Die unabhängigen Variablen der „long list“, aus denen sich die Ausfallwahrscheinlichkeit berechnen soll, sind die in Tabelle 4 zusammengefassten Kriterien bzw. deren Ausprägungsmöglichkeiten.
Zwar ist für eine umfassende Beurteilung der Kreditwürdigkeit eine sehr genaue Evaluation der einzelnen Kreditnehmer nötig. Dieser sind aber insbesondere durch das Datenschutzgesetz (vgl. Bundesministerium der Justiz für Verbraucherschutz 1990) Grenzen gesetzt.
Beispielsweise kam in dem Gespräch mit Herrn Dr. Adler von der Abteilung „Retail Rating Methodologies“ der Deutschen Bank AG heraus, dass die beiden häufigsten Gründe für einen Kreditausfall Arbeitslosigkeit und Scheidung bzw. Trennung sind – man kann jedoch nicht genau genug vorhersagen, ob die Beziehung oder Beschäftigung des Kreditnehmers stabil ist und bleiben wird (Gespräch vom 04.11.15).
Da für das Training künstlicher neuronaler Netze eine große Datenmenge benötigt wird, werden die Ausprägungen dieser Kriterien für insgesamt 15.000 „Kreditnehmer“ simuliert, von denen 10.000 zum Training sowie 5.000 zur Validierung des Modells dienen. Die beiden Stichproben überschneiden sich dabei nicht. Damit nicht die Gefahr eingegangen werden muss, dass die simulierten Kriterien keinen Zusammenhang mit den ebenfalls simulierten Ausfallwahrscheinlichkeiten aufweisen, wird die Information, ob der Kredit eines Kreditnehmers ausgefallen ist oder nicht, wird manuell bestimmt. Wie die Bestimmung erfolgt, wird in Kapitel 5.2 ausführlich erklärt. Insgesamt enthalten die einzelnen Untergruppen der Daten 75% kreditwürdige und 25% nicht kreditwürdige Kreditnehmer, um ein gutes Training des neuronalen Netzes gewährleisten zu können. Zwar ermittelte die Schufa eine Kreditrückzahlungsquote von 97,5% der Ratenkredite in Deutschland (vgl. Schufa 2015), aber bei Trainingsdaten, die auf dieser geringen Ausfallanzahl basieren, konnte das im Beispiel programmierte künstliche neuronale Netz keine Zusammenhänge der Kriterien mit den Ausfällen erkennen. Daher wurde der Anteil der Ausfälle in dem Datensatz auf 25% erhöht.
Bestimmte Ausprägungen von Kriterien oder Ausprägungskombinationen können auch K.O.-Kriterien für die Kreditvergabe sein. Weist ein Kreditantragssteller eine bestimmte Ausprägung eines solchen Kriteriums (z.B. Arbeitslosigkeit, Minderjährigkeit) auf, wird dieser nicht weiter überprüft und als nicht kreditwürdig eingestuft. Derartige Fälle wurden für dieses Beispiel ausgeschlossen, es wird daher angenommen, dass kein Kreditantragssteller minderjährig oder nicht erwerbstätig ist. Die Anteile der jeweils anderen Ausprägungen wurden entsprechend angeglichen (siehe Tabelle 5, Spalte „Annahme“):
Abbildung in dieser Leseprobe nicht enthalten
Tab. 4: Ausgewählte Kriterien zur Kreditwürdigkeitsprüfung (eigene Abbildung)
5.1.1 Qualitative Daten
Für die qualitativen Daten wird angenommen, dass die Anteile der Merkmalsausprägungen der simulierten Stichprobe ähnlich sind wie die aktuelle Merkmalsverteilung in der deutschen Bevölkerung (Tabelle 5).
Zur Weiterverwendung dieser qualitativen Kriterien müssen zunächst deren relevanten Ausprägungsalternativen in Zahlen umgewandelt (Tabelle 6) werden, wobei die Nummerierung von 1 bis 2 bzw. 4 keine Wertung darstellt, da die Zusammenhänge der einzelnen Ausprägungen mit der Ausfallwahrscheinlichkeit noch nicht bekannt sind – diese sollen durch die künstlichen neuronalen Netze bestimmt werden.
Abbildung in dieser Leseprobe nicht enthalten
Tab. 5: Ausprägungen der ausgewählten qualitativen Kriterien in Deutschland (eigene Abbildung, Verteilungsdaten von statista.com, destatis.de und Schufa 2015; Abweichungen von 100% aufgrund von Rundungen und teilweise Daten aus anderen Jahren)
Abbildung in dieser Leseprobe nicht enthalten
Tab. 6: Übertragung der Kriterien aus Tab. 5 auf eine quantitative Skala (eigene Abbildung)
5.1.2 Quantitative Daten
Die Verteilung der quantitativen Kriterien
- Alter
- Bruttovermögen
- Schulden
- Einkommen
- Ausgaben
- Betrag der verwendeten Kredite
- Anzahl der Kreditanfragen
- Dauer des aktuellen Beschäftigungsverhältnisses
- Dauer der Kontobeziehung
erfolgt wie die der qualitativen in Bezug auf die Grundgesamtheit der deutschen Bevölkerung (Tabellen 7 bis 12 und Abb. 4).
Alter
Bei der Simulation der Altersverteilung werden Minderjährige und Personen, die älter als 65 Jahre alt und daher i.d.R. nicht erwerbstätig sind, aus der Betrachtung ausgeschlossen. Die Anteile der jeweils anderen Kategorien werden gemäß Formel (5.1) angeglichen (siehe Abb. 4).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 4: Altersverteilung in der deutschen Bevölkerung 2014 (Quelle: statista.com)
[...]
- Quote paper
- Julia Schmitt (Author), 2015, Kreditrisikomanagement mit künstlichen neuronalen Netzen, Munich, GRIN Verlag, https://www.grin.com/document/335474
-
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X.