Primärziel der Arbeit ist es, den grundlegenden Aufbau und die Funktionsweise von CNN zu erläutern. Dabei wird ebenfalls die Regularisierungsmethode Dropout zur Effizienzsteigerung vorgestellt, sowie fortgeschrittene CNN-Architekturen und Layertypen angeschnitten. Ein genereller Überblick über KNN soll dabei zum besseren Verständnis der Architektur beitragen. Um die Bedeutung von CNN für das Deep Learning darzustellen, wird die historische Entwicklung dieser Disziplin im Allgemeinen und von CNNs im Speziellen skizziert. Weiterhin werden Einsatzmöglichkeiten von CNN abseits der Bilderkennung vorgestellt.
Spätestens seit dem Sieg von Google DeepMinds Programm "AlphaGo" gegen den Go-Spitzenspieler Lee Se-dol im März 2016 sind Deep Learning und Künstliche Neuronale Netze (KNN ) im medialen Mainstream angekommen. Für den Erfolg von AlphaGo ist jedoch eine außerhalb von Fachkreisen weniger bekannte Variante des Deep Learnings namens Convolutional Neural Networks (CNN) verantwortlich, die normalerweise für die Bilderkennung eingesetzt wird. In diesem Bereich sind die CNN spätestens ab dem Jahr 2015 zum Standard geworden.
Das Assignment ist in vier Kapitel gegliedert. Auf die Einführung in die Fragestellung in Kapitel 1 folgt der Hauptteil mit den Kapiteln 2 und 3. Kapitel 2 stellt ein Grundlagenkapitel dar, in dem Deep Learning definiert und die Bestandteile und Wirkmechanismen eines KNN anhand von Feedforward-Netzen vorgestellt werden. Kapitel 3 befasst sich eingehend mit CNN. Zunächst werden der Aufbau und die unterschiedlichen Layertypen erklärt. Anschließend wird die Funktionsweise von CNN erläutert, wobei auch auf Unterschiede zur KNN-Architektur aus Kapitel 2 eingegangen wird. Weiterhin wird die Regularisierungsmethode "Dropout" für die Effizienzsteigerung tiefer Netze beleuchtet sowie neuartige CNN-Architekturen und Layertypen vorgestellt. Das Kapitel schließt mit einem Überblick über die Anwendungsgebiete von CNN. Die Ergebnisse der Arbeit werden im Fazit in Kapitel 4 zusammengefasst und kritisch beleuchtet.
Inhaltsverzeichnis
- Einleitung
- Ziel der Arbeit
- Aufbau der Arbeit
- Deep Learning
- Grundlagen
- Historische Entwicklung
- Convolutional Neural Networks (CNN)
- Aufbau
- Funktionsweise
- Regularisierung
- Fortgeschrittene Architekturen
- ResNets
- DenseNets
- Octave Convolutions
- Beispielhafte Anwendungsgebiete
- Fazit und kritische Würdigung
Zielsetzung und Themenschwerpunkte
Diese Arbeit beschäftigt sich mit Convolutional Neural Networks (CNN), einer wichtigen Architektur im Bereich des Deep Learning. Ziel ist es, den grundlegenden Aufbau und die Funktionsweise von CNN zu erklären, die Regularisierungsmethode Dropout vorzustellen sowie fortgeschrittene CNN-Architekturen und Layertypen zu beleuchten. Weiterhin soll die Bedeutung von CNN für das Deep Learning durch einen historischen Überblick und die Darstellung der Einsatzmöglichkeiten von CNN abseits der Bilderkennung verdeutlicht werden.
- Aufbau und Funktionsweise von Convolutional Neural Networks
- Regularisierungsmethode Dropout zur Effizienzsteigerung
- Fortgeschrittene CNN-Architekturen wie ResNets und DenseNets
- Historische Entwicklung des Deep Learning und von CNN
- Anwendungsgebiete von CNN abseits der Bilderkennung
Zusammenfassung der Kapitel
Das erste Kapitel widmet sich der Einleitung und stellt das Ziel der Arbeit sowie den Aufbau dar. Kapitel 2 definiert Deep Learning und erläutert die Bestandteile und Wirkmechanismen eines Künstlichen Neuronalen Netzes (KNN) anhand von Feedforward-Netzen. Kapitel 3 behandelt Convolutional Neural Networks (CNN) im Detail. Der Aufbau und die unterschiedlichen Layertypen werden erklärt, die Funktionsweise von CNN erläutert und Unterschiede zur KNN-Architektur aus Kapitel 2 hervorgehoben. Die Regularisierungsmethode „Dropout“ für die Effizienzsteigerung tiefer Netze wird beleuchtet und neuartige CNN-Architekturen sowie Layertypen vorgestellt. Abschließend werden Anwendungsgebiete von CNN außerhalb der Bilderkennung vorgestellt.
Schlüsselwörter
Deep Learning, Convolutional Neural Networks (CNN), Künstliche Neuronale Netze, Feedforward-Netze, Regularisierung, Dropout, ResNets, DenseNets, Octave Convolutions, Bilderkennung, Anwendungsgebiete.
- Quote paper
- Julian Sternitzke (Author), 2024, Convolutional Neural Networks (CNN). Eigenschaften und Lernalgorithmen, Munich, GRIN Verlag, https://www.grin.com/document/1458222