Neben dem Problem der Navigation, muss es einem Serviceroboter möglich sein, Objekte zu erkennen und deren Lage zu bestimmen um seinen Manipulator entsprechend positionieren zu können. Die Position des Objektes ist dabei typischerweise nur grob bekannt (irgendwo in diesem Raum), seine Lage gar nicht. Die Objekte sind mit keinerlei Markierungen versehen, um deren Auffinden zu erleichtern. Zur Erkennung des Objektes wird eine Kamera verwandt, die entweder am Robotor oder am Manipulator angebracht ist. Das Objekt soll durch das von der Kamera aufgenommene Bild erkannt werden. Dem Roboter steht kein zuvor erstelltes
Modell des Objektes zur Verfügung. In seiner Datenbank befinden sich Bilder der zu erkennenden Objekte aus verschieden Ansichten oder die daraus extrahierten Merkmale. Die Erkennung erfolgt, indem die Merkmale des gesehenen Bildes mit jenen in der Datenbank verglichen werden. Die Objekterkennung basiert also auf der Erscheinung des Objektes, d.h. auf seiner plenoptischen Funktion.
Es sollen hier zwei Verfahren zur erscheinungsbasierten Objekterkennung vorgestellt und mit Blick auf die Problemfelder in der Servicerobotik bewertet werden. Kapitel 2 beschreibt die Objekterkennung mit Hilfe von mehrdimensionalen Histogrammen. Dabei wird zunächst nur die globale Erscheinung eines Objektes betrachtet und das Verfahren anschließend auf die Erkennung anhand der lokalen Erscheinung adaptiert. Zuletzt werden die experimentellen Ergebnisse vorgestellt und zur Bewertung des Verfahrens herangezogen.
Kapitel 3 erläutert ein Verfahren, das die Erkennung mit Nachbarschaften und mehrdimensionalen Oberflächen durchführt und damit auf lokaler Erscheinung basiert. Der Merkmalsvektor des Verfahrens berücksichtigt zudem die Farbinformationen eines Bildes. Am
Ende des Kapitels wird das Verfahren mit dem SIFT-Algorithmus ([Lowe04]) verglichen
und abschließend ebenfalls auf der Grundlage von Experimenten diskutiert.
Eine Lageschätzung durchzuführen bedeutet, die Winkel unter denen das Objekt gesehen wird sowie seine Entfernung zur Kamera zu schätzen. Ein Verfahren zur Bestimmung der Kamerarotation und Entfernung zum Objekt wird in Kapitel 4 beschrieben. Das Verfahren aus Kapitel 3 wird dann um diese Skalenschätzung erweitert und erneut anhand von Experimenten bewertet.
Inhaltsverzeichnis
- 1 Einleitung
- 2 Objekterkennung basierend auf Grauwertrezeptoren und mehrdimensionalen Histogrammen
- 2.1 Idee des Verfahrens
- 2.2 Generierung der mehrdimensionalen Histogramme
- 2.3 Die Histogrammdatenbank
- 2.4 Definition zweier Merkmalsvektoren für die Erzeugung sechs-dimensionaler Histogramme
- 2.5 Erkennen eines Objektes anhand der Wahrscheinlichkeitsverteilung des Merkmalsvektors
- 2.6 Algorithmus zur Objekterkennung mittels globaler Erscheinung in vorsegmentierten Bildern
- 2.7 Algorithmus zur Objekterkennung mittels lokaler Erscheinung in natürlichen Umgebungen
- 2.8 Experimentelle Ergebnisse und Bewertung
- 2.9 Profiling des Verfahrens
- 3 Objekterkennung basierend auf Farbrezeptoren und mehrdimensionalen Oberflächen
- 3.1 Idee des Verfahrens
- 3.2 Definition des Merkmalsvektors mit Berücksichtigung von Farbinformationen
- 3.3 Generierung der mehrdimensionalen Oberflächen
- 3.4 Erkennung von Objekten mit lokaler Erscheinung und Farbrezeptoren
- 3.5 Vergleich mit dem SIFT-Algorithmus
- 3.6 Experimentelle Untersuchung und Bewertung des Verfahrens
- 3.7 Profiling des Verfahrens
- 4 Skalierungs- und Rotationsinvarianz in der Objekterkennung
- 4.1 Das Problem der Skalenschätzung und die klassische Lösung
- 4.2 Automatische Skalenschätzung
- 4.3 Verfahren zur automatischen Skalenschätzung
- 4.4 Implementierung der automatischen Skalenschätzung
- 4.5 Automatische Schätzung der Orientierung
- 4.6 Normierung des Merkmalsvektors bezüglich der Orientierung
- 4.7 Untersuchung der Objekterkennung und Lageschätzung mit Farbrezeptoren im Hinblick auf bildbasierte Regelung
- 4.8 Initiale Objekterkennung
- 4.9 Schätzen der Lage des erkannten Objekts
- 4.10 Profiling der Objekterkennung mit Skalenschätzung
- 5 Zusammenfassung und Ausblick
Zielsetzung und Themenschwerpunkte
Die Studienarbeit untersucht Verfahren zur erscheinungsbasierten Objekterkennung und Lageschätzung für Serviceroboter. Ziel ist die Entwicklung und Bewertung von Algorithmen, die es einem Roboter ermöglichen, Objekte in einer dynamischen, unstrukturierten Umgebung ohne vorherige Objektmodellierung zu erkennen und deren Position zu bestimmen.
- Objekterkennung basierend auf Grauwertrezeptoren und mehrdimensionalen Histogrammen
- Objekterkennung basierend auf Farbrezeptoren und mehrdimensionalen Oberflächen
- Skalierungs- und Rotationsinvarianz in der Objekterkennung
- Integration von Objekterkennung und Lageschätzung
- Experimentelle Bewertung der entwickelten Verfahren
Zusammenfassung der Kapitel
1 Einleitung: Die Einleitung führt in das Thema der Objekterkennung und Lageschätzung in der Servicerobotik ein. Sie beschreibt die Herausforderungen, die sich aus der Arbeit in unstrukturierten Umgebungen ergeben, und die Notwendigkeit von robusten Algorithmen zur Objekterkennung ohne vorherige Objektmodellierung. Die Arbeit fokussiert auf zwei Verfahren der erscheinungsbasierten Objekterkennung, die im weiteren Verlauf detailliert untersucht werden. Die verwendete Datenbank (COIL-100) und die experimentelle Umgebung werden ebenfalls vorgestellt.
2 Objekterkennung basierend auf Grauwertrezeptoren und mehrdimensionalen Histogrammen: Dieses Kapitel präsentiert ein Verfahren zur Objekterkennung basierend auf mehrdimensionalen Histogrammen von Grauwerten. Es beschreibt die Idee des Verfahrens, die Generierung der Histogramme aus Filterantworten, die Erstellung der Histogrammdatenbank und den Algorithmus zur Objekterkennung sowohl für globale als auch lokale Erscheinung. Die experimentellen Ergebnisse und ein Profiling des Verfahrens werden ebenfalls diskutiert, um die Effizienz und Robustheit des Ansatzes zu bewerten. Der Fokus liegt auf der Wahrscheinlichkeitsverteilung der Grauwerte als Grundlage der Objekterkennung.
3 Objekterkennung basierend auf Farbrezeptoren und mehrdimensionalen Oberflächen: Dieses Kapitel erweitert das Konzept der Objekterkennung um Farbinformationen. Es beschreibt die Definition eines Merkmalsvektors, der neben Grauwerten auch Farbinformationen berücksichtigt, die Generierung mehrdimensionaler Oberflächen und den Algorithmus zur Objekterkennung basierend auf lokaler Erscheinung und Farbrezeptoren. Ein Vergleich mit dem etablierten SIFT-Algorithmus wird durchgeführt, um die Leistungsfähigkeit des vorgestellten Verfahrens zu bewerten. Die experimentelle Untersuchung und das Profiling des Verfahrens runden das Kapitel ab.
4 Skalierungs- und Rotationsinvarianz in der Objekterkennung: Dieses Kapitel befasst sich mit der Herausforderung der Skalierungs- und Rotationsschätzung in der Objekterkennung. Es beschreibt das Problem der Skalenschätzung, die klassische Lösung und ein Verfahren zur automatischen Skalenschätzung. Die Implementierung dieser automatischen Skalenschätzung und die automatische Schätzung der Orientierung werden detailliert erläutert, einschließlich der Normierung des Merkmalsvektors. Schließlich wird die Objekterkennung und Lageschätzung mit Farbrezeptoren im Hinblick auf bildbasierte Regelung untersucht. Die initiale Objekterkennung und die Schätzung der Lage des erkannten Objektes werden ebenfalls behandelt.
Schlüsselwörter
Objekterkennung, Lageschätzung, Servicerobotik, mehrdimensionale Histogramme, mehrdimensionale Oberflächen, Farbrezeptoren, Grauwertrezeptoren, Skalierungsinvarianz, Rotationsinvarianz, Bildverarbeitung, plenoptische Funktion, COIL-100 Datenbank, SIFT-Algorithmus, Matlab.
Häufig gestellte Fragen zur Studienarbeit: Erscheinungsbasierte Objekterkennung und Lageschätzung für Serviceroboter
Was ist der Gegenstand dieser Studienarbeit?
Die Studienarbeit befasst sich mit der Entwicklung und Bewertung von Algorithmen zur erscheinungsbasierten Objekterkennung und Lageschätzung für Serviceroboter in dynamischen, unstrukturierten Umgebungen. Dabei wird auf eine vorherige Objektmodellierung verzichtet.
Welche Methoden werden in der Arbeit untersucht?
Die Arbeit untersucht zwei Hauptmethoden: Objekterkennung basierend auf Grauwertrezeptoren und mehrdimensionalen Histogrammen sowie Objekterkennung basierend auf Farbrezeptoren und mehrdimensionalen Oberflächen. Zusätzlich wird die Skalierungs- und Rotationsinvarianz in der Objekterkennung behandelt.
Wie funktioniert die Objekterkennung basierend auf Grauwertrezeptoren und mehrdimensionalen Histogrammen?
Diese Methode nutzt mehrdimensionale Histogramme von Grauwerten, die aus Filterantworten generiert werden. Die Histogramme bilden die Grundlage einer Histogrammdatenbank. Der Algorithmus zur Objekterkennung basiert auf der Wahrscheinlichkeitsverteilung der Grauwerte und wird sowohl für globale als auch lokale Erscheinungen angewendet.
Wie unterscheidet sich die Objekterkennung mit Farbrezeptoren?
Die Methode mit Farbrezeptoren erweitert das Konzept um Farbinformationen im Merkmalsvektor. Sie verwendet mehrdimensionale Oberflächen anstelle von Histogrammen und konzentriert sich auf die lokale Erscheinung. Ein Vergleich mit dem SIFT-Algorithmus wird durchgeführt.
Wie wird die Skalierungs- und Rotationsinvarianz berücksichtigt?
Die Arbeit beschreibt das Problem der Skalenschätzung und präsentiert ein Verfahren zur automatischen Skalenschätzung und Orientierungsschätzung. Der Merkmalsvektor wird entsprechend normiert. Die Integration in die Objekterkennung und Lageschätzung im Hinblick auf bildbasierte Regelung wird untersucht.
Welche Datenbank wurde verwendet?
Die Studienarbeit verwendet die COIL-100 Datenbank für die Experimente.
Welche Software wurde verwendet?
Die Implementierung der Algorithmen erfolgte mit Matlab.
Welche Kapitel umfasst die Arbeit?
Die Arbeit gliedert sich in fünf Kapitel: Einleitung, Objekterkennung mit Grauwertrezeptoren und Histogrammen, Objekterkennung mit Farbrezeptoren und Oberflächen, Skalierungs- und Rotationsinvarianz, sowie Zusammenfassung und Ausblick.
Welche Schlüsselwörter beschreiben die Arbeit am besten?
Objekterkennung, Lageschätzung, Servicerobotik, mehrdimensionale Histogramme, mehrdimensionale Oberflächen, Farbrezeptoren, Grauwertrezeptoren, Skalierungsinvarianz, Rotationsinvarianz, Bildverarbeitung, plenoptische Funktion, COIL-100 Datenbank, SIFT-Algorithmus, Matlab.
Wo finde ich detailliertere Informationen zu den einzelnen Verfahren?
Die detaillierten Beschreibungen der Algorithmen, experimentellen Ergebnisse und Profilings der Verfahren finden sich in den jeweiligen Kapiteln der Studienarbeit.
- Quote paper
- Tom Paschenda (Author), 2006, Erscheinungsbasierte Objekterkennung und Lageschätzung zur Objektmanipulation in der Servicerobotik, Munich, GRIN Verlag, https://www.grin.com/document/82563