Der intelligenten Technik am Körper, den sogenannten „Wearables“, wie bspw. Fitnessarmbändern oder Smartwatches, wird eine blühende Zukunft prognostiziert. Sie gelten als einer der größten Techniktrends. Eine der Hauptaufgaben der Fitnessarmbänder und Smart Watches ist das Überwachen körperlicher Aktivität. Vergessen wird, dass die Mehrheit längst unentwegt ein Messsystem bei sich trägt – das Smartphone.
Diese Arbeit zeigt, dass die Aktivitätserkennung mittels Sensordaten eines Smartphones mit hohen Erkennungsraten möglich ist. Hierzu wurde ein Echtzeitaktivitätserkennungssystem entwickelt. Das System berücksichtigt Tragegewohnheiten und legt Wert auf Energieeffizienz. Dadurch wird es dem Anspruch an eine komfortable und praktikable Aktivitätserkennung gerecht. Das Aktivitätserkennungssystem kann problemlos für Wearables o.Ä. verwendet werden. Für die Aktivitäten Sitzen, Stehen, Liegen, Gehen, Laufen, Treppensteigen und Treppen hinuntergehen wurde eine Erkennungsrate von rund 97% erzielt. Zur Realisierung des Aktivitätserkennungssystems wurde eine Zeitreihenanalyse durchgeführt. Diese folgt dem Schema des allgemeinen Klassifizierungsprozesses. Der allgemeine Klassifizierungsprozess wurde durch die Auswahl geeigneter Verfahren/Algorithmen aus der Domäne Aktivitätserkennung konkretisiert. Diese werden vorgestellt. Für die Sensoren Gyroskop, Magnetometer und Beschleunigungssensor wurden jeweils individuell Verfahren/Algorithmen ausgewählt. Hierdurch wurde die Erkennungsrate für jeden einzelnen Sensor optimiert. Die Kombination der Sensoren wurde untersucht. Schließlich wurde mit dem Beschleunigungssensor die höchste Erkennungsrate erzielt.
Inhaltsverzeichnis
1 Einleitung
2 Allgemeiner Klassifizierungsprozess konkretisiert zur Realisierung eines Aktivitätserkennungssystems
2.1 Datenerfassung
2.1.1 Konfiguration des Datenerfassungssystems
2.1.2 Smartphone Sensoren
2.1.3 Kombination von Sensoren
2.2 Datenvorverarbeitung
2.2.1 Fehlende Messwerte und Signalschätzung
2.2.2 Filtern
2.2.3 Normalisieren
2.2.4 Merkmalskalierung (Normalisieren)
2.2.5 Fensterung
2.3 Merkmalsextraktion
2.3.1 Instanzbasierte Merkmalsextraktion
2.3.2 Modellbasierte Merkmalsextraktion
2.4 Merkmalselektion
2.4.1 Filter Ansatz (Statistischer Ansatz)
2.4.2 Wrapper Ansatz (Kombinatorische Merkmalselektion)
2.4.3 Inkludierter Ansatz (Embedded Approach)
2.4.4 Ensemble Feature Selection (EFS)
2.4.5 Transformation / Dimensionsreduktion
2.5 Klassifizierung
2.5.1 Klassifizierung anhand instanzbasierter Merkmale
2.5.2 Klassifizierung anhand modellbasierter Merkmale
2.5.3 Hyperparameteroptimierung
2.6 Variante: Trageorientierungsunabhängigkeit
2.6.1 Beschleunigungsbetragsverfahren
2.6.2 Einheitliches Bezugssystem
3 Entwicklung eines Aktivitätserkennungssystems anhand des allgemeinen Klassifizierungsprozesses
3.1 Grundlegendes Aktivitätserkennungssystem
3.1.1 Datenerfassung
3.1.2 Merkmalsextraktion
3.1.3 Klassifizierung
3.1.4 Erkennungsraten von Sensorkombinationen
3.2 Analysen zur Verbesserung des Aktivitätserkennungssystems
3.2.1 Merkmalselektion
3.2.2 Bestimmung der Frequenzbänder
3.2.3 Datenvorverarbeitung
3.3 Zusammenfassung der Analyseergebnisse
3.3.1 Erkennungsraten von Sensorkombinationen (optimierte Konfiguration)
3.3.2 Hyperparameteroptimierung und MLP
3.4 Variante Beschleunigungsbetragsverfahren
3.5 Echtzeitaktivitätserkennung
3.5.1 Segmentierung der Sensorsignale durch Fensterung
3.6 Energieeffiziente Aktivitätserkennung
3.6.1 Optimierung Abtastfrequenz
3.6.2 Optimierung der zu übermittelnden Daten bei einer Server Client Architektur
4 Evaluation des Aktivitätserkennungssystems
5 Fazit
Literaturverzeichnis
Abbildungsverzeichnis
6 Anhang A: Standardeinstellungen
6.1 Hyperparameteroptimierung
7 Anhang B: Ergebnisse
7.1 Erkennungsrate nach Merkmalselektionsverfahren
7.2 Merkmalsrelevanz Tabelle
7.3 Merkmalsrelevanz Frequenzbänder
7.4 Erkennungsrate bei der Verwendung verschiedener Filter
7.5 Erkennungsrate bei Kombinationen aus Butterworth / Interpolation / Z-Score
8 Anhang C: Referenztabelle Merkmalsextraktion
Kurzfassung
Der intelligenten Technik am Körper, den sogenannten „Wearables“, wie bspw. Fitnessarmbändern oder Smartwatches, wird eine blühende Zukunft prognostiziert. Sie gelten als einer der größten Techniktrends. Eine der Hauptaufgaben der Fitnessarmbänder und Smart Watches ist das Überwachen körperlicher Aktivität. Vergessen wird, dass die Mehrheit längst unentwegt ein Messsystem bei sich trägt - das Smartphone.
Diese Arbeit zeigt, dass die Aktivitätserkennung mittels Sensordaten eines Smartphones mit hohen Erkennungsraten möglich ist. Hierzu wurde ein Echtzeitaktivitätserkennungssystem entwickelt. Das System berücksichtigt Tragegewohnheiten und legt Wert auf Energieeffizienz. Dadurch wird es dem Anspruch an eine komfortable und praktikable Aktivitätserkennung gerecht. Das Aktivitätserkennungssystem kann problemlos für Wearables o.Ä. verwendet werden. Für die Aktivitäten Sitzen, Stehen, Liegen, Gehen, Laufen, Treppensteigen und Treppen hinuntergehen wurde eine Erkennungsrate von rund 97% erzielt.
Zur Realisierung des Aktivitätserkennungssystems wurde eine Zeitreihenanalyse durchgeführt. Diese folgt dem Schema des allgemeinen Klassifizierungsprozesses. Der allgemeine Klassifi- zierungsprozess wurde durch die Auswahl geeigneter Verfahren/Algorithmen aus der Domäne Aktivitätserkennung konkretisiert. Diese werden vorgestellt. Für die Sensoren Gyroskop, Mag- netometer und Beschleunigungssensor wurden jeweils individuell Verfahren/Algorithmen aus- gewählt. Hierdurch wurde die Erkennungsrate für jeden einzelnen Sensor optimiert. Die Kom- bination der Sensoren wurde untersucht. Schließlich wurde mit dem Beschleunigungssensor die höchste Erkennungsrate erzielt.
Abstract
Smart and wearable technology like fitnesstrackers or smart watches are referred to as “weara- bles“ which are predicted to have a prosperous future. Currently wearables are considered to be one of the biggest innovations in technology. Monitoring physical activity is one of their main tasks. Frequently neglected is that most people are already wearing a sensing device all the time- the Smartphone.
In this work a real-time human activity recognition system was developed which demonstrates that a high recognition accuracy is obtainable by using smartphone sensordata. The system considers wearing habits and attaches importance to low energy consumption. Thus, the demand for a comfortable and practicable human activity recognition system is fulfilled. The developed human activity recognition system can easily be used for other devices than smartphones. The activities sitting, standing, lying, going, jogging, walking upstairs and downstairs are detected with a recognition accuracy of 97 percent.
In order to develop an activity recognition system a time series analysis has been carried out. This time series analysis follows a certain scheme, referred to as “general classification process”. This process was individually optimized by selecting suitable methods/algorithms for each one of the sensors gyroscope, magnetometer and accelerometer for obtaining a high recognition accuracy. In addition all combinations of sensors were analysed. The highest recognition accuracy finally was achieved by using the accelerometer.
Abkürzungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
1 Einleitung
Wecker, Tageszeitung, Entertainer, Informationsquelle - die Aufzählung lässt sich beliebig fort- setzen. Für einen Großteil der Weltbevölkerung wurde das Smartphone innerhalb nur eines Jahrzehnts zum ständig begleitenden Allzweckwerkzeug. Neben der Mobilkommunikation und der immensen Rechenleistung, trägt eine Fülle von Sensoren zur Multifunktionalität der Ta- schencomputer bei. Durch die Nutzung der Geräte entsteht eine erhebliche Datenflut. Big Data - geht Hand in Hand mit seiner Analyse. Ziel des Analyseprozesses von Massendaten mit Methoden der Künstlichen Intelligenz und des Data Minings ist die Extraktion von Wissen und damit verknüpft, die Erschließung neuer Anwendungsgebiete. Das Smartphone, als ständi- ger Begleiter, partizipiert an den allermeisten Aktivitäten seines Besitzers. Das automatische Erkennen dieser Aktivitäten erschließt das Anwendungsgebiet Aktivitätserkennung. Aktivitätserkennung besitzt eine Vielzahl von Anwendungen. In den letzten Jahren wurden „Fitness Tracker“ populär, mit welchen der Nutzer z.B. seine Laufstrecken aufzeichnen kann. Durch automatische Aktivitätserkennung werden diese Systeme bedienungsfreundlicher und genauer, wodurch bspw. der Energieumsatz sehr viel besser geschätzt werden kann. In der Me- dizin besteht ebenfalls ein großes Interesse an präzisen Aktivitätserkennungssystemen. In der Adipositas-Assistenz kann der Patient auf lange Ruhezeiten aufmerksam gemacht werden und zu mehr Bewegung ermuntert werden. In der Physiotherapie-Assistenz können Bewegungsstö- rungen erkannt werden oder das System gibt dem Patienten Auskunft über richtig oder falsch ausgeführte Bewegungen.
Ziel dieser Arbeit ist es, durch Auswertung der Sensordaten eines Smartphones, beliebige Tagesaktivitäten maschinell und vollautomatisch unterscheiden und erkennen zu können. Primär wird der Fokus auf die Aktivitäten Sitzen, Stehen, Liegen, Gehen, Laufen, Treppensteigen und Treppen hinuntergehen gelegt.
Das Aktivitätserkennungssystem wird mit Verfahren aus dem Fachgebiet der Künstlichen Intelligenz realisiert. Dabei spielt die Auswahl von geeigneten Algorithmen, z.B. zur Modellierung der Zeitreihen, zur Mustererkennung und die Auswahl geeigneter maschineller Lernverfahren, eine entscheidende Rolle.
Der Inhalt dieser Arbeit wird gegliedert in einen theoretischen und einen praktischen Teil. Der theoretische Teil: „Allgemeiner Klassifizierungsprozess konkretisiert zur Realisierung eines Aktivitätserkennungssystems“, erläutert gängige Verfahren und Algorithmen zur Umsetzung eines Aktivitätserkennungssystems. Der praktische Teil: „Entwicklung eines Aktivitätserken- nungssystems anhand des allgemeinen Klassifizierungsprozesses“ bildet den Schwerpunkt die- ser Arbeit. In ihm wird eine Auswahl der im theoretischen Teil vorgestellten Verfahren und Algorithmen getroffen. Diese werden analysiert. Basierend auf den Analyseergebnissen wird ein Echtzeitaktivitätserkennungssystem realisiert, welches möglichst hohe Erkennungsraten er- zielt.
Die Aktivitätserkennung ist der Zeitreihenanalyse zuzuordnen. Folglich kann und wird anhand eines allgemeinen Klassifizierungsprozesses, bestehend aus Datenerfassung, Vorverarbeitung, Merkmalsextraktion und Klassifizierung vorgegangen. Der Fokus dieser Arbeit liegt dabei auf modellbasierter Merkmalsextraktion und Mustererkennung.
2 Allgemeiner Klassifizierungsprozess konkretisiert zur Realisierung eines Aktivitätserkennungssystems
Dieses Kapitel beschäftigt sich mit dem Stand der Technik im Forschungsfeld der Aktivitätser- kennung. Die Aktivitätserkennung ist als Einordnung/Klassifizierung bestimmter Aktivitäten in Aktivitätsklassen zu verstehen.1 Der Begriff Aktivität besitzt im Deutschen verschiedene Be- deutungen. Allgemein kann zwischen körperlicher und geistiger Aktivität differenziert werden. Für diese Arbeit ist lediglich die körperliche Aktivität relevant. Körperliche Aktivität bezieht sich auf jede körperliche Bewegung die den Energieverbrauch des Menschen über den Grund- umsatz hinaus anhebt.2 Differenzierter kann eine Aktivität als willentliche Ausführung einer Bewegung verstanden werden. Dazu gehört als Sonderfall auch die willentliche Ruhe, wie z.B. Liegen.3 Die Qualität eines Aktivitätserkennungssystems wird unter anderem anhand der Er- kennungsrate bestimmt. Die Erkennungsrate ist der Quotient aus richtig erkannten Aktivitäten und der Gesamtzahl aller Erkennungen. Sprich: Die Anzahl der Aktivitäten die richtig klassifi- ziert (eingeordnet) wurden in Prozent.
Die Aktivitätserkennung ist der Zeitreihenanalyse zuzuordnen. Folglich kann anhand eines allgemeinen Klassifizierungsprozesses, bestehend aus Datenerfassung, Vorverarbeitung, Merkmalsextraktion und Klassifizierung vorgegangen werden. (Vgl. Abb. 1).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 1 Klassifizierungsprozess Aktivitätserkennung.
2.1 Datenerfassung
Das von Sensoren gemessene Signal wird abgetastet, wodurch eine diskrete Abfolge von Mess- werten (Samples), auch Sequenz oder Zeitreihe genannt, erfasst wird. Die Abtastrate gibt an, wie oft das Signal abgetastet wird. Eine Abtastrate von bspw. 50Hz entspricht 50 Abtastungen pro Sekunde. Das Ziel der Datenerfassung ist die Erstellung einer Datensammlung bestehend aus Sequenzen.
Die Aufzeichnung der Sequenzen kann durch Einpunkt- oder Mehrpunkt-Systeme erfolgen. Diese bestehen aus einem Sensor oder mehreren Sensoren. Bei den Einpunkt-Systemen werden die Sensoren ausschließlich an einer Körperstelle befestigt, wohingegen die Sensoren bei Mehrpunkt-Systemen auf mehrere Körperstellen verteilt werden. Wichtig für die Bewegungserkennung ist die Wahl geeigneter Körperpositionen und Sensoren. Nach Bieber kann die Bewegungserkennung unterschieden werden in das Erkennen von
- Körperhaltungen
- Bewegungsübergängen
- körperlicher Aktivität4
Wird zur Bewegungserkennung ein Smartphone verwendet, so handelt es sich um ein Einpunkt- System.
2.1.1 Konfiguration des Datenerfassungssystems
Grundlegend für die Datenerfassung ist die Konfiguration der Datenerfassungssysteme, da dies großen Einfluss auf die Messwerte hat. Dazu gehören sowohl Hardware- als auch Softwareein- stellungen. Zu den Softwareeinstellungen gehört z.B. die Abtastrate. Zu den Hardwareeinstel- lungen gehört bspw. der Messbereich der Sensoren. Außerdem beeinflusst die Anbringung der Sensoren (Trageposition und Trageorientierung) das Messsignal erheblich.5 Außerdem hängt die Datenerfassung von Standortfaktoren und den ausführenden Personen ab. So unterscheidet sich z.B. die Schrittfrequenz eines jungen sportlichen Mannes von der einer Frau gehobenen Alters. Dasselbe gilt auch für die Aktivität Treppensteigen. Wird diese stets auf derselben Treppe erfasst, so sind die Messwerte ausschließlich auf diese Treppe angepasst. Üblicherweise gilt: Je spezifischer die Daten erhoben werden, desto besser passt das Modell auf den spezifi- schen und desto schlechter auf den allgemeinen Fall.
2.1.2 Smartphone Sensoren
Es gibt keine Norm dafür welche Sensoren in einem Smartphone verbaut werden müssen und welche nicht.6 Dennoch gibt es Designrichtlinien. Das Betriebssystem Android 6.0 Marshmal- low definiert bspw. welche Sensoren ein neues Smartphone haben muss bzw. sollte. Möchte ein Hersteller Marshmallow vorinstallieren, so muss er ein Mikrofon und sollte die Sensoren Beschleunigungssensor, Gyroksop, Magnetometer, Barometer einbauen, sowie GPS unterstüt- zen.7 Am häufigsten werden die Sensoren Gyroskop, Beschleunigungssensor, Magnetometer, Kamera und Mikrofon in Smartphones verbaut.8 Außerdem wird das GPS (Global Positioning System) praktisch in jedem Smartphone verwendet. Im engeren Sinne ist das GPS kein Sensor, da es mit Hilfe eines Satellitennetzes und der Mobilkommunikation funktioniert. Nichtsdestot- rotz kann das GPS-Modul (zusammenwirken verschiedener Komponenten) als Sensor verstan- den werden.9 Seit 2014 wird vermehrt auch ein Barometer in die Smartphones eingebaut.10 Es ist erstrebenswert ein Aktivitätserkennungssystem zu entwickeln, welches auf den am häufigs- ten verbauten Sensoren basiert.
Ergänzend sind Aktivitätserkennungssysteme zu nennen, die nicht auf Smartphone Sensoren basieren, wie z.B. mobilfunkbasierte Aktivitätserkennungssysteme. Zu nennen ist hierbei die Bewegungserkennung mittels WLAN und Netzsignalen, erforscht von Anderson/Muller.11 Diese werden in dieser Arbeit nicht weiter vertieft.
2.1.2.1 Eigenschaften und Eignung der Sensoren zur Aktivitätserkennung
Folgender Abschnitt beschäftigt sich mit der Eignung der verschiedenen Smartphone Sensoren zur Aktivitätserkennung und beschreibt ihre Funktionsweise.
Mikrofon: Lukowicz, P. et al sind zu sehr guten Aktivitätserkennungsergebnissen gekom- men.12 Allerdings sind die Erkennungsraten mit Vorsicht zu betrachten, da sehr spezifische Ak- tivitäten wie „Hämmern“ gewählt wurden, welche besonders charakteristische Laute von sich geben und der Versuch unter Laborbedingungen (ohne Störgeräusche) durchgeführt wurde. Als Hauptmerkmal wurde die Geräuschintensität gewählt. Ihr Informationsgehalt kann durch Stö- rungen im Alltag, wie z.B. Verkehr, stark beeinträchtig werden. Allerdings beweisen die Auto- ren, dass das Mikrofon zur Erkennung spezifischer Aktivitäten einen wichtigen Beitrag leistet. Kamera: Eignet sich aufgrund der Tragepositionen nicht zur Aktivitätserkennung.
GPS-Modul: GPS funktioniert mit Hilfe eines Satellitennetzes und der Mobilkommunikation. Hierbei werden von den Satelliten Positionssignale gesendet. Diese werden von einer Antenne im Smartphone empfangen und damit die eigene Position berechnet. Für die Aktivitätserken- nung ist GPS sinnvoll, da aus den GPS -Werten die Geschwindigkeit berechnet werden kann. Nachteile sind der hohe Energieverbrauch und die eingeschränkte Funktionalität in Gebäuden.
In zahlreichen Studien konnte die Eignung von Bewegungssensoren zur Aktivitätserkennung nachgewiesen werden. Auf diese wird im Folgenden näher eingegangen.
Beschleunigungssensor: Der Beschleunigungssensor dient dazu, Beschleunigungen in allen drei Raumachsen (X/Y/Z-Achse) zu erkennen. Das Funktionsprinzip beruht auf der Massenträgheit dreier kleiner Siliziumstäbe, die jeweils die Bewegung in eine der drei Raumrichtungen detektieren. Bei einer Bewegung des Handys kommt es zu einer kleinen Auslenkung dieser Stäbe. Diese führt letztendlich zu einer Änderung der elektrischen Kapazität gegenüber einer festen Elektrode. Aus der Kapazitätsänderung kann die Beschleunigung berechnet werden.13 Vorteil des Beschleunigungssensors ist ein geringer Energieverbrauch. Ein bedeutender Nachteil ist die Abhängigkeit von der Trageorientierung.
Gyroskop: Das Gyroskop ist auch als Kreiselinstrument bekannt. „Ein sich drehender Kreisel will die Richtung der Drehachse erhalten.“14 Die Folge ist, dass äußere Versuche das System zu kippen, zu einem Drehmoment führen, welches gemessen werden kann. Die Richtungsänderungen werden ebenfalls im dreidimensionalen Koordinatensystem auf drei Achsen (x,y,z) beschrieben.
Magnetometer: Mit einem Magnetometer kann die Ausrichtung des Smartphones in Bezug zum Erdmagnetfeld in alle drei Raumrichtungen gemessen werden. Die technische Umsetzung basiert dabei oft auf dem Hall Effekt. „Dabei wird eine Platte im sogenannten Hall-Sensor von einem Strom durchflossen. Ein senkrecht zur Flussrichtung verlaufendes Magnetfeld ändert die Ausgangsspannung des Sensors. Die Höhe der Ausgangsspannung wird genutzt, um auf [die] Richtung und Flussdichte des Magnetfeldes zu schließen.“15
Barometer: Mit Barometern kann der Luftdruck gemessen werden. Dies lässt Rückschlüsse auf die Höhenlage über dem Meeresspiegel zu und eignet sich daher zur Erfassung von Aktivitäten bei denen Höhenunterschiede zurückgelegt werden (z.B. Treppensteigen). Da der Barometer erst in sehr neuen Smartphones vorkommt, gibt es kaum Studien wie gut sich dieser zur Aktivitätserkennung eignet. Nach Sankaran et. al ist der Barometer zur Erkennung von einfachen Aktivitäten wie Gehen, Fahren und Treppensteigen bestens geeignet. Ein weiterer Vorteil ist der extrem geringe Energieverbrauch des Sensors.16
2.1.3 Kombination von Sensoren
Die Kombination von Sensoren kann sich positiv auf die Erkennungsrate auswirken. Die Schwächen eines Sensors werden durch die Stärken eines anderen ausgeglichen. In anderen wissenschaftlichen Arbeiten wurde die Kombination verschiedener Sensoren bereits getestet. Bao und Intille stellten hohe Erkennungsraten durch die Kombination von Beschleunigungssensor und Gyroskop fest.17 Sohaib hingegen kam zu dem Ergebnis, dass eine Kombination von Sensoren die Erkennungsrate nur verbessert, wenn die individuelle Performance der Sensoren schlecht ist, damit es Luft für Verbesserungen gibt.18
2.2 Datenvorverarbeitung
Zweck der Datenvorverarbeitung ist die Qualität des Datenbestandes zu verbessern. Hauptsächlich werden hierzu fehlende Daten und Ausreißer berücksichtigt und adäquat behandelt. Die Datenvorverarbeitung ist i.d.R. vor der eigentlichen Datenanalyse notwendig.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 2 Klassifizierungsprozess Aktivitätserkennung Vorverarbeitung.
Die Vorverarbeitungsschritte können unterteilt werden in Normalisieren, Filtern, Transformieren, Ergänzen und Fensterung.19
2.2.1 Fehlende Messwerte und Signalschätzung
In der Regel wird das an den Sensoren anliegende Signal nicht mit der exakt definierten Abtastrate abgetastet, wodurch es zu fehlenden Messwerten kommt. Beispielsweise kommt es aufgrund des Speichermanagements der Mobiltelefone zu variablen Abtastraten.20 Der Vorverarbeitungsschritt Signalschätzung versucht die fehlenden Werte durch Annäherungen zu ersetzen. Dabei gibt es wieder verschiedene Verfahren. Die meist verwendeten sind die Abtastratenkonvertierung, die Interpolation oder die Mittelwertbildung.
2.2.1.1 Abtastratenkonvertierung
Mit der Abtastratenkonvertierung (engl. Resampling) wird die Abtastrate einer Sequenz geän- dert. Mit Upsampling und Interpolation werden z.B. fehlende Werte ergänzt. Unterabtastung reduziert die Datenrate eines Signals. „Bei digitalen Signalen wird dabei eine bestimmte Anzahl der diskreten Signalwerte […] verworfen und nur jeder n-te Wert mit n = 2, 3, … wird beibe- halten.“21 Exemplarisch wäre bei der Abtastratenkonvertierung von 100Hz auf 50Hz n = 2.
2.2.1.2 Interpolation
Die Interpolation dient dazu unbekannte Funktionswerte, anhand benachbarter Funktionswerte durch Schätzung zu ermitteln. Die Zeitreihe wird dabei als Funktion interpoliert und fehlende Messwerte durch Einsetzen in die Funktion berechnet.
2.2.1.3 Mittelwertbildung
Fehlende Werte werden durch den Mittelwert der benachbarten Werte in der Sequenz oder durch den Mittelwert aller Sequenzen an dieser Stelle ergänzt.
2.2.2 Filtern
Sensoren liefern z.T. fehlerhafte Signale, sie sind also verrauscht. Durch filtern soll das Rauschen unterdrückt werden. Rauschen ist typischerweise hochfrequent. Tiefpassfilter versuchen diesen Anteil zu unterdrücken. Allgemein sollen damit die Sensordaten verbessert werden um bessere Erkennungsraten zu erreichen.
Es gibt eine Vielzahl an Tiefpassfiltern. Dabei wird zwischen digitalen und analogen Filtern unterschieden.
Oft verwendet wird unter den Digitalen Filtern der Moving-Average-Filter (MA) und unter den Analogen der Butterworth-Filter (BT). Der Moving-Average-Filter basiert darauf einen gleitenden Mittelwert zu bilden und dadurch die Sequenz zu glätten. Der Mittelwert wird immer aus aufeinanderfolgenden Werten ermittelt.
Der „Butterworth-Filter ist im Wesentlichen durch das konstante Dämpfungsverhalten im Durchlassbereich (DB) charakterisiert, das erst im Bereich der Grenzfrequenz eine geringfügige Amplitudenanhebung zeigt.“22 Bis zur Grenzfrequenz findet praktisch keine Dämpfung statt und danach ist die Dämpfung hingegen sehr stark.
Der Butterworth-Filter wurde bereits erfolgreich von Luis angewandt. Nach ihm ist eine Grenzfrequenz von 20Hz besonders gut zum Filtern von Rauschen geeignet.23 Obwohl beide Filter Tiefpassfilter sind, ist ihre Funktionsweise sehr unterschiedlich.
2.2.3 Normalisieren
Bei der Normalisierung werden die Daten von den Wertebereichen und Maßeinheiten unabhängig gemacht. Hierfür gibt es verschiedene Verfahren.
2.2.3.1 Min - Max Methode
Bei der Min-Max Methode werden die ursprünglichen Werte auf das Intervall (0, 1) abgebildet. Der ehemalige Minimalwert wird dabei zu null und der Maximalwert zu eins, alle Werte dazwischen werden entsprechend auf Werte zwischen null und eins abgebildet.24 Dadurch soll die Standardabweichung verringert und Ausreißer eliminiert werden.
Abbildung in dieser Leseprobe nicht enthalten
v‘ = Neuer Wert, v = Wert, min = Minimalwert der Werte, max = Maximalwert der Werte
2 Allgemeiner Klassifizierungsprozess konkretisiert zur Realisierung eines Aktivitätserkennungssystems 8
2.2.3.2 Z-Score Normalisierung
Die Z-Score Normalisierung skaliert die Werte so, dass sie Gauß-verteilt (Normalverteilt) vorliegen.25 Bei einer Gaußverteilung ist der Mittelwert Null und die Varianz eins. Folglich wird der Mittelwert und die Varianz der ursprünglichen Verteilung durch die Z-Score Normalisierung auf diese Werte abgebildet.
Abbildung in dieser Leseprobe nicht enthalten
v‘ = neuer Wert, v= Wert, m = Mittelwert der Werte, = Standardabweichung der Werte
Der neue Wert wiederspiegelt wie weit der ursprüngliche Messwert vom Mittelwert entfernt ist. Ein Wert von zwei bedeutet bspw., dass der Wert um das Zweifache der Standardabweichung vom Mittelwert abweicht. Aus einer Standardnormalverteilungstabelle könnte dann entnommen werden, dass der Wert größer als 97,7% aller Werte ist.
Die Z-Score Methode ist vorteilhaft, sofern die Minimal- und Maximalwerte nicht bekannt sind oder das Ergebnis durch den Einfluss von Ausreißern beeinflusst werden könnte. Außerdem können Werte verschiedener Skalen nach der Z-Score Normalisierung besser verglichen wer- den.
2.2.3.3 Mittelwertzentrierung
Es kann vorkommen, dass die Werte der Sequenzen bei verschiedenen Smartphones einen iden- tischen oder ähnlichen Verlauf aufweisen, aber bezüglich der Achsenabschnitte zueinander ver- schoben sind. Um solche Sequenzen dennoch einfach miteinander vergleichen zu können bietet sich eine Mittelwertzentrierung an. Dabei wird zunächst der Mittelwert pro Sequenz und Rau- machse gebildet. Von jedem Messwert wird dieser Wert nun subtrahiert.26 Dadurch werden die Daten gegen den Mittelwert verschoben und auf die jeweilige Achse abgebildet. Dass der Mit- telwert der so veränderten Daten nun gleich null ist ergibt sich logisch aus dem Verfahren.
2.2.4 Merkmalskalierung (Normalisieren)
Normalisieren spielt nicht nur bei der Datenvorverarbeitung eine Rolle (vgl. Abschnitt 2.2.3), sondern kann auch nach der Merkmalsextraktion auf den extrahierten Merkmalen durchgeführt werden. Diese Durchführung nennt man Merkmalskalierung. Viele Klassifizierer arbeiten besser wenn die Merkmale vorher skaliert wurden.27
Betrachtet man die Merkmalsvektoren als Punkte innerhalb eines n-dimensionalen Raumes, so kann die Ähnlichkeit zweier Punkte durch die räumliche Distanz dargestellt werden. Eine Dis- tanz von Null bedeutet, dass die Merkmalsvektoren identisch sind, also alle Eigenschaften die- selbe Ausprägung haben. Mit Hilfe der Normalisierung der Daten auf einen festgelegten Wer- tebereich, soll der Einfluss der verschiedenen Attribute auf die Distanz den gleichen Stellenwert enthalten.28 Etabliert haben sich die Z-Score Normalisierung, die Min-Max Methode und die Mittelwertzentrierung.
2.2.5 Fensterung
Dieser Vorverarbeitungsschritt soll dazu dienen, eine Sequenz in gleich große Blöcke zu unter- teilen. So kann z.B. als Fenstergröße zwei Sekunden festgelegt werden. Dies bedeutet, dass die Zeitreihen in Intervalle von 2 Sekunden separiert werden. Die Merkmalsextraktion findet dann auf diesen Intervallen statt. Dieses Verfahren kann auch als Segmentierungsverfahren benutzt werden.29
Falls die Fensterung auch zur Segmentierung eingesetzt wird, bedeutet eine zu große Fenstergröße, dass mehrere Aktivitäten in einem Block vorkommen können. Umgekehrt bietet eine kleine Fensterung zwar die Chance die Merkmalsextraktion zu beschleunigen, beinhaltet aber bei zu kleiner Fensterung das Risiko, dass die Aktivitäten nicht mehr richtig erkannt werden. Grund ist, dass ein Block dann nicht genügend Informationen für eine eindeutige Klassifikation enthält. Außerdem führt die Wahl einer zu kleinen Fenstergröße zu unnötigem Rechenaufwand, weil deutlich häufiger klassifiziert werden muss.
Abschließend kann gesagt werden, dass ein Kompromiss für die Fenstergröße gefunden werden muss und von der Aktivität und den zu extrahierenden Merkmalen abhängt.30 Kurze Aktivitäten (wie Springen) benötigen folgendermaßen kleine Fenster.
In der Arbeit von Zheng et al. werden verschiedene Fenstergrößen (1s, 5s, 10s) gewählt und pro Fenster eine Klassifizierung durchgeführt. Mit Mehrheitsvotum wird dann die Aktivität bestimmt. In dieser Arbeit konnte damit ein gutes Ergebnis erzielt werden.31 Die Methode ist aber nicht für eine kurze Aktivitätsdauer < 10s geeignet.
Einen besseren Ansatz verfolgte Luis. Er wählte eine Fenstergröße von 2.56s. Zusätzlich lässt er aufeinanderfolgende Fenster mit 50% überlappen. Diese Wahl begründet er anhand der Ar- gumente:
- Eine durchschnittliche Person hat eine Schrittfrequenz zwischen 90 und 130 Schrit- ten/min. Im Minimum beträgt diese deswegen 1.5Schritte/s.
- Mindestens ein Schrittzyklus wird im Fenster durchlaufen.
- Menschen mit geringerer Schrittfrequenz als 1.5Schritte/s, z.B. Alte oder Behinderte, profitieren ebenfalls, da auch bei ihnen die Wahrscheinlichkeit steigt, dass genügend Informationen in der Sequenz vorhanden sind.
- Frequenzen werden mit der FFT analysiert, diese ist für Vektoren der Länge 128 opti- miert. Eine Vektorgröße von 128 ergibt sich bei einer Abtastrate von 50Hz und einer Fenstergröße von 2.56s. (Rechnung: 2,56s * 50Hz = 128).32
2.3 Merkmalsextraktion
Jede Sequenz besitzt individuelle Eigenschaften. Diese werden durch Merkmale repräsentiert. Bei der Merkmalsextraktion werden die Merkmale erhoben und aus den Sequenzen extrahiert. Die Merkmale können in einem Merkmalsvektor zusammengefasst werden. Die Merkmalsextraktion ist zwingend notwendig, da die Sequenzen anhand der Merkmale / Merkmalsvektoren unterschieden und den jeweiligen Aktivitätsklassen zugeordnet werden.
Die Merkmalsextraktion stellt im Klassifizierungsprozess häufig den wichtigsten Teil dar.33
Abb. 3 stellt die Merkmalsextraktion in den Zusammenhang zum gesamten Klassifizierungs- prozess.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 3:Klassifizierungsprozess: Merkmalsextraktion
Es wird zwischen instanzbasierter und modellbasierter Merkmalsextraktion unterschieden.
2.3.1 Instanzbasierte Merkmalsextraktion
Die instanzbasierte Merkmalsextraktion verwendet alle Messwerte einer Sequenz als Merkmal. Jeder Meßwert ist somit ein Merkmal.34 Es findet keine Merkmalsextraktion im Sinne der modellbasierten Merkmalsextraktion statt.
2.3.2 Modellbasierte Merkmalsextraktion
Der modellbasierte Ansatz hat den Anspruch mit so wenigen Parametern wie möglich auszukommen. Hierfür wird ein Modell der Sequenz entwickelt, d.h. die originale Sequenz wird durch andere Werte repräsentiert. Vorteil der modellbasierten Merkmalsextraktion ist, dass die Sequenzen mit einer geringen Anzahl von Parametern repräsentiert werden. Das folgende Beispiel zeigt wie eine modellbasierte Merkmalsextraktion aussehen könnte und verdeutlicht zudem den Unterschied zur instanzbasierten Merkmalsextraktion.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 4 Modell -und instanzbasierte Merkmalsextraktion. Quelle: Landmesser, Annette (2015), S. 24
Die linke Abb. stellt eine modellbasierte Merkmalsextraktion dar. Die rechte eine instanzba- sierte. Exemplarisch wird hier bei der modellbasierten Merkmalsextraktion die Sequenz durch eine Funktion mit den Parametern m und b beschrieben; m und b sind dann die Merkmale.
Die modellbasierte Merkmalsextraktion eignet sich insbesondere zur Feststellung von Ähnlichkeiten bezüglich globaler Strukturen in langen Sequenzen.35
Die Länge der Zeitreihen variiert i.d.R. stark. Dies liegt einerseits daran, dass Aktivitäten ver- schieden lang ausgeführt werden und andererseits an der allgemeinen Bewegungsdauer, an ver- schiedenen Aufnahmefrequenzen und Abtastfehlern. Bei der instanzbasierten Variante ist es schwer Sequenzen mit unterschiedlicher Länge zu vergleichen, weil die Zeitreihen aufgrund der hohen Abtastrate sehr groß werden und das eine hohe Rechenkomplexität zur Folge hat. Aus diesen Gründen wird in den meisten Arbeiten der modellbasierte Ansatz verfolgt.
2.3.2.1 Erfassung von typischen Merkmalen
Im Folgenden werden Merkmale aus der Domäne Aktivitätserkennung erfasst. Dazu wurden die Merkmale aus wissenschaftlichen Arbeiten mit ähnlichem Forschungshintergrund zusammengetragen. Die Qualität der Merkmale wird im Verlauf der Thesis analysiert. Folgende Auflistung versucht die meist verwendeten Merkmale abzubilden. Aus Gründen der Übersichtlichkeit wurden die verschiedenen Quellen, in denen die Merkmale benutzt werden, nummeriert und in der Referenztabelle aufgelistet (siehe Anhang C: 8).
2.3.2.1.1 Statistische Merkmale
Abbildung in dieser Leseprobe nicht enthalten
2.3.2.1.2 Prädiktive Modelle
In der Arbeit von Adil M. Kahn et. al wurde gezeigt, dass die Samples des Beschleunigungs- sensors in einem Autoregressiven (AR) Prozess entstehen. Sie können daher mit einem AR Modell abgebildet werden. Ein AR Modell der 10. Ordnung ist dafür nach Kahn am besten geeignet. Das AR Modell nutzt die Zeitkomponente um wichtige im Signal versteckte Infor- mationen zu extrahieren36 Die Parameter des AR Modells können als Merkmale genutzt wer- den37
Abbildung in dieser Leseprobe nicht enthalten
2.3.2.1.3 Spektrale Merkmale
Der spektralen Analyse geht eine Transformation der Daten in einen neuen Raum voraus. In diesem Fall wird das Signal durch das Frequenzspektrum mit Hilfe einer Fourier-Transforma- tion (DFT) oder durch Koeffizienten der Diskreten Kosinus Transformation (DCT) modelliert. Basierend auf den transformierten Daten kann eine weitere Merkmalsextraktion stattfinden.
Abbildung in dieser Leseprobe nicht enthalten
Das Frequenzspektrum kann in Teilstücke aufgetrennt werden. Ein einzelnes Teilstück wird Frequenzband genannt. In verschiedenen Studien konnte durch zusätzliche Untersuchung ein- zelner Frequenzbänder ein besseres Ergebnis erzielt werden (Siehe Referenztabellennummer 6 und 7).
2.3.2.1.4 Weitere Merkmale
Abbildung in dieser Leseprobe nicht enthalten
2.4 Merkmalselektion
Durch Merkmalselektion wird die Anzahl der Merkmale reduziert, indem nur die wichtigsten gewählt werden. Vieles spricht für eine geschickte Auswahl der wesentlichen Merkmale und eine Reduktion ihrer Anzahl. So können wenige Merkmale schneller berechnet werden, was zu einer grundsätzlich gesteigerten Rechenleistung führt.
Außerdem verspricht eine kleine Anzahl an qualitativ hochwertigen Merkmalen bessere Generalisierungseigenschaften der Klassifizierer, das Klassifizierungsergebnis wird gesteigert. Besitzen zwei Merkmale ähnlichen oder identischen Informationsgehalt, so ist eines davon redundant. Zusammen (in einem Merkmalsvektor) führt das redundante Merkmal nur zu geringer oder keiner Erhöhung des Informationsgehalts.
Der Punkt Merkmalselektion fand in den meisten Arbeiten zur Aktivitätserkennung bisher wenig Beachtung. Aufgrund der eben erläuterten Vorteile wird er in dieser Arbeit jedoch ausführlicher behandelt. Zur Bestimmung der Merkmalsrelevanz gibt es verschiedene Ansätze. Diese können in Wrapper, Filter, Inkludierter Ansatz und in Transformation untergliedert werden. Die meisten Verfahren der Merkmalselektion sind nur für die modellbasierte Merkmalsextraktion relevant. Diese werden im Folgenden erläutert.
2.4.1 Filter Ansatz (Statistischer Ansatz)
Die Merkmale werden anhand statistischer Charakteristika ausgewählt. Beispielsweise werden Merkmale, deren Werte hohe Varianz aufweisen, als wichtiger angesehen als Merkmalswerte, die sich nur gering unterscheiden. Ein weiteres Kriterium kann sein, wie stark ein Merkmal mit der Klassenannotation korreliert. Zuletzt kann die Ähnlichkeit zwischen den Variablen bewertet werden um z.B. Merkmale mit wenig Redundanz zu wählen.38
Dabei gibt es verschiedene Heuristiken. Bekannte Heuristiken sind der Fisher Score, das Bayesische Informations Kriterium (BIC), Pearson Correlation, Chi2, Mutual information (MI), Maximal Information Coefficient (MIC).39
Zusammenfassung der Vor- und Nachteile des Filter Ansatzes:
Vorteile: schnell, skalierbar, klassifiziererunabhängig
Nachteile: Keine Optimierungen für bestimme Klassifizierer, Merkmalsabhängigkeiten werden meistens missachtet40
2.4.2 Wrapper Ansatz (Kombinatorische Merkmalselektion)
Bei der kombinatorischen Merkmalselektion werden aus der Gesamtmenge der Merkmale, durch Kombination, verschiedene Untermengen erzeugt. Anhand dieser Untermengen wird klassifiziert. Die Ergebnisse werden genutzt um die relevanten Merkmale für eine optimale Klassifizierung zu identifizieren.41 So kann beispielsweise der Informationsgehalt der Merk- male anhand der Änderung der Erkennungsrate durch wiederholte Klassifikation bestimmt wer- den. Zusätzlich kann mit einem Suchalgorithmus vorgegangen werden, um die Suche zu be- schleunigen.42 Aus Komplexitätsgründen ist die Nutzung eines Random Forest Klassifizierers praktikabel.
Es gibt verschiedene Methoden zur kombinatorischen Merkmalselektion. Einige bekannte werden hier vorgestellt.
- Mittels ausprobieren aller möglichen Merkmalskombinationen. Diese Methode ist auch unter dem Namen Brute Force Feature Elimination bekannt.43 Bei jeder Merkmalskombination wird mittels Kreuzvalidierung die Erkennungsrate bestimmt. Die Kombination mit der höchsten Erkennungsrate ist die Beste. Diese Methode liefert garantiert das beste Ergebnis ist aber extrem rechenintensiv.
- Mittels eines genetischen Algorithmus. Dabei stellt jedes Merkmal ein Gen des Indi- viduums dar. Als Fitnesswert für das Individuum dient die Erkennungsrate durch Kreuzvalidierung. Als Mutation wird ein Merkmal entfernt. Ähnlich dem Evolutions- prozess werden Mutationen, die eine höhere Erkennungsrate zur Folge haben, beibehal- ten, wohingegen unvorteilhafte Merkmalskombinationen aussortiert werden.
- Mittels Backward Elimination Algorithmus. Ein Backward Elimination Algorithmus geht iterativ vor. In jedem Iterationsschritt wird ein (oder mehrere) Merkmale aus der Gesamtmenge entfernt und die Änderung der Erkennungsrate bestimmt. Das Merkmal bei welchem die geringste Änderungsrate erkennbar ist wird entfernt. Das Verfahren wird mit der Untermenge der Merkmale wiederholt, bis es zu einer starken Senkung der Erkennungsrate kommt.44 In Sklearn ist ein Backward Elimination Algorithmus unter dem Namen Recursive Feature Elimination (RFE) implementiert.45 Um ein besseres Er- gebnis zu erhalten, kann RFE mit Kreuzvalidierung (RFECV) durchgeführt werden.
Zusammenfassung der Vor- und Nachteile der kombinatorischen Merkmalselektion: Vorteile: einfach, Optimierung für Klassifizierer, beachtet Merkmalsabhängigkeiten. Nachteile: Überanpassungsgefahr, rechenintensiv, klassifiziererabhängig.46
2.4.3 Inkludierter Ansatz (Embedded Approach)
Der Inkludierte Ansatz benutzt die Klassifizierer selbst zur Merkmalselektion. Im Lernprozess der Klassifizierer wird automatisch die Relevanz der Merkmale erlernt. Z.B. ist die Koeffizien- ten Gewichtung nach Klassifizierung mit der linearen SVM ein Indiz für die Relevanz eines Merkmals. Bei der Klassifizierung mit einem Decision Tree wird die Relevanz der Merkmale bspw. anhand verschiedener Heuristiken (z.B. Gini importance) berechnet.47 Weit verbreitet sind Regressions Methoden, um gute Merkmale zu finden. Bekannte Algorith- men sind Ridge Regression und Lasso. Regressionsalgorithmen bestrafen Koeffizienten im Lernprozess der Klassifizierer damit diese einen geringeren Wert annehmen. Hat dies keinen oder nur sehr geringen Einfluss auf die Erkennungsrate, ist das Merkmal vermutlich redundant. In einem Suchpfad werden somit Redundanzen und unwichtige Merkmale erkannt.48 Der Algo- rithmus Elastic Net kombiniert Ridge Regression und LassoCV, um die jeweiligen Vor-und Nachteile der beiden auszugleichen.49
Die Regressionsmethoden können außerdem mit Kreuzvalidierung angewandt werden um stabilere Ergebnisse zu erhalten und um ein geeignetes Maß für die Bestrafungshöhe zu ermit- teln. Die Algorithmen heißen dann RidgeRegressionCV (RRCV), ElasticNetCV (ENCV), LassoCV (LCV).
Zusammenfassung der Vor- und Nachteile der Verfahren des Inkludierten Ansatzes:
Vorteile: Weniger rechenintensiv als Wrapper Methoden, beachtet Merkmalsabhängigkeiten.
Nachteile: klassifiziererabhängig50
[...]
1 Vgl. Bieber, Gerald (05.2014), S.11.
2 Vgl. European Food Information Council (06.2006), S.1
3 Vgl. Bieber, Gerald (05.2014), S.9.
4 Vgl. Bieber, Gerald (05.2014), S.15.
5 Vgl. Maurer, Uwe et al. (04.2006), S.3 und Olguın, Daniel /Pentland, Alex (2006), S. 2 und Bieber, Gerald (05.2014), S.5 und Sankaran, Kartik et al. (2014), S.1
6 Vgl. https://source.android.com/devices/sensors/index.html, [Zugriff: 31.12.2015]
7 Vgl. Google Inc (10.2015): Compatibility Definition Android 6.0
8 Vgl. Liu, M. (2013), S.2.
9 Vgl. Biermann, Kai (05.2014).
10 Liste von Smartphones welche ein Barometer verbauen: URL: http://www.phonegg.com/list/303-Cell-Phones- with-Barometer, [Zugriff: 25.02.2016]
11 Vgl. Anderson, Ian / Muller, Henk (10.2016).
12 Vgl. Lukowicz, Paul et al. (2004).
13 Biermann, Kai (05.2014).
14 Ebd.
15 Ebd.
16 Vgl. Sankaran, Kartik et al. (2014), S.1, S.3.
17 Vgl. Bao, Ling / Intille, Stephen (2004), S.10.
18 Vgl. Shoaib, Muhammad, et al. (14.06.2014), S. 10146.
19 Vgl. Runkler, Thomas (2013), S.2 und Heering, Oliver / Morik, Katharina (09.2009), S. 41
20 Vgl. Bieber (05.2014), S. 23
21 Schmitz, Roland et al. (2006), S. 6
22 Lipinski, Klaus / Lackner, Hans et al..
23 Luis, Jorge (02.07.2014), S. 94.
24 Vgl. Raschka, Sebastian (11.2014).
25 Vgl. Raschka, Sebastian (11.2014).
26 Vgl. Lohninger, Hans (08.2012).
27 Vgl. Raschka, Sebastian (11.2014) und Chih-Wie, Hsu / Chih-Chung, Chang / Chih, Jen Lin (2003), S. 4.
28 Vgl. Reindler (2005) S.8.
29 Vgl. Heering, Oliver / Morik, Katharina (09.2009), S. 41 und Vgl. Landmesser, Annette (2015), S. 45.
30 Vgl. Lara, Oscar / Labrador, Miguel (2013), S. 1198.
31 Vgl. Zheng, Yonglei. et al. (07.2013), S.12.
32 Vgl. Luis, Jorge (02.07.2014): S. 57.
33 Vgl. Ratanamahatana, Chotirat et al. (2005), S.31
34 Landmesser, Annette (2015): S. 24 ff.
35 Vgl. Landmesser, Annette (2015), S.24
36 Vgl. Khan, Adil et al. (10.2013), S. 13106
37 Landmesser, Annette (2015): S. 26
38 Vgl. Peng, Hanchuan / Long, Fuhui / Ding, Chris (2005), S.1
39 Vgl. Batal, Iyad, Theodoridis (2009), S.261 und Saabas, Ando (11.2014)
40 Saeys, Yvan / Iñaki Inza / Pedro Larrañaga (08.2007), S. 1
41 Vgl. Bieber (05.2014), S. 31.
42 Siehe Brownlee, Jason (06.10.2014).
43 Vgl. Kan, Deng (11.1998), S. 118.
44 Vgl. Rakotomamonjy (2003), S.1367 und Guyon, Isabelle, et al. (2008), S.145.
45 Dokumentation des Algorithmus zu finden unter: http://scikit-learn.org/stable/modules/generated/sklearn.fea- ture_selection.RFE.html
46 Vgl. Saeys, Yvan et al (24.08.2007): S. 2
47 Vgl. Carolin Strobl / Achim Zeileis (2008), S. 14ff
48 Vgl. Hastie, Trevor. et al. (2005), S. 658ff
49 Vgl. Zou, Hui / Hastie, Trevor (2005), S. 301-320.
50 Saeys, Yvan et al (24.08.2007): S. 3
- Citar trabajo
- Matthias Rieger (Autor), 2016, Aktivitätserkennung mittels Sensordaten eines Smartphones, Múnich, GRIN Verlag, https://www.grin.com/document/335904
-
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X.