Durch die Vielzahl von Onlineshops und Fülle an Angeboten verliert der Onlinekäufer schnell die Übersicht. Preisvergleichsplattformen wie idealo helfen dem Kunden das günstigste Angebot im Netz zu finden. Die Gewährleistung der möglichst vollständigen Markttransparenz ist eine grundlegende Herausforderung für idealo. Das von uns entwickelte Softwaresystem Scout soll dabei helfen, den Produktkatalog von idealo auf Vollständigkeit zu überprüfen und fehlende Angebote aufzulisten. Ein wichtiger Prozessschritt ist dabei die Extrahierung von Produktinformationen, wie Produktname oder Preis, aus den einzelnen Webseiten. Die Schwierigkeit der Extraktion liegt darin, dass jeder Shop einen individuellen Aufbau besitzt und unterschiedlich strukturiert ist.
Im Rahmen dieser Arbeit wurde ein Algorithmus entwickelt, welcher mittels maschinellem Lernen die Produktinformationen aus den Webseiten extrahiert. Messungen, welche auf 50 verschiedenen Shops basieren, haben ergeben, dass die Produktinformationen mit einer Precision von über 95 Prozent bei einer Accuracy von etwa 50% extrahiert werden können.
Inhaltsverzeichnis
1 Die Welt der Preisvergleichsportale 4
1.1 Der Onlinehandel von heute 4
1.2 Das Preisvergleichsportal idealo 4
1.3 Das Ziel des Bachelorprojektes 4
1.4 Die Microservice-Architektur des Scout-Softwaresystems
2 Die Extraktion Produktspezifischer Daten 6
2.1 Die technischen Anforderungen an den Parser 6
2.2 Die Positionsbestimmung der Produktattribute 6
2.3 Die Architektur des Parsers 7
2.4 Die Erstellung der Selektoren
3 Die Genauigkeitsmessung des Extraktionsalgorithmus 12
3.1 Die Testdaten der Evaluierung 12
3.2 Die Messergebnisse 12
3.3 Mögliche Fehlerquellen der Messungen
4 Der Ausblick und das Fazit
Das Literaturverzeichnis
- Citar trabajo
- Leonardo Hübscher (Autor), 2018, Maschinelles Lernen im Onlinehandel, Múnich, GRIN Verlag, https://www.grin.com/document/448663
-
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X.