Collaborative Filtering. Einsatz für die Streaming-Branche am Beispiel des Anbieters Joyn


Hausarbeit, 2020

18 Seiten


Leseprobe


I Inhaltsverzeichnis

II Abbildungsverzeichnis

1 Einleitung

2 Recommender Systeme
2.1 Definition
2.2 Gründe für den Einsatz von Recommender Systemen
2.3 Content-based Recommender
2.4 Collaborative Filtering Recommender
2.5 Prediction & Recommendation

3 Filtering Arten
3.1 User-based Filtering
3.2 Item-based Filtering
3.3 Probleme des Collaborative Filtering
3.3.1 Kaltstart-Problem
3.3.2 Spärlichkeit
3.3.3 Lemming-Effekt
3.3.4 Synonymie
3.3.5 Shilling Attacks
3.3.6 Grey Sheep Problem

4 Einsatz anhand eines Praxisbeispiels

5 Fazit

III Literatur

II Abbildungsverzeichnis

Abbildung 1: Übersicht Recommender Systeme

Abbildung 2: User-based Filtering mithilfe von Mentoren

Abbildung 3: Item-based Filtering

Abbildung 4: Ermittlung der nächsten Nachbarn

Abbildung 5: Nutzermatrix mit Bewertungen

Abbildung 6: Berechnung der fehlenden Bewertungen

Abbildung 7: Empfehlung auf Basis der vorausgesagten Bewertungen

1 Einleitung

Die vorliegende Arbeit stellt die Prüfungsleistung des Seminars Technical Applications & Data Management des Masterstudiengangs Digitales Management der Hochschule Fresenius in München dar. Die Ausarbeitung der Arbeit erfolgte zu dem Thema „Collaborative Filtering - Einsatz für die Streaming-Branche am Beispiel des Anbieters Joyn“. Inhalt der Arbeit stellt eine Übersicht von aktuellen Recommender Systemen dar, welche zunächst allgemein beschrieben und dann anhand von gängigen Annahmen voneinander abgegrenzt werden. Im weiteren Verlauf werden die beiden Filtering Arten User-Based Filtering und Item-Basend Filtering näher betrachtet. Nachdem die Unterschiede definiert wurden, werden aktuelle Herausforderungen skizziert, welche im Rahmen der Implementierung von Recommender Systemen auftreten können. Am Schluss wird die allgemeine Funktionsweise eines Recommender Systems anhand des Streaming-Anbieters Joyn demonstriert. Die Arbeit endet mit einem Fazit.

2 Recommender Systeme

Bereits seit Mitte der 90er Jahre bieten Softwareanbieter sogenannte Recommender Systeme für den Einsatz im E-Commerce und der Personalisierung an. Dabei bezeichneten die Systeme anfangs die allgemeine Möglichkeit, Websitebesuchern teilweise automatisierte Empfehlungen zu bestimmten Produkten oder Inhalten auszusprechen.1 Die heute eingesetzten Empfehlungssysteme lassen sich dabei in die zwei Kategorien nicht-individualisierte und individualisierte Systeme aufteilen. Der Unterschied der beiden Klassen liegt in der Nützlichkeit der Empfehlung für einen individuellen Nutzer. Bei nicht-individualisierten Systemen werden vergleichsweise einfache Algorithmen eingesetzt, welche nutzerunabhängige Empfehlungen aussprechen, die für alle Nutzer identisch sind. Die individualisierten Empfehlungssysteme lassen sich wiederum in eigenschaftsbasierte Systeme und Empfehlersysteme aufteilen. Anders als die nicht-individualisierten Systeme, erstellen die individualisierten Systeme Empfehlungen oder Prognosen, welche auf den persönlichen Präferenzen der Nutzer basieren. Im Allgemeinen werden diese Systeme als Collaborative Filtering Systeme bezeichnet. Das Collaborative Filtering kommt überall dort zum Einsatz, wo Objekte nicht anhand objektiver, quantifizierbarer Eigenschaften beschrieben werden können.2

2.1 Definition

„Ein Empfehlungssystem (oft auch „Recommender System“ genannt) ist ein System, das einem Benutzer in einem gegebenen Kontext aus einer gegebenen Entitätsmenge aktiv eine Teilmenge „nützlicher“ Elemente empfiehlt“.3 Die Kernaufgabe von Recommender Systemen lässt sich anhand der mathematischen Formel max (Nutzwert(B,K,T))mit K = (P,M,S) beschreiben. Das Ziel besteht in der Maximierung des Nutzens der Benutzer B mithilfe der empfohlenen Elemente T im Kontext K. Dabei lässt sich der Kontext wiederum durch das Benutzerprofil P, der Entitätsmenge M und der Situation S definieren. Das Profil P besteht sowohl aus expliziten Informationen wie sozio-demographischen Daten und Interessensgebieten als auch aus impliziten Informationen, die auf Interaktionen der Nutzer mit bestimmten Produkten oder Dienstleistungen zurückzuführen sind. Neben den Informationen aus dem Nutzerprofil, lassen sich Empfehlungen auch durch Änderungen der Entitäten, zum Beispiel Zu- oder Abnahme, erzeugen. Zu diesem Zweck wird die Entitätsmenge M in den Kontext aufgenommen. Als Situation S bezeichnet man vorhandene reale Rahmenbedingungen wie Standort-Informationen, benutzte Endgeräte der Nutzer oder Zeitangaben.4

2.2 Gründe für den Einsatz von Recommender Systemen

Die Entwicklung und der Einsatz5 von Recommender Systemen lässt sich vor allem auf ein generelles Überangebot und auf einen im Markt herrschenden Technologiedruck zurückführen. Aufgrund der steigenden Anzahl an verfügbaren Produkten und Dienstleistungen ist es für Verbraucher schwierig geworden, die Informationsflut zu verarbeiten und optimale Angebote zu finden. Damit die Verbraucher trotz Fachkenntnismangel eine gute Entscheidung treffen können, werden Recommender Systeme eingesetzt. Die Systeme sollen eine beratende Funktion einnehmen und somit zusätzliche Berater, unabhängige Preisvergleiche oder die Meinungen von Bekannten überflüssig machen. Darüber hinaus sollen die Systeme auch unaufgeforderte Empfehlungen für Produkte oder Dienstleistungen aussprechen, welche die Nutzer bisher noch nicht in Betracht gezogen haben. In diesem Fall wissen die Nutzer noch nicht, dass es eventuell weitere Empfehlungselemente gibt, die zu den jeweiligen Präferenzen und Affinitäten passen könnten. Neben dem bereits erwähnten Bedarfssog wird der Einsatz von Recommender Systemen durch den vorherrschenden Technologiedruck der Unternehmen begünstigt. Demnach können Unternehmen wie Amazon oder Netflix durch den Einsatz der Systeme Wettbewerbsvorteile generieren und den Kunden attraktive Angebote unterbreiten. Data Mining, die zweckgerichtete Auswertung von Kunden-, Produkt- und Transaktionsdaten und der Einsatz von Informationstechnologien, ermöglicht den Unternehmen die Entwickl

2.3 Content-based Recommender

Wie aus der Abbildung 1 hervorgeht, unterscheiden sich Recommender Systeme im Wesentlichen durch zwei verschiedene Herangehensweisen. Bei content-basierten Techniken werden Vergleiche von Objekten anhand einer bestimmten Anzahl von Eigenschaften angestellt. Dabei kann die Auswahl der Eigenschaften je nach Produkt oder Dienstleistung variieren. Als Beispiele können Eigenschaften wie Produktabmessungen, Farben, Formen, Gewicht, Preise oder Marken genannt werden. Da die Objekte anhand ihrer Eigenschaften kategorisiert werden können, ist es für die Systeme möglich, Bewertungen anhand der vorliegenden Kategorien auszusprechen. Weil die Systeme zunächst relevante Eigenschaften identifizieren und gegebenenfalls bewerten müssen, können Content-based Recommender Systeme als kontextabhängig bezeichnet werden.6 7 8

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Übersicht Recommender Systeme.

(Quelle: Surikala 2017, o.S.)

Um userspezifische Empfehlungen aussprechen zu können, arbeiten Content-based Recommender Systeme mit Feature-Vektoren, welche zum Beispiel durch ein Benutzer-Profil dargestellt werden können. Das Profil enthält dabei die bereits erwähnten Präferenzen der User, auf deren Basis durch das Extrahieren von Features Empfehlungen generiert werden.7 „Dabei beschreibt der Feature-Vektor xu des betrachteten Users u die Präferenzen von u für Items Iu. Jedes Item 3 aus I wird durch einen Feature-Vektor x; repräsentiert, welcher sich aus den Eigenschaften des Items i zusammensetzt.“8 Aus den generierten Feature-Vektoren lassen sich schließlich Vergleiche zu den Vorlieben der User erstellen, welche am Ende durch Empfehlungen dargestellt werden.9

Content-based Recommender Systeme kommen vor allem bei Elementen mit kurzer Lebensdauer zum Einsatz, da diese Elemente aufgrund ihrer Kurzlebigkeit nur wenige Bewertungen erhalten können. Durch die vorhergehende Analyse neuer Elemente, können diese leicht in das System integriert und direkt nach ihrer Verarbeitung neuen Nutzern vorgeschlagen werden. Solche kurzlebigen Elemente können zum Beispiel Nachrichten oder aktuelle Artikel in Online-Zeitschriften darstellen. Ein Nachteil der Content-based Systeme stellt die Eintönigkeit der Empfehlungen dar. Da die Basis der Empfehlung aufgrund der historischen Bewertungen der Nutzer erfolgt, können Nutzern niemals Elemente vorgeschlagen werden, welche sich zu stark von den bisherig betrachteten Elementen unterscheiden. Das Problem der Überspezialisierung führt schließlich dazu, dass den Nutzern ausschließlich Elemente aus einem sehr kleinen Bereich empfohlen werden, welche sich untereinander sehr stark ähneln.10

2.4 Collaborative Filtering Recommender

Anders als beim Content-based Filtering, werden beim Collaborative Filtering Empfehlungen nicht auf Basis der Ähnlichkeit von Produkten, sondern auf Basis von Ähnlichkeiten zwischen den Kunden, zum Beispiel in Bezug auf Kaufentscheidungen oder Produktbewertungen, berechnet.11

„Die grundsätzliche Annahme, die dem Collaborative Filtering zugrunde liegt ist, dass zwei Personen u< und u2 e ?, die ein Element i< e / ähnlich bewerten, auch ein anderes Element i2 e / ähnlich bewerten, aufgrund ihrer persönlichen Präferenzen.“12

Die Vorgehensweise des Collaborative Filtering entsteht durch die Annahme, dass Elemente aus der Präferenzliste einer Person, bei einer großen Überschneidung auch den jeweiligen Geschmack der anderen Person treffen können.13 Die Collaborative Filtering Recommender erstellen demnach zunächst eine gleichgesinnte Nachbarschaft von Nutzern auf Basis des zu betrachtenden Nutzers. Anhand eines Vergleiches historischer Bewertungen von Elementen, können fehlende Bewertungen für unbekannte Elemente angenommen werden, sofern diese durch einen ähnlichen Nutzer durchgeführt wurden.14 Der Einsatz von Collaborative Filtering ist daher nur möglich, wenn das System über eine große Anzahl von Personen und deren Präferenzen verfügt. Diese Präferenzen können sowohl implizit über das Nutzerverhalten als auch explizit durch klassischen Bewertungsformulare erfasst werden.15

Um den Erfolg von Collaborative Filtering Systemen zu gewährleisten, sollten eine Reihe von Faktoren oder Regeln eingehalten werden. Zunächst muss darauf geachtet werden, homogene Ratingfaktoren mit einer möglichst hohen Überlappung auszuwählen, um eine bessere Berechnung der Nutzerähnlichkeiten zu gewährleisten. Zu diesem Zweck sollten zunächst Elemente mit einer hohen erwarteten Bekanntheit ausgewählt werden. Darüber hinaus sollten auch kontrovers bewertete Elemente ausgewählt werden, an denen sich der Grad der Übereinstimmung einfacher messen lässt. Zuletzt muss darauf geachtet werden, dass auch unbekannte Elemente bewertet werden, da für diese ansonsten keine Empfehlungen ausgesprochen werden können. Eine in der Praxis oft angewandte Aufteilung beträgt 50 Prozent bekannte und 50 Prozent zufällig ausgewählte Elemente. Wurden genügend Daten erfasst, müssen im nächsten Schritt besonders ähnliche Nutzer ausgewählt werden. Die sogenannten Mentoren zeichnen sich durch eine berechenbare Ähnlichkeit zu dem aktiven Nutzer aus. Darüber hinaus müssen Mentoren über gewisse Übereinstimmungen der Nutzerprofile verfügen und mindestens ein Element bewertet haben, welches der aktive Nutzer noch nicht bewertet hat.16 Die Berechnung der anschließenden Empfehlung anhand des Collaborative Filtering Ansatzes, erfolgt durch das nachfolgende Schaubild.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: User-based Filtering mithilfe von Mentoren.

(Quelle: Eigene Darstellung.)

Die Abbildung zeigt den aktiven Nutzer U1, die Mentoren 2 und 3 sowie die bewerteten Elemente E1, E2, E3 und E4. Es wird angenommen, dass die Mentoren über eine Vielzahl von Übereinstimmungen mit dem Nutzerprofil von U1 verfügen. Die Präferenzen der Nutzer stimmen insofern überein, als dass alle Profile die Elemente E3 und E4 negativ bewertet haben. Eine weitere Gemeinsamkeit stellt die positive Bewertung von E1 durch den Nutzer U1 und den Mentor 2 dar. Die beiden Mentoren 2 und 3 haben darüber hinaus eine positive Bewertung für das Element E2 abgegeben, welches für den Nutzer U1 noch unbekannt ist. Durch das Collaborative Filtering System würde in diesem Fall eine Empfehlung auf Basis der Übereinstimmung der Präferenzen für das Element E2 erfolgen.

Aus der Funktionsweise geht hervor, dass Collaborative Filtering Systeme zwei Aufgaben erfüllen müssen. Auf der einen Seite muss zunächst eine Vorhersage getroffen werden, wie der aktive Nutzer das potentiell zu empfehlende Element bewerten würde. Die sogenannte Prediction stellt dabei einen numerischen Wert dar, der auf der Abschätzung der möglichen Bewertung basiert. Die letztendliche Empfehlung kann durch eine Liste von Elementen dargestellt werden. Diese Liste darf dabei keine Elemente enthalten, welche der aktive Nutzer bereits kennt oder bewertet hat. Das Element, welches der Nutzer am wahrscheinlichsten gut bewerten würde, wird als Recommendation durch das System ausgegeben.17

3 Filtering Arten

Das Collaborative Filtering stellt die am häufigsten angewandte Methode der Empfehlungssysteme dar. Wie in den vorherigen Abschnitten bereits aufgezeigt wurde, wird der Grundgedanke des Collaborative Filterings durch die Annahme beschrieben, dass Nutzer, die in der Vergangenheit oft denselben Geschmack hatten, auch in Zukunft ähnliche Präferenzen teilen werden. Das Collaborative Filtering kann ferner in die zwei Typen user-based Filtering und item-based Filtering unterteilt werden.18

3.1 User-based Filtering

Die Funktionsweise des user-basierten Ansatzes wurde bereits mithilfe der Abbildung 2 näher erläutert. Die grundsätzliche Logik hinter dem Verfahren stellt das Empfehlen auf Basis von nutzerspezifischen Ähnlichkeiten dar. Zu diesem Zweck muss der Algorithmus zunächst zwei Aufgaben erfüllen. Als erstes müssen die ähnlichsten Nutzer, auch nächste Nachbarn genannt, gefunden werden. Eine Ähnlichkeitsfunktion misst dabei den Grad der Ähnlichkeit unter den verschiedenen Nutzern. Im zweiten Schritt muss der Algorithmus Vorhersagen über eine mögliche Bewertung der Elemente durch den Nutzer treffen, die alle Nachbarn bereits konsumiert haben, der zu betrachtende Nutzer jedoch nicht. Der Gegenstand, welcher die beste vorausgesagte Bewertung erhält, wird dem Nutzer schlussendlich empfohlen.19

[...]


1 Vgl. Gentsch/Lee 2004, S.170.

2 Vgl. Bohnert 2004, S.3.

3 Klahold 2009, S.1.

4 Vgl. Klahold 2009, S.1.

5 Vgl. Schneider 2005, S.5f.

6 Vgl. Dörrhöfer 2012, S.21.

7 Vgl. Feger 2018, S.2.

8 Feger 2018, S.2.

9 Vgl. Feger 2018, S.2.

10 Vgl. Harasic 2011, S.13f.

11 Vgl. Walsh/Deseniss/Kilian 2019, S.542.

12 Dörrhöfer 2012, S.12.

13 Vgl. ebd.

14 Vgl. Feger 2018, S.5.

15 Vgl. Feger 2018, S.6.

16 Vgl. Bohnert 2004, S.7.

17 Vgl. Dörrhöfer 2012, S.13.

18 Vgl. Perez et al. 2017, S.269.

19 Vgl. Pinela 2018, o.S.

Ende der Leseprobe aus 18 Seiten

Details

Titel
Collaborative Filtering. Einsatz für die Streaming-Branche am Beispiel des Anbieters Joyn
Hochschule
Hochschule Fresenius München
Autor
Jahr
2020
Seiten
18
Katalognummer
V1001659
ISBN (eBook)
9783346378026
Sprache
Deutsch
Schlagworte
collaborative, filtering, einsatz, streaming-branche, beispiel, anbieters, joyn
Arbeit zitieren
Yannick Georgii (Autor:in), 2020, Collaborative Filtering. Einsatz für die Streaming-Branche am Beispiel des Anbieters Joyn, München, GRIN Verlag, https://www.grin.com/document/1001659

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Collaborative Filtering. Einsatz für die Streaming-Branche am Beispiel des Anbieters Joyn



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden