Konsumenten sehen sich in Zeiten des Internets einer regelrechten Informationsflut gegenüber. Die wirklich relevanten Informationen herauszufiltern, wird für viele immer schwieriger. Eine Lösung bieten Empfehlungssysteme. Diese reduzieren die Komplexität von Entscheidungen, sodass Nutzer relevante Informationen schneller finden.
Ob bei der Urlaubsplanung oder beim Streaming, viele Anbieter setzen schon jetzt auf Gruppenempfehlungssysteme. Die jeweiligen Lösungen können aber noch nicht allgemein angewandt werden. Wie Marina Hell verdeutlicht, fehlt uns derzeit noch ein domainunabhängiges Empfehlungssystem für Gruppen.
Wie können in einem unabhängigen Setting Empfehlungen für Gruppen generiert werden? Und wie erreichen Empfehlungen eine bessere Genauigkeit? Hell erklärt die theoretischen Grundlagen und entwickelt ein eigenes domänenunabhängiges Empfehlungssystem für Gruppen.
Aus dem Inhalt:
- Empfehlungsalgorithmus;
- Filtering;
- Gruppierungsstrategie;
- Präferenz;
- Cluster
Inhaltsverzeichnis
Abkürzungsverzeichnis
Abbildungsverzeichnis
Tabellenverzeichnis
1 Einleitung
2 Recherche und Diskussion der relevanten Literatur
2.1 Vorgehen der Literaturrecherche
2.2 Begriffsdefinitionen
3 Theoretische Grundlagen zu Gruppenempfehlungssystemen
3.1 Empfehlungssysteme für Einzelnutzer
3.2 Empfehlungssysteme für Gruppen
3.3 Empfehlungsalgorithmen
3.4 Gruppierungsstrategie
3.5 Aggregationsmethode
4 Entwicklung und Umsetzung eines Empfehlungssystems für flüchtige Gruppen
4.1 Anforderungen
4.2 Entwicklung des Modells
4.3 Umsetzung des Modells
5 Implementierung der entwickelten Methode
5.1 Programmeinführung KNIME
5.2 Implementierung des Gruppenempfehlungssystems
6 Evaluation des Gruppenempfehlungssystems und Interpretation der Ergebnisse
6.1 Erhebung des Datensatzes
6.2 Wahl des Evaluationskriteriums
6.3 Vorgehen der Evaluation
6.4 Diskussion der Ergebnisse
7 Schluss
7.1 Zusammenfassung der Arbeit
7.2 Kritische Würdigung und Ausblick für zukünftige Forschung
Literaturverzeichnis
Bibliografische Information der Deutschen Nationalbibliothek:
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
Impressum:
Copyright ©Studylab 2019
Ein Imprint der Open Publishing GmbH, München
Druck und Bindung: Books on Demand GmbH, Norderstedt, Germany
Coverbild: GRIN Publishing GmbH | Freepik.com | Flaticon.com | ei8htz
Abkürzungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
Abbildungsverzeichnis
Abbildung 5-1 Screenshot des Content-Based Filtering Workflows in KNIME
Abbildung 5-2 Screenshot des Collaborative Filtering Workflows in KNIME
Abbildung 6-1 Auswirkung der Vorhersagegenauigkeit von Empfehlungen auf die Umsatzzahlen
Tabellenverzeichnis
Tabelle 2-1 Verschiedene Arten von Gruppen mit ihren Definitionen
Tabelle 2-2 Verschiedene Definitionen von flüchtigen Gruppe in der Literatur
Tabelle 3-1 Betitelungen der populärsten Gruppierungsstrategien
Tabelle 3-2 Aggregationsmethoden aus der Literatur im Überblick
Tabelle 4-1 Notation zur mathematischen Umsetzung des Modells
Tabelle 4-2 Beispielhafte Darstellung eines ungewichteten Itemprofils
Tabelle 4-3 Beispielhafte Darstellung eines gewichteten Itemprofils
Tabelle 4-4 Beispielhafte Darstellung des Aggregationsvorgehens
Tabelle 6-1 Ergebnisse der Evaluation auf Basis von 90 Testwerten
Tabelle 6-2 Ergebnisse der Evaluation auf Basis von 150 Testwerten
1 Einleitung
“We are leaving the age of information and entering the age of recommendation” (Anderson 2006)
Aufgrund der rasanten Entwicklung der Informationstechnologie und der stetig steigenden Menge an digitalen Informationen und Daten sind wir täglich mit einer enormen Informationsüberflutung konfrontiert. Der Psychologe und Neurologe Daniel J. Levitin spricht von einem Zeitalter der Informationsüberlastung, in dem wir mehr Informationen in den letzten paar Jahren generiert haben, als in der gesamten Geschichte der Menschheit (Levitin 2015). Eine Folge der Informationsüberlastung ist, dass Konsumenten heutzutage eine Vielzahl an Items zur Verfügung stehen, aus denen es gilt, die für einen selbst interessanten und relevanten Items herauszufiltern. Das Wort Item ist in der Literatur ein gängiger Sammelbegriff für jegliche Produkte, Objekte, Inhalte, Dienstleistungen, Artikel oder lediglich Informationen, die Konsumenten angeboten werden. Im Kontext von E-Commerce Lösungen können dies beispielsweise käufliche Produkte sein, bei Online Bibliotheken Artikel oder Bücher, aber auch Spielfilme oder Restaurants sind Beispiele, die unter den Sammelbegriff Item fallen. Durch die immense Zahl der zur Verfügung stehenden Items ist es sehr schwer möglich, einen Überblick zu behalten und diese manuell nach subjektiver Relevanz zu filtern. Um diesem Problem entgegen zu wirken, sind personalisierte Empfehlungssystems (Recommender Systems) entwickelt worden. Empfehlungssysteme reduzieren die Komplexität der Entscheidungen und erleichtern Nutzern die Identifikation relevanter Items (Berkovsky und Freyne 2010; Leskovec et al. 2014; Jannach et al. 2010, S.xiii), indem sie mit Hilfe verschiedener Filteralgorithmen die Präferenzen eines Nutzers vorhersagen und ihm die geeignetsten Items empfehlen (Isinkaye et al. 2015; Baltrunas et al. 2010).
Empfehlungssysteme sind mittlerweile in unserem Alltag etabliert und ein, sowohl in der Wissenschaft, als auch in der Praxis, sehr beliebtes und relevantes Themengebiet. Park et al. (2012) haben in ihrer Studie einen Literaturüberblick über wissenschaftliche Arbeiten zum Thema Empfehlungssysteme erstellt und allein aus den Jahren 2001 bis 2010 über 210 Arbeiten zusammengetragen. Seit 2007 tagt auch jährlich die ACM Recommender Systems Conference (RecSys Conference). Ein Forum für die neusten Forschungsergebnisse und Techniken zum Thema Empfehlungssysteme, welches in den letzten Jahren mehr als 500 Teilnehmer zählte (RecSys Community 2017). Der Streaming-Anbieter Netflix stellt ein sehr gutes Beispiel für die wissenschaftliche und praktische Relevanz von Empfehlungssystemen dar. Netflix verwendet Empfehlungssysteme, um seinen Nutzern personalisierte Film- und Serienvorschläge anbieten zu können. Allerdings hat Netflix im Jahr 2006 mit der Ausschreibung des „Netflix Prize“ auch in der Forschung zu Empfehlungssystemen einen erheblichen Beitrag geleistet. Der „Netflix Prize“ war ein mit einer Millionen Dollar Preisgeld dotierter Wettbewerb zur Verbesserung des unternehmenseigenen Empfehlungssystems und zählte tausende teilnehmende Teams aus unterschiedlichsten Nationen (Bennett und Lanning 2007; Gomez-Uribe und Hunt 2016; Lohr 2009).
Viele erfolgreiche Anwendungsbeispiele von Empfehlungssystemen unterstreichen auch ihre Relevanz in der Praxis. Große Unternehmen wie beispielsweise Amazon, eBay, iTunes oder Google sind dafür bekannt, dass sie Empfehlungssysteme verwenden (Pathak et al. 2010). Laut Adomavicius et al. (2013) sind 38 % der Google News Clicks auf Empfehlungssysteme zurück zu führen und 35% des Umsatzes von Amazon ebenfalls. Die Einführung von Empfehlungssystemen hat sowohl Kunden als auch Unternehmen gänzlich neue Möglichkeiten und Vorteile eröffnet. Empfehlungssysteme ermöglichen Nutzern effizienter aus einer großen Anzahl angebotener Produkte zu filtern und reduzieren somit die mit der Suche verbundenen Transaktionskosten (Isinkaye et al. 2015). Laut der 2007 durchgeführten ChoiceStream Umfrage sind 45 % der Nutzer eher dazu geneigt, auf Webseiten einzukaufen, die Empfehlungssysteme verwenden (ChoiceStream 2017). Unternehmen, die Empfehlungssysteme einsetzen, profitieren nicht nur davon, dass Kunden ihre Dienste bevorzugen, wie die oben genannte Studie bestätigt, sondern auch durch erhöhte Kundenloyalität, Click-Through und Conversion Rates und die damit verbundene Umsatzsteigerungen (Adomavicius et al. 2013; Linden et al. 2003).
In den letzten Jahren ist eine neue Art von Empfehlungssystemen in den Fokus gerückt, die sich auf Items spezialisiert, welche kollektiv konsumiert werden (Christensen et al. 2016). Es zeigt sich, dass manche Arten von Items mindestens genauso oft von Gruppen wie von Individuen genutzt werden und die Empfehlung von Items für Gruppen in manchen Situationen sogar sinnvoller und gebräuchlicher ist als für Einzelnutzer (Baltrunas et al. 2010; Jameson und Smyth 2007). Als Beispieldomänen für den sinnvollen Einsatz von Gruppenempfehlungssystemen geben Berkovsky und Freyne (2010) unter anderem Touristenattraktionen oder Stadtführungen, Urlaube, Spielfilme oder TV Programme, sowie die Musikauswahl für öffentliche Orte an. Auch der Besuch diverser Veranstaltungen wie Konzerte oder Musicals, Vergnügungsparks oder Einkaufszentren wird oft in Gruppen getätigt und bietet damit Raum für Gruppenempfehlungssysteme (Marchand und Hennig-Thurau 2012, S.4). Der Bedarf an Gruppenempfehlungssystemen ist nicht nur in diesen geläufigen Alltagssituationen gegeben. Durch die technologische Entwicklung der letzten Jahre hin zur konstanten Nutzung von mobilen Geräten ergeben sich auch immer mehr neue Möglichkeiten, Gruppenempfehlungssysteme sinnvoll einzusetzen (Jameson und Smyth 2007). Beispiele für diese technologisierten, relativ neu entstandenen Situationen, in denen Gruppenempfehlungssysteme ebenfalls einsatzbar sind, können unter anderem die Nutzung von Tablets, Mobiltelefonen, Spielekonsolen oder Smart TVs in Gruppen sein. Jameson und Smyth (2007) reden auch von einem Potenzial für Gruppenempfehlungssysteme bei Anzeigetafeln oder Informationskiosken an öffentlichen Orten. Dies zeigt, dass der Bedarf für Gruppenempfehlungssysteme in alltäglichen Domänen bereits besteht und auch höchstwahrscheinlich zukünftig gegeben sein wird, aber auch, dass durch kontinuierliche Innovation neue Situationen für Gruppenempfehlungssysteme entstehen und sie somit zu einem sehr aktuellen Forschungsgebiet machen. Trotz des vorhandenen Bedarfs und der damit verbundenen Relevanz von Gruppenempfehlungssystemen ist dies noch ein relativ modernes Forschungsgebiet mit vergleichsweise wenig erfolgreichen Anwendungsbeispielen in der Praxis. Aus der bisherigen Literatur geht hervor, dass verschiedene Arbeiten der vergangenen Jahre Empfehlungssysteme für spezielle Domänen und verschiedenste Arten von Gruppen konzipiert haben. Die Herausforderung dieser Arbeit besteht allerdings darin, ein allgemein anwendbares und nicht domänenspezifisches Verfahren zur Generierung von Empfehlungen für eine spezielle Art von Gruppen, den flüchtigen Gruppen, zu entwickeln. Zusätzlich grenzt sich diese Arbeit durch neue Ansätze und Weiterentwicklungen bisheriger Verfahren von anderen Arbeiten in diesem Forschungsfeld ab.
Die allgemeine Forschungsfrage dieser Arbeit lautet daher wie folgt:
Wie können in einem domänenunabhängigen Setting Empfehlungen für flüchtige Gruppen generiert werden, welche eine möglichst hohe Vorhersagegenauigkeit in Bezug auf die tatsächlichen Präferenzen der Gruppe enthalten?
Ziel dieser Arbeit ist es, ein Konzept für die Umsetzung der Forschungsfrage zu erarbeiten, zu implementieren und zu evaluieren. Für die Evaluation des Modells werden mithilfe eines konkreten Experiments eigenständige Daten erhoben und getestet. Somit grenzt sich diese Arbeit nicht nur von dem Forschungsbereich der Einzelnutzerempfehlungssysteme ab, sondern auch von Arbeiten zu ganz speziellen Domänen und anderen Gruppenarten.
Zur Erreichung der Zielsetzung ist der weitere Verlauf dieser Arbeit wie folgt strukturiert: Im zweiten Kapitel wird die Vorgehensweise der Literaturrecherche näher erläutert und ein Literaturüberblick gegeben, um ein allumfassendes Bild des State-of-the-Art bei Gruppenempfehlungssystemen zu erlangen. Zusätzlich werden Begriffsdefinitionen erarbeitet, die sich aufgrund der Dissense in der Literatur ergeben haben. Dabei wird diese Arbeit auch gleichzeitig klar von anderen Arbeiten in ähnlichen Forschungsgebieten abgegrenzt. Im anschließenden Teil der Arbeit, dem dritten Kapitel, werden die theoretischen Grundlagen zu Gruppenempfehlungssystemen näher betrachtet. Hierbei werden die verschiedenen Attribute oder Optionen, die bei dem Design eines Gruppenempfehlungssystems zur Verfügung stehen, erklärt und deren Vor- und Nachteile in Betracht gezogen, um bei der Konzeption des eigenen Empfehlungssystems fundierte Entscheidungen zu den verwendeten Verfahren treffen zu können. Im Hauptteil der Arbeit wird auf Basis der definierten Anforderungen an das System und mit Hilfe der zuvor betrachteten theoretischen Grundlagen ein eigenes Gruppenempfehlungssystem entwickelt und mathematisch umgesetzt. Darauf aufbauend erfolgt die Implementierung des Systems in Excel und in KNIME, um eine Inbetriebnahme und Evaluation zu ermöglichen. Im fünften Kapitel soll das entwickelte System evaluiert werden. Dafür wird zunächst das Experiment zur Erhebung des Datensatzes umrissen und das eigene Modell anschließend mit Hilfe der erhobenen Daten im Hinblick auf das gewählte Evaluationskriterium kritisch betrachtet. Zuletzt erfolgt eine Zusammenfassung der Ergebnisse mit einem Ausblick auf mögliche zukünftige Forschungen und einer kritischen Würdigung der eigenen Arbeit.
2 Recherche und Diskussion der relevanten Literatur
Das primär interessierende Phänomen dieser Arbeit ist die Konzeption, Implementierung und Evaluation eines Gruppenempfehlungssystems für flüchtige Gruppen. Seit einigen Jahrzenten beschäftigt sich die Forschungsliteratur mit Empfehlungssystemen und in den letzten Jahren auch intensiver mit Gruppenempfehlungssystemen. Autoren sind dabei zu verschiedensten Ergebnissen und Entwicklungen gekommen. Zweck dieses Teils der Arbeit soll sein, den bisherigen Stand der Literatur zum Thema Gruppenempfehlungssysteme zu beleuchten und einen systematischen Überblick über die relevantesten und prägendsten Forschungsergebnisse aus bisher veröffentlichten Studien herauszuarbeiten. Der Aufbau des zweiten Kapitels soll daher wie folgt kategorisiert werden: Zuerst wird die Vorgehensweise der Literaturrecherche näher beschrieben. Dann werden Dissense in der Literatur bezüglich der Begrifflichkeit zu Gruppen diskutiert und die für diese Arbeit verwendeten Begriffe klar definiert. Abschließend wird ein genereller Überblick über die bisherigen Entwicklungen im Bereich Gruppenempfehlungssysteme gegeben.
2.1 Vorgehen der Literaturrecherche
Gruppenempfehlungssysteme sind ein sehr komplexes Themengebiet, denn sie umfassen eine große Menge an untergeordneten Aspekten, die es bei der Konzeption zu beachten gilt. Viele Forscher haben sich bereits mit Empfehlungssystemen und auch mit Gruppenempfehlungssystemen beschäftigt, daher ist es notwendig, einen Überblick über die relevantesten Entwicklungen, Trends und den bisherigen Stand der Forschung zu erlangen. Dies erfolgt mittels einer strukturierten Literaturrecherche gemäß Webster und Watson (2002). Für die Recherche wurde in den folgenden Datenbanken nach dem Schlagwort „Group Recommender Systems“ gesucht.
- „Google Scholar“
- „ACM Digital Library“
Beide Datenbanken enthielten mehr als 60.000 Treffer, daher musste die Literaturrecherche eingegrenzt werden. Die Ergebnisse wurden nach Relevanz sortiert und nur die ersten 60 Arbeiten betrachtet. Von den relevantesten Arbeiten wurde der Abstract gelesen. Masterarbeiten, Dissertationen und Working Paper wurden hierbei im Vornherein ausgeschlossen. Auf Basis der relevantesten Arbeiten wurde zusätzlich eine Vorwärts- und Rückwärtssuche mit den wichtigsten Quellenangaben durchgeführt. Ging aus dem Abstract hervor, dass die Veröffentlichung für das Thema dieser Arbeit von Interesse ist, wurde die Veröffentlichung ganz gelesen. Alle Arbeiten, die nach der Filterung weiterhin von Relevanz waren, wurden untergliedert in praktische und theoretische Arbeiten. Zu den praktischen Arbeiten zählen diejenigen, die ein eigenes Gruppenempfehlungssystem entwickelt haben. Diese praktischen Arbeiten wurden auf Basis verschiedener Attribute eingeordnet, um einen strukturierten Literaturüberblick zu erlangen und eine Grundlage für die Erfassung der Theorie im Bereich Gruppenempfehlungssysteme zu bilden.
Die hierfür verwendeten Attribute lauten wie folgt:
- Art der Gruppe, für die das System entwickelt wurde
- Anwendungsdomäne
- Empfehlungsalgorithmus
- Gruppierungsstrategie
- Aggregationsmethode
Auch die identifizierten theoretischen Arbeiten im vorliegenden Themenbereich dienen als unterstützender Beitrag zu den theoretischen Grundlagen des anschließenden Kapitels. Dort wird auch auf die Attribute Empfehlungsalgorithmus, Gruppierungsstrategie und Aggregationsmethode näher eingegangen.
2.2 Begriffsdefinitionen
Aus der differenzierten Literaturrecherche geht hervor, dass Gruppen in der Forschung hinsichtlich ihrer Natur und des Grundes für die Zusammenkunft unterschieden werden, weswegen es verschiedene Formen von Gruppen gibt. Quintarelli et al. (2016) unterscheiden lediglich zwischen permanenten und flüchtigen Gruppen. Wobei flüchtige Gruppen laut ihrer Definition aus Nutzern bestehen, die zum ersten Mal zusammentreffen und permanente Gruppen bereits eine gemeinsame Historie an Aktivitäten vorweisen. Boratto und Carta (2010) gliedern Nutzer von Gruppenempfehlungssystemen dagegen in vier Arten von Gruppen: Langzeit-Gruppen, die ein Interesse teilen und bewusst entschieden haben, Teil der Gruppe zu sein („ Established group “), Gelegenheitsgruppen, die für einen Moment ein gemeinsames Ziel oder einen gemeinsamen Anlass haben („ Occasional group “) und zufällig gebildete Gruppen mit Mitgliedern, die für eine bestimmte Zeit eine Umgebung teilen („ Random group “), sowie automatisch identifizierte Gruppen, die auf Basis ihrer Präferenzen und den vorhandenen Ressourcen automatisch identifiziert werden („ Automatically identified group “).
Abbildung in dieser Leseprobe nicht enthalten
Tabelle 2-1 Verschiedene Arten von Gruppen mit ihren Definitionen
Der Fokus dieser Arbeit wird auf Empfehlungssysteme für flüchtige Gruppen gelegt, welche einer Kombination aus den Gelegenheits-Gruppen und den zufällig gebildeten Gruppen von Boratto und Carta (2010) entsprechen. Ein einheitlicher Begriff für diese Form von Gruppen hat sich jedoch in der relativ jungen Literatur zu diesem Thema bisher noch nicht etabliert. Wie bereits angedeutet, verwenden Boratto und Carta (2010) den Begriff zufällige Gruppen ( „ Random groups “), oder Gelegenheitsgruppe ( „ Occasional group “). Quintarelli et al. (2016) verwenden für die gleiche Art von Gruppe den Begriff flüchtig („ Ephemeral groups “) und Beckmann und Gross (2011), Basu Roy et al. (2015) und Baltrunas et al. (2010) den Begriff Ad-hoc-Gruppen („ Ad-hoc groups “).
Aufgrund dieses Dissenses in der Literatur wird für die vorliegende Arbeit entschieden, einheitlich den Begriff „flüchtige Gruppe“ zu verwendet. Die Abgrenzung einer flüchtigen Gruppe gegenüber einer Langzeit-Gruppe wird für den Rahmen dieser Arbeit an die Definition von Quintarelli et al. (2016) angelehnt und wie folgt definiert: Flüchtige Gruppen bestehen aus Nutzern, die in einer Umgebung erstmalig in der Konstellation zusammentreffen und in der Vergangenheit als Gruppe gemeinsamen keine Bewertungen abgegeben haben, was bedeutet, dass keine gemeinsame Historie an Bewertungen von der Gruppe besteht. Ein zusammenfassender Überblick über die verschiedenen, in der Literatur verwendeten, Definitionen ist in der folgenden Abbildung zu finden.
Abbildung in dieser Leseprobe nicht enthalten
Tabelle 2-2 Verschiedene Definitionen von flüchtigen Gruppe in der Literatur
Im Bereich Einzelnutzerempfehlungssysteme sind bereits eine Vielzahl von Systemen entwickelt worden, doch auch das Forschungsfeld zu Gruppenempfehlungssystemen hat in den letzten Jahren an Popularität gewonnen. Die Besonderheit dieser Arbeit besteht darin, zum einen ein Empfehlungssystem zu entwerfen, das Empfehlungen für flüchtige Gruppen generiert und zum anderen, dass es allgemein anwendbar und somit nicht domänenspezifisch ist. Das eigene System soll domänenübergreifend anwendbar sein, daher wird nun ein Überblick erarbeitet, welche Domänen für flüchtige Gruppen bisher in der Literatur relevant waren und welche Systeme für diese Domänen bisher entwickelt wurden. Hierfür werden im Folgenden ausschließlich Empfehlungssysteme diskutiert, die im weitesten Sinne der Definition einer flüchtigen Gruppe gerecht werden und nach ihren Anwendungsdomänen geordnet vorgestellt. Die relevanten Arbeiten wurden mithilfe der oben beschriebenen Literaturrecherche erfasst und mit dem von Boratto und Carta (2010) bereits veröffentlichten Literaturüberblick über Empfehlungssysteme für Gruppen verglichen und teilweise ergänzt.
In der Tourismus-Domäne können flüchtige Gruppen per Definition dieser Arbeit in verschiedenen Situationen auftreten. Beispielsweise kann eine Gruppe, die bisher noch nie gemeinsame Bewertungen abgegeben hat zufällig für eine Stadttour zusammen kommen. Auch eine Gruppe von Menschen, die zum ersten Mal zusammen in den Urlaub reisen oder Menschen, die sich ein Transportmittel zum Urlaubsziel teilen, können in dieser Domäne für Empfehlungssysteme für flüchtige Gruppen interessant sein. Bisher wurden bereits einige Systeme für diese Situationen entworfen. CATS (Collaborative Advisory Travel System) (McCarthy et al. 2006) generiert Empfehlungen für einen gemeinsamen Skiurlaub von maximal vier Personen anhand von Content-Based Filtering mit der Besonderheit, dass Nutzer einzelne Eigenschaften einer Empfehlung kritisieren können, um die Eignung der Empfehlung zu verbessern. Das heißt, das System ist mit interaktiven und kooperativen Attributen gestaltet. Travel Decision Forum (Jameson 2004) dagegen dient Gruppen, die einen Urlaub zusammen planen möchten, primär als Schnittstelle der individuellen Präferenzen der Gruppenmitglieder. Nutzer können die Interessen der anderen Gruppenmitglieder sehen und kopieren. Empfehlung werden dann mittels Content-Based Filtering generiert und anhand des Medianes aggregiert (Jameson 2004). Grouptourrec (Coles et al. 2016, S.412 ff.) ist eines der aktuellsten Gruppenempfehlungssysteme im Bereich Tourismus und generiert Empfehlungen für Sightseeing-Touren. Das System verwendet hierfür Clustering-Methoden. Christensen et al. (2016) haben in der Tourismus-Domäne ein Hybrides System aus Content-Based, Collaborative und Demographic Filtering für Gruppentouren entwickelt.
Auch in der Film- und TV-Domäne ist der Bedarf an Empfehlungssystemen für flüchtige Gruppen vorhanden. Bei Kinobesuchen, einem Filmabend zuhause oder der Wahl des TV Programms können Gruppen auftreten, die zuvor in der Konstellation keine Aktivität unternommen haben und bisher als Gruppe keine Bewertungen abgegeben haben. PolyLens (O’Connor et al. 2002) beispielsweise wurde entwickelt, um einer Nutzergruppe einen Film empfehlen zu können. Die Generierung der Empfehlung geschieht hier mittels Collaborative Filtering und die Aggregation zu einer Gruppenempfehlung mit Hilfe der Least Misery Methode. TV4M (Yu et al. 2006) ist dagegen auf Empfehlungen von Fernsehsendungen spezialisiert und verwendet für die Generierung der Empfehlung Content-Based Filtering, eine Aggregation der Nutzerpräferenzen als Gruppierungsstrategie und eine neu entwickelte Aggregationsmethode, die „Total Distance Minimization“.
Ganz besonders in der Musik-Domäne können flüchtige Gruppen häufig auftreten. In verschiedensten Situationen, wie z.B an öffentlichen Orten, in Fitnessstudios oder Wartezimmern, können sich Menschen ansammeln, die bisher in der Gruppenkonstellation keine Musik gemeinsam bewertet haben, aber für die es interessant ist, passende Musikempfehlungen zu erhalten. Adaptive Radio (Chao et al. 2005) wurde beispielsweise entwickelt, um einer Gruppe von Menschen in einem Büro Musik vorzuschlagen. Das System unterscheidet sich durch ein besonderes Vorgehen. Hier werden negative Präferenzen betrachtet, das heißt Nutzer geben nicht an was ihnen gefällt, sondern was sie nicht hören möchten. Somit werden bei diesem Vorgehen Songs ausgeschlossen, die der Gruppe nicht gefallen würden. MusicFX (McCarthy und Anagnost 1998) auf der anderen Seite generiert mit Hilfe von Collaborative Filtering Musikempfehlungen für Nutzer eines Fitnessstudios. Flytrap (Crossen et al. 2001) spezialisiert sich wiederum darauf Musik für Gruppen in Gaststuben zu generieren und analysiert hierfür MP3 Dateien der Anwesenden. Die Informationen werden vom System durch Content-Based Filtering ausgewertet. Anschließend bewertet ein repräsentativer Agent jedes Nutzers die Musik im Sinne seiner Präferenzen.
Auch Restaurants sind eine populäre Domäne für flüchtige Gruppen. Sowohl McCarthy (2002), als auch Park et al. (2008) haben Gruppenempfehlungssysteme für einen gemeinsamen Restaurantbesuch entwickelt. Pocket Restaurant Finder (McCarthy 2002) erfasst die individuellen Präferenzen der Gruppenmitglieder und berechnet auf der Grundlage die Präferenzen für bisher unbekannte Restaurants. Diese werden anschließend mit der Average Aggregationsmethode zu einer Gruppenpräferenz zusammengefasst, um der Gruppe eine allgemeine Empfehlung aussprechen zu können.
Let’s Browse (Lieberman et al. 1999) hat sich auf eine bisher etwas weniger bekannte Domäne in der Literatur spezialisiert, indem das System einer Nutzergruppe Webseiten empfiehlt. Hierfür werden auf Basis bestimmter Keywords Nutzerprofile erstellt, die linear zu einem Gruppenprofil kombiniert werden. Empfohlen werden dann Webseiten, die mit Keywords aus den Nutzerprofilen übereinstimmen.
Die vorgestellten Systeme haben sich primär auf die Anwendung in bestimmten Domänen fokussiert, wenngleich manche der verwendeten Methoden und Algorithmen möglicherweise auch auf andere Domänen übertragbar wären. Lediglich Quintarelli et al. (2016) hat nach Kenntnis des Autors bisher bereits ein allgemeines und nicht domänenspezifisches Empfehlungssystem für flüchtige Gruppen entwickelt. Eine Besonderheit ihres Systems ist ein Lösungsansatz des New Item Kaltstartproblem und die Miteinbeziehung von Kontextinformationen. Ziel dieser Arbeit ist es ebenfalls ein allgemein anwendbares und nicht domänenspezifisches Empfehlungssystem zu entwickeln, das flüchtige Gruppen adressiert. Durch Weiterentwickelungen bisheriger Verfahren und neue Ansätze wird sich das entwickelte System dennoch von anderen Arbeiten in diesem Forschungsbereich abgrenzen. Hierfür werden im anschließenden Kapitel Grundlagen des Themenbereichs vermittelt, um darauf aufbauend ein eigenes System zu entwickeln.
3 Theoretische Grundlagen zu Gruppenempfehlungssystemen
In diesem Teil der Arbeit sollen theoretische Grundlagen zu Gruppenempfehlungssystemen erarbeitet werden. Aus der strukturierten Literaturrecherche ging hervor, dass in den letzten Jahrzehnten eine Vielzahl verschiedener Algorithmen und Methoden für die Generierung von Empfehlungen für Gruppen entwickelt wurden. Diese verschiedenen Möglichkeiten wurden während der Literaturrecherche zusammengetragen und werden im weiteren Verlauf dieses Kapitels vorgestellt. Zuerst werden Empfehlungssysteme, sowie speziell Gruppenempfehlungssysteme und deren Herausforderungen näher definiert. Im Anschluss werden die bekanntesten Methoden für das Design von Gruppenempfehlungssystemen vorgestellt. Bei der Konzeption eines Gruppenempfehlungssystems sind drei übergeordnete Designentscheidungen zu treffen: die Wahl des Empfehlungsalgorithmus, die Wahl der Gruppierungsstrategie und die Wahl der Aggregationsmethode. Jede dieser Designentscheidungen verfügt über verschiedenste Umsetzungsmöglichkeiten, von denen die bisher populärsten Methoden in den entsprechenden Absätzen näher betrachtet werden. Zusätzlich werden deren Vor- und Nachteile, oder sofern keine spezifischen Vor- und Nachteile aus der Literatur ersichtlich sind, die Eignung der Methode in der Praxis diskutiert. Ziel dieses Kapitels ist es mit Hilfe der theoretischen Grundlagen zu Gruppenempfehlungssystemen im darauf folgenden Teil der Arbeit qualifizierte Designentscheidungen über das eigens zu entwickelnde Modell treffen zu können.
3.1 Empfehlungssysteme für Einzelnutzer
Empfehlungssysteme für Einzelnutzer analysieren Nutzerdaten im Hinblick auf bestimmte Charakteristiken und versuchen die Bewertungen vorherzusagen, die ein Nutzer den Items, die er noch nicht kennt, geben würde (McCarthy und Anagnost 1998). Wie ein Nutzer ein Item voraussichtlich bewerten würde, wird mittels einer der im späteren Verlauf vorgestellten Empfehlungsalgorithmen berechnet. Die für das System verfügbaren Nutzerdaten werden häufig in Form einer Bewertungsmatrix gesammelt, welche für das Verständnis der folgenden Abschnitte kurz erläutert werden muss. Die Bewertungsmatrix bildet ab, welche Bewertungen Nutzer den jeweiligen Items in der Vergangenheit gegeben haben, wobei die Bewertungen der Nutzer in Zeilen abgebildet sind und die Bewertungen der Items in Spalten. Als Bewertungsvektor wird dabei der Vektor aller Bewertungen eines Benutzers bezeichnet.
3.2 Empfehlungssysteme für Gruppen
Ziel der Einzelnutzerempfehlungssysteme ist unter anderem den Geschmack des Nutzers so genau wie möglich vorherzusagen, um den Wert des Items für den betrachteten Nutzer zu maximieren (Marchand und Hennig-Thurau 2012, S.128). Hierbei stehen ausschließlich die Präferenzen des Nutzers im Vordergrund. Im Gegensatz zu Einzelnutzerempfehlungssystemen haben Gruppenempfehlungssysteme das Ziel, den Geschmack der gesamten Gruppe so präzise wie möglich abzubilden. Der gemeinsame Gruppenwert besteht aus aggregierten Einzelwerten der Gruppenmitglieder (Marchand und Hennig-Thurau 2012, S.128). Das heißt Empfehlungsalgorithmen, die für die Vorhersage von Einzelnutzerbewertungen verwendet werden, bilden ebenfalls die Grundlage für Gruppenempfehlungssysteme (Jameson 2004). Daher werden diese im weiteren Verlauf des Kapitels näher vorgestellt. Dennoch sind die Präferenzen der einzelnen Gruppenmitglieder oft sehr unterschiedlich (Popescu 2013). Gruppenempfehlungssysteme müssen daher den Geschmack vieler Einzelnutzer nicht nur wahrnehmen, sondern auch berücksichtigen. Diese Tatsache stellt Gruppenempfehlungssysteme vor zwei Herausforderungen: Zum einen müssen Gruppenempfehlungssysteme die Meinungsverschiedenheiten in einer Gruppe bestmöglich lösen (Amer-Yahia et al. 2009) und zum anderen müssen die unterschiedlichen Präferenzen während des Empfehlungsverfahrens zu einer Gruppenempfehlung aggregiert werden. Aufgrund dieser Herausforderungen werden hierbei, im Gegensatz zu Einzelnutzerempfehlungssystemen, drei Methoden angewendet um eine Empfehlung für eine Gruppe zu generieren: Der Empfehlungsalgorithmus, die Gruppierungsstrategie und die Aggregationsmethode. Jedes dieser Verfahren hat Einfluss auf die Qualität der letztendlich generierten Empfehlungen, weswegen die drei Verfahren mit ihren jeweiligen Umsetzungsmöglichkeiten nun näher vorgestellt werden.
3.3 Empfehlungsalgorithmen
Der Empfehlungsalgorithmus ist einer der zentralen Bausteine des Empfehlungssystems und die Grundlage auf welcher Empfehlungssysteme unterschieden werden. Die Unterscheidung ist auf die unterschiedliche Verwendung der Nutzerinformationen zurückzuführen (Christensen et al. 2016). Angelehnt an die Arbeiten von Aggarwal (2016), Burke (2007), Bokde et al. (2015), Park et al. (2012) und Ricci et al. (2011) werden nun die populärsten Ansätze von Empfehlungsalgorithmen näher erläutert, sowie deren Stärken und Schwächen analysiert.
- Collaborative Filtering
- Content-Based Filtering
- Knowledge-Based Filtering
- Demographic Filtering
- Hybrid Filtering
3.3.1 Collaborative Filtering
Collaborative Filtering ist einer der meist ausgereiften und meist implementierten Empfehlungsalgorithmen (Isinkaye et al. 2015). Besonders in den letzten Jahren ist die Aufmerksamkeit für Collaborative Filtering durch neue Entwicklungen bei Wettbewerben wie dem Netflix Prize oder des Yahoo! Music KDD Cups stark gestiegen (Bogers und Koolen 2016). Collaborative Filtering kann mit unterschiedlichen Verfahren umgesetzt werden. Die Gemeinsamkeit aller Collaborative Filtering Verfahren ist die Annahme, dass es eine Korrelation zwischen Nutzern und Items gibt (Aggarwal 2016, S.8). Aufgrund dieser Annahme können unbekannte Bewertungen mithilfe bekannter Bewertungen ähnlicher Nutzer oder Items berechnet werden (Aggarwal 2016, S.8; Schafer et al. 2007). Breese et al. (1998) unterteilen Collaborative Filtering in zwei grundlegende Arten, die im Folgenden mit ihren weiteren Ausprägungen näher erläutert werden:
- Memory-Based Collaborative Filtering
- Model-Based Collaborative Filtering
3.3.1.1 Memory-Based Collaborative Filtering
Memory-Based Collaborative Filtering trägt diesen Namen, da hier die ursprünglichen Daten der Bewertungsmatrix gespeichert werden und für die Empfehlungsgenerierung herangezogen werden (Jannach et al. 2010, S.26). Aufgrund der Verfahrensweise ist die Methode auch bekannt unter dem Namen Neighborhood-Based Collaborative Filtering, denn es werden hierbei die „nächsten Nachbarn“ identifiziert. Dieses Verfahren beruht auf der Annahme, dass Nutzer die in der Vergangenheit ähnliche Präferenzen aufwiesen, auch in der Zukunft den gleichen Geschmack aufweisen werden (Schafer et al. 2007). Das heißt, Nutzer die sich ähnlich sind weisen ähnliche Bewertungsverhalten auf und Items die sich ähnlich sind erhalten ähnliche Bewertungen (Aggarwal 2016, S.29). Aufgrund letzterer Tatsache wird das Memory-Based Verfahren unterschieden zwischen User-Based und Item-Based.
3.3.1.1.1 User-Based Collaborative Filtering
Die User-Based Methode vergleicht die vorhandenen Bewertungen aller Nutzer und versucht auf Basis ihrer Bewertungsmuster Nutzer mit hoher Ähnlichkeit zu identifizieren (Aggarwal 2016, S.28). Die Bewertungsvorhersage für den betrachteten Nutzer wird dann mit Hilfe der Bewertungen der ihm ähnlichsten Nutzer berechnet (Wang et al. 2004). Für die Berechnung der Ähnlichkeit zwischen den Nutzern werden Ähnlichkeitsmaße herangezogen.
3.3.1.1.2 Item-Based Collaborative Filtering
Dieses Verfahren basiert auf dem gleichen Prinzip der User-Based Methode, allerdings transponiert auf die Ähnlichkeit zwischen Items, statt ähnlicher Nutzer. Um zu bestimmen, welche Bewertung ein Nutzer einem Item geben würde, wird betrachtet, welche Bewertung der Nutzer ähnlich bewerteten Items gegeben hat (Aggarwal 2016, S.29).
3.3.1.2 Vor- und Nachteile des Memory-Based Collaborative Filtering
Die Vorteile des User-Based und des Item-Based Ansatzes sind prinzipiell identisch, bis auf die Tatsache, dass Item-Based Collaboarative Filtering nachgesagt wird für den Nutzer etwas genauere Empfehlungen zu generieren, da dieser Ansatz sich auf die eigenen Ratings des Nutzers stützt und nicht auf die Ratings eines ähnlichen Nutzers (Aggarwal 2016, S.42). Bei dem User-Based Verfahren kann die Situation aufkommen, dass trotz eines ähnlichen Bewertungsverhaltens die Interessen voneinander abweichen und bestimmte Empfehlungen in manchen Fällen weniger relevant für den Nutzer sein könnten.
Einige Vorteile dagegen sind beiden Verfahren gemein. Beispielsweise ist es bei der Memory-Based Methode relativ einfach neue Daten über Nutzer oder Items hinzuzufügen, da das Verfahren kontinuierlich Empfehlungen neu berechnet und neu hinzukommende Informationen berücksichtigen kann (Bokde et al. 2015). Außerdem sind keine inhaltlichen Informationen über Items und ihre Eigenschaften für die Anwendung des Verfahrens notwendig. Dieses Verfahren berücksichtigt lediglich Ähnlichkeiten der Bewertungsmuster zwischen Nutzern und Items, wofür keine Hintergrundinformationen zu Items notwendig sind, im Gegensatz zum Content-Based Filtering (Bokde et al. 2015).
In der Vergangenheit haben sich dennoch einige Schwächen des Memory-Based Collaborative Filtering Ansatzes aufgetan. Wie oben genannt, ist Anwendung des Verfahrens abhängig von Nutzerbewertungen, daher ist es problematisch Empfehlungen für neu hinzukommende Nutzer oder Items zu generieren, wenn ihr Nutzerprofil oder Itemprofil bislang ohne Bewertungen ist und der Geschmack der Nutzers dadurch noch unbekannt ist (Bokde et al. 2015; Isinkaye et al. 2015). Außerdem ist eine sehr spärliche Bewertungsmatrix problematisch. Dies tritt auf, wenn nur ein kleiner Teil der vorhandenen Items bewertet wurden und macht es bei der Berechnung schwierig, nächste Nachbarn zu lokalisieren (Isinkaye et al. 2015). Dies hat wiederum zur Folge, dass die Genauigkeit der Empfehlungen nachlassen kann (Sarwar et al. 2000).
3.3.1.3 Model-Based Collaborative Filtering
Im Gegensatz zur Memory-Based Methode werden beim Model-Based Collaborative Filtering die Daten der Bewertungsmatrix offline vorverarbeitet (Jannach et al. 2010, S.26). Das bedeutet, die Daten werden im Vorhinein zuerst abstrahiert (Sarwar et al. 2001) und im Vorfeld ein zusammenfassendes Modell auf Basis der Bewertungen erstellt (Aggarwal 2016, S.7; Adomavicius und Tuzhilin 2005). Wurden die Modellparameter erstellt, generieren diese Empfehlungen, ohne die im System vorhandenen Daten verwenden zu müssen (Marchand und Hennig-Thurau 2012, S.101). Hierbei kommen unterschiedliche Data Mining und Machine Learning Modelle zum Einsatz, die im weiteren Verlauf dieses Abschnittes vorgestellt werden (Isinkaye et al. 2015). Das Model-Based Verfahren hat ebenfalls durch den Netflix Prize in letzter Zeit an Popularität gewonnen und es werden konstant Weiterentwicklungen der Varianten vorgestellt, sodass der Fokus dieses Kapitels im Rahmen der vorliegenden Arbeit ausschließlich auf die bisher bekanntesten Varianten des Model-Based Verfahrens gesetzt wird.
3.3.1.3.1 Rule-Based Models
Bei diesem Verfahren werden Maße wie Support und Konfidenz angewandt, um die Korrelation zwischen Items aufzudecken. Es wird versucht Assoziationsregeln nach dem „Wenn …, dann…“- Prinzip aufzustellen und Empfehlungen auf Basis dieser Regeln abzuleiten (Aggarwal 2016, S.77, Ricci et al. 2011, S.51). Ein einfaches Beispiel hierfür ist der Ansatz, wenn Person X einen Apfel mag, dann ist es wahrscheinlich, dass ihm auch eine Banane gefallen wird (Marchand und Hennig-Thurau 2012, S.102).
3.3.1.3.2 Bayesian Classifier
Um Empfehlungen auszusprechen werden hier bedingte Wahrscheinlichkeiten für die gegebenen Klassen berechnet (Isinkaye et al. 2015; Ricci et al. 2011, S.52).
Clustering Models
Items werden hierbei Clustern zugeteilt, wobei sich Items desselben Clusters ähnlich sind und die Cluster untereinander unähnlich (Isinkaye et al. 2015). Ziel des Clustering ist es, die Ähnlichkeit innerhalb der Cluster zu vergrößern und dadurch auch die Unähnlichkeit zu anderen Clustern (Ricci et al. 2011, S.61).
3.3.1.3.3 Artificial Neural Networks
Bei dieser Variante wird versucht mit Hilfe von Data Mining Techniken einen Zusammenhang zwischen Reiz und Reaktion zu erschließen und dadurch menschliche Entscheidungen zu erklären, sowie bestimmte Reaktionen auf Empfehlungen vorherzusagen (Marchand und Hennig-Thurau 2012, S.103).
3.3.1.3.4 Decision Trees
Hierbei kommen Entscheidungsbäume zum Einsatz, bestehend aus Entscheidungsknoten und Blattknoten (Ricci et al. 2011, S.50). Items werden dann auf Basis ihrer Eigenschaften und mit Hilfe der Baumstruktur klassifiziert (Ricci et al. 2011, S.50).
Link Analysis
Bei dieser Methode werden Netzwerke von verlinkten Objekten im Web erstellt um Muster oder Trends aufzudecken (Isinkaye et al. 2015).
3.3.1.3.5 Latente Variablenmodelle
Eine der populärsten Varianten des Model-Based Collaborative Filtering sind die Latenten Variablenmodelle oder auch dimensionsreduzierende Ansätze (Aggarwal 2016, S.134; Marchand und Hennig-Thureau 2012, S.102). Die bekannteste Methode der latenten Variablenmodelle ist die Matrixfaktorisierung. Bei dieser Methode wird die Bewertungsmatrix zu einer Nutzer- und einer Item-Matrix zerlegt (Ortega et al. 2016). Aus dieser Dekomposition der Bewertungsmatrix werden latente Faktoren über die Nutzer und Items ermittelt, die zur Bewertungsvorhersage herangezogen werden (Ortega et al. 2016). Die herausgefilterten latenten Faktoren werden als ein Vektor der Eigenschaften von Nutzer und Item gesehen (Jannach et al. 2010, S.27). Ähneln die latenten Faktoren der Items denen des Nutzers, dann wird das Item empfohlen (Jannach et al. 2010, S.27). Ziel dieser Methode ist es die nicht vorhandenen Bewertungen der Bewertungsmatrix vorherzusagen, indem man versteckte Muster und Strukturen unter den Bewertungen aufdeckt (Bokde et al. 2015; Isinkaye et al. 2015). In der Praxis werden verschiedene Algorithmen angewendet, diese latenten Faktoren aufzudecken. Die bekannteste und meist genutzten sind die Alternating Least Square Methode (ALS) und Single Value Decomposition (SVD) (Isinkaye et al. 2015).
[...]
- Quote paper
- Marina Hell (Author), 2018, Empfehlungssysteme für Gruppen. Wie man die Genauigkeit verbessert und unterschiedliche Settings abdeckt, Munich, GRIN Verlag, https://www.grin.com/document/494645
-
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X.