Ziel der Arbeit ist es, die aktuellen rechtlichen Herausforderungen der Strafverfolgung auf sozialen Netzwerken herauszuarbeiten und mögliche Verbesserungen in der aktuellen Gesetzeslage darzulegen. Anschließend sollen Methoden des Natural Language Processing vorgestellt werden, welche der Polizei und anderen Behörden zukünftig helfen können, technische Kompliziertheiten in der Informationsverarbeitung einzugrenzen. Diese Themen sollen anschließend durch ein Experteninterview modifiziert werden. Zum Abschluss sollen die Methoden des NLPs evaluiert werden, um ein mögliches Lösungskonzept für die technischen Schwierigkeiten vorlegen zu können. Abschließend sollen weitere Lösungsmöglichkeiten zur Erleichterung der Strafverfolgung auf sozialen Netzwerken vorgestellt werden.
Jahr für Jahr nimmt die Rolle von sozialen Netzwerken wie Facebook, Instagram oder Twitter zu. Mit dem zunehmenden Einfluss der Netzwerke kommt es auch vermehrt zu Straftaten, welche sowohl direkt auf den Plattformen in Form von beispielsweise Betrug oder Cybermobbing stattfinden können, als auch durch Aufrufe zu schweren Straftaten wie Attentaten in realen Leben auftreten. Deshalb sind soziale Netzwerke durch die steigende Menge an Informationen für strafverfolgende Behörden sehr interessant. Jedoch stellen technische Problematiken, wie die Verarbeitung von der großen Menge an Informationen, sowie auch rechtliche Hürden, bspw. Datenschutzrichtlinien oder Grundrechte der Verdächtigen, die strafverfolgenden Behörden vor große Herausforderungen.
Verarbeitung von Social-Media Content zur Strafverfolgung
Karlsruher Institut fuör Technologie, Kaiserstr. 12 in 76131 Karlsruhe, Deutschland
Zusammenfassung.
Jahr fuör Jahr nimmt die Rolle von sozialen Netzwerken wie Facebook, Instagram oder Twitter zu. So stieg die Anzahl monatlicher aktiver Nutzer auf Facebook zwischen 2009 und 2019 innerhalb von 10 Jahren von weniger als 200 Millionen Nutzern auf knapp 2,5 Milliarden monatlich aktiven Nutzern an. Mit dem zunehmenden Einfluss der Netzwerke kommt es auch vermehrt zu Straftaten, welche sowohl direkt auf den Plattformen in Form von beispielsweise Betrug oder Cybermobbing stattfinden koönnen, als auch durch Aufrufe zu schweren Straftaten wie Attentaten in realen Leben auftreten. Deshalb sind soziale Netzwerke durch die steigende Menge an Informationen fuör strafverfolgende Behöorden sehr interessant. Jedoch stellen technische Problematiken, wie die Verarbeitung von der großen Menge an Informationen, sowie auch rechtliche Huörden, bspw. Datenschutzrichtlinien oder Grundrechte der Verdaöchtigen, die strafverfolgenden Behöorden vor große Herausforderungen.
Ziel der Arbeit ist es, die aktuellen rechtlichen Herausforderungen der Strafverfolgung auf sozialen Netzwerken herauszuarbeiten und möogliche Verbesserungen in der aktuellen Gesetzteslage darzulegen. Anschließend sollen Methoden des Natural Language Processing vorgestellt werden, welche der Polizei und anderen Behoörden zukuönftig helfen köonnen, technische Kompliziertheiten in der Informationsverarbeitung einzugrenzen. Diese Themen sollen anschließend durch ein Experteninterview modifiziert werden. Zum Abschluss sollen die Methoden des NLPs evaluiert werden, um ein moögliches Loösungskonzept fuör die technischen Schwierigkeiten vorlegen zu koönnen. Abschließend sollen weitere Loösungsmöoglich- keiten zur Erleichterung der Strafverfolgung auf sozialen Netzwerken vorgestellt werden.
Schlüsselwärter: Social Media • Natural Language Processing • Prosecution.
1 Einleitung
Wie der Titel schon vorwegnimmt, befasst sich diese Seminararbeit mit der Strafverfolgung im Social-Media Zeitalter. Der Fokus liegt in dieser Arbeit vor allem auf den rechtlichen und technischen Aspekten, die bei der Verarbeitung von Social-Media Content zur Strafverfolgung relevant sind. Ziel dieser Ausarbeitung soll es sein, einen generellen Uä berblick uäber Cybercrime-Delikte in Social-Media zu geben. Daruäber hinaus sollen die technischen und juristischen Herausforderungen bei der Strafverfolgung in sozialen Netzwerken exploriert werden und daraus mäogliche Läosungsansäatze vorgestellt werden.
1.1 Relevanz des Themas
Das Internet uäbt heutzutage einen immer groäßer werdenden Einfluss auf das alltaägliche Leben in Deutschland aus. So sind rund 76 Prozent der deutschen Internetnutzer mittlerweile Mitglied eines sozialen Netzwerks. Zwar stellen soziale Netzwerke vor allem eine Bereicherung fuär Internetnutzer dar1, jedoch fäordern sie auch die Begehung von Straftaten oder rufen diese sogar hervor [1]. Da also zum einen drei von vier Deutschen Social-Media nutzen und zum anderen soziale Netzwerke Straftaten erregen bzw. herbeifuähren, ist das in dieser Seminararbeit untersuchte Thema von hoher Relevanz.
1.2 Methodik und Aufbau der Arbeit
Nachdem nun im ersten Kapitel das Ziel dieser Studienarbeit ausgefuährt wurde und die Relevanz des Themas aufgezeigt wurde, wird im zweiten Kapitel der rechtliche Hintergrund fuär die Verarbeitung von Social-Media Content zur Strafverfolgung vorgestellt. Anschließend werden im dritten Kapitel die technischen Aspekte, die fuär die Verfolgung von Cybercrime-Delikten hinsichtlich Social-Media relevant sind, herausgearbeitet und aufgezeigt. Im vierten Kapitel werden die Ergebnisse der qualitativen Inhaltsanalyse des Experteninterviews vorgestellt und erlaäutert. Danach werden im fuänften Kapitel Loäsungsansäatze fuär diese Art der Strafverfolgung aufgezeigt. Zum Schluss folgt im sechsten Kapitel eine kurze Zusammenfassung, sowie eine kritische Wuärdigung und ein Ausblick.
2 Rechtliche Grundlagen
In diesem Kapitel soll herausgearbeitet werden, welche aktuellen rechtlichen Hindernisse bei der Strafverfolgung aus sozialen Netzwerken fuär die Behäorden bestehen. Dabei soll zunaächst eine allgemeine Einfuährung in die vorkommenden Straftaten auf sozialen Netzwerken dargestellt werden. Anschließend sollen die rechtlichen Grenzen der Ermittlungsbehäorden betrachtet werden und moägliche Probleme in der aktuellen Gesetzgebung skizziert werden.
2.1 Charakterisierung der Cyber-Straftaten
Uä ber die letzten Jahre nahm die Bedeutung sozialer Netzwerke in Deutschland stetig zu. So waren im Maärz 2019 basierend auf Informationen des offiziellen Boärsenberichtes von Facebook mehr als 32 Millionen Nutzer monatlich aktiv, wovon mehr als 23 Millionen taäglich das soziale Netzwerk besuchten [2]. Diese Nutzerzahlen und die damit verbundenen großen Mengen an Informationen wecken natuärlich auch das Interesse der Behoärden zur Ermittlung von strafrechtlich relevanten Themen [3]. So kann es auf sozialen Netzwerken zu verschiedenen Rechtsverstoäßen kommen. Hierbei treten beispielsweise bei Straftaten wie Cybermobbing väollig neue Straftaten fuär die Ermittlungsbehoärden durch soziale Netzwerke auf.
Unterschieden käonnen diese dabei grob in zwei Fallgruppen: Die erste Fallgruppe beschaäftigt sich hauptsaächlich mit Straftaten, welche in den sozialen Netzwerken stattfinden. Dies koännen zum einen illegale Veroäffentlichungen von Videooder Bildmaterialien sein, zum anderen Vorfaälle wie Cybermobbing oder Betrug. Moägliche Ermittlungsspuren von Straftaten zaählen zur zweiten Fallgruppe. Diese umfasst unter anderem sowohl Ankuändigungen und Berichte von Straftaten, Erkenntnisse uäber moägliche Aufenthaltsorte oder kriminelle Netzwerke, als auch die mäogliche Uä berpruäfung von Alibis [4]. Aufgrund der unterschiedlichen Rechtsauffassungen der Betreiberlaänder der gaängigen sozialen Netzwerke, wie den Vereinigten Staaten von Amerika, kann es jedoch bereits bei der Aufklaärung von Straftaten wie Beleidigung zu unterschiedlichen Rechtsauffassungen kommen. So kann beispielsweise eine Aussage nach deutschem Recht als Beleidung im strafrechtlichen Sinne gelten, nach amerikanischem Recht aber als freie Mei- nungsaäußerung zäahlen[A14]. Des Weiteren werden strafverfolgenden Behäorden bei der Nutzung verschiedener Ermittlungsmethoden zur Strafverfolgung, wie einfacher Recherche bis hin zur Gewinnung der benoätigten Informationen fuär die Verfolgung von Straftaten und Ermittlung der Behoärden auf sozialen Netzwerken, auch rechtliche Grenzen und Huärden gesetzt.
2.2 Rechtliche Grenzen und Hürden der Strafverfolgung
So duärfen zur gezielten Fahndung uäber soziale Netzwerke Bilder von verdäachtigen Personen nur veroäffentlicht werden, falls es sich um eine schwere Straftat handelt und die Identifikation ohne das Posten von Bildern weniger Erfolg versprechen wuärde. Hinzu kommt eine richterliche Genehmigung fuär solche Vorhaben (Strafprozessordnung). Des Weiteren duärfen Behoärden aus datenschutzrechtlicher Sicht keine Informationen uäber Verdäachtige bei Facebook posten und veräoffentlichen. Hintergrund hierfuär ist die Datenuäbertragung der sensiblen Daten mit in den USA stehenden Servern, wodurch den Behoärden moäglicherweise dauerhaft der Zugriff auf diese Daten entzogen werden kann. Auch die Kommentarfunktion der sozialen Medien unter den Veräoffentlichungen ist fuär die Aufklaärung von Straftaten nur bedingt nutzbar, da personenbezogene Daten und Hinweise aus datenschutzrechtlichen Gruänden dort nicht veroäffentlich werden duärfen [5].
Geloäst werden diese Probleme mit Posten von Links bei Fahndungsaufrufen auf den sozialen Netzwerken, auf welchen die benäotigten Informationen wie Bild- und Videomaterial auf polizeilichen Servern gespeichert sind [5]. Mit Hilfe dieser Methoden kann die Polizei bei Fahndungen von verdaächtigen Personen die Privacy Awareness2 sicherstellen und die unautorisierte Weitergabe sensibler Daten schuätzen.
Neben der gezielten Fahndung von verdaächtigen Personen koännen polizeiliche Behoärden die sozialen Medien auch zu verdeckten Ermittlungen benutzen. Jedoch gibt es auch hier einige rechtliche Huärden und Grenzen. So verfuägen Nutzer sozialer Netzwerke uäber verschiedene Grundrechte bei der Nutzung ebendieser, welche durch das deutsche Grundgesetz abgedeckt werden. Derart werden die Rechte der Betroffenen durch das allgemeine Persoänlichkeitsrecht in Artikel 2 I i.V.m. Art. 1 I als auch Artikel 10 des deutschen Grundgesetztes geregelt [6], [4].
Die aktuelle Rechtslage der Strafprozessordnung (StPO) regelt hierbei, welche Grenzen und Moäglichkeiten bei verdeckten Ermittlungen fuär die Behäorden bestehen. So ermäachtigen beziehungsweise schraänken die Gesetzte der allgemeinen Ermittlungsklausel (§§ 161 I, 163 I StPO), die Regelungen fuär die Observation (§ 163f StPO), die Regelungen fuär verdeckte Ermittler (§ 110a StPO), sowie die Telekommunikationsuäberwachung (§ 100a StPO) die Strafverfolgung auf sozialen Netzwerken ein (Beck 2019).
Bei der aktuellen Rechtsgrundlage fuär Ermittlungen auf sozialen Netzwerken treten allerdings einige Probleme auf, wie beispielsweise die ungeklaärte Definition der langfristigen Observation. So ist diese nach aktueller Rechtsgundlage nach §163 f als planmaäßig angelegte Beobachtung des Beschuldigten, die durchgehend laänger als 24 Stunden dauern oder an mehr als zwei Tagen stattfinden sollen“ [7]. Hierbei ist jedoch fraglich, ob die Läangerfristigkeit zeitgemaäß ist und ob die schweren Voraussetzungen wie die Schwere der Straftat die Ermittler nicht zu sehr einschraänken. Des Weiteren ist die aktuelle Generalermaächtigung der Behoärden moäglicherweise fuär verdeckte Ermittlungen zu weit und offen und entspricht nicht den eigentlichen Eingriffen auf Facebook und Co.. Aufgrund dieser nicht rechtmäaßigen Wiederspiegelung der Begebenheiten auf sozialen Netzwerken scheint eine Neuregelung durch die Gesetzgeber hier sinnvoll [4].
Aufgrund der hohen Flut an Informationen, welche auf sozialen Netzwerken zur Strafverfolgung theoretisch genutzt werden käonnen, treten neben diesen rechtlichen Grenzen auch technische Grenzen fuär die strafverfolgenden Behoärden auf. Aufgrund dessen werden Methoden des Natural Language Processing eine zentrale Rolle neben der gezielten verdeckten Ermittlung von bekannten, verdaächtigen Einzelpersonen bei der zukuänftigen Strafverfolgung auf sozialen Netzwerken wie Facebook oder Instagram einnehmen, weil ohne viel Aufwand riesige Mengen an Daten verarbeitet werden käonnen [8].
Tabelle 1. Maßnahmen und Ermächtigungen bei verdeckten Ermittlungen auf sozialen Netzwerken (verändert nach Beck [4])
Abbildung in dieser Leseprobe nicht enthalten
3 Technische Möglichkeiten der Informationsextraktion
Die beschriebene Rechtslage legt den allgemeinen Rahmen fuär die Moäglichkeiten der Strafverfolgung fest. Dabei ist die Abwäagung zwischen dem Schutz der Pri- vatsphaäre gegenuäber der freigiebigen Nutzung privater Daten durch Ermittlungs- behoärden elementaär [9]. In diesem Kapitel soll herausgearbeitet werden, welche allgemeinen, dem aktuellen Stand der Technik entsprechenden Moäglichkeiten es gibt, um Texte aus sozialen Medien analytisch zu verarbeiten und dabei wichtige Informationen aus ihnen zu extrahieren. Dabei sollen zuerst die allgemeinen Ansaätze beschrieben werden, welche spaäter in einer Evaluation anhand der Problemstellung bewertet werden.
3.1 Definition Natural Language Processing
Kumar beschreibt Natural Language Processing (NLP) als die Art und Weise, wie Computer und Maschinen die natuärliche, menschliche Sprache verstehen [10]. Die Kommunikation kann hierbei in schriftlicher oder verbaler Form erfolgen. Vorliegend ist die schriftliche Form im Vordergrund, da in sozialen Medien die meisten Informationen textuelle Struktur besitzen. Besonders wichtig fuär NLP sind in den letzten Jahren die Fortschritte im Bereich der kuänstlichen Intelligenz und des maschinellen Lernens geworden, wodurch NLP revolutionaäre Verbesserungen erfahren hat.
NLP Techniken lassen sich in verschiedene Klassen einteilen. Ziele dieser Klassen sind z.B Kategorien mit Teilen des Textes zu verknuäpfen (Topic modeling), den Text anders zu strukturieren oder den Text in einer komplett anderen Form darzustellen [11]. Kulkarni et al. beschreiben die zentralen, fortgeschrittenen NLP Techniken, um Informationen aus einem Text zu extrahieren [12]. Auf die fuär das Thema relevantesten soll im Folgenden eingegangen werden.
3.2 Parts of speech tagging
Parts of speech tagging (POS) ist eine der grundlegendsten Techniken zur linguistischen Verarbeitung und syntaktischen Analyse von Texten [13].
Dabei wird jedes Wort eines Textes mit dem richtigen morphosyntaktischen Tag versehen. Neben der Wortart wird folglich beispielsweise auch die Zeitform beachtet [14]. Somit koännen Mehrdeutigkeiten verhindert werden, da sich unter Betrachtung der angrenzenden Woärter ein Kontext ergibt, der auf die genaue Bedeutung schließen laässt. Die Tags werden aus verschiedenen Tagsets bezogen, eines der am meisten benutzten ist in Abbildung 1 dargestellt. Das POS tagging kann als Ausgangspunkt fuär weitere NLP Methoden, wie z.B. Named entity recognition oder Sentiment analysis, verwendet werden.
Schwierigkeiten bereiten bei der Anwendung auf Facebook und Co. der von strukturierten Texten abweichende Syntax, sowie oft vorkommende Schreib- oder Grammatikfehler. Hinzu kommen untypische lexikalische Begriffe, die das POS tagging zusaätzlich erschweren [16].
Trotzdem kann uäber Trainingssäatze aus sozialen Medien eine richtige Zuordnung der Tags von 93,72 Prozent erreicht werden [17].
Abb. 1. Penn Treebank POS Tagset [15]
Abbildung in dieser Leseprobe nicht enthalten
3.3 Named entity recognition
Named entity recognition (NER) ist ein Unterproblem des Information-Retrieval und beschreibt den Prozess, wie man Ausdrücke identifiziert, die beispielsweise für Menschen oder Orte stehen [18]. Dieser Prozess kann in zwei Phasen aufgeteilt werden: der Identifizierung von Namen und der Klassifizierung ebendieser. Dadurch können zentrale Themen eines Textes erfasst und dieser in eine Kategorie eingeordnet werden, was als erster Schritt fiir weitere Methoden genutzt werden kann. Zentrale Probleme hierbei sind die semantische, sowie die kontextabhängige Mehrdeutigkeit der Substantive.
Während die ersten NER Systeme hauptsachlich durch definierte, themenabhängige Regeln charakterisiert wurden, kännen neuere Systeme durch neuronale Netze eine erhäohte Themenunabhaängigkeit erreichen [19]. Folglich sind sie flexibler und universeller einsetzbar. Außerdem performen Modelle basierend auf neuronalen Modellen deutlich besser als ihre Vorgaänger. Auch wenn es mit dieser Technik relativ einfach sein sollte, Texte aus sozialen Medien zu kategorisieren, steht die praktische Anwendung vor einigen Schwierigkeiten.
In einer experimentellen Studie haben Ritter et al. [20] existiernde Tools fuär NER auf verschiedene Tweets angewendet, wobei sich vor allem die Klassifizierung als besonders komplex herausgestellt hat, da Tweets ohne jeden Kontext veräoffentlicht werden. Außerdem werden verschiedenste Entitaätstypen genannt, wodurch eine große Menge an Trainingsdaten erforderlich ist.
3.4 Topic modeling
Während bei NER der Fokus auf den Substantiven liegt, geht es beim Topic modeling darum, die verschiedenen Themen eines Textes herauszuarbeiten [21]. Dabei wird eine Einstufung der verschiedenen Wörter in Abhängigkeit ihrer übergeordneten Themen vorgenommen, wodurch ein automatisierter Prozess entsteht, um vor allem fuär große Mengen an Text ein Set an wichtigen Kategorien abzubilden [22]. Die Einstufung erfolgt hierbei anhand verschiedener Thesauri. Dabei nimmt das Modell an, dass die Bedeutung eines Textes relativ zur Anzahl der Woärter verschiedener Themengebiete ist [23].
Jedes Dokument wird dabei als Bag of words dargestellt und die verschiedenen Woärter anschließend durch statistische Methoden den verschiedenen Themen zugeordnet. Folglich werden sehr große Mengen an Text benoätigt, sowie am besten verschiedene Dokumente zu aähnlichen Themen, um moäglichst gute Ergebnisse zu erhalten. Dies scheint im Widerspruch zu den meist kurzen, sowie nur begrenzte Kontextinformationen besitzende Informationen aus sozialen Medien zu stehen., welche daruäber hinaus oft Fehler aufweisen.
Dennoch käonnen kurze Texte mit diesem Model bearbeitet werden, in dem das Wissen uäber den semantischen Zusammenhang der Woärter nicht aus verschiedenen Thesauri extrahiert wird, sondern durch Erkenntnisse aus neuronalen Netzwerk-Sprachmodellen neu generiert wird. Dabei kann die Themenaähnlichkeit zweier Woärter erhoäht werden, wenn sie selten in kurzen Texten vorkommen [24].
3.5 Sentiment analysis
Bei der Sentiment analysis wird untersucht, wie Gefuähle in einem Text ausge- druäckt werden und ob diese mit positiven oder negativen Meinungen zu einer bestimmten Sache verknuäpft sind [25]. In Social Media käonnten so Beleidigungen oder radikalisierte Meinungen zu bestimmten Themen herausgearbeitet werden. Die Sentiment analysis laässt sich in drei zentrale Unterkategorien aufteilen [26]. Der einfachste und weit verbreiteste Ansatz ist Keyword spotting. Bei diesem Verfahren wird nach bestimmten Woärtern gesucht wird, die unmissverstaändlich ein Gefuähl ausdruäcken (z.B. gluäcklich, traurig). Probleme sind hier zum einen die Negation ebendieser Woärter, zum anderen muässen diese Schluässelwoärter zwingend vorhanden sein.
Statt eindeutige Schluässelwäorter auszuwäahlen, definiert man bei der Lexical affinity fuär beliebige Wäorter Wahrscheinlichkeiten, inwiefern sie mit bestimmten Emotionen in Verbindung gebracht werden käonnen. Diese Wahrscheinlichkeiten werden durch Textkorpora trainiert, von deren Auswahl die Guäte stark abhaängig ist. Auch die Negation kann hier zu Problemen fuähren, da die Schluässelwäorter zwar erkannt werden, jedoch durch die Verneinung mit einer gegenteiligen Intention verwendet wurden.
Durch Statistical methods, wie z.B. der Support Vecotor Machine, käonnen die Vorteile der ersten beiden Ansaätze erlernt werden, falls die gegebene Datenmenge groß genug ist.
[...]
1 beispielsweise als Kommunikationsmittel oder als kostenlose Werbeplattform
2 Privacy Awareness: (Privatsphöare Bewusstsein) Bezeichnet den bewussten Umgang mit Informationen der Privatsphaöre
- Citar trabajo
- Maximilian Bernhardt (Autor), 2020, Verarbeitung von Social-Media Content zur Strafverfolgung, Múnich, GRIN Verlag, https://www.grin.com/document/1320928
-
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X.