Grin logo
en de es fr
Boutique
GRIN Website
Publier des textes, profitez du service complet
Aller à la page d’accueil de la boutique › Mathématiques - Divers

Phishing Detection with Modern NLP Approaches

Titre: Phishing Detection with Modern NLP Approaches

Thèse de Master , 2020 , 59 Pages , Note: 1,3

Autor:in: Christian Schmid (Auteur)

Mathématiques - Divers
Extrait & Résumé des informations   Lire l'ebook
Résumé Extrait Résumé des informations

Phishing is a form of identity theft that combines social engineering techniques and sophisticated attack vectors to fraudulently gain confidential information of unsuspecting consumers. To prevent successful phishing attacks, there are several approaches to detect and block phishing emails. In this work, we apply a number of modern transformer based machine learning methods for phishing email detection.

Typically, phishing messages imitate trustworthy sources and request information via some form of electronic communication. The most frequent attack route is via email where phishers often try to persuade the email recipients to perform an action. This action may involve revealing confidential information (e.g. passwords) or inadvertently providing access to their computers or networks (e.g. through the installation of malicious software).

Extrait


Inhaltsverzeichnis

  • Introduction
    • Motivation
    • Research Objective
    • Research Approach
  • Related Work
    • Modern NLP Approaches
      • Transformers
      • BERT
      • ROBERTa
      • XLNet
      • ALBERT
      • DistilBERT
      • ELECTRA
      • MobileBERT
  • Data and Methodology
    • The IWSPA-AP Dataset
    • Data Preprocessing for Classic NLP Methods
    • Splitting and Oversampling
    • Model Selection
    • Performance Metrics
  • Results
    • Results of classic machine learning models
    • Results of modern NLP models
  • Discussion

Zielsetzung und Themenschwerpunkte

Die Masterarbeit befasst sich mit der Erkennung von Phishing-Angriffen mithilfe moderner Ansätze aus dem Bereich des Natural Language Processing (NLP). Das Hauptziel der Arbeit ist die Untersuchung der Leistungsfähigkeit von modernen NLP-Modellen im Vergleich zu klassischen Machine-Learning-Methoden bei der Detektion von Phishing-E-Mails.

  • Analyse der neuesten Fortschritte im Bereich des NLP, insbesondere der Transformer-Architektur und ihrer verschiedenen Implementierungen.
  • Bewertung der Leistung verschiedener NLP-Modelle wie BERT, ROBERTa, XLNet, ALBERT, DistilBERT, ELECTRA und MobileBERT bei der Phishing-Erkennung.
  • Vergleich der Ergebnisse moderner NLP-Modelle mit klassischen Machine-Learning-Methoden und Untersuchung der Vor- und Nachteile beider Ansätze.
  • Bewertung der Eignung und Effizienz verschiedener Datenvorverarbeitungstechniken und Modellauswahlmethoden im Kontext der Phishing-Erkennung.
  • Diskussion der Herausforderungen und Chancen bei der Verwendung von NLP-Modellen zur Detektion von Phishing-Angriffen.

Zusammenfassung der Kapitel

Die Arbeit beginnt mit einer Einführung, die die Motivation für die Forschung, das Forschungsziel und den Forschungsansatz darlegt. Es folgt ein Kapitel, das relevante Arbeiten aus dem Bereich der Phishing-Erkennung und NLP beleuchtet, wobei ein besonderer Fokus auf moderne NLP-Ansätze wie Transformer-Modelle gelegt wird. Kapitel 4 befasst sich mit den verwendeten Daten, der Datenvorverarbeitung, der Modellauswahl und den Performance-Metriken. Kapitel 5 präsentiert die Ergebnisse der Untersuchung, getrennt nach klassischen Machine-Learning-Modellen und modernen NLP-Modellen. Die Diskussion der Ergebnisse findet in Kapitel 6 statt, während Kapitel 7 die Schlussfolgerungen der Arbeit zusammenfasst.

Schlüsselwörter

Phishing-Erkennung, Natural Language Processing (NLP), Transformer-Modelle, BERT, ROBERTa, XLNet, ALBERT, DistilBERT, ELECTRA, MobileBERT, Machine Learning, Datenvorverarbeitung, Modellauswahl, Performance-Metriken, IWSPA-AP Dataset, Klassifikationsmodelle.

Häufig gestellte Fragen

Wie hilft NLP bei der Erkennung von Phishing-E-Mails?

Natural Language Processing (NLP) analysiert sprachliche Muster, Semantik und Kontext in E-Mails, um betrügerische Absichten zu identifizieren, die für herkömmliche Filter unsichtbar sind.

Was sind Transformer-Modelle im Kontext der IT-Sicherheit?

Transformer-Modelle wie BERT oder ROBERTa nutzen Aufmerksamkeitsmechanismen, um komplexe Zusammenhänge in Texten zu verstehen, was sie sehr effektiv bei der Erkennung von Social-Engineering-Angriffen macht.

Welches NLP-Modell eignet sich am besten für die Phishing-Detektion?

Die Arbeit untersucht Modelle wie BERT, XLNet und DistilBERT. Während BERT sehr präzise ist, bieten Modelle wie DistilBERT eine höhere Effizienz bei geringerem Ressourcenverbrauch.

Was ist das IWSPA-AP Dataset?

Es handelt sich um einen standardisierten Datensatz, der speziell für die Forschung zur Erkennung von Phishing-Angriffen verwendet wird, um Modelle zu trainieren und zu vergleichen.

Warum sind klassische Machine-Learning-Methoden oft unterlegen?

Klassische Methoden verlassen sich oft auf statische Merkmale (wie Keywords), während moderne NLP-Modelle den tieferen sprachlichen Kontext und die Nuancen der Täuschung erfassen können.

Fin de l'extrait de 59 pages  - haut de page

Résumé des informations

Titre
Phishing Detection with Modern NLP Approaches
Université
University of Ulm
Note
1,3
Auteur
Christian Schmid (Auteur)
Année de publication
2020
Pages
59
N° de catalogue
V999799
ISBN (ebook)
9783346413048
Langue
allemand
mots-clé
phishing detection modern approaches
Sécurité des produits
GRIN Publishing GmbH
Citation du texte
Christian Schmid (Auteur), 2020, Phishing Detection with Modern NLP Approaches, Munich, GRIN Verlag, https://www.grin.com/document/999799
Lire l'ebook
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
Extrait de  59  pages
Grin logo
  • Grin.com
  • Expédition
  • Mentions légales
  • Prot. des données
  • CGV
  • Imprint