Diese Arbeit bewertet die fünf bekanntesten Persönlichkeitstests auf dem deutschen Markt hinsichtlich ihrer Qualität und empirisch abgesicherten Eignung für den Einsatz in der Personalauswahl. Dies sind der Myers-Briggs-Typen-Indikator, das persolog Persönlichkeits-Profil, das Bochumer Inventar zur berufsbezogenen Persönlichkeitsbeschreibung, das INSIGHTS MDI und der NEO-Persönlichkeitsinventar. Um ein besseres Verständnis wissenschaftlicher Anforderungen an Persönlichkeitstests zu ermöglichen, findet eine theoretische und literaturbasierte Einführung in die Gütekriterien und Anforderungen an messtheoretisch fundierten Fragebögen und Tests statt. Diese werden in der DIN 33430 sowie dem Testbeurteilungssystem des Testkuratoriums spezifiziert und bilden die Bewertungsgrundlage der Testverfahren.
Die Beurteilung ergab, dass von den fünf Testverfahren lediglich der NEO-PI-R sowie das Bochumer Inventar zur berufsbezogenen Persönlichkeitsbeschreibung für die Personalauswahl geeignet sind. Diese erfüllen weitgehend die Anforderungen nach der DIN 33430 und zeigen anhand unterschiedlicher Studien die empirische Absicherung des Persönlichkeitsmodells sowie relevante Zusammenhänge mit berufsrelevanten Leistungskriterien. Die anderen drei Verfahren weisen erhebliche Einschränkungen in der Transparenz ihrer Untersuchungsdaten auf und beziehen sich auf Untersuchungsdaten, die schwer nachvollziehbar oder ungeeignet als Beleg der Güterkriterien sind. Der Myers-Briggs-Typen-Indikator, das persolog Persönlichkeits-Profil sowie das INSIGHTS MDI sollten daher lediglich zur Reflexion oder Orientierung in Personalentwicklungskontexten eingesetzt werden, jedoch nicht in der Personalauswahl.
Inhaltsverzeichnis
I. Abbildungsverzeichnis
II. Tabellenverzeichnis
III. Abkürzungsverzeichnis
1 Einleitung
1.1 Problemstellung
2 Definition und Abgrenzung von Persönlichkeitstests
2.1 Klassifikation von Persönlichkeitseigenschaften
2.1.1 Beschreibung typologischer Testverfahren
2.1.2 Beschreibung multidimensionaler Testverfahren
2.2 Relevanz, Nutzung und Mehrwert
3 Qualitätsbeurteilung von Persönlichkeitstests
3.1 Anforderungen nach DIN 33430 für Persönlichkeitstests
3.2 TBS-TK
3.3 Hauptgütekriterien diagnostischer Verfahren
3.3.1 Objektivität
3.3.2 Reliabilität
3.3.3 Validität
3.4 Nebengütekriterien
3.5 Normierung
3.5.1 Ökonomie
3.5.2 Nützlichkeit
3.5.3 Fairness
3.5.4 Unverfälschbarkeit
3.5.5 Skalierung
4 Beschreibung der fünf bekanntesten Persönlichkeitstests
4.1 MBTI®
4.2 Persolog® Persönlichkeitsprofil (DISG)
4.3 BIP und BIP-6F
4.4 INSIGHTS MDI®
4.5 NEO-FFI und NEO-PI-R
5 Methodisches Vorgehen
6 Beurteilung der fünf bekanntesten Persönlichkeitstests
6.1 MBTI®
6.1 Persolog® Persönlichkeits-Profil (DISG)
6.2 BIP-6F
6.3 INSIGHTS MDI®
6.4 NEO-FFI und NEO-PI-R
7 Gesamtdiskussion
7.1 Zusammenfassung der Ergebnisse
7.2 Implikation für die Praxis
8 Literaturverzeichnis
I. Abbildungsverzeichnis
Abbildung 1: Architektur der DIN 33430
Abbildung 2: Einsatzhäufigkeit und Bekanntheitsgrad der Persönlichkeitstests
II. Tabellenverzeichnis
Tabelle 1: Besprechungs- und Beurteilungskriterien
Tabelle 2: Formalisierte Bewertungsskala
Tabelle 3: Persönlichkeitsbereiche und Facetten des revidierten NEO- Persönlichkeitsinventars
III. Abkürzungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
Genderhinweis
In dieser Arbeit wird aus Gründen der besseren Lesbarkeit das generische Maskulinum verwendet. Weibliche und anderweitige Geschlechteridentitäten werden dabei ausdrücklich mitgemeint, soweit es für die Aussage erforderlich ist.
Anhang
Der Anhang dieser Arbeit wurde aus urheberrechtlichen Gründen entfernt.
Zusammenfassung
Die vorliegende Arbeit bewertet die fünf bekanntesten Persönlichkeitstests auf dem deutschen Markt hinsichtlich ihrer Qualität und empirisch abgesicherten Eignung für den Einsatz in der Personalauswahl. Diese sind laut Umfragen: der Myers-Briggs-Typen-In- dikator, das persolog® Persönlichkeits-Profil, das Bochumer Inventar zur berufsbezogenen Persönlichkeitsbeschreibung, das INSIGHTS MDI® und der NEO-Persönlichkeitsinventar. Um ein besseres Verständnis wissenschaftlicher Anforderungen an Persönlichkeitstests zu ermöglichen, findet eine theoretische und literaturbasierte Einführung in die Gütekriterien und Anforderungen an messtheoretisch fundierten Fragebögen und Tests statt. Diese werden in der DIN 33430 sowie dem Testbeurteilungssystem des Testkuratoriums spezifiziert und bilden die Bewertungsgrundlage der Testverfahren.
Die Beurteilung ergab, dass von den fünf Testverfahren lediglich der NEO-PI-R sowie das Bochumer Inventar zur berufsbezogenen Persönlichkeitsbeschreibung für die Personalauswahl geeignet sind. Diese erfüllen weitgehend die Anforderungen nach der DIN 33430 und zeigen anhand unterschiedlicher Studien die empirische Absicherung des Persönlichkeitsmodells sowie relevante Zusammenhänge mit berufsrelevanten Leistungskriterien. Die anderen drei Verfahren weisen erhebliche Einschränkungen in der Transparenz ihrer Untersuchungsdaten auf und beziehen sich auf Untersuchungsdaten, die schwer nachvollziehbar oder ungeeignet als Beleg der Güterkriterien sind.
Der Myers-Briggs-Typen-Indikator, das persolog® Persönlichkeits-Profil sowie das INSIGHTS MDI® sollten daher lediglich zur Reflektion oder Orientierung in Personalentwicklungskontexten eingesetzt werden, jedoch nicht in der Personalauswahl.
Abstract
This thesis evaluates the five best-known personality tests on the German market with regard to their quality and empirically proven suitability for use in personnel selection. According to surveys, these are: the Myers-Briggs Type Indicator, the persolog® Personality Profile, the ,Bochumer Inventar zur berufsbezogenen Persönlichkeitsbeschreibung‘, the INSIGHTS MDI® and the NEO Personality Inventory. In order to provide a better understanding of the scientific requirements for personality tests, a theoretical and literature-based introduction to the quality criteria and requirements for questionnaires and tests based on measurement theory is provided. These are specified in DIN 33430 as well as in the german test evaluation system of the test curatorship and form the evaluation basis of the test procedures.
The results of the review showed that out of five personality tests, only the NEO-PI-R and the ,Bochumer Inventar zur berufsbezogenen Persönlichkeitsbeschreibung‘ are suitable for personnel selection. These largely fulfill the requirements of DIN 33430 and, on the basis of various studies, demonstrate the empirical validation of the personality model as well as relevant correlations with job-relevant performance criteria. The other three tests show considerable limitations in the transparency of their research data and refer to empirical data that are difficult to trace or unsuitable as evidence of the quality criteria. The Myers-Briggs Type Indicator, the persolog® Personality Factor Profile and the INSIGHTS MDI® should therefore only be used for reflection or orientation in personnel development settings, but not in personnel selection.
1 Einleitung
Die Rahmenbedingungen vieler Branchen und Märkte verändern sich rasant. Zunehmende Digitalisierung, komplexere Arbeitsabläufe, stetig kürzer werdende Reaktionszeiten und Produktlebenszyklen sowie der steigende Wettbewerbsdruck sorgen dafür, dass die Anforderungen sowohl an Mitarbeiter als auch Unternehmen steigen (vgl. hierzu und zum Folgenden Treier, 2019, 3 ff.). Um diese Herausforderung zu bewältigen, wird eine Transformation der Personalarbeit empfohlen, in der der Mensch in den Mittelpunkt von Wertschöpfungsprozessen rückt. In der strategischen Personalplanung eines Unternehmens wird es daher umso wichtiger, bereits bei der Bewerberauswahl die ,richtigen‘ Kandidaten auszuwählen (Krause, 2017). Personalmanagern stehen dafür eine Reihe von Praktiken und Auswahlverfahren zur Verfügung, mit denen sie systematisch Schlüsselqualifikationen und Potentiale von externen Bewerbern mit den gewünschten Stellenanforderungen abgleichen können. Der Einsatz entsprechender Instrumente und Auswahlverfahren hilft dabei, genauere Aussagen über die berufliche Eignung eines Kandidaten treffen zu können und somit das Risiko von Frühfluktuation und hohen Folgekosten zu reduzieren (Krause, 2017; Lorenz & Rohrschneider, 2015). Allerdings eignet sich nicht jedes Instrument oder Verfahren, um eine fundierte Auswahlentscheidung zu treffen (Kanning, 2019). Das Maß bzw. die ,Genauigkeit‘, mit dem ein Instrument oder Verfahren bestimmte Erfolgskriterien (z. B. berufliche Leistung) vorhersagt, wird in der Eignungsdiagnostik als ,Validität‘ bezeichnet (Schmidt-Atzert, Krumm & Amelang, 2021b). Diese kann, abhängig von der Verfahrenswahl, erheblich variieren (Schmidt & Hunter, 1998). Für eine vertrauenswürdige' Erfolgsprognose bei der Personalauswahl ist es daher von großer Bedeutung, Verfahren mit einer hohen Validität einzusetzen (Krause, 2017).
Es stellt sich jedoch die Frage, wie die tatsächliche Praxis in deutschen Unternehmen aussieht. Eine Erhebung über die Einsatzhäufigkeiten bestimmter Instrumente und Auswahlverfahren in Unternehmen (Armoneit, Schuler & Hell, 2020) zeigt, dass neben weit verbreiteten biografischen und simulationsorientierten Verfahren (z. B. Sichtung von Bewerbungsunterlagen oder Probearbeitstag) auch vermehrt eigenschafts- oder konstruktorientierte Verfahren eingesetzt werden (Schuler, 2014). Während die ersten zwei genannten Verfahrenstypen darauf abzielen Leistungserfolge und direkt beobachtbares Verhalten zu beurteilen, beziehen sich eigenschafts- und konstruktorientierte Verfahren auf die Erfassung überfachlicher Kriterien. In dieser Verfahrenskategorie nehmen vor allem Persönlichkeitsmessverfahren (,Persönlichkeitstests') eine wichtige Rolle ein, denn sie erlauben eine systematisierte Messung von zeitlich relativ stabilen Persönlichkeitseigenschaften bzw. Verhaltenspräferenzen, die in einen Zusammenhang mit anderen wünschenswerten Kriterien gebracht werden können (vgl. hierzu und zum Folgenden Schuler, 2014, S. 119 ff.).
1.1 Problemstellung
Der Einsatz von Persönlichkeitstests hat einerseits eine Reihe von Vorteilen. Im Vergleich zu anderen Eignungsverfahren, erlauben Persönlichkeitstests schwer veränderbare Persönlichkeitsmerkmale systematisch zu erfassen (vgl. hierzu und zum Folgenden Lorenz & Rohrschneider, 2015, S. 119 ff.). Diese Erkenntnisse über die Persönlichkeitsstruktur eines potenziellen Bewerbers können folglich genutzt werden, um mögliche Spannungsfelder oder Leistungseinschränkungen im zukünftigen Arbeitsumfeld zu beleuchten. Andererseits, konnte bereits 1991 in den Meta-Studien von Bar Rick und Mount1 sowie Jackson, Rothstein und Tett2 belegt werden, dass kein bzw. nur ein sehr niedriger Zusammenhang zwischen Persönlichkeitsmerkmalen und beruflicher Leistung besteht. Andere Auswahlverfahren, wie das unstrukturierte Bewerbungsgespräch oder Intelligenztests, könnten im Vergleich deutlich bessere Korrelationen3 (r = .35 und .51) erzielen (Schmidt & Hunter, 1998). Ein Persönlichkeitstest als alleiniges Auswahlinstrument kann somit nur in einem geringen Maße für die Vorhersage von Berufserfolg herangezogen werden und sollte daher keine alleinige Entscheidungsgrundlage darstellen. Schlecht konstruierte Testverfahren begünstigen damit mögliche Fehlprognosen in der Personalauswahl und können zu Fehlentscheidungen führen (Kanning, 2019). Trotz dieser belegten niedrigen Vorhersagekraft kommen Persönlichkeitstests in fast 20 Prozent aller deutschen Unternehmen zum Einsatz (Armoneit et al., 2020; Hossiep & Weiß, 2017).
Die Empfehlungen seitens der Wissenschaft und die Praktiken der Unternehmen weichen an dieser Stelle voneinander ab (vgl. hierzu und zum Folgenden Funk, Nachtwei & Melchers, 2015, S. 26 ff.). Wissenschaftlern der Persönlichkeitsforschung scheint es auf der einen Seite nicht zu gelingen, ihre Ergebnisse und Empfehlungen zur Eignungsdiagnostik anwendungsorientiert und zugeschnitten auf die Bedürfnisse der HR-Praktiker zu präsentieren. Auf der anderen Seite scheint es HR-Praktiker zu geben, denen die Erkenntnisse der Persönlichkeitsforschung nicht bekannt sind oder denen keine Beachtung geschenkt wird diese nicht berücksichtigen wollen.
Ein weiteres Problem stellt die Verbreitung und Bekanntheit von Persönlichkeitstests mit zweifelhafter wissenschaftlicher Fundierung dar. So zeigen aktuelle Studien von Hos- siep, Weiß und Schecke (2015), dass der Typenindikator nach Myers-Briggs (,MBTI®‘) und das Dominanz-, Initiative-, Stetigkeits- und Gewissenhaftigkeits-Persönlichkeitsprofil (,DISG‘) die bekanntesten und am häufigsten eingesetzten Persönlichkeitstests in Unternehmen sind. Eben diese werden in der Wissenschaft, aufgrund ,veralteter‘ Persönlichkeitsmodelle, stark kritisiert und von dem Einsatz in der Personalauswahl wird abgeraten (Kersting, 2014). Aus dieser Diskrepanz zwischen Theorie und Praxis entstehen unweigerlich die Fragen: Welche Anforderungen müssen Persönlichkeitstests erfüllen, damit ein qualitatives und wissenschaftlich fundiertes Auswahlverfahren gewährleistet ist? Wie unterscheiden sich die bekanntesten Persönlichkeitstests im Hinblick auf diese Anforderungen? Welche Aussagen lassen sich hinsichtlich der prognostischen Validität für die berufliche Leistung treffen?
Diese Fragestellungen bilden den Ausgangspunkt für die vorliegende Bachelorarbeit. Folglich ist das Ziel, eine Vergleichbarkeit der bekanntesten Persönlichkeitstests zu erreichen und mit Empfehlungen zu den Einsatzmöglichkeiten sowie Grenzen in der Personalauswahl zu verknüpfen. Unternehmen, die sich für den Einsatz von persönlichkeitsorientieren Verfahren interessieren, soll nähergebracht werden, welche Merkmale und Unterschiede Persönlichkeitstests kennzeichnen und wie man diese sachgemäß beurteilen kann. Mit diesen Ergebnissen können auch Unternehmen, in denen Persönlichkeitstests bereits eingesetzt werden, den Einsatz ihrer Instrumente evaluieren und somit prüfen, ob und inwieweit diese den gewünschten Anforderungen genügen.
2 Definition und Abgrenzung von Persönlichkeitstests
Eine Definition für Persönlichkeitstest lässt sich durch die Zerlegung des Begriffs in - Persönlichkeit und ,Test‘ herleiten. Für den Begriff Persönlichkeit gibt es zahlreiche Definitionen, die im Alltagsverständnis und je nach Forschungsfeld variieren (Neyer & Asendorpf, 2018). Was letztendlich eine Persönlichkeit ausmacht, ist schwierig zu bezeichnen und selbst unter Psychologen nicht einheitlich definiert (Simon, 2006). Im Allgemeinen lässt sich die Aussage treffen, dass jeder Mensch im Laufe seines Lebens eine Persönlichkeit entwickelt, dessen Ausprägung ab dem Zeitpunkt der Geburt ein lebenslanger und sich verändernder Prozess ist (Jung, 2014). Die Wissenschaft versucht, die Persönlichkeitsentwicklung über mehrere Paradigmen4 genauer zu erforschen und zu definieren (Neyer & Asendorpf, 2018). Diese stellen häufig die Grundlage für die Entwicklung wissenschaftlicher Persönlichkeitskonzepte in Persönlichkeitstest dar. Eine allgemeine Definition von Neyer und Asendorpf beschreibt die Persönlichkeit als die „Gesamtheit [aller] Persönlichkeitseigenschaften: die individuellen Besonderheiten in der körperlichen Erscheinung und in Regelmäßigkeiten des Verhaltens und Erlebens [eines Menschen]“ (ebd. 2018, S. 2).
Geprägt wird die Persönlichkeit durch typische Verhaltensweisen, Werte, Stärken und Schwächen, erkennbare und gefestigte Charakterzüge sowie das Umfeld, in dem sich ein Mensch bewegt (Simon, 2006). Die Ausprägung dieser individuellen Eigenschaften eines Menschen wie auch seine Motive, Interessen und Einstellungen werden nur im Vergleich mit einer Referenzgruppe deutlich (Neyer & Asendorpf, 2018).
Unter dem Begriff ,Test‘ versteht man in der psychologischen Wissenschaft ein Routineverfahren, das versucht über Fragen oder Aufgabenstellungen die Ausprägungen von unterschiedlichen Merkmalen zu erfassen (Moosbrugger & Kelava, 2020).
Ein Persönlichkeitstest ist demnach ein wissenschaftliches Instrument, das die systematische Messung von Persönlichkeitseigenschaften durch die Selbsteinschätzung eines Menschen ermöglicht. Die Messung erfolgt, indem Testteilnehmer über Fragen zur Selbstreflektion angeregt werden und anschließend eine Selbsteinschätzung zu ihren Einstellungen, Werten, Motivationen, Interessen usw. abgeben (Kanning, 2019). Zur Beantwortung stehen den Probanden meist abgestufte Skalen zur Verfügung, mit denen sie einer Aussage mehr oder weniger zustimmen können (Pospeschill & Spinath, 2009). Die Testwerte werden anschließend in einem Persönlichkeitsprofil auf einer einheitlichen Skala abgebildet und für die Beantwortung von weiterführenden Fragestellungen (z. B. Personalauswahl) herangezogen (Neyer & Asendorpf, 2018). So lassen sich bspw. Verhaltensweisen in bestimmten Alltags- und Arbeitssituationen prognostizieren oder aber eine Aussage darüber treffen, was einen Menschen motiviert oder welche seine Wertevorstellungen sind (Simon, 2006).
Grundsätzlich lassen sich Persönlichkeitstests in folgende Konzepte differenzieren (Pospeschill & Spinath, 2009):
- Persönlichkeitsstrukturtests, die zentrale Verhaltenstendenzen von Individuen erfassen,
- Motivationstests, die sich mit dem Antreibern beschäftigen, der dem menschlichen Verhalten zugrunde liegt,
- Interessenstests, die die individuellen Interessen eines Probanden erfassen,
- objektive Tests, bei denen die Probanden nicht nachvollziehen können, welche Aspekte einer Persönlichkeit gemessen werden,
- projektive Tests, die beim Probanden über Reizvorlagen frei assoziierte Antworten auslösen, die wiederum Rückschlüsse über Verhaltenstendenzen erlauben.
Neben Persönlichkeitstests wird eine weitere Kategorie von Tests unterschieden, die sich mit Leistungs- und Fähigkeitsmessung beschäftigen. Diese zielen darauf ab, die maximale Fähigkeit bzw. kognitive Leistungsfähigkeit innerhalb eines bestimmten Zeitrahmens eines Menschen zu messen. Beispiele hierfür sind Konzentrations-, Intelligenz, Schulleistungs- oder Entwicklungstests (ebd. 2009).
Im Rahmen dieser Arbeit liegt der Schwerpunkt auf der Untersuchung von Persönlichkeitsstrukturtests und ihren unterschiedlichen theoretischen Ansätzen. Als Grundlage für die Beurteilung der gewählten Testverfahren ist es daher von Vorteil, ein Grundverständnis der verschiedenen Ansätze zu haben. Aus diesem Grund werden diese im folgenden Kapitel näher betrachtet.
2.1 Klassifikation von Persönlichkeitseigenschaften
Der Wunsch des Menschen, sich zu vergleichen, Unterschiede sowie Gemeinsamkeiten zu benennen und in Typen einteilen zu können, reicht zurück bis ins Altertum (Jung, 2014). Die ersten Ansätze, den Menschen mittels seines Aussehens, Körperbaus, Kindheitserfahrungen oder Reaktionsweisen zu unterscheiden, werden in der ,seriösen‘ Wissenschaft heute kaum noch weiterverfolgt. Die aktuellen Testverfahren, die über die letzten Jahrzehnte Einzug in die Praxis gefunden haben, werden in typologische und multidimensionale Testverfahren eingeteilt (Kersting, 2013).
2.1.1 Beschreibung typologischer Testverfahren
„Die Grundidee einer Typologie ist, dass ein Mensch einem bestimmten Typen zuzuordnen ist und somit durch bestimmte Merkmale charakterisiert werden kann“ (Kersting, 2013, S. 27). Typologische Testverfahren gehen davon aus, dass es Antwortmuster gibt, mit Hilfe derer sich Menschen einem bestimmten Persönlichkeitstyp zuordnen lassen (Jung, 2014). Einen maßgeblichen Einfluss auf die Entwicklung von typologischen Persönlichkeitstests hatten die Typentheorien von Carl Gustav Jung (1875 - 1961) und William Moulton Marston (1893 - 1947) (Kersting, 2013).
C.G. Jung entwickelte, basierend auf den Vorüberlegungen von Sigmund Freud, unterschiedliche Typen, die sich durch zwei gegensätzliche Einstellungen (Introversion und Extraversion) und vier psychologischen Grundfunktionen abgrenzen (vgl. hierzu und zum Folgenden Hossiep & Mühlhaus, 2015, S. 33 ff.). In den 1960er Jahren wurde diese Typologie genutzt, um Tests wie den MBTI® oder INSIGHTS MDI® zu entwickeln. Folgt man der Theorie von W.M. Marston, so unterscheiden sich die Typen in vier Reaktionsarten: Einflussnahme, Submission, Dominanz und Unterordnung. John G. Geier nutze dieses Modell, um ebenfalls in den 1960er Jahren das Testverfahren DISG- Persönlichkeitsprofil zu entwickeln.
Typologische Testverfahren unterliegen in dieser Hinsicht häufig gewissen Einschränkungen in der Anwendbarkeit. Diese sind, aufgrund der niedrigen wissenschaftlichen Evidenz der Modelle sowie der niedrigen Stabilität der gemessenen Eigenschaften, für die Personalauswahl weniger geeignet(Hossiep & Mühlhaus, 2015). Ein Vergleich von Persönlichkeitsmerkmalen zwischen Testprobanden, ist mit typologischen Testverfahren daher meist nicht vorgesehen (Steininger, 2020). Dennoch lassen Umfragen darauf schließen, dass diese vereinzelt auch im Recruiting eingesetzt werden (Klimmer & Neef, 2004).
2.1.2 Beschreibung multidimensionaler Testverfahren
Multidimensionale Testverfahren oder auch ,Persönlichkeits-Struktur-Tests‘ genannt, sind differenzierter als die oben beschriebenen typologischen Testverfahren (Hossiep & Mühlhaus, 2015). Sie messen voneinander unabhängige Persönlichkeitsmerkmale und ordnen diese mehreren Dimensionen zu. Je nach Testverfahren kann die Anzahl der Dimensionen zwischen zwei und 16 Dimensionen variieren (Hossiep & Weiß, 2017).
Die Dimensionen umfassen in der Regel eine Reihe von Persönlichkeitsfacetten und erlauben somit eine weitaus differenziertere Abbildung der Persönlichkeit (Steininger, 2020). Das einflussreichste Persönlichkeitskonzept innerhalb der multidimensionalen Testverfahren ist das ,Fünf-Faktor-Modell‘ (auch unter ,Big Five-Modell‘ bekannt) , das die Persönlichkeit in fünf unterschiedliche Dimensionen einordnet (vgl. hierzu und zum Folgenden Hossiep & Weiß, 2017, S. 164 ff.). Das Modell konnte in mehreren Untersuchungen kulturübergreifend bestätigt werden und genießt in der Wissenschaft eine hohe Akzeptanz. Die bekanntesten Verfahren, die sich auf dieses Modell beziehen, sind das NEO-Fünf-Faktoren-Inventar (,NEO-FFI‘) sowie seine umfassendere Version, der NEOPersönlichkeitsinventar in revidierter Fassung (,NEO-PI-R‘).
Trotz der breiten Anwendung in der Wissenschaft, werden diese Verfahren in Organisationen allerdings selten eingesetzt (vgl. hierzu und zum Folgenden Hossiep & Mühlhaus, 2015, S. 75 ff.). Ein Grund hierfür sind unter anderem die fehlende Berufsbezogenheit einiger Testfragen und die eindeutige Ergebnisinterpretation für den beruflichen Kontext. Ein Testverfahren, das diesen Aspekt besser umsetzt, ist das ,Bochumer Inventar zur berufsbezogenen Persönlichkeitsbeschreibung‘ (BIP). Dieses multidimensionale Testverfahren ist explizit für den Einsatz im beruflichen Kontext konzipiert und erfährt durch die Erfassung von 14 beruflich relevante Dimensionen eine hohe Akzeptanz.
Wie die genaue Nutzung von Persönlichkeitstests in Unternehmen aussieht und welchen Mehrwert diese stiften, wird im folgenden Kapitel erläutert.
2.2 Relevanz, Nutzung und Mehrwert
Als Instrument der Personaldiagnostik können Persönlichkeitstests in unterschiedlichen Situationen innerhalb einer Organisation zum Einsatz kommen: Sie können im Rahmen der Personalentwicklung (z. B. in Assessment-Centern oder Coachings), für die Personalauswahl (z. B. in Einstellungsgesprächen) oder für die Organisationsentwicklung als Personalmarketinginstrument angewendet werden. Laut einer Umfrage von Hossiep et al. (2015) stellen die Personalentwicklung und -auswahl mit einer Nutzungshäufigkeit von 89 Prozent und 52 Prozent die häufigsten Einsatzgebiete dar. In der Personalentwicklung sollen Persönlichkeitstest dazu beitragen, den persönlichen Entwicklungsbedarf eines Mitarbeiters aufzuzeigen und relevante Themenbereiche für die Weiterentwicklung herauszuarbeiten (Kanning, 2019).
Neben der Personalentwicklung dienen Persönlichkeitstest als sinnvolles Hilfsinstrument, um geeignete Mitarbeiter zu identifizieren (Simon, 2006). Nicht nur bei der externen Personalauswahl wird genau geschaut in welcher Abteilung oder in welchem Bereich potenzielle Mitarbeiter ihre Qualifikationen und ihr Persönlichkeitsprofil voll ausschöpfen können. Genauso können Persönlichkeitstests für interne Personalentscheidungen (bspw. Neuorganisation von Teams oder Abteilungen) herangezogen werden (Kanning, 2019). Mit Hilfe von erstellten ,Profil‘-Portfolios lassen sich individuelle Wünsche der Mitarbeiter sowie deren Kompetenzen auf die Anforderungen der Arbeitsstelle übergreifend aufeinander abstimmen (Kersting & Palmer, 2017).
Grundsätzlich ist der Einsatz von persönlichkeitsorientierten Testverfahren im beruflichen Kontext nur dann gerechtfertigt, wenn ein bedeutsamer Zusammenhang zwischen den Ergebnissen und beruflich relevanten Kriterien vorliegt (Hossiep & Weiß, 2017). Auf diese Anforderung liefert die Wissenschaft jedoch keine einheitliche Antwort. Auf der einen Seite ist die Persönlichkeit, wie in Kapitel 1.1 beschrieben, weniger für die Vorhersage beruflicher Leistung geeignet. Auf der anderen Seite, belegen Studien, dass einzelne Persönlichkeitsmerkmale, insbesondere die ,Big Five‘-Dimension ,Gewissenhaftigkeit' (r = .31), sehr wohl einen bedeutsamen Zusammenhang mit Berufserfolg aufweisen (Schmidt & Hunter, 1998). Auch Zusammenhänge zwischen Arbeitszufriedenheit, Selbstwirksamkeit im Beruf oder Führungserfolg konnten nachgewiesen werden (Hough & Oswald, 2005). Daraus lässt sich schließen, dass die wissenschaftliche Absicherung der gemessenen Persönlichkeitsmerkmale mit geeigneten Außenkriterien für den Einsatz in der beruflichen Praxis entscheidend ist.
Die Durchführung eines Tests kann mit Hilfe von Papierfragebögen (,Paper-Pencil-Test') oder computergestützt bzw. webbasiert durchgeführt werden. Computergestützte Testverfahren haben oft den Vorteil, in der Durchführung und Auswertung praktischer und dadurch kostensparender zu sein. Nachteilig ist, dass eine ggfs. gewünschte Interaktion zwischen Testleiter und Testprobanden nicht gegeben ist (Steininger, 2020).
Für ein Unternehmen haben Persönlichkeitstests oft den Vorteil ökonomisch und objektiv zu sein. Standardisierte Persönlichkeitsfragebögen sind zudem messgenau und eignen sich daher für den Einsatz in großer Stückzahl (Kanning, 2019).
In der mittel- und langfristigen Betrachtung können Persönlichkeitstests im Auswahlprozess dazu beitragen ,passende' Bewerber einzustellen und damit höhere Leistungsmotivation und geringere Fluktuation zu erreichen (Kersting & Palmer, 2017).
3 Qualitätsbeurteilung von Persönlichkeitstests
Neben der grundsätzlichen Entscheidungsfrage, welche Strategie bei der Personalauswahl verfolgt werden soll (Diagnostik- und Testkuratorium, 2018a) und an welcher Stelle im Auswahlprozess ein Persönlichkeitstest zum Einsatz kommen soll (Hossiep & Mühlhaus, 2015), stellt sich auch die Frage, welcher Persönlichkeitstest am besten geeignet ist. Wer sich auf die Suche nach Persönlichkeitstests begibt, findet auf dem Markt ein unüberschaubares Spektrum an Testanbietern, die angeben unterschiedlichste Persönlichkeitskonstrukte messen zu können (Eisele, 2010). Neben wissenschaftlich fundierten Testverfahren, die über professionelle Testverlage wie z. B. ,Hogrefe Verlag' vertrieben werden, befinden sich auf dem Markt auch zahlreiche unseriöse Testanbieter mit eigens entwickelten Verfahren und entsprechenden Lizensierungsangeboten (Kersting, 2019). Um als wissenschaftlich fundiert gelten zu können, müssen Anbieter in ihren Testverfahren eine klare Definition und Abgrenzung des zu messenden Konstrukts vornehmen und diese mit hinreichenden Forschungsergebnissen untermauern können (Steininger, 2020).
Während professionelle Testverlage sich also tendenziell mit zurückhaltenden, aber evidenzbasierten Informationen präsentieren, vermarkten sich unseriösen Testanbieterhäufig durch geschickten Einsatz von Werbetexten, Verweisen auf Autoritäten und zahlreiche zufriedene Anwender oder Kunden meist prägnanter und schaffen es so, von der Qualität ihrer Testverfahren zu überzeugen (Hossiep & Mühlhaus, 2015; Kersting, 2014). Ungeschulte Personalmanager, denen die notwendigen Kenntnisse der Testdiagnostik fehlen, können bei ihrer Entscheidung daher nur auf das subjektive Evidenzgefühl und die Aussagen der Anbieter vertrauen (Kersting, 2014). Doch auch geschultes Personal steht häufig vor der Herausforderung, ein ganzheitliches Bild von der Qualität eines Tests zu erhalten, wenn Testanbieter die Herausgabe von Sachinformationen zu ihren Testverfahren unter Gründen des ,Betriebsgeheimnisses', verweigern (ebd. 2014). Laut Kersting (2006) ist das Informationsangebot zur Beurteilung von Tests in Buchpublikationen oder Fachzeitschriften insgesamt weder quantitativ noch qualitativ überzeugend. Als Reaktion auf die Marktintransparenz fasste der Berufsverband Deutscher Psychologen (,BDP') den Entschluss, ein standardisiertes Regelwerk zur Qualitätssicherung von beruflichen Eignungsbeurteilungen zusammenzutragen. Das Regelwerk ist bekannt als die ,DIN 33430' und soll im nächsten Kapitel vorgestellt werden.
3.1 Anforderungen nach DIN 33430 für Persönlichkeitstests
Die Deutsche Industrienorm (DIN) 33430 formuliert „Anforderungen an Verfahren und deren Einsatz bei berufsbezogenen Eignungsbeurteilungen“ (Reiman, 2010, S. 15). Sie vereint den aktuellen Stand der Wissenschaft sowie praktische Leitlinien und formuliert daraus fachlich gesicherte Empfehlungen für die Planung und Durchführung von Eignungsbeurteilungsprozessen, der Bewertung externer Angebote sowie der Qualitätssicherung und -optimierung von Personalentscheidungen (Kersting & Püttner, 2018).
Entwickelt wurde die DIN 33430 im Jahr 2002 auf Initiative des BDP. Zusammen mit einem Normungsausschuss, bestehend aus Mitgliedern staatlicher Institutionen wie der Bundesagentur für Arbeit, privaten Unternehmen, wie dem TÜV, Hogrefe Verlag sowie erfahrenen Experten, wurde die Norm in einem „Konsensverfahren kollegial erarbeitet“ (Kersting, 2008, S. 50) und nach öffentlicher Überprüfung veröffentlicht (ebd. 2008).
Zwar existieren bereits seit den Fünfzigerjahren eine Reihe von international anerkannten Qualitätsstandards, die von amerikanischen Organisationen wie der American Educational Research Association (,AERA‘), American Psychological Association (,APA‘) oder National Council on Measurement in Education (,NCME‘) vorgegeben wurden, allerdings, unterliegen diese größtenteils gewissen Einschränkungen für die Eignungsbeurteilung im Auswahlprozess sowie der Praktikabilität für Nicht-Psychologen. Aus diesem Grund wird die DIN 33430 für den Einsatz in Unternehmen als wegweisend angesehen (Kersting, 2006, 2010). Die Anwendung der DIN 33430 ist für ein Unternehmen dennoch nicht verpflichtend (Reiman, 2010). Ein Auftraggeber (z. B. Unternehmen) muss sie in der Personalauswahl nicht umsetzen und ein Bewerber kann die Anwendung nicht einfordern. Verbindlich wird sie erst dann, wenn Auftraggeber und Auftragnehmer sich zuvor auf die Anwendung vertraglich einigen.
Die DIN 33430 umfasst drei Säulen: Prozess, Verfahren und Personen (siehe Abbildung 1). In diesen Säulen werden wichtige Qualitätskriterien und -standards definiert, die sich auf vier relevante Bereiche beziehen:
1. „(...) Planung von berufsbezogenen Eignungsbeurteilungen
2. Auswahl, Zusammenstellung, Durchführung und Auswertung von Verfahren
3. Interpretation der Verfahrensergebnisse und die Urteilsbildung sowie
4. Anforderungen an die Qualifikation der an der Eignungsbeurteilung beteiligten Personen“ (Kersting, 2008, S. 55).
Die DIN stellt somit keine Produkt-, sondern eine Prozessnorm dar und bezieht sich auf alle Verfahren, die für die Eignungsbeurteilungen (bspw. Interviews, Assessment Center oder Persönlichkeitstests) eingesetzt werden können (Kersting, 2006).
Innerhalb der zweiten Säule werden diese Verfahren in fünf Kategorien eingeteilt, von denen eine die messtheoretisch fundierten Fragebögen (z. B. Persönlichkeitsfragebögen) umfasst. Laut der Norm müssen messtheoretisch fundierte Fragebögen neben Handhabungshinweisen mit Informationen zu Anwendungsbereichen, persönlichen Qualifikationsanforderungen sowie der Durchführung, Auswertung und Interpretation des Testverfahrens zusätzlich Verfahrenshinweise vorweisen können (vgl. hierzu und zum Folgenden Höft, Püttner & Kersting, 2018, S. 116 ff.).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1: Architektur der DIN 33430 (Kersting & Püttner, 2018, S. 7)
Diese werden häufig auch Testmanual oder Testhandbuch genannt. In weiteren Ausführungen formuliert die Norm zwei umfangreiche Anforderungskataloge (DIN 33430 Anhang A‘ und .Anhang B‘) an die Handhabungs- und Verfahrenshinweise, die für die weitere Qualitätsbewertung herangezogen werden.
Basierend auf der DIN 33430 formulierte Kersting und das Diagnostik- und Testkuratorium (,DTK‘) (2010) ein spezifisches Beurteilungssystem für Tests und Fragebögen, indem das gesamte Regelwerk in Einzelaussagen zerlegt und in Checklistenform zusammengesetzt wurde. Die Zusammenfassung der Checkliste gibt die Anhänge A und B vollständig wieder und umfasst hauptsächlich Aussagen zu Anforderungen an Verfahrenshinweisen laut der DIN 33430 (Kersting, 2006). Jede Aussage wird als ,Muss-Anfor- derung‘ oder ,Soll-Anforderung‘ durch die Antwortmöglichkeiten ,Ja‘ und ,Nein‘ bewertet und nachvollziehbar dokumentiert (Kersting, 2018).
Im Ganzen setzt die Checkliste einen Schwerpunkt auf Überprüfung aller Informationen, die mit der Konstruktion, Anwendung, Auswertung und Interpretation des Testverfahrens zusammenhängen (Sarges, 2013). In anderen Abschnitten werden weitere Qualitätsaspekte zur Auswahl und Zusammenstellung von Verfahren sowie der Dokumentation und Qualifikation der beteiligten Personen abgefragt.
Das nächste Kapitel soll einen Überblick über die Entwicklung und Handhabung dieses Beurteilungssystems geben.
3.2 TBS-TK
Das Testbeurteilungssystem des Diagnostik- und Testkuratori ums (,TBS-TK‘) ist ein standardisiertes Verfahren, mit dem die Qualität und die testtheoretischen Gütekriterien von Tests und Fragebögen (z. B. Persönlichkeitsfragebogen, Interessenfragebogen oder Intelligenz- und Wissenstests) sichergestellt und optimiert werden können (Diagnostik- und Testkuratorium, 2018a). Das System wurde vom DTK für den deutschen Testmarkt entwickelt und bietet damit eine deutschsprachige Alternative zu vorliegenden europäischen Beurteilungssystemen, wie COTAN5 und EFPA5 6 (vgl. hierzu und zum Folgenden Moosbrugger & Kelava, 2020, S. 210 ff.). Eine Besonderheit des TBS-TK liegt darin, dass sie Anforderungen der europäischen Beurteilungssysteme in flexiblerer Form berücksichtigt und Standards der DIN 33430 explizit in die Beurteilung integriert. Die standardisierte Bewertung mittels vorgegebener Beurteilungskriterien ermöglicht somit eine höhere Transparenz sowie eine objektive und konstruktübergreifende Vergleichbarkeit verschiedener Testverfahren.
Soll ein Testverfahren mittels des TBS-TK bewertet werden, geschieht dies über den offiziellen Weg des DTK und in drei wesentlichen Schritten (vgl. hierzu und zum Folgenden Diagnostik- und Testkuratorium, 2018b, S. 106 ff.):
Nach einem internen Auswahlverfahren des zu rezensierenden Tests durch das DTK werden zwei Parteien für die Beurteilung bestimmt. Diese Parteien bestehen aus einer oder mehreren Personen, die über bestimmte fachliche Qualifikationen verfügen sowie ihre Unvoreingenommenheit bei der Rezension erklären müssen. Die Identität der Rezensionsparteien werden bis zum letzten Beurteilungsschritt vom DTK geheim gehalten. Im zweiten Schritt werden die formalen Voraussetzungen für die Bewertung geschaffen. Dafür werden die Testanbieter aktiv eingebunden und um die Bereitstellung aller notwendigen Verfahrenshinweise (Testmanual oder Testhandbücher) gebeten. Kommt der Testanbieter dieser Auskunfts- und Bereitstellungsbitte innerhalb einer Frist nicht nach, wird das Testverfahren vom Testkuratorium als ,nicht prüffähig' gewertet.
Im dritten Schritt findet der eigentliche Beurteilungsprozess statt, der wiederum in zwei Phasen unterteilt wird.
Die erste Phase besteht darin, den Informationsgehalt der Verfahrenshinweise zu bewerten . Diese Anforderungen sind aus den Anhängen der DIN 33430 übernommen und für die vereinfachte Anwendung in einer Checkliste (,DIN SCREEN Checkliste 1') zusammengefasst. Mittels der Checkliste prüfen die unabhängigen Rezensionsparteien, ob der Test .prüffähig1 ist. Sind in den Verfahrenshinweisen bestimmte Angaben nicht enthalten, erfüllt das Testverfahren gemäß der DIN 33430 die Anforderungen nicht und ist damit nicht prüffähig.
Werden die Anforderungen als .erfüllt' angesehen, wird der Testanbieter zusätzlich um eine Selbsterklärung gebeten, in der er versichert, dass in der geschäftlichen Praxis die Verfahrenshinweise auch jedem anderen Anwender zur Verfügung gestellt werden.
In der zweiten Phase wird der Test anhand von zehn Besprechungs- und Beurteilungskriterien des DTK bewertet (siehe Tabelle 1). Die dafür notwendigen Informationen zur Bewertung werden der aktuellen Version der Verfahrenshinweise entnommen.
Tabelle 1: Besprechungs- und Beurteilungskriterien
Abbildung in dieser Leseprobe nicht enthalten
Für die Bewertung der Kategorien sieht das TBS-TK keine festen Bewertungsschemata vor. Den Rezensionsparteien ist es damit frei überlassen eigene Bewertungsmaßstäbe 19 anzusetzen, die im Gesamtkontext am zieldienlichsten sind. Lediglich einzelne Kriterien sollen zusätzlich über ein formalisiertes Schema bewertet werden (siehe Tabelle 2). Eine weitere Vorgabe bezieht sich die auf Gesamtlänge der Bewertung, die 12.000 Zeichen nicht überschreiten darf.
Tabelle 2: Formalisierte Bewertungsskala voll weitgehend Der Test erfüllt die Anforderungen.
Nach Abschluss der Testrezension mittels des TBS-TK, werden die Ausarbeitungen der beiden Rezensionsparteien an das DTK geschickt, das die Einhaltung der Richtlinien überprüft. Erst danach wird die Anonymität der Parteien aufgehoben und im Folgeschritt eine gemeinsame Rezension erstellt. Für den Fall, dass die Rezensionsparteien sich bei der finalen Beurteilung nicht einigen können, wird eine gemeinsame Fassung mit den unterschiedlichen Positionen angefertigt. Vor der Veröffentlichung der Rezension wird dem Testanbieter die Möglichkeit eingeräumt, gegenüber dem DTK Stellung zu beziehen und auf mögliche Sachfehler im Rezensionsentwurf hinzuweisen.
3.3 Hauptgütekriterien diagnostischer Verfahren
Wie in Kapitel 3.2 beschrieben, ist die Qualität eines psychologischen Testverfahrens von bestimmten Gütekriterien abhängig. In der deutschsprachigen Literatur wird dafür traditionell auf die von Lienert und Raatz (1998) definierten Kriterien verwiesen. Lienert und Raatz unterscheiden dabei zwischen Haupt- und Nebengütekriterien. Das Testkuratorium und der Universitätsprofessor für Psychologische Diagnostik, Klaus Kubinger, ergänzen diese um weitere Nebengütekriterien (Diagnostik- und Testkuratorium, 2018b; Kubinger, 2006). In der Gesamtbetrachtung kann die Beurteilung eines Testverfahrens damit die Hauptgütekriterien: Objektivität, Reliabilität und Validität berücksichtigen sowie die Nebengütekriterien: Eichung (bzw. Normierung), Ökonomie, Nützlichkeit, Störanfälligkeit, Unverfälschbarkeit, Fairness und Skalierung. Diese Haupt- und Nebengütekriterien werden in den folgenden Unterkapiteln genauer beschrieben
3.3.1 Objektivität
Beschließt ein Unternehmen den Einsatz eines Testverfahrens, erfordert die Anwendung stets die Einbindung eines oder mehrerer Prozessverantwortlicher (auch ,Testleiter‘ genannt), die die Testung durchführen, die Ergebnisse auswerten und interpretieren (vgl. hierzu und zum Folgenden Kubinger, 2019, S. 46 ff.). Diese drei Arbeitsschritte kennzeichnen sensible Phasen, in denen es zu zufälligen oder systematischen Abweichungen in der Testanwendung kommen kann. Grundsätzlich besteht der Anspruch eines Testleiters darin, alle Testprobanden unter möglichst identischen Bedingungen zu testen. Dies kann z. B. durch genaue Anweisungen und Vorgaben der Arbeitsschritte erfolgen. Der Grad, in dem es gelingt die Ergebnisse eines Tests unabhängig vom Testleiter zu erfassen, wird als ,Objektivität“ bezeichnet (Lienert & Raatz, 1998). Ein Testverfahren gilt also dann als objektiv, wenn verschiedene Testleiter bei derselben Testperson zu demselben Ergebnis gelangen. Man unterscheidet nach Lienert und Raatz (1998), entsprechend der drei Phasen, drei Unterformen der Objektivität:
- Durchführungsobjektivität,
- Auswertungsobjektivität und
- Interpretationsobjektivität.
Kubinger (2019) präzisierte diese Unterformen mit den Bezeichnungen:
- Testleiterunabhängigkeit,
- Verrechnungssicherheit und
- Interpretationseindeutigkeit.
Um den Grad der Testleiterunabhängigkeit eines Testverfahrens maximal hoch zu halten, ist es notwendig, für alle Arbeitsschritte die Anweisungen an den Testleiter so genau wie möglich schriftlich festzuhalten und die Untersuchungsbedingungen bestmöglich zu standardisieren (Lienert & Raatz, 1998). In der Praxis ist dies allerdings schwer umzusetzen, da Testungen unter den absolut gleichen Bedingungen niemals gewährleistet werden können. So können bspw. Übungseffekte beim Testleiter einsetzen und damit zu Veränderungen der Durchführungsobjektivität führen (Kubinger, 2019). Eine geeignete Methode, um die Verhaltensvariation eines Testleiters durch Interaktionen zwischen ihm und dem Testprobanden zu reduzieren, ist die Verwendung von computergestützten Testverfahren.
Hinsichtlich der Verrechnungssicherheit ist eine maximale Objektivität am ehesten gegeben, wenn die Auswertung mittels Schablone (in der Regel eine Klarsichtfolie, die relevante Antwortmöglichkeiten anzeigt) oder automatisiert am Computer erfolgt (ebd. 2019).
Die Interpretationseindeutigkeit ist für einen Test dann gegeben, wenn verschiedene Testleiter unabhängig voneinander aus den gleichen Auswertungsergebnissen die gleichen Schlüsse ziehen. Dies ist vor allem bei normierten Testverfahren gewährleistet, da eine Zuordnung von Testwerten innerhalb einer Referenzpopulation genauere Interpretationen ermöglicht (ebd. 2019).
3.3.2 Reliabilität
Unter Reliabilität versteht man die Messgenauigkeit eines Testverfahrens unter Berücksichtigung eines etwaigen Messfehlers (Kubinger, 2019). Es ist dabei unerheblich, ob das tatsächlich gemessene Merkmal auch gemessen werden sollte. Die Messgenauigkeit bezieht sich lediglich auf die formale Exaktheit der Messung.
Es werden drei methodische Vorgehensweisen unterschieden, nach denen die Reliabilität eines Tests bestimmt werden kann:
Eine Möglichkeit besteht darin, bei denselben Testprobanden zwei zeitlich versetzte Testungen durchzuführen. Die Korrelation aus beiden Testungen liefert die ,Test-Retest- Reliabilität' und ermöglicht Aussagen über die Stabilität einer gemessenen Eigenschaft (ebd. 2019). Ein brauchbares Testverfahren sollte einen Stabilitätswert von mindestens r = .50 oder höher vorweisen können (Schuler, 2014). Laut der DIN 33430 sind für Untersuchungen der Reliabilität eher Werte zwischen a = .70 und .85 üblich (Normausschuss Gebrauchstauglichkeit und Dienstleistungen, 2002). Für Personalentscheidungen sollte die Reliabilität sogar bei mindestens .90 liegen (Kersting, 2006) Bei dem Untersuchungsdesign besteht allerdings stets die Herausforderung, ein angemessenes Zeitintervall zu finden, in dem der Einfluss von Erinnerungs- oder Übungseffekte vermieden wird und gleichzeitig das Merkmal keinen zeitlichen Veränderungen unterliegen konnte (Krumm, Schmidt-Atzert & Amelang, 2021). Ein weiterer Einflussfaktor ist die Größe der Personenstichprobe. Diese sollte laut Westhoff eine Mindestgröße von 400 Personen umfassen, damit die Reliabilitätsschätzung keinen bedeutsamen Schwankungen unterliegt (Westhoff, 2010).
Das zweite Reliabilitätsvorgehen erfasst die innere Konsistenz eines Tests und gibt an, wie gut einzelne Items dasselbe Merkmal erfassen. Sollten die Items eines Tests nicht zueinander passen, so wird das Testergebnis stark vom Zufall bestimmt und erlaubt damit keine exakte Messung (Kubinger, 2009). Die Bestimmung der internen Konsistenz erfolgt in den meisten Fällen mittels der ,Split-half‘-Methode, bei der die Items eines Tests in zwei Teile geteilt und statistisch korrigiert werden (ebd. 2009). Der empfohlene Reliabilitätskoeffizient für die innere Konsistenz sollte a > .70 sein (Hossiep & Mühlhaus, 2015; Kanning, Pöttker & Klinge, 2008). Dieser wird durch den Faktor ,Cronbachs Alpha' angegeben.
[...]
1 Korrelationskoeffizient r liegt bei .11.
2 Korrelationskoeffizient r liegt bei .24.
3 Korrelation beschreibt die statistische Beziehung zweier Variablen und kann Werte zwischen ,0‘ (=kein Zusammenhang) und |1| (=perfekter Zusammenhang) annehmen.
4 Unter Paradigmen versteht man ein von vielen Wissenschaftlern geteiltes Bündel aus theoretischen Leitsätzen, Fragestellungen und Methoden.
5 Committee On Test Affairs Netherlands.
6 European Federation of Psychologists Associations.
- Arbeit zitieren
- Slava Jungblut (Autor:in), 2022, Beurteilung von Persönlichkeitstests in der Personalauswahl. Möglichkeiten und Grenzen, München, GRIN Verlag, https://www.grin.com/document/1316729
-
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen.