HR, Big Data und die Vereinfachungsfalle

14. Januar 2019

Wie die Missachtung von Unsicherheit in Ihren Daten zu kostspieligen Fehlern führen kann

Heute ist ein allgemeiner Trend zu mehr datengetriebenen Entscheidungen in Unternehmen zu beobachten. Diese Entwicklung gilt auch für Bereiche und Funktionen, die bisher weniger "quantitativ" waren, wie z.B. das Personalwesen.

Bild eines Laptops der diverse Statistiken anzeigt
Mehr und mehr Entscheidungen in Unternehmen werden aufgrund Daten getroffen. Ein Trend der anhält. Foto © CC0 Licence

Der HR-Bereich holt jedoch in dieser Hinsicht sehr schnell auf. Es gibt mittlerweile eine Reihe von großen Daten- und Analyseapplikationen und Firmen experimentieren auch mit Rekrutierungsrobotern, die auf Facebook Messenger oder automatisiertem Screening von KandidatInnen für Schulungen basieren. Dennoch beobachte ich regelmäßig einige weit verbreitete Wissenslücken unter den Personalverantwortlichen in Bezug auf einige quantitative Grundprinzipien. Aus meiner Sicht ist einer der wichtigsten Punkte, wie man mit Unsicherheit in (HR-)Daten umgeht. Insbesondere stelle ich fest, dass viele ManagerInnen oft nur Daten aus einer Stichprobe und nicht aus der gesamten Population haben, und dass sie den Fehler machen, ihre Stichprobe so zu behandeln, als wäre es die Population. Das Übersehen dieses Punktes kann zu Fehlentscheidungen und potenziell kostspieligen Fehlern führen.

Das "Unsicherheitsproblem" von Proben

In der Regel sind Personalverantwortliche an Daten über ihr gesamtes Unternehmen interessiert, z.B. an Daten über alle Projektteams des Unternehmens, über alle MitarbeiterInnen, über alle aktuellen Expats etc. Obwohl wir zwar Daten über all diese MitarbeiterInnen, Teams oder Expats erhalten und analysieren möchten, kann die Datenerfassung äußerst kostspielig oder zeitaufwendig sein. Daher ist es für Personalverantwortliche oft erforderlich, nur Daten aus einer Teilmenge dieser Gruppen, d.h. einer "Stichprobe", zu erheben. Einfach ausgedrückt bedeutet die Verwendung von Stichproben, dass Sie nicht alle verfügbaren Informationen nutzen.

Bild einer einzelnen Spielfigur, die neben einer Gruppe anderer Figuren steht
Bei einer Stichprobenanalyse werden zur leichteren Analyse, nicht alle verfügbaren Informationen genützt. Foto © CC0 Licence

Der am weitesten verbreitete Ansatz besteht darin, einige Statistiken über die verfügbaren Daten durchzuführen und die Ergebnisse als gute "Schätzungen" für die Grundgesamtheit zu verwenden. Nehmen wir zum Beispiel an, dass ein Unternehmen 300 Expats hat und Daten über eine Stichprobe von 100 davon gesammelt hat. In diesem Jahr liegt die durchschnittliche Zufriedenheit der 100 Expats mit den Expat-Vorbereitungskursen der Firma auf dem Niveau von 3,8 auf einer 5-Punkte-Skala (5 bedeutet „sehr zufrieden“ und 1 "sehr unzufrieden"). In den letzten zwei Jahren, als das Unternehmen Daten von allen Expats sammelte, lag die Zufriedenheit in beiden Jahren bei 4,2. Die Personalverantwortlichen könnten folglich zu dem Schluss kommen, dass die Vorbereitungskurse geändert werden müssen, weil "das Ergebnis immer schlimmer wird"! In der Grafik würde das nun folgendermaßen aussehen:

filler-news-vereinfachungsfalle3deutsch.jpg

Aber ist das die richtige Interpretation?

Das Problem mit dieser Schlussfolgerung ist, dass sie auf der Annahme basiert, dass 3,8 in der Stichprobe 3,8 in der Gesamtbevölkerung repräsentiert. Das stimmt so aber nicht! Wenn eine andere Stichprobe entnommen worden wäre, hätte die durchschnittliche Zufriedenheit 3,5 oder 4,0 oder sogar 4,5 betragen können, nur weil die Personalverantwortlichen ganz zufällig einige mehr oder weniger verärgerte Expats in die Stichprobe bekommen haben, die die durchschnittliche Bewertung der Vorbereitungskurse beeinflusst haben. So haben wir einen Hinweis darauf, wie alle 300 Expats den Vorbereitungskurs bewerten, der auf der Stichprobe basiert (und das sagt uns, dass es in diesem Jahr "3.8" ist), aber es gibt einige Unsicherheiten in Bezug auf diesen Wert - es könnte sehr wohl auch anders sein.

Wenn ManagerInnen diese Unsicherheit nicht berücksichtigen, besteht die Möglichkeit, dass sie über- oder unterreagieren. Nehmen wir zum Beispiel an, dass in Wirklichkeit alle 300 ManagerInnen einen Zufriedenheitsgrad von 4,2 haben, während unsere Stichprobe, völlig zufällig, uns sagt, dass es 3,8 ist, weil es einige unzufriedenere Expats in den Stichprobendaten gibt. Was wäre dann die Schlussfolgerung? Nun, hier können wir zu dem Schluss kommen, dass die Qualität des angebotenen Kurses in Ordnung ist - eigentlich auf dem gleichen Niveau wie es die gesamte Gruppe der Expats in den letzten zwei Jahren gesehen hat. Aber wenn alle ManagerInnen einen durchschnittlichen Zufriedenheitsgrad von 3,6 haben (und unsere Stichprobe zeigt immer noch 3,8), dann könnten wir wirklich besorgt sein, dass irgendetwas im Rahmen derVorbereitungen nicht gut läuft.

4 Personen halten ein Schild mit einem grünen Haken vor ihre Gesichter
Ist die Zufriedenheit in der Stichprobe hoch, bedeutet das nicht, dass es auch für die gesamte Population gilt. Foto © CC0 Licence

Wenn ManagerInnen also einfach davon ausgehen, dass eine Statistik, wie z.B. ein Durchschnitt aus einer Stichprobe, in der Grundgesamtheit gleich ist, besteht die Möglichkeit, dass sie die falschen Schlussfolgerungen ziehen. Diese Fehler können Unterreaktionen (der Vorbereitungskurs sollte verändert werden, wird es aber nicht) oder Überreaktionen (der Vorbereitungskurs sollte nicht verändert werden, da es keine eindeutigen Hinweise auf einen Trend zu mehr Unzufriedenheit gibt, aber dennoch wird der gut funktionierende Kurs adaptiert) sein - beide Entscheidungen sind daher potenziell kostspielige und zeitraubende Fehler.

Die Lösung

In der Statistik würden wir die Ergebnisse aus einer Stichprobe als "Punkteschätzung" bezeichnen. Eine Punkteschätzung an sich könnte ein guter Anfang sein, um über die Grundgesamtheit nachzudenken (es ist eine erste gute Schätzung), aber eine Punkteschätzung liefert keine Informationen darüber, wie "gut" diese Schätzung ist - sie berücksichtigt nicht die Unsicherheit.

Die gute Nachricht ist: Wenn Ihre Stichprobe zufällig entnommen wurde, kann die Statistik uns helfen, eine Vorstellung von dem Fehler zu bekommen, den wir haben könnten, weil wir eine Stichprobe und nicht die Grundgesamtheit haben. Wir werden nie sicher wissen, wie der tatsächliche Wert (die wahre durchschnittliche Zufriedenheit der gesamten Gruppe) aussieht, bis wir tatsächlich Daten für die Grundgesamtheit sammeln und analysieren. Dennoch können wir dieses Problem immer noch mit Konfidenzintervallen lösen.

Konfidenzintervalle können auch als "Bandbreitenschätzungen" bezeichnet werden. Im Gegensatz zu Punktschätzungen bietet eine Bandbreitenschätzung eine ganze Reihe von potenziellen Grundgesamtheitsschätzungen, die wahrscheinlich wahr sind. Für unser obiges Beispiel würden wir, anstatt davon auszugehen, dass der 3,8-Durchschnitt der Stichprobe auch in der Grundgesamtheit 3,8 beträgt, das Konfidenzintervall berechnen und unsere Entscheidungsfindung auf eine Aussage stützen, die besagt, dass wir zu 95% sicher sein können, dass der tatsächliche Durchschnitt der Grundgesamtheit irgendwo im Bereich zwischen 3,6 und 4,0 liegt.

Mann zeigt einen Daumen nach oben
Mithilfe der Konfidenzintervalle kann man berechnen in welcher Bandbreite sich ein Wert sehr wahrscheinlich befindet. Foto © CC0 Licence

Die Sache mit dem Konfidenzintervall ist, dass unsere Schlussfolgerungen aus den Daten sehr unterschiedlich werden: Wir sind von einer einfachen Punkteschätzung (die Zufriedenheit aller Expats ist 3,8) zu einer Bereichsschätzung übergegangen (es ist sehr wahrscheinlich, dass die Zufriedenheit der Expats irgendwo im Bereich zwischen 3,6 und 4,0 liegt) und deshalb könnten wir eine andere, qualifiziertere Entscheidung treffen. In diesem Fall könnten wir zu dem Schluss kommen, dass der Unterschied zwischen 4,2 und dem höchstwahrscheinlichen 4,0 dieses Jahres nicht groß genug ist, um den Kurs aufgrund des schlechten Feedbacks der Teilnehmer zu überarbeiten.

Zusammenfassend lässt sich sagen, dass wir durch die Verwendung von Stichproben und Bandbreitenschätzungen anstelle von Punktschätzungen erkennen, dass unsere Schätzung über die Grundgesamtheit bis zu einem gewissen Grad unsicher ist und wir dadurch besser gerüstet sind, um kostspielige Unter- oder Überreaktionen zu vermeiden.

Lesen Sie von Prof. Phillip Nell auch über Politik als Risikofaktor für Unternehmen.

Seite teilen