Ausreisser in Messdaten bewerten. Teil 2: Praxistipps zum Umgang mit Ausreissern
Arbeiten Sie auch mit experimentellen Daten? Dann haben Sie es sicherlich schon einmal mit Ausreißern zu tun gehabt. In diesem Fall stellen sich zwei Fragen: gibt es ein eindeutiges Kriterium, nach dem Ausreißer identifiziert werden können? Und: wie geht man mit Ausreißern um? Im zweiten Teil der Artikelserie beantworten wir die zweite Frage.
In diesem Artikel lernen Sie, wie Sie
Im ersten Artikel haben wir die wichtigsten Begriffe eingeführt und erklärt was ein Ausreißer ist. Zusätzlich zeigten wir Ihnen einen statistischen Test zur Erkennung potenzieller Ausreisser, den Dean-Dixon Test. Zu dessen Anwendung stellen wir auch ein Excel Tool bereit.
In diesem zweiten Artikel besprechen wir
- den Umgang mit Ausreissern. Sie werdenaußerdem
- die wichtigsten Praxistipps für einen fachgerechten Umgang mit Ausreißern erhalten.
Inhalt
Umgang mit Ausreißern
Beim Umgang mit Ausreißern muss unbedingt immer beachtet werden, dass die Statistik niemals eine Ursache für den Ausreißer liefert und deswegen auch keinen Beweis darstellt!
Merke: Statistik liefert gute Hinweise aber keine Beweise!
Mit Hilfe der vorgestellten Methoden ist somit lediglich die Aussage möglich, dass es sich um potenziell auffällige Werte (also statistisch signifikante Werte) handelt. Erst wenn nachgewiesen werden kann, dass sich die Ausreißerwerte tatsächlich von den anderen Werten auch technisch unterscheiden, also die Frage nach dem warum geklärt ist, handelt es sich um wirkliche Ausreißer.
Aus dieser Überlegung folgt, dass im Anschluss an die statistische Bewertung eine technische Analyse folgen muss. Diese technische Analyse hat die Aufgabe die Ursache für die Auffälligkeit zu finden. Erst wenn dadurch sichergestellt ist, dass es sich bei dem oder den identifizierten Ausreißern tatsächlich um Werte einer anderen Population handelt, dürfen diese aus der Analyse ausgeschlossen werden.
Eingangs hatten wir gesagt, dass es vier mögliche Gründe für Ausreißer gibt, es:
- handelt sich um einem Zahlendreher (anstelle von 13 wurde beim Datenübertrag 31 eingetragen)
- wurden versehentlich die falschen Daten eingetragen, Messsignale vertauscht oder es liegt ein Messfehler vor
- ist schlicht Zufall. Bei allen streuenden Daten können rein zufällig extremale Werte auftauchen.
- gibt einen plausiblen physikalischen Grund, dass sich dieser Wert von den restlichen Werten unterscheidet.
Liegt einer der ersten beiden Punkte vor, dann kann der Wert korrigiert oder gegebenenfalls aus dem Datensatz entfernt werden. Im dritten Fall darf der Wert nicht aus dem Datensatz entfernt werden, sondern muss berücksichtig werden. Hier eignen Sich evtl. Robuste Methoden um mit diesen Werten umzugehen. Nur im letzten Fall liegt ein echter Ausreißer vor, der dann aus der Stichprobe entfernt werden darf und die Stichprobe neu ausgewertet werden kann.
In jedem Fall ist das Ergebnis zu dokumentieren und zu vermerken, welche Werte aus der Stichprobe entfernt wurden. Diese Entscheidung zur Entfernung der Daten ist unbedingt schlüssig zu begründen.
Erfahrungen aus der Praxis um Ausreisser zu bewerten:
Die natürliche Streuung wird gerne unterschätzt. Um dies zu veranschaulichen wird die Größe des größten jemals gemessenen Menschen (Robert Wadlow, 272 cm) mit der Größe des kleinsten jemals gemessenen Menschen (Chandra Bahadur Dangi, 55 cm) verglichen. Es handelt sich in beiden Fällen um Männer. Die Streuung könnte somit als zufällig angesehen werden und nicht als Ausreißer. Hier helfen evtl. robuste Methoden bei der Datenauswertung.
Es muss bei potenziellen Ausreißern vom Ingenieur oder Techniker die Frage beantwortet werden: „Warum weicht dieser Wert von den anderen Werten der Stichprobe ab?“. Im Falle des Bildes dieses Beitrages handelt es sich um Roggen inmitten eines Gerstenfeldes. Das erklärt den "Ausreisser"!
Manchmal zeigen Ausreißer neue Probleme auf. In diesem Fall können diese Werte aus der Stichprobe entfernt werden, sollten jedoch sehr genau analysiert werden, um die neuen Probleme rechtzeitig separat zu beheben.
Was meine ich damit: Sie wären nicht der erste, der quasi zufällig feststellt, dass sich die Bauteilqualität verschlechtert hat.
Dazu ein Beispiel:
Üblicherweise werden mit Lieferanten Preisabbauraten vereinbart. Das bedeutet, dass der Lieferant sich verpflichtet sein Bauteil an Sie jedes Jahr etwas günstiger anzubieten als im Vorjahr. Um dies zu erreichen muss er seinen Prozess im Werk optimieren. Hierbei kann es vorkommen, dass sich aus Versehen die Qualität verschlechtert. Ausreißer bei z. B. Werkstofftests könnten dafür ein Idiz sein. Nur: ob es tatsächlich so ist, dies kann nur der Ingenieur durch klassische Ingenieursarbeit beantworten.
In diesem Fall kann der auffällige Wert aus der aktuellen Untersuchung entfernt werden, sollte aber separat behoben werden.
Gehen Sie auch offen mit Ausreißern und den Problemen damit um. Idealerweise diskutieren Sie die Auffälligkeiten mit Kollegen und Vorgesetztem und machen Sie Vorschläge für das weitere Vorgehen.
Sollten Sie in Ihren Daten große Streuungen haben, dann überdecken diese gerne Ausreißer. Mit den klassischen Tests finden Sie diese dann nicht. Bedenken Sie hier, dass große Streuungen praktisch immer unerwünscht und meißt teuer sind. Bedeuten sie doch letzenendes einen nicht kontrollierten Prozess.
Neben den rechnerischen Methoden zur Ausreißerbewertung
Download: Ausreißer Test nach Dean-Dixon mit Excel
können Sie auch noch grafische nutzen. Damit bekommen Sie ein Gefühl für die Daten. Hier hilft evtl. eine Visualisierung im Wahrscheinlichkeitsnetz (z. B. mit unseren Excel Tools) oder im Histogramm. Manche Statistiskpakete liefern auch noch sog. Box-Plots, die Ausreißer aufzeigen können.
Auf den Punkt
- Klären Sie immer die Ursache für den Ausreißer.
- Entfernen Sie nur Werte aus den Untersuchungen, wenn Sie dafür plausible technische oder pysikalische Gründe haben.
- Große Streuungen können das Auffinden von Ausreißern deutlich erschweren.
- Nutzen Sie grafische Methoden um ein Gefühl für Daten zu bekommen.
Ich hoffe, ich kann mit diesen Artikeln zur Statistik ein wenig den Respekt vor diesen Methoden nehmen und Vorurteile gegenüber der Statistik abbauen. Ich bin zutiefst überzeugt, dass die Statisik - richtig angewandt - ein sehr wertvolles Werkzeug für uns Ingenieure ist und zusätzlich auch echt Spaß machen kann.
Weiterführende Informationen zur Auswertung von Wöhlerversuchen
Hier finden Sie ähnliche Artikel und Informationen zu passenden Seminaren und Büchern. Außerdem können Sie den Inhalt des Artikels bewerten.
Bewerte den Artikel!
[yasr_visitor_votes size="medium"]
Seminar Werkstoffkennwerte der Betriebsfestigkeit (für Simulation und Auslegung) einfach ermitteln und anwenden
Wollen Sie Ihre Versuche so kostengünstig wie möglich und mit der geringsten Anzahl an Versuchen durchfürhen? Dann ist evtl. unsere Wöhlerlinien auswerten und Versuche planen für Sie richtig.
Sie lernen hier,
- wie Sie Wöhlerversuche und Dauerfestigkeitsversuche mit geringst möglichem Stichprobenumfang durchführen
- Wöhlerlinien und Dauerfestigkeiten statistisch auszuwerten
- Ausreißer zu finden und mit Ausreißern umzugehen
- Versuche aus der Vergangenheit zu nutzen
- mit sehr geringen Stichprobenumfängen umzugehen
- Sicherheiten für Ihre Bauteilauslegung abzuleiten
- zwei Wöhlerlinien statistisch miteinander zu vergleichen
- einen kurzen Einstieg in die Betriebsfestigkeit kennen.
Weiterführende Literatur
Um Wöhlerkurven und Dauerfestigkeiten statistisch auszuwerten und zu planen, bietet sich außerdem unser
Buch Statistik der Betriebsfestigkeit an.
dieses führt Sie schnell und verständlich in die Versuche und die Statistik Betriebsfestigkeit ein und liefert gleichzeitig noch viele Excel Tools zur einfacheren Auswertung von Versuchen der Betriebsfestigkeit wie Wöhlerlinien. Hier erfahren Sie auch mehr Details zum Umgang mit Ausreissern.