Warum ist es Blödsinn, mehr als 30-40 Sporen zu messen?

Krötenhocker · 8. Februar 2018

Hallo nochmal,

Antwort:
Jede Analyse von Messwerten setzt eine Annahme einer Verteilung der Messdaten voraus. Misst man z.B. bei Sporen ganz ganz viele, erkennt man irgendwann häufig eine Mehrgipfeligkeit oder zumindest eine Überbewertung einer Schiefe und damit kann man keine mögliche simplifizierte Verteilungsfunktion mehr als Grundlage annehmen.
Es geht aber nicht darum, eine einzelne Sporenpopulation völlig exakt abzubilden, sondern darum, sie möglichst genau in ihren physikalischen Werten zu beschreiben und sie gleichzeitig aber auch möglichst genau in Relation zu anderen Populationen berechenbar zu beschreiben.

LG, Jens

Wolfgang Prüfert · 9. Februar 2018

Hallo Jens,

in einem Punkt gebe ich Dir Recht: Bei der Ermittlung eines Mittelwertes gilt für die Größe der Stichprobe zwar grundsätzlich "viel hilft viel", aber sobald die Standardabweichung des Mittelwertes kleiner ist als der absolute Fehler des Messverfahrens, kommt kein Erkenntnisgewinn mehr dazu. Das ist (je nach Variabilität der Sporen) auch schon nach 16 Sporen erreicht, denn

Standardabweichung des Mittelwertes = Standardabweichung / Wurzel(Anzahl),

bei typischen Sporenverteilungen ist die Standardabweichung plus-minus 1 my, und das geteilt durch Wurzel(16) = 0,25 my.

Zitat von Krötenhocker

Es geht aber nicht darum, eine einzelne Sporenpopulation völlig exakt abzubilden, sondern darum, sie möglichst genau in ihren physikalischen Werten zu beschreiben und sie gleichzeitig aber auch möglichst genau in Relation zu anderen Populationen berechenbar zu beschreiben.

Wenn es DIR nicht darum geht, eine Verteilung abzubilden, ist das Dein gutes Recht. In bisher verwendeten Bestimmungsschlüsseln, die auch im 21.Jahrhundert meist eher auf Min/Max-Werten beruhen als auf Mittelwerten, ist eine Kenntnis der Verteilung auch überflüssig.

Aber wer weiß - vielleicht lassen sich in ein paar Jahren heute noch kryptische Artenpaare nicht über den Sporenmittelwert, sondern über signifikant verschiedene Verteilungen trennen? Insofern darfst Du den Beschreibern neuer Arten durchaus zugestehen, mehr als 30 Sporen zu messen. Ein einziges derartiges Beispiel kenne ich aus dem Stand: Tulostoma winterhofii ist von Tulostoma fimbriatum durch eine signifikant höhere Varianz der Sporendurchmesser gekennzeichnet, bei fast gleichem Mittelwert.

Beispiele mit unterschiedlicher Schiefe der Verteilung kenne ich aktuell nicht, aber das liegt wohl daran, dass bisher die Schiefe der Verteilung nicht standardmäßig bei den Sporenmessungen mit angegeben wird. Sonst würden einem vielleicht an ein paar Stellen die Augen aufgehen...

Gruß,

Wolfgang

Krötenhocker · 9. Februar 2018

Hallo Wolfgang,

Zitat von Wolfgang Prüfert

in einem Punkt gebe ich Dir Recht: Bei der Ermittlung eines Mittelwertes gilt für die Größe der Stichprobe zwar grundsätzlich "viel hilft viel

Hab ich zwar meines Wissens nicht geschrieben, aber meine Zustimmung, allerdings auch nur für den Mittelwert. Aber man sollte ja auch ein gesundes Maß zwischen Arbeitsaufwand und Verbesserung der Aussagekraft des Ergebnisses haben und da ist nach bei 30-40 Messwerten i.d.R. nicht mehr viel Veränderung zu erwarten.

Zitat von Wolfgang Prüfert

aber sobald die Standardabweichung des Mittelwertes kleiner ist als der absolute Fehler des Messverfahrens, kommt kein Erkenntnisgewinn mehr dazu.

Also erstens kennen wir den absoluten Fehler des Messsystems hier nicht und zweitens kenne ich einen absoluten Fehler eher auf einen Einzelmesswert bezogen und nicht auf ein Messsystem und müßte dafür auch noch den exakten Wert kennen, damit ich ein Delta x erhalte.
Kein Erkenntnisgewinn für den Einzelmesswert---> ja

Zitat von Wolfgang Prüfert

Das ist (je nach Variabilität der Sporen) auch schon nach 16 Sporen erreicht, denn

Standardabweichung des Mittelwertes = Standardabweichung / Wurzel(Anzahl),

bei typischen Sporenverteilungen ist die Standardabweichung plus-minus 1 my, und das geteilt durch Wurzel(16) = 0,25 my.

Die theoretische Abbe-Grenze (die meinst du doch?), ist als objektiver Fehler anzusehen und macht damit als zufälliger Fehler nur unsere Mittelwertschätzung ein wenig unsicherer. Denn, wir können ja auch im Abbebereich zufällig genau richtig gemessen haben, oder eben kleiner oder größer. Und solche Fehler heben sich bei unendlich vielen Messungen gegenseitig auf.
Somit gilt der Abbe-Fehler nur für den Einzelwert und nicht für unsere Annäherung an den tatsächlichen Mittelwert der Population. Dein obiger Vergleich ist so für mich nicht nachvollziehbar.

Ich verstehe auch nicht, woher du die Standardabweichung von 1µ hast? Das wär ja prima, wenn wir immer eine 1 hätten. Da sie aber doch auch von der Größe der Einzelmesswerte abhängt, kann ich diese deine Aussage nicht nachvollziehen.

Zitat von Wolfgang Prüfert

Wenn es DIR nicht darum geht, eine Verteilung abzubilden, ist das Dein gutes Recht.

Ich versuche es noch einmal genauer auszudrücken. Um die echteVerteilung abzubilden müßten wir, wie auch für den wahrenMittelwert alle Sporen messen.
In Wirklichkeit approximieren wir abermit mehr oder weniger Erfolg eine Normalverteilung,
Es kann sogar kontraproduktiv sein, noch mehr (hier speziell Sporen) zur Auswertung heranzuziehen. Die Übergänge von großen mehrkernigen Sporen zu kleinen wenigerkernigen Sporen verschwimmt immer mehr und Ausreißer-Tests bekommen immer mehr Probleme. Bei geringerem n ist es dagegen viel einfacher, Ausreißer zu erkennen und somit z.B. wenigerkernige Sporen zu detektieren.

Zitat von Wolfgang Prüfert

In bisher verwendeten Bestimmungsschlüsseln, die auch im 21.Jahrhundert meist eher auf Min/Max-Werten beruhen als auf Mittelwerten, ist eine Kenntnis der Verteilung auch überflüssig.

Ich weiß jetzt nicht, auf welcher Seite du die überflüssige Verteilung meinst.
Aber wenn ich messe und mein Mittelwert ist z.B. kleiner als der x-Wert im Schlüssel, dann kann ich doch damit prima schlüsseln, soweit die Unsicherheit meiner Mittelwerte nicht den angegeben x-Wert mit einbezieht.
Klar, bei letzterem wird es tricky und man käme um echte Mittelwertvergleiche nicht mehr herum. Dann sind die klassischen MIN-MAX aber schon lange am Ende.

Zitat von Wolfgang Prüfert

Aber wer weiß - vielleicht lassen sich in ein paar Jahren heute noch kryptische Artenpaare nicht über den Sporenmittelwert, sondern über signifikant verschiedene Verteilungen trennen?

Und auch dazu gibt es ja Tests. Um also z.B. die Stichprobe eher in die Nähe an einer Lognormalverteilung zu stellen. Nur wird es dann schwierig, z.B. einen Mittelwert mit Streuung zu beschreiben. Ich hab dazu, glaube ich, 4 verschiedene Möglichkeiten in der Literatur gefunden
.

Zitat von Wolfgang Prüfert

Insofern darfst Du den Beschreibern neuer Arten durchaus zugestehen, mehr als 30 Sporen zu messen.

Machen kann doch jeder, was er will! Ich schreib doch hier keinem etwas vor! Aber mehrere Mittelwerte (am besten über 5) (auch kleinerer Stichproben) mit ihren Unsicherheiten wären viel aussagekräftiger als eine große Stichprobe.
Und was ich bei großer Stichprobe bei Mehrgipfeligkeit empfehlen würde, wäre eine Randomauswahl von z.B. eben.n=30.

Zitat von Wolfgang Prüfert

Ein einziges derartiges Beispiel kenne ich aus dem Stand: Tulostoma winterhofii ist von Tulostoma fimbriatum durch eine signifikant höhere Varianz der Sporendurchmesser gekennzeichnet, bei fast gleichem Mittelwert.Sehr spannend. Wo finde ich die Veröffentlichung? Die Varianztests sind ja auch Standardtest in der Normalverteilungsstatistik.

Und zur Schiefe… Da sie wohlhauptsächlichvon den Anteilen verschiedenkerniger Sporen abhängt, habe ich sogar schon angedacht, mal in kritischen Arten nur tote Sporen zu messen, dafür aber über die Anzahl der Zellkerne die Stichproben aufteilen zu können…
Aber Andreas G. schrieb leider mal irgendwo, er habe es noch nicht geschafft, Zellkerne sichtbar zu machen. Ich habe auch schon mal zum Thema recherchiert. Ohne Fluoreszenzmikroskop dürften sie schwer erkennbar bleiben. Im Fluoreszenzbild sah man dagegen die Zellkerne prima.

LG, Jens

Alles anzeigen

Wolfgang Prüfert · 9. Februar 2018

Zitat von Krötenhocker

Es kann sogar kontraproduktiv sein, noch mehr (hier speziell Sporen) zur Auswertung heranzuziehen. Die Übergänge von großen mehrkernigen Sporen zu kleinen wenigerkernigen Sporen verschwimmt immer mehr und Ausreißer-Tests bekommen immer mehr Probleme. Bei geringerem n ist es dagegen viel einfacher, Ausreißer zu erkennen und somit z.B. wenigerkernige Sporen zu detektieren.

Meine Vorlesungen in Messwertstatistik sind zwar schon ein paar Jahrzehnte her, aber das habe ich deutlich anders in Erinnerung.

Wenn Außreißer-Tests "Probleme bekommen", heißt es, es sind keine Ausreißer und müssen mit berücksichtigt werden. Und die echte Verteilung ist dann schief mit zwei Maxima, und die Angabe eines Mittelwertes ist nur bedingt sinnvoll.

Kennst Du irgendeine Publikation, in der statt des Mittelwertes der Median vorgeschlagen wird? Der sollte stabiler gegenüber einem zweiten kleineren "Neben-Maximum" sein.

Wolfgang

Krötenhocker · 9. Februar 2018

Hallo Wolfgang,

Zitat von Wolfgang Prüfert

Meine Vorlesungen in Messwertstatistik sind zwar schon ein paar Jahrzehnte her, aber das habe ich deutlich anders in Erinnerung.

meine auch...

Aber durch Smaff und Diskussionen mit Christoph H. bin ich immer wieder voll im Thema.

Zitat von Wolfgang Prüfert

Wenn Außreißer-Tests "Probleme bekommen", heißt es, es sind keine Ausreißer und müssen mit berücksichtigt werden. Und die echte Verteilung ist dann schief mit zwei Maxima, und die Angabe eines Mittelwertes ist nur bedingt sinnvoll.

Zwei der Ausreißertests in Smaff funktionierten ursprünglich bei ihrer Veröffentlichung nur bis 30? oder 40? Messwerten. Shapiro/Wilk z.B. wurde erst viel später erweitert. Grubbs graue ich ab einer gewissen Anzahl ab, wenn ich mich recht erinnere.
Zur Verteilung...Das Problem ist, dass es sich bei solchen schiefen Populationen i.d.R. um Mischpopulationen handelt. Eigentlich dürfte man ja nur z.B. einkernige Sporen messen. Misst man zusätzlich auch zweikernige dazu, ist es, als ob man versucht, mit einem Mittelewert die Größe von z.B. Orangen und Clementinen gleichzeitig zu beschreiben.
Dabei sind ja die zweikernigen Sporen pro forma etwas ganz anderes und gehören getrennt gemessen.
Bei wenig Messungen werden sie noch gut erkannt. Ich hab ja schon geschrieben, warum es mit zunehmendem n immer schwieriger wird, die Populationen über Ausreißertests zu trennen. So gibt es ja auch große Clementinen und kleine Orangen und wenn ich genug messe, finde ich bestimmt auch Überschneidungen und dann? Zum Glück haben wir ja i.d.R. viel weniger mehrkernige Sporen in Mischpopulationen und deshalb kann man sie mit Ausreißertests erwischen, Solange man noch nicht im totalen Überschneidungsbereich rumwuselt, weil man sehr viele Messungen in einer Mischpopulation gemacht hat.

Zitat von Wolfgang Prüfert

Kennst Du irgendeine Publikation, in der statt des Mittelwertes der Median vorgeschlagen wird? Der sollte stabiler gegenüber einem zweiten kleineren "Neben-Maximum" sein.

Nein, aber es gibt auch dafür eine statistische Vorgehensweise z.B. zum Vergleich von Messreihen. Aber die Tests sind halt nicht mehr so stark wie Tests, die auf der Normalverteilung basieren.

LG, Jens

Krötenhocker · 11. Februar 2018

Hallo Wolfgang,

Zitat von Wolfgang Prüfert

Aber wer weiß - vielleicht lassen sich in ein paar Jahren heute noch kryptische Artenpaare nicht über den Sporenmittelwert, sondern über signifikant verschiedene Verteilungen trennen? Insofern darfst Du den Beschreibern neuer Arten durchaus zugestehen, mehr als 30 Sporen zu messen. Ein einziges derartiges Beispiel kenne ich aus dem Stand: Tulostoma winterhofii ist von Tulostoma fimbriatum durch eine signifikant höhere Varianz der Sporendurchmesser gekennzeichnet, bei fast gleichem Mittelwert.

Das hattest du leider falsch abgespeichert...
In obigem Artikel aus der ZfM wird nicht mit statistischen Werten gerechnet und dementsprechend auch keine Differenzierung über Varianzen vorgenommen.
Schade...
Ich wäre auch da wohl anders vorgegangen, aber ohne Daten keine Fakten!

LG, Jens

Christoph · 15. Februar 2018

Hallo Jens,

die Bewertung als "Blödsinn" ist abwertend, niedermachend, polemisch. Warum fragst du nicht, ob es "sinnvoll" ist, mehr als 30-40 Sporen zu messen?

Dann verwendest du gerne das Attribut "wertlos" zu Daten, die andere Personen erheben. Als Beleg zitierst du dann beispielsweise

Zitat

"Die Angabe des Messwertes einer physikalischen Größe ist ohne Angabe der zugehörigen

Unsicherheit wissenschaftlich wertlos. Die Unsicherheit beschreibt dabei die Qualität der

Information, die im Messergebnis enthalten ist."

siehe Über den Umgang mit Messdaten... Einen hau ich noch raus... ;-)

Leider wendest du den Spruch dann auch auf andere Dinge an und wertest erneut ab.

Natürlich ist ein Messwert ohne Angabe der Unsicherheit wertlos. Die Unsicherheit ist bei Sporenmessungen im Mikroskop aber hinlänglich bekannt, wie auch Wolfgang angemerkt hat (in jenem oben zitierten Thread). Du weitest das Attribut "wertlos" entgegen des Zitats auf Auswertungen von Messwerten aus und nimmst die Autoren der Uni Darmstadt als seriösen Hintergund - damit missbrauchst du die Uni Darmstadt.

Beispielsweise der Mittelwert (arithmetisches Mittel) aus z. B. 30 gemessenen Sporen - der ist mathematisch festgelegt. Man addiert die 30 Messungen auf und teilt durch 30. Das wiederum ist eine Zahl, kein Messwert.

Macht man jetzt einen Sprung weg von den Einzelmesswerten hin zu Aussagen über eine Gesamtheit real existierender Sporen, wird es natürlich schwierig. Aber hier verlässt man die Einzelmesswerte. Was ist Ziel davon? Man will entweder einen Pilz beschreiben oder ihn bestimmen. Wenn man ihn bestimmt, geht es um die Wahrscheinlichkeit, bei einem Schlüsselpunkt falsch zu gehen. Messe ich, plakativ gesprochen, nur eine Spore - und diese eine Spore wäre zufälligerweise ein Ausreißer, würde ich auch bei "sauber berechneten" Konfidenzintervallen (was den Schlüssel oder die Beschreibungen angeht) wohl den falschen Weg einschlagen. Es geht also darum, abzuschätzen, wieviele Stichproben man machen muss, um selber eine Verteilung zu erhalten, die man mit den bekannten Daten der jeweiligen Art vergleicht. Du sagst nun, mehr als 30 bis 40 seien Blödsinn.

Nimm mal eine Verteilung mit sehr großer Varianz. Dann kann es sein, dass bei 30 Zufallsmessungen noch keine saubere Verteilung mangels Maximum zu erkennen ist. Dann muss man mehr messen. Beispiel aus der Physik: ein Röntgenspektrum - ab wieviel gemessenen Photonen wird das zu erwartende Muster der Bremsstrahlung erkennbar? (die Peaks lasse ich mal weg, weil da das Beispiel zu sehr hinkt). Mit 30 siehst du noch nichts...

Jetzt gehst du vermutlich davon aus, dass bei allen Pilzen die Varianz so ähnlich ist, dass 40 Sporen als Maximum reichen. Das ist dann eine These, die begründet gehört. Das mit Attributen wie "Blödsinn" zu belegen, statt die These klar aufzustellen und dann zu begründen, ist rhetorisch weit weg von wissenschaftlichem Anspruch.

Das ist in meinen Augen das Hauptproblem. Nicht der Inhalt dessen, was du aussagen willst - darüber könnte(!) man diskutieren. Das müsste dann sachlich und neutral ablaufen. So aber polemisierst du und wertest andere Menschen ab. Und das recht derb. Interessanterweise machst du das, ohne selbst auch nur irgendwo das vorzumachen, was du so hart ablehnst. Deine Enttäuschung über Autoren aus Skandinavien mag groß sein. Hättest du aber mal versucht, selbst ein Werk entsprechender Inhaltstiefe zu schreiben, hättest du vermutlich mehr Verständnis dafür, dass manchmal einfach nur grob Werte angegeben werden. Und nein, das ist dann nicht wertlos.

Kritik ist immer o.k. und erwünscht, solange sie sachlich und konstruktiv ist. Kennt sich der Kritiker in der Materie aus (in dem Fall der Mykologie), wird die Kritik vermutlich eher gehört und angenommen. Ist jemand aber mykologisch völlig unbekannt, regt sich aber maßlos über Mykologen auf und vergreift sich dabei im Ton, so wird derjenige kaum noch ernst genommen (wenn, dann partiell in den Bereichen, in denen offenbar eine Qualifikation vorliegt).

Ich werde jetzt keine inhaltliche Diskussion beginnen, wie viele Sporen vermessen werden sollten oder wie sinnvoll es ist, bei einer Messgröße mit Konfidenzintervallen zu arbeiten, bei anderen nicht (z. B. Fruchtkörpermaße, Zystidenmaße usw.). Das habe ich mehrfach versucht und musste abbrechen, da es dann sofort auf die persönliche Ebene rutscht.

Vielleicht denkst du aber darüber nach, mit welcher Rhetorik du hier vorgehst und was du damit eigentlich erreichen willst. Rundumbeleidigungen gegen alle, die nicht deiner Idelavorstellung mykologischer Arbeit entcprechen, sind einfach nicht hilfreich. Besser wäre es, erstmal selber mykologisch zu arbeiten, erstmal als gutes Vorbild (darum geht es dir ja vermutlich) zu wirken, um dann andere zu überzeugen, dass es so viel sinnvoller ist. Ideal wäre es, z.B. einen Bestimmungsschlüssel einer Gattung, der nur mit min-max-Werten arbeitet, zu überarbeiten. Ersetze es durch deine statistisch sauber ermittelten Werte, optimiere den Schlüssel - und dann kann man testen. Man lässt beide Schlüssel verwenden und schaut, bei welchem Schlüssel die Ergebnisse besser sind. Das wäre spannend und damit könntest du den Vorteil klar aufzeigen.

Ich hingegen behaupte, dass man auch mit alten Schlüsseln bestimmen kann, die nicht einmal Konfidenzintervalle und Mittelwerte, geschweige denn deren Konfidenzintervalle angeben. Und ich behaupte auch, dass diese Schlüssel nicht wertlos sind. Sonst wäre ja jede Pilzbestimmung reines Raten. Und wäre es wirklich so, dann kannst du ja als erster "richtige" Schlüssel erstellen.

Kurz gesagt: mach doch bitte mal vor... Und hör bitte mit deiner herabwürdigenden Polemik auf.

LG
Christoph

Krötenhocker · 15. Februar 2018

Hallo Christoph,

Zitat von Christoph

Ich werde jetzt keine inhaltliche Diskussion beginnen, wie viele Sporen vermessen werden sollten oder wie sinnvoll es ist, bei einer Messgröße mit Konfidenzintervallen zu arbeiten, bei anderen nicht (z. B. Fruchtkörpermaße, Zystidenmaße usw.

Darum geht es aber hier, falls du es nicht bemerkt haben solltest... also um eine inhaltliche Diskussion.
Die ganzen Unterstellungen solltest du dir einfach mal sparen

Gruß Jens

Christoph · 15. Februar 2018

Servus Jens,

Zitat

Die ganzen Unterstellungen solltest du dir einfach mal sparen

welche Unterstellungen?

Der Vorschlag, dass du mal selbst deine Methodik anwenden könntest und man dann z.B. anhand eines Bestimmungsschlüssels, den du optimiert hast, die Wertlosigkeit vs. der Werthaftigkeit testen kann, läuft natürlich ebenfalls ins Leere. Schade, aber dann ist das halt so.

Ich kann immer nur hoffen, dass du einfach mal über die Form deiner Auslassungen nachdenkst. Mehr geht aber nicht. Und wie sollte man beginnen, inhaltlich zu diskutieren, wenn schon die Form an sich einer Diskussion im Weg steht?

Aber das alles musst du wissen. Jetzt hast du auch wieder deine Ruhe vor meinen Meinungsäußerungen.

Liebe Grüße,
Christoph

craterelle · 5. März 2018

Hallo,

Ich habe mir dazu einige Gedanken gemacht und im pilzforum.eu aufgeschrieben:
https://www.pilzforum.eu/board…mmen?pid=398293#pid398293

Beste Grüße,
Craterelle

P.S.: Schwer zu entscheiden, in welchen der vielen Beiträge +/- zur selben Thematik das nun am besten passt.
______________________________________________________

Um die Fragestellung nach dem angemessenen Umfang einer Stichprobe sowie der Anwendbarkeit von statistischen Berechnungen für Normalverteilungen auf nicht normalverteilte Daten weiter zu beleuchten, habe ich mir als Beispiel nochmals Dieters Scheidling vorgenommen. Die Daten der Messreihe mit 120 Wertepaaren sind im hier veröffentlicht:
https://www.pilzforum.eu/board…mmen?pid=363509#pid363509

So sieht die Längenverteilung aus, sie ist - leicht erkennbar - nicht normalverteilt.

Das repräsentiere also unsere Grundgesamtheit. Ob nun von einem Fruchtkörper, einer Kollektion oder einer Art ist an dieser Stelle vollkommen egal, hier will ich auf die mathematischen Gegebenheiten hinaus.

Der Shapiro-Wilk-Test erkennt ebenfalls, dass es sich wahrscheinlich nicht um eine Normalverteilung handelt.

Lässt man wie in Jens' Programm ("Smaff") voreingestellt den Nalimov-Test heraus, kann man mit Hilfe der drei anderen Test zwar einige "Ausreißer" entfernen, nur ergibt das immer noch keine Normalverteilung.

Mit Nalimov-Test erhält man zwar eine, verliert aber 20% des Probenumfangs.

Also reduziere ich den Stichprobenumfang durch zufällige Auswahl auf 40 bzw. 30 Werte. Dies habe ich zur Sicherheit zweimal mit verschiedenen Zufallsreihen durchgeführt, erhalte also 2 x 4 Stichproben à 30 Wertepaaren bzw. 2 x 3 à 40.

Normalverteilt erschienen davon
bei U=40: 1 von 6
bei U=30: 2 von 8

und nach Elimination von "Ausreißern" ohne Nalimov-Test
bei U=40: 3 von 6
bei U=30: 7 von 8

Also niemals 100%.

Testweise habe ich den Umfang noch weiter reduziert, aber auch bei 2 x 12 Stichproben à 10 war noch eine dabei, der man mit sämtlichen Tests (hier inkl. Nalimov) nicht beikommen konnte. Nur 10 Sporen für eine statistische Auswertung heranzuziehen würde allerdings wohl niemand ernsthaft empfehlen. Bleiben wir also vorerst bei U=30 als dem Wert, bei dem man zumindest mit einiger Wahrscheinlichkeit durch Eleminieren von "Ausreißern" eine vermeintliche Normalverteilung darstellen kann.

Aus den 8 Stichproben habe ich das Programm also die Mittelwerte und den 95%-Konfidenzbereich für selbige berechnen lassen. Ein besonderer Vorteil an statistisch berechneten Werten ist ja, das man zuverlässig vorhersagen kann, mit welcher Wahrscheinlichkeit eine weitere Stichprobe aus derselben Grundgesamtheit in die errechneten Mittelwertgrenzen fällt.

Tatsächlich liegt beim paarweisen Vergleich von Mittelwerten und Mittelwertgrenzen in 7 von 56 Fällen (12,5%) der Mittelwert der einen außerhalb der Konfidenzgrenzen der anderen Probe.

Die Vorhersage von Wahrscheinlichkeiten könnte also trügerisch sein, wenn die Grundgesamtheit nicht normalverteilt ist. Hier wären ggf. mehr Versuche mit anderen Zufallsverteilungen nötig, um die Beobachtung zu erhärten oder zu entkräften.

Die Mittelwerte schwanken mit einer Standardabweichung von 0,11, was vertretbar erscheint und bei so kleinen Stichproben auch nicht verwunderlich. Die Schwankungsbreite bei den Medianen ist auch nicht wesentlich geringer (0,09), aber die Beschreibung mit Median und Quantilsgrenzen hat den Vorteil, dass man ohne irgendwelche Nachteile mehr Werte messen könnte, wenn die Schwankungen zu groß sein sollten (bei U=60 im Beispiel: 0,07).

Einen weiteren Punkt hatte Dieter schon herausgearbeitet:

Der 95%-Konfidenzbereich für die Verteilung der Werte ist bei rechtsschiefen Verteilungen systematisch nach links (zu den kleineren Werten hin) zu groß, d.h. er erstreckt sich über Bereiche, in denen in der Grundgesamtheit keine Werte vorkommen. Ich führe das jetzt nicht noch ein weiteres Mal aus, für Interessierte:
https://www.pilzforum.eu/board…mmen?pid=363471#pid363471

Quantilsgrenzen bilden in diesem Fall die Realität offenbar zutreffender ab.

Grafisch dargestellt: links in Grün die errechneten 95%-Populationsgrenzen und Mittelwerte für die 8 Stichproben, rechts in Rot die 95%-Quantilsgrenzen und Mediane. Gelb hinterlegt die Bandbreite der Grundgesamtheit (100%).

Meine Schlussfolgerungen:

30-40 Messungen sind zu wenig, um zu beurteilen, ob in der Grundgesamtheit eine Normalverteilung vorliegt.
Liegt keine Normalverteilung vor, liefern statistische Methoden, die auf der Normalverteilungsannahme beruhen, irreführende Ergebnisse.
Die Messwerte sind in diesem Fall mit Median und Quantilsgrenzen aussagekräftiger beschrieben.

Man könnte sogar argumentieren, dass diese Art der Beschreibung allgemein vorzuziehen wäre, da sie für nicht normalverteilte Stichproben besser geeignet ist und für normalverteilte ähnlich gut wie errechnete Werte. Mediane und Mittelwerte fallen bei symmetrischen Verteilungen zusammen. Ebenso werden Quantile und berechnete korrespondiere Wahrscheinlichkeitsbereiche zusammenfallen, wenn die Daten normalverteilt sind.

Andreas Kunze · 5. März 2018

Hallo Craterelle,

zunächst einmal vielen Dank für den Link zu Deinen interessanten Beitrag auf pilzforum.eu und dass Du Jens hier im "Exil-Forum" Gelegenheit geben möchtest, sich dazu zu äußern.

Allerdings erscheint mir Deine dort getroffene Aussage:

Zitat von craterelle

Es ist nicht unbedingt mein Ziel, mit Jens darüber zu diskutieren (weil es nach den bisherigen Erfahrungen wenig fruchtbar sein könnte) ...

kein Ansporn, dies zu tun.

Es wäre toll, auch für andere Nutzer des DGfM-Forums, wenn Du den Beitrag parallel hier posten würdest. Dann braucht man nicht ständig zwischen den Tabs/Fenstern hin und her zu wechseln, ebenso ist es einfacher, Teile des Postings hier zu zitieren.

Würde mich freuen, wenn Du das machen könntest.

Weiter viel Spaß und spannende Erkenntnisse zu dem Thema

Andreas

craterelle · 5. März 2018

Hallo Andreas,

klar, kann ich machen.

Off Topic: Da ich ja mit dem Forum hier noch wenig vertraut ist und du als Administrator mir da vielleicht auf die Sprunge helfen kannst: Inzwischen habe ich zumindest den erweiterten Editor gefunden. Einzig die Möglichkeit, Entwürfe zwischenzuspeichern, vermisse ich noch. Existiert die?

Grüße,
Craterelle

Andreas Kunze · 5. März 2018

Hallo Craterelle,

wenn Du im WoltLab BurningBoard 4.1 im Editor einen Beitrag verfasst, wird er automatisch als Entwurf gespeichert. Aber eine "Inbox für Entwürfe" wie z.B. im MyBB gibt hier leider nicht.

Gruß, Andreas

Krötenhocker · 5. März 2018

Hallo Andreas, hallo Craterelle,

"Exil-Forum" ist ein schöner Begriff. Nur fühle ich mich hier bedeutend sicherer aufgehoben und nicht im Exil. Man muß sich doch auch mal streiten dürfen. Die Welt ist nicht nur rosa...

@craterelle
Ich finde es einerseits schön, dass du hier dein Posting wiederholst. Andererseits in einem von mir gestarteten Thread und mit mir diskutieren ist gleichzeitig deiner Ansicht nach wenig fruchtbar???
Zudem geht es, finde ich, unter die Gürtellinie, mich in einem Forum zu kritisieren, in dem ich nicht mehr Stellung beziehen kann....
Was ich aber auch völlig nachvollziehen kann, ist, dass man das Forum, in dem man "groß" geworden ist, sehr schätzt...
Aber ich habe gerade gesehen, dass die Diskussion in deinem Forum mit den Experten läuft...
Das finde ich sehr gut und da du ja auch alle von hier auf deinen Beitrag aufmerksam gemacht hast, wird es wohl auch im Pilzforum.eu spannend. Jetzt muß ich wahrscheinlich nur noch warten, bis du da auch gesperrt wirst und dann können wir hier über deine Theorien wirklich diskutieren...

Darf man hier eigentlich ein wenig sarkastisch werden? Ich glaube in meinem schwierigen Fall schon...

LG, Jens

Wolfgang Prüfert · 5. März 2018

Hi Craterelle,

freut mich, hier von Dir zu lesen!

Und freut micht erst recht, dass Du meine in einem der vielen Parallelthreads geäußerte Vermutung bestätigst, dass der Median im allgemeinen der bessere Schätzer ist als der Mittelwert.

Das breite Mykologenpublikum hat sich also noch nicht immer mit dem Mittelwert angefreundet, da kommen schon viel weitergehende Überlegungen...

Der Mittelwert hat aber m.E. auch dann seinen Sinn, wenn die Verteilung Nicht-Normal ist, denn er ist auch dann immer noch eine statistisch wohl definierte Größe. Und auch in Deinem Beispiel kaum vom Median unterschieden.

Erst bei den Konfidenzintervallen passt es gar nicht mehr (wobei der Vergleich mit den Quantilen unfair ist, denn diese können ja schon per definitionem nicht außerhalb der Grundgesamtheit liegen).

Weißt Du, ob es sowas wie "schiefe Konfidenzintervalle" gibt, die die die Schiefe der Verteilung eingerechnet ist? Wie ist denn vom Zahlenwert die Schiefe der Verteilung in Deinem Beispiel?

Grüße,

Wolfgang

Krötenhocker · 5. März 2018

Hallo zusammen,

Wolfgang:
Du suchst leider auch immer noch nach der besten Methode, eine Stichprobe zu beschreiben.
Wie willst denn dann die nächste Stichprobe der nächsten Aufsammlung, die kaum 2- oder 4- sporige Basidien hatte, weil sie z.B. keinen "Stress" hatte, mit der (z.B. von Dieter) vergleichen?

Wenn du alle Sporen eines Basidio-Pilzes vermessen würdest, hättest du hinterher eine Kurve, die wahrscheinlich 1-4 oder noch mehr, wenn ich so an Cantharellus denke, Maxima hätte, 2 bis ? Wendepunkte usw. Du könntest daraus eine Funktion erstellen, die näherungsweise sehr exakt die Verteilung dieses Pilzes zeigt: so ala
f(x)=0,1145x^4+0,345x^3+0,0224x^2+0,78x+b
Wenn du aus der Grundgesamtheit dann eine Stichprobe ziehst, würde sie mit sehr hoher Wahrscheinlichkeit genau in diese Funktion passen.
Aber nur für diesen Pilz mit seiner eigenen Mischpopulation. Der Nachbarpilz stand im Schatten und hat kaum 2- oder mehrkernige Sporen und wenn du wieder alle Sporen vermessen hättest, wären wieder an den selben Stellen die Maxima zu sehen und die Wendepunkte auch "etwa" gleich.
Aber die Amplituden der Maxima der Mischpopulation wären sehr unterschiedlich und damit auch die Funktion. Wenn du also alle vermessen hättest und eine Stichprobe von Dieters Pilz (nur als Beispiel zu betrachten) versuchen würdest, mit der Funktion, die du mit dem weniger gestressten Pilz zu vergleichen, würdest du notgedrungen keine gleichen Ergebnisse erhalten und deshalb macht es keinen Sinn, alle z.B. Sporen zu vermessen. Du kannst genau diesen Pilz exakt beschreiben, aber jeder Nachbarpilz hätte eine andere Funktion, durch die jeweilige individuelle Verteilung beschrieben. Was hast du davon, genau diesen Pilz exakt zu kennen?

craterelle:
Ich werde jetzt wieder sachlich, denn eigentlich kann ich mir den Mut vorstellen, hier nach deinen Aussagen doch noch deine Ansätze zu posten.
Und in deinem Forum läuft es auch nicht zielführend. Jedenfalls mein Empfinden.

Zitat von craterelle

Der Shapiro-Wilk-Test erkennt ebenfalls, dass es sich wahrscheinlich nicht um eine Normalverteilung handelt.

Genau, weil es sich um eine Mischpopulation handelt. Also um eine Grundgesamtheit, die aus einer Vermischung (wahrscheinlich) dort dreier normalverteilter Einzelpopulationen handelt.
Deshalb auch meine gedanklichen Ansätze, nur die "Hauptpopulation" zu separieren, Also die mit dem größten Anteil in der Mischpopulation.
Denn ich denke, nur die kann man sinnvoll von Stichprobe zu Stichprobe vergleichen.

Zitat von craterelle

und nach Elimination von "Ausreißern" ohne Nalimov-Test
bei U=40: 3 von 6
bei U=30: 7 von 8

Also niemals 100%.

Damit belegst du doch gerade meine These. Bei U=30: 7 von 8 (wahrscheinlich) normalverteilt ist doch super. Hier sind 40 Messwerte also schon zu viele, es ist aber auch eine wirklich doofe Stichprobe, die sehr rechtsschief ist.
100% würden bei Gaußverteilungen eine unendlich große Datenmenge implizieren. Also schätzen wir doch lieber weiter, bevor wir uns totzählen.

Zitat von craterelle

Die Messwerte sind in diesem Fall mit Median und Quantilsgrenzen aussagekräftiger beschrieben.

Ja, natürlich! Es gibt viele Ansätze, die Messwerte möglichst aussagekräftig zu beschreiben.
Nur leider versucht man damit immer nur genau diese Stichprobe möglichst genau zu beschreiben. Darum geht es aber doch nicht. Für zukünftige Vergleiche muß man die Daten der Grundgesamtheit schätzen. Daraus ist die Stichprobe, auch Dieters, nur eben eine Stichprobe. Nicht mehr und nicht weniger. Und wenn du alle Sporen der Aufsammlung vermisst... siehe oben bei @Wolfgang
Wenn du dann auch noch vergleichen willst, ist die Grundgesamtheit theoretisch die aller z.B: hier Sporen der Art. Theoretisch gehören dazu natürlich auch die Sporen, die sich so auf der rechtsschiefen Seite rumtreiben. Aber da es sich um eine Mischpopulation handelt, muß man entweder versuchen, diese z.B. über die Anzahl der Kerne in der Spore in einzelne Populationen aufzuteilen, oder meinen Ansatz, nur eine Hauptpopulation zu beschreiben, durchdenken oder... hier wären auch neue Ansätze erwünscht.

Zitat von craterelle

Gelb hinterlegt die Bandbreite der Grundgesamtheit (100%).

Es ist und bleibt keine echte Grundgesamtheit. Es ist eine Vermischung aus verschiedenen Grundgesamtheiten. Das zeigt doch auch die erste Grafik.
Komm doch mal weg davon, genau eine Stichprobe möglichst exakt zu beschreiben, hin zu dem Ansatz, möglichst reproduzierbare und damit vergleichbare Datensätze (Stichproben) zu haben.

Zitat von craterelle

Tatsächlich liegt beim paarweisen Vergleich von Mittelwerten und Mittelwertgrenzen in 7 von 56 Fällen (12,5%) der Mittelwert der einen außerhalb der Konfidenzgrenzen der anderen Probe.

Auch hier hast du durch die Vermischung von Grundgesamtheiten natürlich einen Fehler, der über dem zu erwartenden liegt.

Zitat von craterelle

Quantilsgrenzen bilden in diesem Fall die Realität offenbar zutreffender ab.

Ja, mach das doch einfach. Scheib dazu, dass du deine Stichprobe mit Quantilsgrenzen beschreibst und alles ist gut. Jeder kann danach raten, ob seine Quantilsgrenzen denn dann zu deinen passen.
Oder gibt es einen Ansatz von dir, wie du dann die Übereinstimmung berechnest?
Weil, wenn es sich nicht berechnen lässt.... kann sich jeder denken..., worauf ich dann verweise.

LG, Jens

P.s.: vergiss den Nalimov Test. Aus meiner Sicht ist der viel zu kritisch und erzwingt geradezu eine Normalverteiluing.

craterelle · 6. März 2018

Zitat von Krötenhocker

Hallo
Zudem geht es, finde ich, unter die Gürtellinie, mich in einem Forum zu kritisieren, in dem ich nicht mehr Stellung beziehen kann....

Hallo Jens, wodurch genau fühlst du dich denn kritisiert?

Durch meine Annahme, dass eine Diskussion mit dir nicht fruchtbar sein könnte?

Das ist ja erstmal nicht mehr als eine Befürchtung, die eben eintreffen wird oder auch nicht.

LG, Craterelle

craterelle · 6. März 2018

Hallo Wolfgang,

Zitat von Wolfgang Prüfert

Und freut micht erst recht, dass Du meine in einem der vielen Parallelthreads geäußerte Vermutung bestätigst, dass der Median im allgemeinen der bessere Schätzer ist als der Mittelwert.

Das habe ich mir nicht aus dem Ärmel geschüttelt. Ein Zitat aus diesem frei erhätlichen PDF einer Dipl.-Mathematikerin:

Zitat von Daniela Keller

Bei metrischen (und ordinalen) Varialben wird die Lage durch den Mittelwert oder den Median beschrieben. Der Mittelwert ist das arithmetische
Mittel oder der „Durchschnitt“ und eignet sich vor allem bei normalverteilten oder zumindest symmetrisch verteilten Daten. Er ist anfällig für
Ausreißer. Der Median ist die mittlere Beobachtung. Er gibt ähnlich wie der Mittelwert die Lage der Daten an, ist aber nicht anfällig für Ausreißer
(robust) und kann auch die Mitte von schiefe Daten gut beschreiben.

Und zum Maß für die Streuung:

Zitat von Daniela Keller

Die Streuung von metrischen Daten wird bei annähernd normalverteilten Daten mittels Standardabweichung (standard deviation, SD)
beschrieben. Sie ist die Wurzel aus der mittleren quadrierten Abweichung der Beobachtungen vom Mittelwert. Bei nicht-normalverteilten Daten
oder wenn Ausreißer vorliegen, ist als Streumaß besser der Interquartilsbereich (Inter quartile range, IQR) zu verwenden. Er ist der Abstand
zwischen dem 25 %- und dem 75 %-Quantil und damit auch ein Maß für die Streuung der Daten.

Zitat von Wolfgang Prüfert

Weißt Du, ob es sowas wie "schiefe Konfidenzintervalle" gibt, die die die Schiefe der Verteilung eingerechnet ist?

Ich halte Quantile (etwa das 80%-Quantil, von dem ich annahm, dass es durchaus verbreitet wäre, bis Christoph mich eines besseren belehrt hat) für gut geeignet, Intervalle unter Berücksichtigung der Schiefe abzubilden.

Zitat von Wolfgang Prüfert

Wie ist denn vom Zahlenwert die Schiefe der Verteilung in Deinem Beispiel?

Die Schiefe selbst hatte ich mir zunächst nur über die Differenz von Median und Mittelwert visualisiert. Das ist nicht wirklich präzise, weil es auch schiefe Verteilungen geben kann, bei denen die beiden Werte zusammenfallen. Aber der Umkehrschluss, dass bei einer Differenz die Verteilung nicht symmetrisch sein kann, sollte wohl zutreffend sein.
Zusätzlich habe ich sie per Tabellenkalkulation berechnen lassen und komme auf Werte um die 0,6 für die Länge, 1 für die Breite, 0,4 für den Quotienten und 2 für das Volumen (alle positiv=rechtsschief). Ich habe aber bisher noch kein wirkliches Verständnis von diesem Maß der Schiefe und seiner Berechnung entwickelt.

Meine Statistikvorlesungen liegen auch schon recht lange zurück

LG, Craterelle

Krötenhocker · 6. März 2018

Hallo Wolfgang und Craterelle,

es wäre schön, wenn ihr etwas zum Thema schreiben könntet.

So wäre eure jetzige Diskussion, ob der Median der bessere Schätzer ist, im Thema Der Mittelwert ist meistens der beste Schätzer
viel besser aufgehoben.
Die Gesamtthematik ist viel zu komplex, um sie in einem einzelnen Thread abzuarbeiten..

Hier würde ich gerne weiter zu meiner These, nur wenige Messwerte zu messen, um eine Hauptpopulation zu beschreiben, weiterdiskutieren. Oder natürlich auch gerne über alternative Ideen, wie man die Mischpopulationen trennen kann.
Denn danach würden die meisten Probleme (schiefe Verteilung, mehrgipfelige Verteilung) kaum noch auftreten.

LG, Jens

OT: Liebe Craterelle, ich glaube nicht, dass du solche Kommentare gerne über dich lesen würdest...

Krötenhocker · 6. März 2018

Hallo Craterelle,

so sehe ich die von dir abgebildete Realität von Dieters Stichprobe:

Drei sich überschneidende Einzelpopulationen. Diese wird man meines Erachtens nie sinnvoll allgemeingültig beschreiben können.
Deshalb mein Ansatz, nur die rote Population, von mir ab jetzt als Hauptpopulation betitelt, zu beschreiben. Die wird notgedrungen in solchen Mischpopulationen immer ein wenig rechtsschief sein, weil wir ja so erst einmal nicht zwischen kleinen grünen und großen roten unterscheiden können. Aber wir hätten eine viel weniger kritische Verteilung.
Jetzt werden viele denken: Und was ist mit dem Rest der Sporen auf der rechten Seite?
Da würde ich zu schreiben, dass es Nebenpopulationen mit Sporen bis zu 8,7 µm gab, diese aber nicht mit berücksichtigt wurden.
So in etwa stelle ich mir das vor und dein toller Versuch hat ja gezeigt, dass man mit einer kleinen Stichprobe sehr wohl auf die rote Population schließen kann, solange die Anzahl der Einzelmessungen nur klein genug gewählt wird.

LG, Jens

Warum ist es Blödsinn, mehr als 30-40 Sporen zu messen?

Jetzt mitmachen!

Teilen