Warum ist es Blödsinn, mehr als 30-40 Sporen zu messen?

Wolfgang Prüfert · 6. März 2018

Hallo Jens,

ich glaube, wir nähern uns dem Kern der Sache.

So habe ich es auch von meinen Statistik-Vorlesungen in Erinnerung: wenn man eine Unterscheidbarkeit der Elemente der Stichprobe erreichen kann, ändert sich die gesamte Kombinatorik. Natürlich wird die Aussagekraft der Stichprobe besser.

Frage ist nur - und jetzt kommen die Pilze in's Spiel:
Sind in einem Sporenabwurf die Sporen verschiedenzähliger Basidien unterscheidbar?

Ich sage "im allgemeinen nein", Du nimmst es als Prämisse.

de facto ist es wahrscheinlich so, dass es von der Pilzgattung abhängt. Wenn die Varianz der Sporen grundsätzlich klein ist, gibt es gute Chancen, dass die Verteilungen von 2- und 4-sporigen Basidien einigermaßen bis zur Grundlinie getrennt sind. Ist die Varianz groß, gibt es starke Überlappung der Verteilungen (z.B. Entoloma!, Inocybe?).

Je nachdem, welche Antwort zu der Frage oben man einschlägt, macht Deine gesamte Argumentationskette Sinn, oder fällt in sich zusammen (oder erfordert letale Kernfärbung der Sporen, was wieder andere Probleme mit sich bringt).

Nimmt man an, dass sich zwischen Sporen von 2- und 4-sporigen Basidien das Volumen um Faktor 2 unterscheidet, würde sich eines der Längenmaße um 2^0.3 = 26% unterscheiden. Also z.B. 9 gegenüber 11,3 my - sowas hat jeder von uns schon in einer einzelnen Probe gefunden.

Ja, du hast Recht, zwischen verschiedenen Proben einer Art wird der Anteil 2-sporiger Basidien schwanken. Na und? Das ergibt sicherlich Kurven, die in einem normalen Lehrbuch über Messwertstatistik nicht abgehandelt werden, aber es geht doch um Wissenschaftlichkeit, also um neue Erkenntnisse und Methoden, oder?

Grüße,

Wolfgang

Krötenhocker · 6. März 2018

Hallo Wolfgang,

Zitat von Wolfgang Prüfert

Frage ist nur - und jetzt kommen die Pilze in's Spiel:
Sind in einem Sporenabwurf die Sporen verschiedenzähliger Basidien unterscheidbar?

Hatte ich ja schon geschrieben, ich habe irgendwo schon Aufnahmen unter Fluorenz gesehen, da waren sie zu unterscheiden.

Meine Gegenfrage ist, muß man sie unterscheiden können oder reicht nicht die Annahme eines egal wie großen Anteils anderskerniger Sporen aus, um bei Basidiomyceten grundsätzlich kleinere Stichproben als aussagekräftiger zu betrachten?

Zitat von Wolfgang Prüfert

Ist die Varianz groß, gibt es starke Überlappung der Verteilungen (z.B. Entoloma!, Inocybe?).

Meine Gegenfrage hier: Ist die Varianz so groß, weil die Stichprobe zu groß war und/oder Ausreißer nicht elemeniert wurden?

Zitat von Wolfgang Prüfert

Je nachdem, welche Antwort zu der Frage oben man einschlägt, macht Deine gesamte Argumentationskette Sinn, oder fällt in sich zusammen (oder erfordert letale Kernfärbung der Sporen, was wieder andere Probleme mit sich bringt).

Schrieb ich ja alles schon und es ist schön zu lesen, dass sich meine Ideen so langsam einprägen. Aber ich würde am liebsten nicht letal messen.

Zitat von Wolfgang Prüfert

Nimmt man an, dass sich zwischen Sporen von 2- und 4-sporigen Basidien das Volumen um Faktor 2 unterscheidet, würde sich eines der Längenmaße um 2^0.3 = 26% unterscheiden. Also z.B. 9 gegenüber 11,3 my - sowas hat jeder von uns schon in einer einzelnen Probe gefunden.

Ja natürlich. Aber es könnte ja auch eine große Spore einer 4-sporigen Basidie sein. Gestreut sind die Werte ja trotzdem.

Zitat von Wolfgang Prüfert

Ja, du hast Recht, zwischen verschiedenen Proben einer Art wird der Anteil 2-sporiger Basidien schwanken. Na und?

Oder es gibt auch Sporen einsporiger Basidien... Um dein "Na und?" geht es doch gerade.
In dem Moment der Vermischung lässt sich keine aussagekräftige Statistik mehr machen.
Ohne diese bleibt nur Raten, weil man nichts mehr belegen kann und in einer wissenschaftliche Publikation kann (sollte) man sich dann wegen Unmöglichkeit, nachvollziehbare Daten zu repräsentieren, sich diese lieber mit dem Satz sparen: Leider war durch die untrennbare Durchmischung von Populationen keine genauere Schätzung möglich, als ...
und da kann man dann ja seine Quartilsgrenzen oder rechts3weg links3weg Grenzen oder sonst was für eine Idee publizieren. Nur wird letzteres immer eine Sackgasse bleiben, wohingegen ich versuche, Möglichkeiten zu diskutieren, die auch mehr oder weniger auf Knopfdruck funktionieren und vergleichbare Ergebnisse liefern könnten.

Zitat von Wolfgang Prüfert

aber es geht doch um Wissenschaftlichkeit, also um neue Erkenntnisse und Methoden, oder?

Was mach ich denn gerade? Ich stelle die Methodik von z.B. Christoph in Frage und biete die Diskussion um neuere Methoden und Ansätze. Und es gibt doch jetzt schon neue Erkenntnisse. Und wer weiß, was noch kommt, wenn sich das mal mehr durchsetzt und man Datenbanken mit den Stichproben füllt. Dann kann man wirklich mal Rückschlüsse auf die Grundgesamtheit der Hauptpopulationen der einzelnen Arten treffen. Das gilt natürlich nicht nur für Sporen. Nur ist es ja gerade bei Basidios manchmal so schwierig.
Bei Ascos sieht das sowieso anders aus.

LG, Jens

Wolfgang Prüfert · 6. März 2018

Zitat von Krötenhocker

in einer wissenschaftliche Publikation kann (sollte) man sich dann wegen Unmöglichkeit, nachvollziehbare Daten zu repräsentieren, sich diese lieber mit dem Satz sparen: Leider war durch die untrennbare Durchmischung von Populationen keine genauere Schätzung möglich, als ...
und da kann man dann ja seine Quartilsgrenzen oder rechts3weg links3weg Grenzen oder sonst was für eine Idee publizieren.

Hallo Jens,

genau deswegen beschränken sich einige Autoren auf Min, Max und Mittelwert und jagen Dein ganzes statistisches Brimborium zum Teufel. Weil es SO nicht immer geht! Wie Du jetzt mal selbst schreibst.

Ich finde diesen Schluss allerdings falsch. Auch eine Nicht-normale Verteilung ist reproduzierbar, und sie enthält Information. Und die Kunst ist es, diese 'rauszukitzeln.

Gut's Nächtle,

Wolfgang

Krötenhocker · 7. März 2018

Hallo Wolfgang,

Zitat von Wolfgang Prüfert

genau deswegen beschränken sich einige Autoren auf Min, Max und Mittelwert und jagen Dein ganzes statistisches Brimborium zum Teufel.

Erstens ist es nicht mein statistisches Brimborium, zweitens ist der von dir als Brimborium betitelte Teil der Mathematik die wissenschaftliche Form, mit Stichproben umzugehen, drittens reden wir hier doch nur über die Ausnahmen, in denen es mal nicht gut funktioniert und nur dafür versuche ich bisher neue Lösungsansätze zu erarbeiten, viertens kann man sich den Mittelwert immer noch ohne seine Fehlerschätzung schenken und fünftens sollen doch alle zum Teufel schicken, was auch immer sie wollen...
Es könnte aber auch sein, dass es Interessierte oder Publizierende gibt, die mit ihren Stichproben mal mehr machen wollen, als sie nach der Messung und einer MIN MAX Schätzung wegzuwerfen.

Zitat von Wolfgang Prüfert

Ich finde diesen Schluss allerdings falsch. Auch eine Nicht-normale Verteilung ist reproduzierbar, und sie enthält Information. Und die Kunst ist es, diese 'rauszukitzeln.

Ja, sehe ich genauso. Aber wir haben hier keine nicht-normale Verteilung. Wir haben mindestens 3 miteinander vermischte Verteilungen. Und da sich durch den schwankenden Anteil (gerade hier ja bei Basisio-Sporen besonders nach rechts) der Mittelwert auch gleich sehr stark verschiebt, verliert er auch seine große Aussagekraft. Deshalb elemeniert man ja auch bei Normalverteilungsannahme die Ausreißer. Sie hätten einen viel zu großen Einfluß auf den Mittelwert.

Edit: Ich wollte gerne noch auf einen Artikel von Groß (1972) in der ZfP verweisen, der ist aber nicht in unserer Datenbank. Darin geht es um die Vermischung der Stichproben durch verschiedenkernige Sporen...
Wem soll ich den Artikel schicken, damit in der Datenbank abrufbar wird? Ansonsten, wen er jetzt schon interessiert muß mich anmailen...

LG, Jens

Andreas · 7. März 2018

Hallo,

ich muss zunächst vorausschicken, dass ich mathematisch völlig unbeleckt bin, ich dem meisten was hier diskutiert nicht folgen kann und zudem auch noch etwas skeptisch Statisken gegenüberstehe.
Aber mein Gefühl (ja, ich weiß, sowas ist hier nicht angebracht ....) sagt mir, dass es nicht falsch sein kann, möglichst viele Sporen zu messen.
Heute habe ich mal wieder eine Kollektion Clitopilus gemessen. Ein Exsikkat von 1984, leider mit relativ wenigen intakten Sporen. Also Sporen gabs genug, aber die meisten halt kaputt und nicht zum Messen geeignet. Ich hatte also zu tun, einige zusammen zu bekommen. Tägliche Praxis, wenn man mit Herbarmaterial umgehen muss ....
Ich konnte aus zwei Lamellen eines Fruchtkörper jeweils 20 Sporen messen. Ich hatte die aber 10er-weise notiert, habe also 4 Zahlenreihen à 10 Sporenmessungen.

Diese würde ich ohne irgendwelche Statistikberechnungen wie folgt hinschreiben (natürlich würde ich vor Publikation noch runden):
a) 6,1 - 6,75 - 7,2 x 3,7 - 4,0 - 4,2 µm ; Q = 1,6 - 1,7 - 1,78
b) 5,9 - 6,63 - 6,9 (7,8) x 3,4 - 3,9 - 4,2 µm ; Q = 1,6 - 1,7 - 1,86
c) 6,0 - 6,76 - 7,3 x 3,5 - 4,0 - 4,4 µm ; Q = 1,6 - 1,68 - 1,79
d) 6,3 - 6,77 - 7,3 x 3,6 - 3,9 - 4,2 µm ; Q = 1,6 - 1,72 - 1,86
Die mittleren Werte sind jeweils der Mittelwert.

Alles in allem also sehr einheitlich, würde ich sagen.
Schaut man sich aber die Normalverteilung der vier Sporengruppen an, dann sieht das nimmer so schön aus:

Insbesondere bei 1a (links oben) und 2b (rechts unten) würde man ja an zwei Sporenpopulationen denken müssen (2sporige und 4sporige Basidien?)

Wenn ich aber die 10er-Gruppen zusammenfasse, dann sieht es schon gleich ganz anders aus, aber es kommt auch darauf an, welche der 10er-Gruppen ich zusammenlege:

Die Kombinationen sind wie folgt:
1a/2a links oben 1a/2b rechts oben
1a/b links unten 2a/b rechts unten

Sieht bei 1a/2b und bei 1a/b immer noch nicht gut aus. Also auch wenn ich von Fruchtkörper 1 20 Sporen vermessen habe, habe ich immer noch keine Normalverteilung.

Wenn ich aber alle 40 Messungen zusammen nehme, dann würde ich schon von Normalverteilung sprechen:

Was lernen wir nun daraus?

a) Viele Sporen zu messen macht ja dann doch Sinn? Mit zunehmender Anzahl an Sporenmessungen wird die Verteilungskurve normaler ....

b) Hätte ich aus Messung 1b) ein paar störende Werte entfernt ("Ausreisser") dann hätte ich vielleicht auch mit 10 oder 20 Messungen eine schöne Normalverteilung?

c) Da sich alle vier Messreihen in ihrer Gesamtvariabilität eigentlich kaum unterscheiden, hätte ich mir die ganze statistische Aufarbeitung eh sparen können?

beste Grüße,
Andreas

Krötenhocker · 7. März 2018

Hallo Andreas,

als erstes kann man daraus lernen, dass diese Grafiken bei wenig Sporen wenig Aussagekraft haben. Und nicht schön sind. Dafür sind dann ja aber die Tests da. Ok nur einer, der Shapiro-Wilk.

Zitat von Andreas

a) Viele Sporen zu messen macht ja dann doch Sinn? Mit zunehmender Anzahl an Sporenmessungen wird die Verteilungskurve normaler ....

Ja, wenn du wenige mißt, sieht es fast immer doof aus, da die wenigen Sporen ja nur in wenige Intervalle aufgeteilt werden. Die Intervalle siehst du in Smaff, wenn du über der Grafik auf Balkendiagramm gehst. Wenn da dann eine Lücke zwischen den Balken ist, dann ist das Intervall leer. Jeder Balken ist so breit wie jedes Intervall. Je mehr Sporen du mißt, desto wahrscheinlicher ist es natürlich auch, dass irgendwann die Sporen kommen, die auch die Lücke ausfüllen. Normalverteilung vorausgesetzt.
Also wenn es dir darum geht, eine schöne Verteilungskurve zu haben, mußt du i.d.R. mehr Werte messen. "Normaler" wird dadurch die Verteilung deiner Sporen aber nicht. Man kann nur eine immer genauere Schätzung abgeben, ob sie denn normal verteilt sein könnten.
Oder man kommt in den ja hier diskutierten Bereich, dass Ausreißertests nicht mehr relativ zuverlässig Sporen mit einer anderen Kernzahl und damit auch einem anderen Volumen rausschmeißen...

Du hast auf dem Tab mit dem Normalverteilungstest auch den P-P Plot. Da sollten die Messwerte schön verteilt und in der Nähe der Diagonalen Linie liegen. Das ist eine wichtigere Grafik als die erste mit der Verteilungskurve, um die Daten zu beurteilen.

Zitat von Andreas

b) Hätte ich aus Messung 1b) ein paar störende Werte entfernt ("Ausreisser") dann hätte ich vielleicht auch mit 10 oder 20 Messungen eine schöne Normalverteilung?

Bei nur 10 Werten bezweifel ich das. Und Ausreißer kannst du nicht einfach so beurteilen. Das solltest du schon einen Ausreißertest machen lassen. Danach liegt die Kurve natürlich näher an der theoretischen Normalverteilungskurve, aber ob man das schon sehen kann? Wenn man ein wenig mit den Intervallen, in die die Sporen hineinfallen, spielt, kann man auch schönere Grafiken machen. Das habe ich in Smaff aber nicht vorgesehen, weil es nicht wirklich wichtig ist.

Zitat von Andreas

c) Da sich alle vier Messreihen in ihrer Gesamtvariabilität eigentlich kaum unterscheiden, hätte ich mir die ganze statistische Aufarbeitung eh sparen können?

Ja und nein. Für dich selber, um dir ein Bild machen zu können, ja.
Wenn du einen wissenschaftlichen Beitrag mit Mehrwert schreiben möchtest, solltest du den Mittelwert und die Signifikanz angeben (Konfidenz und Anzahl auch). Damit kann dann jeder seine Stichproben mit deinen Werten mathematisch vergleichen.
Da das doof aussieht ((6,75µm, s=0,4518, 95%, n=10) (aus deinem ersten Beispiel, s und n sind geraten)) und wir ja auch mal schnell im Buch vergleichen können wollen, geben wir ja noch zusätzlich die Konfidenzgrenzen, also das Intervall an, in dem zukünftige Sporen dieses Pilzes mit eben z.B. 95% wieder liegen würden.

Zitat von Andreas

Sieht bei 1a/2b und bei 1a/b immer noch nicht gut aus. Also auch wenn ich von Fruchtkörper 1 20 Sporen vermessen habe, habe ich immer noch keine Normalverteilung.

Nach Bild oder nach Shapiro-Wilk-test?

Zitat von Andreas

Wenn ich aber alle 40 Messungen zusammen nehme, dann würde ich schon von Normalverteilung sprechen:

Ich glaube, du hälst dich zu sehr am Bild fest...
Glaub du mir einfach, dass der Shapiro-Wilk Test auch mit wenig Werten sehr zutreffende Aussagen darüber machen kann, ob eine Normalverteilung vorliegen könnte. Da ist jede Grafik dann noch weit davon entfernt, uns das mit dem Auge beurteilen zu lassen.

Was smaff ja noch nicht kann, ist, die Mittelwerte von Stichproben miteinander zu vergleichen. Dadurch würde man sofort viel eher verstehen, wieso der Mittelwert mit seinem Schätzfehler so wichtig ist.

LG, Jens

Andreas · 7. März 2018

Hallo Jens,

ganz herzlichen Dank für die Erläuterungen.
Und ja, du hast recht, ich rufe einfach nur die Messdatei auf und guck mir die Kurve an .....
Ich werde bei Gelegenheit mal mit den anderen Features spielen, die Du da genannt hast.

Es interessiert mich tatsächlich sehr, denn in dieser Gruppe mit den Clitopilus gibt es kaum Merkmale. Schon gar keine verbünftigen trennmerkmale zu den Nachbararten. Aber die Arten gibt es molekular. Eine der wenigen Möglichkeiten sie zu trennen ist vermutlich die SPorengröße, aber die überlappt so grandios, dass sie vermutlich nicht wirklich einen Hiatus bilden. Zumindest nicht mit Wertebereichen. Aber vielleicht mit den Mittelwerten, aber auch dann wäre es sehr knapp wo man die Grenze zieht zwischen der einen und der anderen Art ....

beste Grüße,
Andreas

Krötenhocker · 7. März 2018

Hallo Andreas,

wenn man sie über die Mittelwerte trennen kann, dann kann man hinterher sagen, das sich die Mittelwerte signifikant unterscheiden (normalerweise ist bei uns mit 95% üblich).
Wenn nicht, spielen die Sporengrößen eben keine Rolle. Aber es gibt vieles, was man messen kann. (Hutgröße meine ich jetzt nicht). Oder Zählen. Zählen kann man z.B. die (durchlaufenden) Lamellen. Schnallen haben die ja leider auch nicht. Gibt es Differenzen in der Mykorrhiza?
Was ist mit chemischen Reaktionen?
Und, jetzt kommt noch etwas bitteres: es könnte ja auch sein, dass die molekularen Differenzen für unsere zukünftige Taxonomie jetzt noch keine Rolle spielen...?

LG, Jens, der nicht zu den wichtigen Dingen kommt...

Warum ist es Blödsinn, mehr als 30-40 Sporen zu messen?

Andreas Kunze 17. Mai 2020

Andreas Kunze 17. Mai 2020

Jetzt mitmachen!

Teilen