Zum Umgang mit Stichproben / Messreihen

    Es gibt 17 Antworten in diesem Thema. Der letzte Beitrag () ist von Krötenhocker.

    • Zum Umgang mit Stichproben / Messreihen

      Achtung: Dieses Thema wurde geteilt – die Diskussion bitte hier fortführen.
      Der Ursprung befindet sich im Thema „Geschlossene Gruppe zum Umgang mit Stichproben / Messreihen“.


      Servus Jens,

      auch auf die Gefahr, dass eine Reaktion auf deine diesmal fast resigniert wirkenden Aussagen, ein Fehler ist, möchte ich versuchen, noch einmal zu erklären, warum ich anders denke, was das gesamte Thema betrifft. Das ist ja wertneutral.

      Ich fühle mich nur leider als Einzelkämpfer. Das ist ja noch nicht mal schlimm. Nur gibt es von keiner Seite mehr Input. Und ich habe ein wenig das Gefühl, dass sich keiner traut, öffentlich Stellung zu beziehen. Oder es ist allen egal.
      Die Frage ist, warum von keiner Seite Input kommt. Ich kann das natürlich nur für mich beantworten - und hatte das in früheren Reaktionen schon versucht.

      Wieso sind denn alle bei den Pilzmessreihen so unwissenschaftlich? Ich versteh es nicht.
      Meine Meinung:

      Sporenmaße sind ein Kriterium unter vielen Kriterien, die ich betrachte, will ich einen Pilz beschreiben oder bestimmen. Wie du selbst zugegeben hast, reicht für eine Bestimmung bei stark unterschiedlichen Bereichen (z. B. 3-4 µm Länge vs. 10-18 µm Länge) das Messen weniger Sporen und für die Unterscheidung der Arten reicht ein Blick ohne Statistik. Hier wäre zum Bestimmen die genaue Auswertung unnötig.

      Sobald die Sporenmaße zu ähnlich sind, suche ich nach anderen Trennmöglichkeiten. Ich gehe - wie bei vielemn biologischen Systemen - von einer recht großen Schwankungsbreite aus. Junge Fruchtkörper ergeben andere Sporenmaße als alte Fruchtkörper (nicht vergleichbare Kollektionen). Neulich hat Miatthias Dondl eine Flammulina untersucht, bei der unterschiedliche Abwürfe unterschiedliche Sporenformen ergaben (neuer Abwurf auf Papier vs. älterer von der Huthaut eines darunter befindlichen Pilzes). Da wird es eh schwierig... Was bringt es dann, dass Smaff für das selbe Individuum zwei unterschiedliche Konfidenzintervalle ausspuckt?

      Das alles negiert natürlich nicht das Berechnen von Konfidenzintervallen an sich, zumal sie keine wirkliche Arbeit machen.

      Ich persönlich sehe darin aber die Gefahr, dass man durch die statistische Auswertung wirklich glaubt, dass, würde man vom selben Fruchtkörper nochmal die Sporen ausmessen - andere Stelle des Abwurfs - wieder 95% der Sporen innerhalb des gleichen Konfidenzintervalls finden wird. Das wäre erstmal zu prüfen... Oder: wenn man vom gleichen Fruchtkörper ein paar Tage später nochmal einen Abwurf macht - gleiche Maße? Das geht in vivo im Gelände. Nuss hat das bei Porlingen gemacht - du wirst überrascht sein, wie da die Maße teils schwankten, bis sie sich dann eingependelt haben (später waren die Sporen anders als bei den ersten Abwürfen - auch in der Form).

      Ich persönlich erachte den Wert der Schwankungsbreiten als überbewertet. Ich verwende gerne (immer) den Mittelwert der Kollektion(en), die ich in Publikationen vorstelle. Und auch da gehe ich von einer recht großen Schwankungsbreite aus. Und klar, da beißt sich die Katze in den Schwanz - was bringt ein Mittelwert einer Kollektion? Ist mir klar...

      Ich verstehe zudem nicht, warum andere Maße wie Hutdurchmesser, Stiellänge (usw.) dann nicht genauso angegeben werden sollten (gut, die Anzahl der Stichproben ist da geringer, aber man kann ja viele Kollektionen heranziehen) - da bist du in deiner Kritik völlig einverstanden? Wie unterscheiden sich die einen Maße (Sporen) von den anderen Maßen (Stiellänge)?

      Es ist wissenschaftlicher usus.
      Das ist halt die Frage. In Bezug auf Einzelmesswerte ist eine Fehlerabschätzung essentiell, da sind wir uns ja einig. Bei stark schwankenden, immer mit Ausnahmen belegten biologischen Systemen ist es aber schwieriger, eine aussagefähige Auswertung herzuzaubern als bei physikalischen Systemen. Daher ist es eben nicht wirklich Usus, Konfidenzintervalle anzugeben. Es war mal ein bisserl Mode (oder ist es noch) in nordischen Ländern. Betrachte ich aber Papers weltweit, ist es die Ausnahme - weil eben die Sporenmaße allein nicht als so wichtig erachtet werden. Es ist halt eine Zusatzinformation, nicht mehr und nicht weniger. Oft sind Aussagen über das Hyphensystem, die Basidienform oder was auch immer wichtiger.

      Beispiel:
      Du willst die Körpergröße der Spezies Mensch angeben. Du misst 30 Personene aus (denn mehr ist "Blödsinn?). Das machst du in Deutschland - o.k. Dann wertest du das aus, gibst Konfidenzintervalle an und meinst, dass das dann für die Spezies Mensch stimmt? Ich fahre nach Sizilien, messe dort 30 Menschen aus und erhalte eine andere Verteilung.
      Ich fahre nach Ruanda und stelle fest, dass das drei unterschiedliche Teilpopulationen vorhanden sind (Tutsi, im Schnitt groß gewachsen, Hutu, im Schnitt kleiner und Pygmäen, sehr klein).

      Nein, um die Spezies Mensch im allgemeinen zu erfassen, braucht man zig Stichproben in allen möglichen Regionen - und kann dann irgendwann feststellen, wie groß Menschen sind. Oder man gibt die bekannten Extremwerte an: 0,95 m - 2,72 m (ich meine, dass das ungefähr hinkommt). Beides sind Ausreißer, aber beide Ausreißer waren lebendige Menschen. Insofern kann ein (erwachsener!) Mensch auch nur knapp 1 Meter groß sein oder fast 3 Meter Länge erreichen.

      Die Frage, die sich mir da stellt, ist, was die Angabe eines Konfidenzintervalls bei der Größe des Menschen an Mehrinformation bringt. Wenn ich einen Menschen immer erkennen will, reichen mit 95% als Grenzen nicht aus.

      Ob du das jetzt nachvollziehen kannst, weiß ich nicht. Ich bin sehr pragmatisch: bringt mir die Angabe einen echten Mehrwert? Oder suggeriert sie eine Genauigkeit, die bei physikalischen Systemen gegeben ist, bei denen aber das Leben nicht mitspielt? Von letzterem gehe ich aus. Und deshalb gebe ich aus Prinzip nur ungefähre Schwankungsbreiten an, obwohl ich durchaus in der Lage bin, die für dich notwendige statistische Auswertung anzuwenden.

      Zudem interessiere ich mich für die Biologie der Arten. Heterosporie finde ich spannend - und sie kommt eben häufiger vor als gedacht - denk nur an Crassibasidien bei Amanita oder an Sklerobasidien bei Armillaria - oder wie schon mehrfach dir gegenüber erwähnt die unterschiedliche Mischung von 1-, 2-, 3- und 4-sporigen Basidien (was auch ein Merkmal sien kann).

      Und was machst du bei Pfifferlingen, die von 2- bis 6-sporigen Basidien alles haben (eventuell auch 8-sporige, aber ich kenne sie nur bis 6-sporig). Ich hatte mal eine Kollektion, die durchgehend 6-sporige Basidien hatte. Die wurde, weils ie so hübsch von oben aussieht, von Prof. Wanner (München) mit einem REM fotografiert und diente als Kalenderblatt. Warum sollte ein 6-sporiger Pfifferling die gleiche Verteilung wie ein 4-sporiger haben?

      Mir gefällt auch nicht, rechtsschiefe Verteilungen einfach zwangszuglätten, wo gerade die Rechtsschiefe ein echtes Merkmal sein kann (anders ausgedrückt: wieviel Prozent der Basidien sind 4- wieviel Prozent 2-sporig).

      Jetzt schaue ich mir sehr viele unterschiedlichen Pilze an - von Corticioiden über Porlinge, über Agaricales bis hin zu diversen Ascomyzeten und imperfekten Pilzen. Bei manchen kann man keine Unterscheidung anhand der Sporen treffen. Was dann? Und manche bilden keine oder kaum Sporen - was dann? Sporen sind ein(!) Merkmalsbereich unter vielen.

      Dieses Sackgassendenken und Festhalten an antiquierten Standards in der Mykologie ist aus meiner Sicht schon lange nicht mehr zielführend
      Und hier sehe ich (immer noch) das Hauptproblem. Alle, die deinem Weg nicht folgen (selbst dann, wenn sie begründen, warum), sind antiquiert und haben dieses Sackgassendenken...? Und dann fragst du dich, warum praktisch niemand auf deine Beiträge reagiert?

      Hier wird dauernd ein status quo verteidigt, der seit Erfindung des Taschenrechners schon überholt war. Genau das ist aus meiner Sicht einer der lähmenden Effekte. Warum geht es nicht mal weiter?
      Ich selber betreibe Mykologie, nicht Sporenmaßauswertung, als Fachgebiet. Dazu gehört viel mehr als nur der Versuch, bei stark genäherten Verteilungen Unterschiede herausrechnen zu wollen. Denn dann, wenn die von dir eingeforderte Genauigkeit wichtig wäre, suche ich lieber nach anderen Merkmalsbereichen, die die Unterscheidung von Arten ermöglichen. Und warum? Siehe oben: weil ich die Variabilität innerhalb einer Art als größer als anhand von wenigen Fruchtkörpern als Ausgangsbasis ansehe.

      Es wäre eher lähmend, wenn ich hier versuchen würde, bei geringen Unterschieden das dann doch anhand der Sporenmaße zu unterscheiden. Dann nehme ich lieber eine Sequenz oder die Rhizomorphen oder weitere Merkmale her.

      Wie will man denn mal irgendwo Förderungen oder ... beantragen, wenn hier mit Daten umgegangen wird, wie in der Sendung mit der Maus..
      Und wäre nicht immer dieser polemische Beigeschmack in den Postings... So machst du letzten Endes alle, die nicht genau deiner dir genehmen Methodik folgen, zu naiven Deppen. Ich frage mich ehrliche gesagt, warum. Und durch eine saubere Sporenstatistik bekommt man schon lange keine Fördergelder mehr. Da müssen die Projekte schon andere Inhalte haben. Aber das wäre ein anderes Thema.

      Liebe Grüße,

      Christoph
    • Hallo Christoph,

      Werde ich ein wenig polemisch, habe ich dich am Ar... Wenn nicht, gibt es eh keine Reaktion. Rein logisch sollte ich zuerst dich überzeugen. Aber du bist ja leider derjenige, der den unwissenschaftlichen Umgang mit Messdaten am vehementesten verteidigt. Warum denn nur? Es geht doch gar nicht darum, ob es in den Einzelaspekten jetzt erkennbare Unterschiede gibt oder nicht. Halte dich bitte nicht nur an Sporen fest. Siehe Titel. Es geht um Grundsätzliches. Entweder spielen wir auch mit den Großpilzen oben mit (beinhaltet für mich den wissenschaftlichen Umgang mit<> allen Messwerten), oder wir reden hier wieder über Pilzkunde, weil alles andere anmaßend wäre.
      Wir sollten, um uns nicht als .. such dir was aus..., darzustellen, unsere Messwerte so behandeln, wie es alle anderen machen. Welche Erkenntnisse daraus noch später möglich sind, ist doch jetzt egal. Ohne den sinnvollen Umgang mit unseren Messwerten gibt noch nicht einmal die Möglichkeit späterer Erkenntnisse. (..zu Sackgasse)

      Christoph, ich halte dich für einen hervorragenden.. ja, wie soll ich es schreiben.. Kenner! Von dir lerne ich immer wieder! Gerne! Und ich lese es grundsätzlich, wenn du irgendwo was schreibst! Aber...

      Wenn Messdaten anfallen, sollte man damit genau was nach deiner Meinung damit machen? Also schon mal nicht wissenschaftlich korrekt auswerten? Und wenn nein, warum nicht?


      Christoph schrieb:

      Es wäre eher lähmend, wenn ich hier versuchen würde, bei geringen Unterschieden das dann doch anhand der Sporenmaße zu unterscheiden. Dann nehme ich lieber eine Sequenz oder die Rhizomorphen oder weitere Merkmale her.
      Du willst anhand einer Sequenz Arten unterscheiden?


      Christoph schrieb:

      Ich selber betreibe Mykologie
      Das würde den wissenschaftlichen Umgang mit deinen Daten implizieren.
      So bleibst du ein super guter Pilzkenner!


      Christoph schrieb:

      Die Frage, die sich mir da stellt, ist, was die Angabe eines Konfidenzintervalls bei der Größe des Menschen an Mehrinformation bringt. Wenn ich einen Menschen immer erkennen will, reichen mit 95% als Grenzen nicht aus.
      Entweder hast du mein Beispiel mit Orangen und Mandarinen nicht gelesen oder du verstehst die gesamte Problematik grundsätzlich nicht. Und warum mehr als 30 zu messen bei vielen Arten Blödsinn ist, kannst du gerne dort weiter diskutieren.

      Übrigens kommst du immer wieder mit Beispielen, die nichts mit der Verteilung von z.B. Pilzsporen zu tun haben. Dass du immer wieder nur die bekannten Ausnahmen bei Sporenverteilungen zitierst, wirkst du auch nicht gerade innovativ. Wie sähen denn deine Ideen zur Differenzierung von Mischpopulationen aus?


      Christoph schrieb:

      Es war mal ein bisserl Mode (oder ist es noch) in nordischen Ländern. Betrachte ich aber Papers weltweit, ist es die Ausnahme - weil eben die Sporenmaße allein nicht als so wichtig erachtet werden. Es ist halt eine Zusatzinformation, nicht mehr und nicht weniger. Oft sind Aussagen über das Hyphensystem, die Basidienform oder was auch immer wichtiger.
      Schon wieder versuchst du den wissenschaftlichen Umgang mit Messwerten dadurch zu negieren, dass es auch andere Infos gibt. Ich halte auch die anderen Infos oft für elementar. Nur! Es ändert nichts daran, wie man wissenschaftlich mit Messwerten umgeht.

      Und nicht nur Sporen! Schau dir mal die von Ditte (Neubeschreibung) zitierten Artikel an. Da werden nicht nur Sporen wissenschaftlich korrekt behandelt. Nur mal so, weil du immer fragst, was mit dem Rest ist. Wenn etwas elementar ist, kommt man doch nicht um eine wissenschaftlich korrekte Veröffentlichung herum.

      LG, Jens
    • Krötenhocker schrieb:

      Werde ich ein wenig polemisch, habe ich dich am Ar... Wenn nicht, gibt es eh keine Reaktion. Rein logisch sollte ich zuerst dich überzeugen.
      Hallo Jens,

      das ist meines Achtens genau der Punkt: Du willst gar nicht diskutieren, denn das würde ja einschließen, dass Du selbst etwas dazulernst und Deine Meinung modifizierst. Du willst entweder polemisieren oder bestenfalls andere überzeugen (beides schließt sich übrigens psychologisch aus), und erwartest, dass die anderen ... welche Reaktion bringen? Jubel?

      Anstelle jetzt ewig weiter rein theoretisch auf dem Mittelwert herumzureiten, solltest Du lieber an praktischen, selbst gemessenen Beispielen aufzeigen, wo die Messwertstatistik echt neue Informationen gebracht hat.

      Und da ist als erstes die bei Pilzen ewig wiederholte These, durch die Schiefe der Sporenverteilung könne man keine Messwertstatistik mehr machen. Das ist natürlich Quark, es macht die Messwertstatistik hier erst richtig interessant (weil kompliziert). Aber wie? Wieviele Sporen von wievielen Kollektionen muss man gemessen haben, um die Schiefe der Verteilung selbst als Messgröße betrachten zu können, die selbst einen Mittelwert und eine Standardabweichung hat (die Schiefe ist dann übrigens normalverteilt, im Gegensatz zu den Sporenmaßen selbst)?

      Zum Median ist Dir letzhin nichts besseres eingefallen, er hätte den Vorteil, dass man ihn ohne Rechnen ermitteln kann. Ernsthaft jetzt? Nein, er ist stabiler gegenüber schiefen Verteilungen, dafür wird er eingesetzt! Z.B. beim Haushaltseinkommen. Warum nicht bei Pilzsporen?

      Wenn schon Messwertstatistik, dann bitte Diskussionen mit offenem Ausgang.

      Gruß,

      Wolfgang
    • Hallo Jens,

      Wolfgang Prüfert schrieb:

      das ist meines Achtens genau der Punkt: Du willst gar nicht diskutieren, denn das würde ja einschließen, dass Du selbst etwas dazulernst und Deine Meinung modifizierst. Du willst entweder polemisieren oder bestenfalls andere überzeugen (beides schließt sich übrigens psychologisch aus), und erwartest, dass die anderen ... welche Reaktion bringen? Jubel?
      das ist auch mein Empfinden, darum beteilige ich mich nicht an diesem Thread. Für mich scheint es genauso wie Wolfgang das beschreibt: Du "erdrückst" einen mit deiner Argumentation dass keine Luft für anderes bleibt. Also was soll man denn diskutieren? Deine Ansicht ist zementiert, und Du tust sie hier kund, okay. Aber wo bleibt Raum für andere Ansichten? Nirgends, denn Du bist ja der festen Überzeugung, alles andere als der von Dir aufgezeigte Weg ist unseriös.

      beste Grüße,
      Andreas (der übrigens SMAFF gerne nutzt, wenn auch ohne sich Gedanken um ausgefeilte Statistik zu machen ...)
    • Hallo,

      eigentlich hab ich doch schon alles argumentiert. Smaff ist doch egal. War wohl so gesehen im Nachhinein eher ein Fehler. Denn so setzt sich niemand mit der Theorie dahinter auseinander. Was ich eher für ein Axiom gehalten habe, scheint in den letzten Jahren in der Pilzkunde wieder zu Althergebrachtem zu verschwimmen.

      Andreas schrieb:

      Deine Ansicht ist zementiert, und Du tust sie hier kund, okay. Aber wo bleibt Raum für andere Ansichten? Nirgends, denn Du bist ja der festen Überzeugung, alles andere als der von Dir aufgezeigte Weg ist unseriös.
      Ja, und zwar in einer wissenschaftlichen Publikation, in der sich überschneidene Messreihen zur Differenzierungsargumentation mit MinMax beschrieben werden. Das kann keiner Nachvollziehen, weil es keiner Nachrechnen kann. Mit Mittelwerten und der Standardabweichung kann man so etwas Nachrechnen. Und damit auch über zukünftige Aufsammlungen die neue Art belegen.
      Überall woanders ist es mir völlig schnuppe, wäre aber schön, weil dann die Daten Teil von weiteren Projekten werden könnten, also die Messreihen aufgehoben werden würden.
      Das ist auch ein Grund, warum ich nicht irgendwelche Gattungen für das Böhmerwald-Projekt bearbeite. Ich sehe in der gesamten DB keinen Mehrwert. Das hatte ich aber auch im Vorfeld mit Wolfgang schon "diskutiert".



      Wolfgang Prüfert schrieb:

      Anstelle jetzt ewig weiter rein theoretisch auf dem Mittelwert herumzureiten, solltest Du lieber an praktischen, selbst gemessenen Beispielen aufzeigen, wo die Messwertstatistik echt neue Informationen gebracht hat.
      Schau in das Tricholoma Projekt. Die Mittelwerte irgendeiner Aufsammlung von Pablo waren bei zwei Sporenfotos desselben Sporenabwurfs dermaßen weit auseinander, dass man sie nicht hätte zusammenlegen dürfen.
      Ohne Smaff (egal..),... ohne statistische Mittelwertbetrachtung wäre das bestimmt nicht aufgefallen. So weiß ich heutzutage, das Freihandfotos durch das Okular einen möglichen sehr großen systematischen Fehler beinhalten können und damit dieses Verfahren so richtig gar nicht geeignet ist, um damit zu Messen, jedenfalls bei Pablos Aufnahmen.

      Wolfgang Prüfert schrieb:

      Und da ist als erstes die bei Pilzen ewig wiederholte These, durch die Schiefe der Sporenverteilung könne man keine Messwertstatistik mehr machen. Das ist natürlich Quark, es macht die Messwertstatistik hier erst richtig interessant (weil kompliziert).

      Seh ich anders, also nicht das mit der ewig wiederholten These... Ich würde immer versuchen, die Schiefe zu vermeiden und das hatte ich ja auch schon begründet.
      Also so wenig Sporen messen, dass anderskernige als Ausreißer erkannt werden. Oder, als Idee, nur tote Sporen Messen, dafür aber die Kernzahl erkennen können.
      Das Problem sind doch wohl immer die Vermischung von Orangen mit Mandarinen. Ich hatte in meinen Messungen meistens eine Normalverteilung. Da ist es doch dann sowieso unproblematisch und der Mittelwert ist dann der beste Schätzer.
      Die Schiefe wird aus meiner Sicht völlig überwertet. Nur muß man eben auch die Ausreißer rechtzeitig rausschmeißen. Und warum rechtzeitig hab ich auch schon begründet.
      Und der Median ist für (auch nur annähernd) normalverteilte Stichproben nicht der beste Schätzer.
      Dein Einkommensbeispiel ist doch wohl weit davon entfernt, eine Normalverteilung als Grundlage anzunehmen.

      Und zu den weiteren Beispielen... Gebt mir eure Daten und ich mach die Beispiele. Ein paar eigene hab ich ja auch. Aber auch meine Zeit, die ich für die Mykologie frei hab, ist begrenzt.
      Vielleicht können wir uns ja mal auf ein paar Arten festlegen, die überall vorkommen. Tubaria hiemalis jetzt zum Beispiel. Obwohl die hier auch gerade ziemlich durch aussehen... Egal, ich kann nicht zeitlich noch fröhlich mikroskopieren, mich um Smaff kümmern, Smaff erweitern, den Sinn von Statistik überhaupt diskutieren und dann noch gegen Windmühlenflügel ala Christoph ankämpfen.

      Also, sammeln wir mal wirklich Daten. Gemessen wird doch sowieso. Nur gesammelt und in größerem Umfang ausgewertet wird das alles nicht. Und nicht nur Sporen. Schade, dass das mit meiner Teilnahme am Tricholoma Projekt so an die Wand gefahren ist. Mit den kleinen Differenzen der Sporenmittelwerte hätte man ja mal zeigen können, ob sich das in der Genetik widerspiegelt. Da hätte wohl in keinem Fall ein MinMax geholfen.

      Übrigens wäre ich froh, wenn ihr für eure Argumentation zukünftig Beispiele aus den Naturwissenschaften nehmen würdet.

      LG, Jens
    • Lieber Jens,

      gut, ich nehme Dich beim Wort!

      ich habe eine ganze Reihe von Messungen verschiedener Kollektionen aus dem Artenkreis der crepidotoiden Clitopilus-Arten um Clitopilus hobsonii-daamsii-rhodophyllus-passeckerianus-fasciculatus

      Alle Messungen wurden von getrocknetem Material vorgenommen, alle in Kongorot/NH3 und alle mit demselben Mikroskop und Kamera mit demselben Messprogramm von mir vermessen.

      Insgesamt sind es glaube ich so etwa 30 Messreihen à 20-30 Sporen, ausnahmsweise auch mal 50.

      Interessiert?

      beste Grüße,
      Andreas
    • Krötenhocker schrieb:

      Die Schiefe wird aus meiner Sicht völlig überwertet. Nur muß man eben auch die Ausreißer rechtzeitig rausschmeißen. Und warum rechtzeitig hab ich auch schon begründet.
      Und der Median ist für (auch nur annähernd) normalverteilte Stichproben nicht der beste Schätzer.
      Hi Jens,

      ich halte die Schiefe auch in vielen Gattungen für überbewertet, aber ich kann es nicht statistisch belegen. Das wird auch nie gelingen, wenn man sie nicht misst.


      Krötenhocker schrieb:

      Also so wenig Sporen messen, dass anderskernige als Ausreißer erkannt werden. Oder, als Idee, nur tote Sporen Messen, dafür aber die Kernzahl erkennen können.
      Das Problem sind doch wohl immer die Vermischung von Orangen mit Mandarinen.

      Das sehe ich total anders. Weniger Messungen erzeugen immer nur ungenauere Ergebnisse. Wenn die tatsächliche Verteilung einer Messgröße komplizierter ist als eine Gauss-Kurve, dann kann man nicht einfach alles ignorieren, das einem nicht in den Kram passt. Sondern man muss mit der komplizierteren Ausgangssituation umgehen. Dein Ignorieren funktioniert auch nur, wenn der Anteil an 1- oder 2-sporigen Basidien unter 5% liegt. Bei Entoloma sind es oft 20% oder mehr, da sollte Dir jeder seriöse Ausreißertest einen Vogel zeigen und alle Daten 'drinlassen. Ob die Riesensporen dann wirklich mehr Kerne haben, wage ich zu bezweifeln (wäre aber spannend). Ich glaube eher, dass die Basidien zur Bildung einer gewissen Menge an Sporenvolumen befähigt sind, und das auf alle fehlerfrei gebildeten Kerne = Sporen aufteilen, die anderen Kerne wurden einfach aufgelöst.


      Krötenhocker schrieb:

      Und der Median ist für (auch nur annähernd) normalverteilte Stichproben nicht der beste Schätzer.
      Für alle symmetrischen (nicht nur normalen) Verteilungen sind Erwartungswert von Median und Mittelwert identisch.


      Krötenhocker schrieb:

      Schau in das Tricholoma Projekt. Die Mittelwerte irgendeiner Aufsammlung von Pablo waren bei zwei Sporenfotos desselben Sporenabwurfs dermaßen weit auseinander, dass man sie nicht hätte zusammenlegen dürfen.
      Ohne Smaff (egal..),... ohne statistische Mittelwertbetrachtung wäre das bestimmt nicht aufgefallen.

      Mit Tests auf Normalverteilung und Ausreißer kommt (manchmal) was Sinnvolles bei 'rum.
      Das ist aber was deutlich anderes, als nur Mittelwert und Standardabweichung auf zwei Nachkommastellen anzugeben - auch vom Zeitaufwand. Ich sage ja gar nicht, dass dieser Aufwand nicht lohnt, aber Mittelwerte ohne Test auf Normalverteilung täuschen die Wissenschaftlichkeit zumindest in unserem Anwendungsfall nur vor. Und dafür kommst Du mit den max. 30 Sporen auch leicht an die Grenze.

      Grüße,

      Wolfgang
    • Hallo zusammen,

      @Andreas:

      Andreas schrieb:

      Insgesamt sind es glaube ich so etwa 30 Messreihen à 20-30 Sporen, ausnahmsweise auch mal 50.

      Interessiert?
      Ja, ich bin aber skeptisch, weil du dann ja wahrscheinlich Quetschpräparate gemacht hast. Was möchtest du denn mit den Messreihen belegen?

      Meine Fragen zu deinen Daten:

      Hast du Fotos gemacht und dann immer alle (richtig liegenden) Sporen pro Foto vermessen, um zu vermeiden, gleiche (also doppelt) zu vermessen und um sich nicht selbst zu beeinflussen? Ich muß meistens mehrere Fotos pro Aufsammlung machen, um für ca. 30 genug richtig liegende zu haben...

      Du hast nicht freihändig durch das Okular fotografiert?

      Also bei genauer Skalierung ist das Mikroskop, wie auch die Kamera und das Messprogramm egal.
      Und man kann ja auch immer noch mal gegentesten, in dem man das Okularmikrometer einfach mit den Einstellungen noch einmal vermisst. Sonst könnte man ja auch gar keine Messreihen unterschiedlicher Messsysteme vergleichen...
      Auch ich habe da aus meinen Fehlern lernen dürfen, als ich vor Jahren neben dem 40er auch ein 40er Öl in Benutzung hatte und nicht soweit gedacht hatte, dass ein anderes Objektiv auch eine andere Vergrößerung macht, auch wenn überall 40er draufsteht.. Die Messungen von damals sind heute wertlos, da ich sie keinem Objektiv mehr eindeutig zuzuordnen sind.

      Übrigens, da du mich mit "Eigenverlag" zitiert hattest... Ich hatte, weil mich Jürgen M. darum gebeten hatte, in der SPR einen Artikel zu Smaff geschrieben, damit man Smaff "zitieren" kann.
      Hier der Zitiervorschlag, den ich jetzt aus Jürgens Website kopiert habe:
      Wilk, J. (2012): Smaff - "Statistische Messreihen-Auswertung für Fungi v3.1". Südwestdeutsche Pilzrundschau. Jhrg. 48, Heft 2. S. 49-56.



      @Wolfgang,

      Wolfgang Prüfert schrieb:

      ich halte die Schiefe auch in vielen Gattungen für überbewertet, aber ich kann es nicht statistisch belegen. Das wird auch nie gelingen, wenn man sie nicht misst.
      Smaff misst berechnet die Schiefe.

      Wolfgang Prüfert schrieb:

      Weniger Messungen erzeugen immer nur ungenauere Ergebnisse. Wenn die tatsächliche Verteilung einer Messgröße komplizierter ist als eine Gauss-Kurve, dann kann man nicht einfach alles ignorieren,
      Ich ignorier doch nichts. Aber wodurch wird es denn komplizierter? Groß, glaube ich, hatte mal versucht, die Größenunterschiede (prozentual) zur Kernzahl zu ermitteln. Da war es jedenfalls die Kernzahl, die zur Verzerrung geführt hat. Also wieder die Vermischung eigenständig zu vermessender Populationen.

      Wolfgang Prüfert schrieb:

      Dein Ignorieren funktioniert auch nur, wenn der Anteil an 1- oder 2-sporigen Basidien unter 5% liegt.
      Das ist es ja. Bei mir funzt das i.d.R. ganz gut, dass die Normalverteilungstests nach Rausschmiss der Ausreißer die Wahrscheinlichkeit der Normalverteilung annehmen.
      Aber wenn mal nicht...? Vielleicht nehmen die Skandinavier deshalb so gerne das 90% Intervall?

      Wolfgang Prüfert schrieb:

      Für alle symmetrischen (nicht nur normalen) Verteilungen sind Erwartungswert von Median und Mittelwert identisch.
      Ja und? Dadurch wird doch wohl die Schiefe berechnet, also mit der Differenz der beiden.

      Wolfgang Prüfert schrieb:

      Ich sage ja gar nicht, dass dieser Aufwand nicht lohnt, aber Mittelwerte ohne Test auf Normalverteilung täuschen die Wissenschaftlichkeit zumindest in unserem Anwendungsfall nur vor. Und dafür kommst Du mit den max. 30 Sporen auch leicht an die Grenze.
      Smaff testet, wenn man das richtige Häckchen setzt, auch den Shapiro-Wilk Test auf Normalverteilung. Ich bin übrigens nicht verwandt oder verschwägert, soweit ich weiß... ;)
      Und du vergisst, dass auch die Ausreißer raus müssen.
      Dann bin ich deiner Meinung nach aber in der Wissenschaftlichkeit und kann meine weiteren Tests machen, oder?

      Ausserdem hatte ich 30 bis 40 Sporen geschrieben nicht max 30. Das ist auch nur ein Wert, den ich erstens durch die Literatur der einschlägigen Artikel und zweitens durch eigene Erfahrungen so einschätze.
      Wo genau die "Verschwimmgrenze" für die Stat-Tests durch Populationsvermischung anfängt, hängt wohl von vielen Faktoren ab und kann ja ohne Weiteres sogar von Stressfaktoren der Aufsammlung, Wetter, Kühlschrank, o.ä. abhängen? Und dann gibt noch die Aufsammlungen, die enorm symetrisch sind? Aber da wird es ja einfach...

      Aber wenn wir da nicht wissenschaftlich bei den Messreihen vorgehen, sind die Ergebnisse, die man daraus ermitteln könnte, da nicht nachrechenbar, auch nicht für wissenschaftliche Publikationen zu gebrauchen.
      Jedenfalls wenn man sich in der Argumentation auf solche Daten stützt.

      Aus meiner Sicht sind durch den jetzt üblichen Umgang mit den Daten ganz viele Fragen nicht ordentlich bearbeitbar. Z.B. welche Auswirkungen haben Stressfaktoren auf Sporenpopulationen. Oder spiegeln sich solche Faktoren in der Größe der Basidien? Und und und... Überall, wo es um kleinere Unterschiede geht, ist MinMax sofort am Ende.

      LG, Jens
    • Hallo Jens,

      Krötenhocker schrieb:


      Andreas schrieb:

      Insgesamt sind es glaube ich so etwa 30 Messreihen à 20-30 Sporen, ausnahmsweise auch mal 50.

      Interessiert?
      Ja, ich bin aber skeptisch, weil du dann ja wahrscheinlich Quetschpräparate gemacht hast. Was möchtest du denn mit den Messreihen belegen?
      Meine Fragen zu deinen Daten:

      Hast du Fotos gemacht und dann immer alle (richtig liegenden) Sporen pro Foto vermessen, um zu vermeiden, gleiche (also doppelt) zu vermessen und um sich nicht selbst zu beeinflussen? Ich muß meistens mehrere Fotos pro Aufsammlung machen, um für ca. 30 genug richtig liegende zu haben...

      Du hast nicht freihändig durch das Okular fotografiert?
      natürlich habe ich Quetschpräparate gemacht, oder bist Du in der Lage aus Exsikkaten Sporenabwürfe zu produzieren? Alle Messreihen sind aus Lamellenpräparaten entstanden, stets in Kngorot/NH3.

      Ich habe mit einer Einsteckkamera (5 MP) Standbilder gemacht und dann alle mir plan seitlich liegend erscheinenden Sporen vermessen. Wenn ich nur wenige Sporen hatte, dann musste ich eben mehrere Bilder machen, Meist haben zwei genügt, manchmal mehrere, selten nur eines. Die Fotos davon habe ich aber nur selten abgespeichert.
      Diese Vorgehensweise war bei allen Messreihen dieselbe.

      Was ich herausbekommen will ist, ob sich anhand der Sporengröße Sippen zeigen. In der Gruppe werden traditionell manche Arten über Sporengrößen getrennt (hobsonii vs. daamsii, passeckerianus vs. fasciculatus).
      Das sollte sich anhand der relativ vielen Belege ja nachvollziehen lassen, sofern unsere Messreihen einer Normalverteilung unterliegen, nicht wahr? Und wenn dem so ist, dann müsste sich das ja auch durch die molekularen Ergebnisse entsprechend bestätigen, indem die jeweiligen Arten zusammen clustern. Jedenfalls wenn die Kollektionen richtig bestimmt sind, bzw. das Trennmerkmal Sporengröße was taugt.
      Ich möchte gerne sehen, was Du denkst, was anhand der Sporengrößen zusammengehört und ob sich eben Gruppen bilden oder ob letztlich alles im selben Spektrum liegt.

      besten Dank für den Hinweis mit der Zitierung von SMAFF - wusste ich nicht obwohl ich die SPR hab *schäm*. Ich hoffe es ist trotzdem o.k. für Dich so.

      beste Grüße,
      Andreas
    • Hallo Andreas,

      Andreas schrieb:

      natürlich habe ich Quetschpräparate gemacht, oder bist Du in der Lage aus Exsikkaten Sporenabwürfe zu produzieren? Alle Messreihen sind aus Lamellenpräparaten entstanden, stets in Kngorot/NH3.
      Das macht es natürlich schwer. Es ist dir natürlich auch klar, das unfreiwillig abgegebene Sporen bestimmt nicht das widerspiegeln, was man bei freiwillig abgegeben Sporen erwarten könnte. Du kannst den Exsiccatwen ja nicht mal ansehen, wie reif der FrK. denn ursprünglich mal war.
      10 frei Sporen hätten womöglich eine größere Aussagekraft als 100 gequetschte. Aber ich muß zugeben, dass ich bisher nur an Frischmaterial gemessen habe. Ich hab vor 3? Jahren angefangen, einfach einen Objektträger mit einem Abwurf zusätzlich zu machen.

      Andreas schrieb:

      Das sollte sich anhand der relativ vielen Belege ja nachvollziehen lassen, sofern unsere Messreihen einer Normalverteilung unterliegen, nicht wahr?
      Da die einzelnen Messreihen aus meiner Sicht als suboptimal zu betrachten wären, weiß ich nicht, ob man damit weit kommt.
      Eine Messreihe aus einem jungen Pilz dürfte doch durch die vielen unreifen Sporen einen viel kleineren Mittelwert haben, als aus einem "reifen".
      Ich bin gerne bereit, mir deine Messreihen mal anzuschauen, aber egal was man daraus ablesen kann, die Ergebnisse würde ich als sehr sehr ungenau und damit auch nicht als reproduzierbar bezeichnen, da du die grundsätzliche Datenherkunft mit so einem Präparat nicht optimal vergleichbar erzeugst. Da wäre ein Abwurf... Ach ist dir doch alles klar.


      Andreas schrieb:

      besten Dank für den Hinweis mit der Zitierung von SMAFF - wusste ich nicht obwohl ich die SPR hab *schäm*. Ich hoffe es ist trotzdem o.k. für Dich so.
      Klar, hab ich jetzt eigentlich auch nur geschrieben, damit auch Christoph mal lesen kann, dass ich wenigstens irgend etwas zitierfähiges geschrieben hab... ;)

      Grundsätzlich gelten übrigens die Grafiken in Smaff auch als relevant zur Beurteilung der Güte der Daten Also der QQ und PP-Plot. Daran kann man auch optisch schon (nach ein wenig Erfahrung) erkennen, wie gut die Daten sich einer Normalverteilung (Gauss) annähern oder wie weit Ausreißer vom rest weg sind.

      Und auch grundsätzlich sind das natürlich die auch wichtigen Fragen: Kann man Zusammenhänge zwischen Genetik und morphologischen Tatsachen herstellen.

      In ZfM 79/2 S.517 ist eine Grafik, die ich gerne nachbasteln würde. Ich habe mir damals die dort zitierte Dokumenta Geigy gekauft, um die Populationsellipsen nachvollziehen zu können. Kann ich jetzt und ich habe mir verschiedene Symbole programmiert, die man farblich beliebig füllen kann.

      Wenn du jetzt z.B. deine Messreihen zu z.B. C. hobsonii alle gelb machst und die Messreihen dazu jeweils mit einem anderen Symbol versiehst und die von C. damsii alle grün, auch je Messreihe mit einem anderen Symbol usw. und der Populationsellipse drumrum, könnte man so schon optisch schnell ohne Mathe Zusammenhänge in der Grafik erkennen. So habe ich es vorgehabt.

      Dafür müssten aber die Messreihen alle irgendwie aus einer Datenbank zur Verfügung stehen. Mal kann man das bestimmt einfach in ein Array packen.
      ...Oder direkt ANOVA, darüber weiß ich aber nicht genug, weil ich noch nie so viele Daten hatte...

      Na, jedenfalls bin ich nicht mehr ganz so pessimistisch, weil wenigstens mal ein von mir hoch geschätzter Mykologe etwas mit SMAFF gemacht hat.

      LG, Jens
    • Hallo Jens,

      >>Ich bin gerne bereit, mir deine Messreihen mal anzuschauen, aber egal was man daraus ablesen kann, die Ergebnisse würde ich als sehr sehr ungenau und damit auch nicht als reproduzierbar bezeichnen, da du die grundsätzliche Datenherkunft mit so einem Präparat nicht optimal vergleichbar erzeugst. Da wäre ein Abwurf... Ach ist dir doch alles klar<<

      dann muss ich leider zugeben, dass mein Interesse an deiner Sporenstatistik auf den Nullpunkt gesunken ist. Auch wenn mir klar ist, dass Sporenabwürfe besser sind - wenn man eine Gattung bearbeiten will, dann muss man auch herbarisiertes Material untersuchen und kann sich nicht darauf verlassen, dass ein Sporenabwurf da ist. Ich habe noch nie einen Sporenabwurf in geliehenem Herbarmaterial gefunden. Und da meine Messergebnisse untereinander vergleichbar sein müssen, messe ich natürlich alles von der Lamelle.
      Deine Wunschvorstellung ist also völlig realitätsfern, und wenn Statistik nur mit Sporenabwürfen klappt, dann ist die Anwendbarkeit in der Mykologie für mich sehr begrenzt. Kann man mit neuen Kollektionen machen, aber das ist ja nur ein Teil der Arbeit mit Pilzen.

      beste Grüße,
      Andreas
    • Hallo Andreas,

      jetzt wirf doch nicht gleich die Flinte ins Korn.
      Die Statistik klappt mit Sporenabwürfen am besten, weil die Bedingungen dadurch möglichst gleich sind ==> reife Sporen
      Es gibt aber für so ziemlich alles ein statistisches Vorgehen. Die Frage bleibt halt, wie scharf man seine Aussagen treffen kann.
      Smaff ist bisher mit seinen Aufgaben gewachsen und wenn dein Vorgehen Usus ist, kann man doch mal schauen, welche Tests bei den Quetschpräparaten funktionieren und womöglich in Smaff implementieren.
      Bisher weiß ich noch nicht viel über deine Daten. Sind die Stichproben normalverteilt?
      Schick sie mir doch bitte trotzdem: jw(äd)smaff.de

      Vieles kann man in der Praxis erst richtig bewerten. Falls man deine Arten über die Sporen trennen kann und ein Test dies zeigt, müsstest du halt in der Beschreibung angeben, mit welchem Test du das belegst und mit welcher Signifikanz und das es eben Quetschpräparate in Kongorot waren.

      LG, Jens
    • Hallo Jens,

      ich bin sehr gespannt, umso mehr als ich mathematisch völlig unbeleckt bin und das allermeiste was ihr da diskutiert völliger Bahnhof für mich ist. Aber vielleicht habe ich durch ein Beispiel aus der Praxis (meine Messreihen ...) die Möglichkeit, einen Hauch davon mitzubekommen, was eigentlich das Problem ist und vor allem für mich zu entscheiden, was ich denn zukünftig mache.

      Vielen Dank für Deine Bereitschaft, und ich hoffe Du hast von dem Aufwand vielleicht auch bissel was davon wenigstens,
      Andreas
    • Hallo Jens,

      nicht ganz passend zur Diskussion, aber hast Du mal einen Buchtip, wo man sich als statistisch Ungebildeter, aber Interessierter, ein paar Basics aneignen kann?

      In Basso, M. T. (2005): Manuale di Microscopia dei Funghi, Band 1, p.237-295 ist ein ganzer Abschnitt von Daniele Uboldi: Elementi di Statistica Applicati alla Micologia, aber in Italienisch. Da komme ich ganz schnell an meine Grenzen.

      Beste Grüße
      Stefan
    • Hallo Andreas und Stefan,

      Andreas schrieb:

      was eigentlich das Problem ist und vor allem für mich zu entscheiden, was ich denn zukünftig mache.
      Das Problem ist die Falsifizierbarkeit. Keiner kann die Aussagen in Frage stellen oder eben belegen, weil es bei MINMAX nur ein Rumraten ist. Ich rede hauptsächlich über die Fälle, wo es Überschneidungen gibt. Ausserdem kann man mit MINMAX nicht (auch bei genug Einzelstichproben) auf die wahre Grundgesamtheit (also den wahren Mittelwert einer Art mit seiner Streuung) schließen. Dazu benötigt man grundsätzlich gut beschriebene und bearbeitete Stichproben. Wieviele weiß ich allerdings auch nicht.
      MINMAX ist da eine Sackgasse ohne weiteren Mehrwert.
      Andreas, im Rahmen meiner Möglichkeiten helfe ich gerne, wenn du statistisch publizieren möchtest und/oder Fragen dazu hast.
      Ich habe mir gerade vorhin noch einmal durchgelesen, was Christoph H., Wolfgang P. und Gerd Fischer zu Gerds damaliger ExcelTabelle (ist 10 Jahre her im damaligen pilzbestimmung.de/forum) diskutiert haben und bin erschreckt, dass ich heutzutage genau mit den gleichen Diskussionsteilnehmern über fast exakt das Gleiche diskutiere und sich seitdem in den Einstellungen zur Thematik kaum was geändert hat. Es wurden keine Fakten geschaffen oder neue Ansätze /Thesen angedacht, von denen ich etwas mitbekommen hätte. Warum nicht?
      Ich würde dir immer raten, in Publikationen statistisch vorzugehen. Machst du da Fehler, sind sie i.d.R. erkennbar; machst du keine, schaffst du echte Grundlagen.


      Bibliothekar schrieb:

      hast Du mal einen Buchtip, wo man sich als statistisch Ungebildeter, aber Interessierter, ein paar Basics aneignen kann?
      Ja, zwei gute Einstiege schick ich dir gerne per Mail, wenn du mir p.237-295 schickst.
      Du kannst mir deine Mail-Adresse ja per PM mitteilen oder, oben hab ich schon meine Mail Adresse im Thread an Andreas angegeben, und da schreibst du was. Ich hab deine Mailadresse schon, glaube ich...

      LG, Jens
    • Hallo Interessierte,

      Andreas hat mir seine Stichproben ohne Bezug zu den angedachten Arten dahinter zugeschickt. Also ein halb-Blind-Versuch sozusagen.
      Und es gibt ein erstes Ergebnis zu Andreas Stichproben, welches ich so nicht erwartet hätte:
      Die Lamellenquetschpräparate aus 36 Exsiccaten sind, bis auf eine Stichprobe, mit 95%iger Wahrscheinlichkeit alle normalverteilt. Eine weitere Stichprobe ist im Volumen nicht normalverteilt, aber die Länge und Breite der Sporen für sich betrachtet sind normalverteilt und ich werde diese Stichprobe erstmal weiter mitbearbeiten. Und es gab sehr selten mal einen Ausreißer und nur einmal zwei Ausreißer.
      Zwei Stichproben sind allerdings stark linkssteil oder rechtschief, egal wie man das betrachten möchte, was aus meiner Sicht ein Hinweis auf sehr junge FrKs ist. Das untermauern auch die etwas kleineren Mittelwerte. Die werde ich wahrscheinlich aufgrund des gesunden Menschenverstandes nicht mit berücksichtigen. Das Alter der FrKs., die man untersucht, kann man also wahrscheinlich im Exsiccat schlecht beurteilen...

      LG, Jens