Über den Umgang mit Messdaten... Einen hau ich noch raus... ;-)

  • Hallo Jens,


    glücklicherweise haben wir es als Mykologen im Allgemeinen mit einer hoch standardisierten Routine-Methodik zu tun, nämlich der lichtmikroskopischen Längenmessung unter Ölimmersion.


    Für diese Methodik ist der absolute Fehler der Einzelmessung hinreichend gut erforscht, und beträgt 0,3 - 0,5 Mikrometer, was sich aus der numerischen Apertur der verwendeten Optik, der Wellenlänge des Lichts und einem Ablesefehler zusammensetzt und sich sowohl praktisch nachvollziehen als auch theoretisch ableiten lässt. Diese Unsicherheit kann also bei jeder Angabe z.B. von Sporenmaßen vorausgesetzt werden.


    Auf diese Weise ist gerade nicht die gesamte mykologische Weltliteratur "WERTLOS!" geworden


    ;)



    Etwas ganz anderes ist der statistische Fehler bei der Ermittlung des Mittelwertes, der neben dem absoluten Fehler des Einzelwertes auch von der Größe der Stichprobe abhängt. Aber dazu hast Du ja einen eigenen Thread...



    Grüße,


    Wolfgang

  • Hallo Wolfgang,


    dein ganzer erster Abschnitt gilt ja nur für jeweils eine Einzelmessung. Zum absolutem Fehler schreibe ich gleich nebenan was. Ich würde das eher maximaler Fehler der Einzelmessung nennen.

    Auf diese Weise ist gerade nicht die gesamte mykologische Weltliteratur "WERTLOS!" geworden

    Darin geht es ja zum Glück auch nicht nur um Größenangaben.... ;)
    Uns wird aber ja aus dem hohen Norden oft genug gezeigt, dass es auch anders geht.
    Und ich lese immer wieder, dass eine Fehlerrechnung von Messreihen nur statistisch möglich ist.


    LG, Jens

  • Hi Jens,


    nur dass wir uns nicht falsch verstehen: ich bin ein großer Fan von Mittelwerten und Standardabweichungen.
    Zumal die Berechnung davon mit minimalem Mehraufwand verbunden ist.


    Aber Min/Max-Werte sind deshalb noch nicht wertlos. Sie sind halt nur nicht vollständig.


    Und Mittelwerte ohne Standardabweichung, wie es die von Dir so hoch gelobten Skandinavier oft praktizieren, wären streng genommen noch mehr von dem oben genannten Zitat aus Darmstadt betroffen als der vollständige Verzicht auf jedes statistische Merkmal, denn wer nichts schreibt, schreibt auch nichts Wertloses...



    Wolfgang

  • Hallo Wolfgang,

    Aber Min/Max-Werte sind deshalb noch nicht wertlos. Sie sind halt nur nicht vollständig.

    Wissenschaftlich betrachtet sind sie wertlos. Ich kann mit und durch sie nicht weiterrechnen. Sie sind enorm unvollständig und lassen nur ein Raten zu.



    Und Mittelwerte ohne Standardabweichung, wie es die von Dir so hoch gelobten Skandinavier oft praktizieren

    Hast du da mal ein Beispiel. In FN oder FNE machen sie das ja nicht.


    Übrigens gibt es nicht nur das Zitat aus Darmstadt. Die drücken das nur mal bewertend aus....


    LG, Jens

  • Hallo Jens,


    machen wir es ganz konkret: Heilmann-Clausen, FNE 2, S. 42, Lactarius plumbeus ("turpis"):


    Sporenmittelwerte 7-8 x 5.6 - 6 my.


    Wieso ist das jetzt wissenschaftlicher, wie ist hier die Unsicherheit definiert (da ja sonst "wertlos!") , und wie rechnest Du damit weiter?


    Wie wirken sich hier unterschiedliche Verteilungsmuster ( z.B. durch variablen Anteil 2-kerniger Sporen), oder verborgene kryptische Arten aus?


    Oder ist es doch wieder dasselbe eine Stufe höher, nämlich Min/Max-Werte einer etwas schärfer definierten Messgröße?


    Und noch konkreter: Ist diese Angabe jetzt schon perfekt, oder wie sähe eine Angabe aus, die aus Deiner Sicht perfekt ist?



    Wolfgang

  • Hallo Wolfgang,


    Sporenmittelwerte 7-8 x 5.6 - 6 my.


    Ja, mit den Eingangsinformationen in FNE2, 20 Messwerte und 95% Konfidenz wäre es jetzt ein leichtes, auf die Standardabweichung zurück zu rechnen. Damit wäre für weitere Tests aufgrund der Kenntnis der Varianz vieles weitere möglich.


    Jetzt muß ich durcheinander antworten.


    Oder ist es doch wieder dasselbe eine Stufe höher, nämlich Min/Max-Werte einer etwas schärfer definierten Messgröße?

    Ja leider. Ich hab die FNE immer gerne in meiner Argumentation mit herangezogen. Aber auch die haben einen elementaren Fehler gemacht. Sie haben einfach ohne irgendwelche standardisierten Verfahren zu benutzen die größten und kleinsten Konfidenzintervallergebnisse mehrerer unabhängiiger Messreihen als Grenzwerte benutzt.
    Ich heul gleich...
    Wirklich, ich bin enorm enttäuscht. Ich dachte immer, wenn ich die Zahlen nehme, kann ich echte Vergleiche anstellen. Weit gefehlt. Durch das unmathematisch geregelte Kombinieren der Einzelergebnisse machen sie alle weiteren mathematischen Vergleiche unmöglich. Das habe ich nachgerechnet.



    Wieso ist das jetzt wissenschaftlicher, wie ist hier die Unsicherheit definiert (da ja sonst "wertlos!") , und wie rechnest Du damit weiter?

    Hätte ich nicht gedacht, aber jetzt habe ich mich damit ja auseinandergesetzt und frage mich, wieso sie so einen guten Ansatz durch die willkürliche Vermischung der Ergebnisse der Einzelmessreihen so kaputt machen?



    Wie wirken sich hier unterschiedliche Verteilungsmuster ( z.B. durch variablen Anteil 2-kerniger Sporen), oder verborgene kryptische Arten aus?

    Sie schreiben ja nichts zur Qualität ihrer Messreihen. Ausreißer elemeniert? Normalverteilung getestet oder einfach nur angenommen? Sie rechnen zwar in ihren Einzelmessreihen mit der Normalverteilung, aber dann kommt der elementare Fehler im Umgang mit den Messungen.
    Zu verborgenen kryptischen Arten... Wenn man die überhaupt über Messwerte erkennen können möchte, dann muß man einfach nicht immer alles als "passt schon" deklarieren und die statistischen "Gesetze" mal bis zum Ende anwenden.Und irgendwie Mischpopulationen vermeiden...
    Zu z.B. dem Verhindern einer Überwichtung diskret vorkommender 2-kerniger Sporen (gibt ja noch andere Kernigkeit) siehe nebenan.


    .

    Und noch konkreter: Ist diese Angabe jetzt schon perfekt, oder wie sähe eine Angabe aus, die aus Deiner Sicht perfekt ist?

    Aus meiner Sicht? Die ist ja gerade diskutierbar. Es gibt die statischen Regeln, also die Mathematik. Es gibt eine möglich Anpassung an die gebräuchliche Notation in der Mykologie, es gibt die Möglichkeit, mit Messreihen so umzugehen, dass sie möglichst viel an Informationen hinterlassen (z.B. auch Regression) und man sollte intensiv darüber nachdenken, grundsätzlich die Messreihen verfügbar zu halten. Analog der Sequenzierung.


    Also,theoretisch würde es ausreichen, was ich sehe. Praktisch in diesem Fall natürlich nicht. Sieht nach mehr aus, als es ist, weil kaputt kombiniert.
    Und für Regressionsanalysen reichen die momentan ja nur theoretisch verfügbaren Infos sowieso nicht aus. Smaff berechnet die Werte alle im Hintergrund schon, aber bisher nur für mich, da alles in der Testphase ist.


    Und jetzt muß ich es leider auch schreiben. Wertlos, die Angaben in FNE2 da sie so eine Einbahnstrasse sind, keine weiteren mathematischen Vergleiche zulassen und die Einzelstichproben völlig individuell ohne mathematische Regeln zu Pseudokonfidenzintervallen zusammengefasst wurden. Nur zum geschätzten Raten geeignet. Rechnerisch kann kommt man nicht weiter, leider.


    Warum werden denn simpelste statistisch mathematische Verfahren in der Mykologie kaum mal angewandt?


    Wolfgang, da du dir auch die Höflichkeit eines Grußes sparst, spare ich mir einmalig auch diesen...


    Jens

  • Hallo Jens,

    Und jetzt muß ich es leider auch schreiben. Wertlos, die Angaben in FNE2

    nein, man kann damit Pilze bestimmen. Ist das nix? Das kann man aber mit Min/Max-Werten von Einzelwerten auch (fast so gut), daher ist der Unterschied m.E. nur graduell.



    Aus meiner Sicht? Die ist ja gerade diskutierbar.

    Naja, nachdem Du so genau weißt, was Du verdammenswert schlecht findest, bist Du m.E. schon in der moralischen Pflicht, einen positiven Gegenentwurf zu liefern.


    Ganz liebe Grüße,


    Wolfgang

  • Hallo Wolfgang,



    nein, man kann damit Pilze bestimmen. Ist das nix? Das kann man aber mit Min/Max-Werten von Einzelwerten auch (fast so gut), daher ist der Unterschied m.E. nur graduell.

    Ja, man kann man damit Pilze bestimmen. Das kann man ja auch mit Min-Max.. Aber wissenschaftlich betrachtet ist genau bei solchen Daten ein Endpunkt erreicht. Ohne auf die Standardabweichung zurückrechnen zu können, kann man die Werte nicht mehr für weitere Tests benutzen. Auch kann man die Werte so durch neue Stichproben nicht aussagekräftiger machen. Man kann keine zukünftige Aussage über die Grundgesamtheit der Art treffen, die durch neue Stichproben immer besser werden würde, weil man die Mittelwerte und die Standardabweichung ja zusammenrechen könnte. Man kann die Werte auch nicht heranziehen, um mathematische Vergleiche zu machen. Und dein Wunsch, kryptische Arten erkennen zu können, rückt damit auch weit weg.
    Untersuchungen zu äußeren Einflüssen auf die Messwerte werden genauso unmöglich, wie auch die Möglichkeit, systematische Fehler zu erkennen.


    Naja, nachdem Du so genau weißt, was Du verdammenswert schlecht findest, bist Du m.E. schon in der moralischen Pflicht, einen positiven Gegenentwurf zu liefern.

    Ich finde es nicht verdammenswert schlecht. Es ist nicht Stand der Wissenschaft. Es ist eine Sackgasse und der Umgang mit Messdaten gehört doch wohl zu jedem naturwissenschaftlichen Studium. Man muß das nur mal hier in der Mykologie auch anwenden. Und eine moralische Pflicht für mich? Eigentlich sollte jeder, der wissenschaftlich publiziert, sich selbst in der Pflicht sehen, auf dem Stand der Wissenschaft zu publizieren. Aber okay, ich fang jetzt trotzdem noch mal an, besonders da man ja auch nicht alle Regeln, die z.B. für technische Messungen gelten, hier 1:1 übernehmen. Stichwort Mischpopulation.


    Und ich hatte jetzt noch eine Erkenntnis. Es kann nötig sein, die Standardabweichung mit anzugeben.
    Ein Zurückrechnen auf die Standardabweichung von Smaffwerten hat mir gezeigt, dass man eigentlich mindestens 2 Stellen hinter dem Komma mit angeben müßte, um auf die Standardabweichung genau genug zurückrechnen zu können.


    Also die bisherige Erkenntnis, eine Stelle hinter dem Komma reiche bei Sporenwerten, stimmt so alleine hingestellt nicht.


    Ich glaube, wir müssen unterscheiden, ob wir Werte angeben wollen, in die man bei einer schnellen eigenen Messung mal seine Werte einordnen kann (Konfidenzintervalle, wie in Smaff) und den für eine Vergleichbarkeit nötigen Angaben, wie sie z.B. in einer Erstbeschreibung stehen sollten.


    Aus meiner minimalistischen Sicht reicht (ANOVA hab ich mir noch nicht angeschaut und für Regressionsanalysen reichen die Angaben trotzdem nicht) , wenn man
    1. die Messreihe ausreißerfrei macht
    2. Mittelwert
    3. Standardabweichung
    4. Anzahl Messwerte
    5. Vertrauensniveau
    angibt und
    6.auch noch eine Aussage zur Normalverteilung trifft. Wobei allgemein auch bei annähernder Normalverteilung weiter gerechnet wird.
    7. Zusätzlich natürlich noch Angaben zum Umgang/Herkunft der Messwerte. (Abwurf oder Quetsch, Wasser KOH usw.)


    Das sieht so aber doof für uns aus und man kann/sollte ja ohne weiteres für den schnellen unmathematischen Vergleich auch die Konfidenzgrenzen angeben, Zumal man da ja wunderbar noch die Extremwerte (nicht die Ausreißer) in Klammern mit angeben kann, soweit überhaupt vorhanden.


    Und wenn man mehrere Messreihen zusammen legen möchte/muß, macht man als Vortest den F-test und dann entweder den Welch-Test oder t-test, ob man die Messreihen zusammenlegen darf. Wenn man das dann nicht darf, muß man sich fragen, warum das so ist, dass die Messwerte nicht zur Grundgesamtheit passen.


    Um meine Aussagen zu untermauern füge ich noch eine kopierte Stelle aus Kaiser, R. E. & Mühlbauer, J. A. (1986) - Elementare Tests zur Beurteilung von Meßdaten an:


    b) das Messergebnis in STANDARDFORM anzugeben:
    Resultat = mx ± T(Einheit); (± s;P%;n)
    mx = Mittelwert
    T = Streubereich, siehe weiter unten
    s = (Näherungs)standardabweichung.

    Man muss exakt
    angeben, welche Standardabweichung gemeint ist:

    jene aus WIEDERHOLWERTEN oder aus VERGLEICHSWERTEN
    oder aus einem gemeinsamen RINGVERSUCH. Darauf
    wird noch eingegangen.
    P = statistische Sicherheit in %; siehe unten.
    n = Zahl der zu dem Mittelwert verwendeten Einzelmessungen.


    Diese Standardform einer Resultatangabe ist zwar REDUNDANT,
    das heisst, sie enthält mehr Angaben, als unbedingt
    notwendig ist. Unbedingt notwendig ist, wie schon erwähnt,
    neben dem Mittelwert eines Ergebnisses noch die Standardabweichung
    s und die Zahl der Wiederholmessungen n anzugeben.
    Aber die redundante Form der Resultatangabe hat für
    die Praxis so viele Vorteile, dass wir ihre konsequente
    Anwendung empfehlen!



    Obwohl ich das Büchlein schon oft benutzt habe, war mir bisher entgangen, dass sie dort auch die Standardabweichung mit angegeben sehen wollen. Verstehe ich jetzt auch erst nach meinen Versuchen, auf diese zurückzurechnen.
    Soweit mein bisheriger bescheidener Laienblick auf diese Thematik.



    Ganz liebe Grüße,


    Nehm ich jetzt als echt gemeint an und grüß dich gerne lieb zurück.


    Jens

  • Hallo zusammen,


    Da Christoph H.so gesehen mit dem Bezug des obigen Zitats auf genau einen Messwert bedingt recht hätte, wenn man nur das Einzelzitat berücksichtigt, hier ein weiteres Zitat aus einem Script der TUHH zur Fehlerrechnung.


    "....In wissenschaftlichen Experimenten ist die Angabe solcher Ungenauigkeiten besonders wichtig,
    um einzuschätzen, in welchem Wertebereich der wahre Wert mit welcher Wahrscheinlichkeit
    liegt, diesen Wert also „einzugrenzen“. Ohne eine solche Eingrenzung ist die Angabe eines
    Wertes, wie etwa Ihre 78,34655 kg, aussage- und sinnlos."


    Sinnlos und aussagelos... Ist das für die Kritiker die bessere Wortwahl? Zimperlich sind die nicht mit ihrer Wortwahl. (Edit: ,die Profs der Unis..., nicht, dass sich schon wieder jemand persönlich angesprochen fühlt!)
    Natürlich gilt immer noch, man kann mit den MINMAX Angaben einen Fund meistens einschätzen. Aber eben sehr sehr unsicher und man muß sich jetzt im Nachhinein auch nicht wundern, wenn dann die Genetik noch mehr Arten in diversen Artengruppen zeigt, wenn man vorher so unmathematisch mit den Stichproben umgegangen ist...


    LG, Jens

  • Andreas Kunze

    Hat das Label Expertenthema hinzugefügt.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!