Sprechanalyse - Oszilloskop, Tonhöhevariabilität, Lautstärkevariabilität, Intonation, Sprechgeschwindigkeit... Alles muss gemessen werden!

  • Es funktioniert!
    Keine Fehlermeldungen! Und es ist sogar genauer geworden (Leider nicht komplett genau)!
    Allerdingst wenn ich 26 dB Verringere wird weniger erkannt als mit 26 db und 10 sec.


    Zeit Verminderung gibt kein Fehler aus allerdings hat scheinbar auch kein Einfluss

  • Habe gerade mit Praat verglichen:
    Gleiche Einstellungen (unter Praat zusätzlich noch <75 Hz):
    Praat --> 32 Perioden erkannt (16 Sprechperioden)
    Audacity --> 45 Perioden (23 Sprechperioden)
    Manuell --> 26 Sprechperioden (Audacity hat 3 nicht erkannt)


    Mit Periodenerkennung bin ich zufrieden! Die Genauigkeit konnte allerdings noch besser sein.

  • Zitat

    Zeit Verminderung gibt kein Fehler aus, allerdings hat scheinbar auch kein Einfluss.


    Das ist richtig, ich habe eine Idiotensicherung eingebaut (weniger als 1 Sample kannst Du halt nunmal nicht analysieren).


    Zitat

    Leider nicht komplett genau


    Heisst das nun 'genau genug' oder muss ich da nochmal ran (weil viel mehr dürfte wahrscheinlich nicht rauszuholen sein).

  • (Meine Fragen haben sich teilweise schon von selbst beantwortet)


    Trotzdem: so wie ich das sehe kommen wir da nur weiter wenn ich eine der Originaldateien haben könnte. Ich weiss jetzt natürlich nicht ob das überhaupt möglich ist, wenn es sich tatsächlich um richtige Patientendaten handelt. Oder kannst Du mir vielleicht selbst so einen Satz in Dein Macbook sprechen, und mir schicken, dann hätten wir wenigstens die gleiche Datei, mit der wir das testen können.


    Im Zweifelsfall: Meine e-mail Adresse steht hier.

  • ... war natürlich doch noch nicht im Bett - jetzt neu:


    - doppelte Präzision 5ms und zwar auch bis zum Ende der Datei (war vorher leider nicht der Fall)
    - erweiterter 'Treshold' Bereich bis -60dB (das Macbook nimmt besser auf als ich dachte)


    Alles was es sonst noch zu meckern gibt :) bitte hier reinschreiben, ich geh jetzt aber wirklich ins Bett.

  • H-A-M-M-E-R!
    Ich weiß nicht wie du das rausgezaubert hast aber das Ding sieht super aus. Ausführlich habe ich noch nicht getestet aber erste Eindrück ist unglaublich. Ich bin ein paar Dateien durchgegangen und es ist fast immer so wie ich es manuell machen würde (Das ganze unter Standarteinstelungen von 5 ms und 45 dB).
    Ich werde das noch ausführlicher Testen und dann Berichten. Schade dass man die Ausgabe-Datei nicht nach der "rummanipulieren" ausgeben konnte. Wirklich Schade! Obwohl ich glaube in den meisten Fällen wird das auch nicht mehr nötig sein!


    Übrigens welche Trashold würdest du mir empfehlen? Bin in Sachen Akustik absolute Laie und habe immer noch nicht gerafft was (-dB) bedeuten! In Physiologie hatten wir nur "normale" (dB), also so etwas: http://upload.wikimedia.org/wi…/a/a2/Akustik_db2phon.jpg
    Habe im Net damals auch keine vernünftige Erklärung gefunden und habe Aufnahme bei Audacity bis (-1 oder -3 dB) eingestellt. Weiß aber bis heute nicht warum :huh: .

  • Stunden später und mal wieder mitten in der Nacht. Ich kann nicht 100% versprechen dass es auch auf Mac funktioniert, aber auf Windows 2000 und XP und Ubuntu Linux gehts. Die neue Version schreibt im Verzeichnis mit der 'Audacity' Datei eine Datei 'analysis.dat' mit den PHP Ergebnissen. Bitte mal ausprobieren. Was ich momentan nicht ändern kann ist, dass bei jeder neuen Analyse die Vorgängerdatei überschrieben wird. Also bitte die Ergebnisse vorher irgendwo in Sicherheit bringen.

  • Bel und Dezibel (= 1/10 Bel) sind eigentlich 'Faulheitsmasse'. Der Grund ist, dass z.B. fast alle Lautstärkeberechnungen nicht auf Addition und Subtraktion sondern auf Multiplikation und Division, in schlimmeren Fällen sogar auf Potenz- und Wurzel- und Trigonometriefunktionen beruhen. Das führt sehr schnell zu Berechnungsformeln, die niemand mehr im Kopf ausrechnen kann.


    Schlaue Leute kamen nun auf die Idee einen uralten Rechenschiebertrick zu verwenden (Rechenschieber = Vorläufer des Taschenrechners), nämlich über Logarithmenrechnung alle Multiplikations- und Divisions- und davon abgeleitete Funktionen in ganz normale Additionen und Subtraktionen zu transformieren. Statt mit Lautstärkeverhältnissen (Bruchzahlen) zu hantieren brauchst Du nur noch deziBel zu Addieren und Subtrahieren, und das können sogar schon Grundschüler im Kopf ausrechnen.


    Das führt jetzt natürlich zu dem Problem, dass die 'Rückwärts'-Berechnung (also die Auflösung der dB Zahlen in reale Verhältnisse) im Prinzip komplizierter ist als vorher, die gute Nachricht ist aber, dass das so gut wie nie notwendig ist (und ich könnte es jetzt ehrlich gesagt auch nicht freihändig aus dem Kopf erklären). Die mathematischen Formeln dazu befinden sich unter:


    http://de.wikipedia.org/wiki/Bel_%28Einheit%29


    Was auch noch wichtig ist: da es sich bei Bel und deziBel nicht um Einheiten sondern um nichts weiter als einen Rechentrick handelt (offiziell heisst das 'Verhältnismass') muss immer ein Bezugspunkt angegeben werden, von dem dann auch die zugehörige Einheit abgeleitet werden kann. In Audacity ist das z.B. die Vollaussteuerung der Tonspur (also wenn die Wellenform in der Tonspur oben und unten bei +1.0 und -1.0 anstösst). -6dB sind dabei genau die Hälfte (in Audacity also +/-0.5) -10dB sind ungefähr ein Drittel (drei Komma eins nochirgendwas), -20dB genau ein Zehntel (also +/-0.1), -40dB genau ein Hundertstel (+/-0.01), -60dB genau ein Tausendstel (+/-0.001), usw. Frag mich jetzt bitte nicht nach der Berechnungsformel (siehe Link oben), das sind Zahlen, die ich auswendig weiss.


    Der Hauptgrund warum ich dB-Regler verwendet habe und keine 'Audacity Zahlen' ist dass wir es mit sehr kleinen Lautstärken zu tun haben, bei denen sonst viele Nachkommastellen eingegeben werden müssten. Auuserdem entspricht der logarithmische Schiebeweg des Reglers auch eher dem, was wir mit unseren Ohren hören (das Gehirn hält das dann wieder für linear). Hört sich seltsam an, ist aber trotzdem wahr.


    Zitat

    ... welchen Treshold würdest du mir empfehlen ? ...


    45dB sind wahrscheinlich schon ein bisschen zu viel. Der Detektor findet bereits wirklich jedes kleinste Detail. Der (in Deinem Fall) optimale Pegel dürfte sich wahrscheinlich irgendwo zwischen 40dB und 45dB bewegen. Was der beste Pegel ist kannst aber im Prinzip nur Du selbst entscheiden, indem Du die Ergebnisse des Analyse Plugins mit Deinen eigenen Ergebnissen vergleichst. Ich behaupte jetzt auch mal, dass wenn Du genau die gleichen Aufnahmen auf auf einem anderen Macbook genau gleicher Bauart machen würdest, Du auf Grund der elektrischen Bauteilestreuungen auf dem anderen Macbook höchstwahrscheinlich andere 'Threshold' Werte brauchen würdest. Natürlich nicht radikal anders, aber so bis Faktor +/-6dB. Um einstellbare Schieberegler werden wir also leider nicht drumrum kommen.

  • Sorry dass ich mich so lange nicht melde aber ich bin immer noch am auswerten. Wenn ich fertig bin dann sage ich dir Bescheid wie es aussah. Habe vorher diese "automatisierte " Auswertung mit Praat durchgeführt und mache jetzt dass gleiche mit Audacity. Möchte dann die beiden Ergebnisse vergleichen.
    Ich lasse dich auf jedem Fall wissen wie es ausgegangen ist.


    Bis bald!

  • ...aus einer e-mail von lesnoj:


    Wie versprochen, hier ist der Vergleich: http://www.audacity-forum.de/d…rum/Praat_vs_Audacity.htm


    Einstellungen sind zwar unterschiedlich aber dass sind jeweils die, die der Wahrheit am nächsten sind. Audacitiy ist meiner Meinung nach mit der Plugin-Standardeinstellungen optimal eingestellt (zumindest für mein Aufgabebereich) und gilt bei diesem Vergleich 'als Maß' so dass getestet wird eigentlich nur PRAAT. (Das ist kein wirkliches Vergleichstest bitte nicht so ernst nehmen). Ich habe wie gesagt die Einstellungen verwendet die, die beste Ergebnisse geliefert haben. Warum Treshold so unterschiedlich ist, habe ich keine Ahnung!


    Nach diesen Auswertung kann ich nur sagen dass diese Sound und Silence Erkennung ist eine totale Grauzone. Jede Auswerter wird es anders Interpretieren und eine gute Standardisierung wäre gar nicht so schlecht. Zur Zeit wird meine Auswertung von einer erfahrenen Professorin stichweise überprüft und ich bin gespannt was da raus kommt.


    edgar schreibt:


    Zitat

    lesnoj: Audacitiy ist meiner Meinung nach mit der Plugin-Standardeinstellungen Optimal eingestellt...


    Deshalb wollte ich ja Originaldateien haben. Ich befürchte aber, wie gesagt, dass es nur auf *Deinem* Notebook optimal ist. Ich befürchte zudem, dass eine 'Standardisierung' der Thresholdschwelle überhaupt nicht möglich ist, weil es zu den Sachen gehört, die mit Computern im Prinzip überhaupt nicht ausrechenbar sind, was jetzt natürlich nicht heissen soll, dass ich deshalb aufgeben will.


    Zitat

    lesnoj: Warum Treshold so unterschiedlich ist, habe ich keine Ahnung


    Weil 'Treshold' genauso wie 'dB' ein sehr variabler Begriff ist (muss mal noch genauer erforscht werden).


    Zitat

    lesnoj: Zur Zeit wird meine Auswertung von einer erfahrenen Professorin stichweise überprüft...


    Ich glaube auch, was wir erstmal am dringendsten bräuchten ist eine Aussage von jemand, der/die/das so etwas schon öfter gemacht hat ob und wie weit das überhaupt was taugt. Ich kenne z.B. nicht alle Originaldateien, so dass ich jetzt aus den Messwerten noch nicht einmal genau sagen kann, ob 'Praat' oder 'Audacity' die besseren Werte liefert.