Pausen zw. den durch Speech Segment Analysis (VoiceAnalysis.ny) ermittelten Blöcke vergrößern

  • Hallo zusammen,


    suche nach einer Möglichkeit, die (Zeit)abstände zwischen den durch die Funktion `Speed Segment Analsysis´ (Plugin: `VoiceAnalysis.ny`) ermittelten Blöcken/Sequenzen automatisiert zu vergrößern/verdoppeln.


    Dabei können die den Blöcken zwischenliegenden Sequenzen gerne in Stille gewandelt werden.


    Für Hilfe bin ich sehr dankbar!


    Morph

  • Nur zur Sicherheit - geht es um dieses Plugin hier: http://www.audacity-forum.de/post/12628 ?


    Frage - Wo genau sollen die Pausen verlängert werden:


    [1] in der Ausgabe der Analysedaten [= Text]


    [2] in der Tonspur selbst, so dass hinterher eine Tonspur mit doppelt so langen Pausen entsteht


    Version [1] ist relativ leicht, Version [2] ist nur mit CMU Nyquist, aber nicht mit Nyquist in Audacity machbar.

  • Lieben Dank für die schnelle und kompetente Hilfe!


    Zu Deinen Fragen: Ja, es handelt sich um das Plugin aus dem Thread. Es geht um die Vergrößerung der Pausen in der Tonspur selbst.


    Habe CMU Nyquist leider noch nicht verwendet. Werde es ausprobieren und hoffe, dass es so bedienerfreundlich und funktional wie Audacity ist...


    Was noch relevant wäre: Existiert noch eine andere Software, die die gesuchten Funktionen bietet (Sprache in Audiodateien finden und zwischen den ausgemachten Wörtern die “Pausen” vergrößern)?


    Beste Grüße,


    Morph

  • Zitat

    Existiert noch eine andere Software, die die gesuchten Funktionen bietet (Sprache in Audiodateien finden und zwischen den ausgemachten Wörtern die “Pausen” vergrößern)?


    Ein Programm mit einer komplett fertigen "Pause verlängern" Funktion, wo du nur draufklicken brauchst, kenne ich leider überhaupt keins. So etwas wird wahrscheinlich einfach zu selten gebraucht.


    Das Standard Programm zur Analyse und Manipulation von Sprachdateien heisst Praat: http://www.fon.hum.uva.nl/praat/

  • Dass es keine Ein-Klick-Lösung gibt, ist schade. Habe mir CMU Nyquist (-> NyquistIDE) angesehen. Es bedarf wohl eingier Einarbeitung, um das Program überhaupt nutzen zu können.


    Daher möchte ich das Problem zuvor anders angehen: Besteht eine Möglichkeit, in normalem Gesprächstempo Gesprochenes (-> Diktiertes) "langsamer zu machen", und das Gesprochene dabei nur minimal zu verzerren (z. B. in die Höhe), außer mit der Funktion "Tempo ändern" in Audacity (da diese dies ja nur bedingt leistet)?


    Danke,


    Morph

  • Zitat

    Besteht eine Möglichkeit, in normalem Gesprächstempo Gesprochenes (-> Diktiertes) "langsamer zu machen", und das Gesprochene dabei nur minimal zu verzerren (z. B. in die Höhe), außer mit der Funktion "Tempo ändern" in Audacity (da diese dies ja nur bedingt leistet)?


    Meiner Meinung nach ist das möglich, ich kenne aber kein Programm, dass so etwas als fertig eingebaute Funktion hat.


    Das Problem besteht aus mehreren Teil-Problemen:


    * [1] Was ist Sprache und was ist Hintergrund- oder Störgeräusch? Wenn du dir den Nyquist Code des "Speech Segment Analsysis" Plugins anschaust dann wirst du sehen dass es bereits einen sehr grossen Aufwand erfordert um Konsonanten von Störgeräuschen unterscheiden zu können. Bei ausreichendem Störabstand funktioniert das einigermassen, bei schlechter Aufnahmequalität ist ein zuverlässiges Unterscheiden von Konsonanten und Störgeräuschen nicht möglich.


    * [2] Was ist eine Pause innerhalb und ausserhalb eines Worts? Es gibt im deutschen sehr viele zusammengesetzte Wörter, die, wenn sich an der Trennstelle der einzelnen Wörter ein Konsonant befindet, als mehrere Wörter mit kurzen Pausen gesprochen werden. Auch wenn sich am Anfang oder am Ende von Silben Plosive befinden entstehen beim Sprechen innerhalb eines Wortes Pausen. Je nach Sprecher/in können Pausen innerhalb eines Wortes länger sein als die Pausen zwischen zwei Wörtern. Es ist nicht möglich allein über die Länge der Pausen zu ermitteln wo genau der Anfang und das Ende eines Wortes sind.


    * [3] Das Verlängern der Pausen erfordert mehrere Bearbeitungsschritte. Im ersten Schritt müssen die Zeiten ermittelt werden, wo jedes Wort anfängt und aufhört (sofern das überhaupt möglich ist, siehe [2]). In einem zweiten Arbeitsschritt muss dann mit den Daten aus dem ersten Schritt die Original-Tondatei in "Wörter" und "Pausen" zerlegt und nur die "Pausen" verlängert werden, danach muss alles wieder zu einer neuen Tondatei zusammengesetzt werden.


    Ein Audacity Plugin kann immer nur einen Arbeitsschritt auf einmal ausführen. Es wird deshalb nicht möglich sein diese Funktion als Audacity Plugin zu implementieren. Das bedeutet, dass ein extra Programm dafür geschrieben werden muss. Das ganze ist ein geschätzter Arbeitsaufwand von mehreren Monaten und es gibt keine Garantie dass es am Ende auch wirklich funktionieren wird.