Gespräch während Autofahrt zu verrauscht

  • Hallo,

    Ich muss ein Gespräch transkribieren, das während einer Autofahrt aufgenommen wurde.

    Es ist leider durch das Fahrtgeräusch so übertönt, dass ich so gut wie gar nichts verstehe. Es ist eine Mono Spur.


    Es geht mir nur darum möglichst viel irgendwie zu verstehen, egal ob Stimme unecht klingt usw


    Ich hab schon Rauschverminderung probiert, tempo verlangsamt, aber komme nicht weiter.


    Kann jemand helfen? Gibt es irgendwelche tricks?


    Ich hab zb festgestellt dass ich irgendwie das Echo lauter höre wenn ich eine kurze Schlaufe anhöre. Dabei bezieht sich das Echo aber auf Wortfetzen von irgendwo anders, also nicht direkt vor oder nach der Schlaufe.


    Gerne auch tips für andere Programme oder Personen die es bearbeite könnten.


    Vielen Dank

    Johanna

    • Offizieller Beitrag

    Das Auto selbst ist kein "Rauschen" im klassischen Sinn. Es ist ja ein vorhandenes Geräusch. Mit dem Rauschfilter wirst Du da nicht weiterkommen.


    Versuch doch mal das Frequenzspektrum einzuengen. Die menschlich Stimme bewegt sich bei Sprache in einem sehr engen Tonraum. Das ist Deine Chance!


    Mit demAudacity Equalizer


    Mit dem Hochpassfilter machts du alles weg, was unterhalb von 300Hz ist

    Mit dem Tiefpassfilter machts du alles weg, was oberhalb von 2500Hz ist


    Es gibt mehrere Wege dies zu tun. Einer ist der Menü - Effekt - Equalizer. Hier kann Du die einzelnen Frequenzen versuchweise herausnhemen und dir gleich das Ergebniss anhören. Am Ende ensteht so eine Art "Telefon-Effekt" der bestenfalls nur noch die Stimme enthält.


    Hier ist eine genaue Beschreibung:


    Audacity: Telefon Effekt mit dem Equalizer | PEGEL10
    Ein Telefon Effekt kann ein Hörspiel, Filmprojekt oder Podcast ordentlich aufpeppen. Und das beste ist, dass du einen solchen Effekt sehr einfach und schnell…
    www.pegel10.de


    oder hier:


    Telefonstimme erzeugen: So geht's! - Dominik Braun
    In diesem Tutorial zeige ich Dir, wie Du eine Telefonstimme erzeugen kannst. Es geht sowohl um die technische Umsetzung als auch um die Physik dahinter.
    dominik-braun.net


    Du markiert einen aussagekräftigen Auschnitt deiner Aufnahme (ca 20sek). Mit dem beginnst Du die Tests:

    Du fängst jeweils ganz links und ganz rechts außen an die Regler des Equalizers herunterzuziehen. Von 0 bis 200Hz kannst du sie garantiert alle auf -20dB Ziehen. Von 4.000 bis 20.000 sicher auch! Danach wird es spannend... Nach jeden Regler testest Du jetzt die Aufnahme (Vorhören) und traust Dich immer mehr Regler wegnehmen, bis es sich erstmals nachteilig auswirkt. Jetzt wendest Du genau diese Einstellung auf die gesamte Aufnahme an. Mehrfache Anwendung bringt mehrfache Verbesserung!


    Wenn Du Glück hast, ist die Stimme jetzt isoliert. Wenn Du Pech hast, war das Autogeräusch im genau gleichen Frequenzspektrum.



    Sprache-zu-Text-Software


    Möglicherweise funktioniert auch eine Software, die Diktate in Text umwandelt ziemlich gut. Hierbei lässt du einfach das Audio laufen und die Software transskribiert dir alles, was sie erkennt. Stichwort für die Google-Suche "Diktat zu Text"



    Beispiel hier einstellen


    Du kannst auch gerne hier einen relevanten 20sek Auschnitt deines Audios reinstellen und ich probier mal etwas rum. Dafür musst du den Ausschnitt als WAV oder MP3 abspeichern, dann in eine ZIP wandeln, dann als Anhang deines nächsten Schreibens mit senden. Aber bitte nur 20sek nicht das ganze interview!!

  • Hallo Midimaster,


    Vielen lieben Dank für deine Antwort.


    Die Frequenzen einschränken werde ich auprobieren und mich dann wieder melden. Würdest du also alles außerhalb von 200-4000 auf 0 setzen und dann nach und nach mehr auf 0 setzen und vorhören oder?

    Sollte ich auch bestimmte Frequenzen hervorheben?


    Was mir noch eingefallen ist: das Motorgeräusch des Autos ist ja viel lauter als das Gespräch. Gibt es eine Möglichkeit alles oberhalb eines bestimmten Lautstärkepegels sozusagen stumm zu schalten? Weil dann würde ja das Gespräch in Relation zu dem Rauschen lauter werden.


    Vielen Dank nochmal,

    Johanna

    • Offizieller Beitrag

    1.

    Ich meinte mit "0" natürlich "ganz runter" also auf -20dB.


    2.

    Nein nix hervorheben! Nur die anderen Frequenzen runtersetzen. Sonst droht Übersteuerung.


    3.

    Ja...das wäre schön wenn man das "Laute" so einfach los werden würde, indem man oberhalb eines Pegels alles abschneidet. Aber das geht leider gar nicht. Durch "Abschneiden" entstehen weitere Störgeräusche.


    4.

    Der Weg über die Frequenzen in der Richtige. Mach erst mal diesen Teil, dann sehen wir weiter. Schritt 2 wäre, dass man dann mit NOTCH-Filtern (AUDACITY:Effekt-Kerbfilter) nach weiteren stark hervortretenden "Fahrzeug"-Frequenzen in der Aufnahme sucht und dann auch diese herausnimmt. Dazu analysierst Du die Sprachpausen. In denen erfährst du mit welchen Frequenzen das Auto "tönt".


    Sende doch mal 20sek!!!

  • Hallo,


    1. Ja genau, so hatte ich es auch gemeint. Nach Hoch- und Tiefpassfilter ist es leider immer noch zu "verrauscht" vom Motorgeräusch um das Gespräch zu verstehen.


    2. OK, würde es nur ausprobieren für den Fall dass es evtl dann verständlicher ist


    3. Wenn du sagst durch Abschneiden enstehen weitere Störgeräusche - gibt es da dann doch theoretisch eine Möglichkeit dies auszuprobieren? Evtl sind ja die Störgeräusche "besser" wie das laute Fahrtgeräusch


    4. Der Kerbfilter klingt noch nach einer guten Möglichkeit. Da müsste ich mich mal richtig dazu einlesen/informieren, hast du da evtl eine Anleitung? Das Problem dass ich mir dabei vorstelle, ist dass das Motorgeräusch ja nicht konstant das gleiche Geräusch ist, so dern es sich ja ständig ändert. Es ist sogar oft so dass man kaum hört ob Gesprächspausen sind, da das Motogeräusch einfach so laut ist. Aber vielleicht würde ich dann wenigstens Teile davon verstehen.


    Ja ich schicke gerne mal einen Ausschnitt, muss mal einen raussuchen!


    Danke nochmal für deine Tips und Hilfe!

    • Offizieller Beitrag

    Der Kerbfilter ist ein zeitaufwändigs Verfahren. Hierbei wird im Audiomaterial eine bereits hervorstechende Frequenzen testhalber verstärkt (+20db) und gehorcht, ob diese vom Auto oder vom Mesch kommt. Kommt Sie vom Mensch wird sie auf 0db belassen. Kommt sie vom auto wird sie auf -20dB gesenkt. Dabei geht man in 5% oder 10% Schritten voran. Also 200Hz, dann +20HZ=220Hz, dann +22Hz = 240Hz. Das dauert natürlich ewig bis man bei 2000Hz ist.


    Der AUDACITY Kerbfilter ist da nicht sehr hilfreich, weil er keinen Drehknopf für die Frequenzen hat, mit dem man in Echtzeit das laufende Audio anhören könnte.


    Deshalb wäre es gut, wenn Du als nächster Schritt das Hörbespiel reinstelen könntest. Natürlich bitte ein total unbehandeltes!

  • Hallo,


    Vielen Dank für die Erklärung und entschuldige bitte die späte Antwort, ich war die Woche in Urlaub.


    Ich werde heute Abend oder morgen mal ein unbehandeltes Hörbeispiel reinstellen.


    Ok so ungefähr verstehe ich was du meinst. Also du meinst alle anderen Frequenzen auf -20db stellen außer eine und dann schauen ob diese eine Frequenz vom Mensch oder Auto kommt und dann demenstprechend entweder absenken oder verstärken? Und dann das gleiche mit der nächsten Frequenz usw?


    Aber wäre das dann für die gesamte Länge die gleichen Frequenzen die verstärkt bzw abgesenkt werden müssten? Das kann sich ja vermutlich auch immer wieder ändern je nach Stimmlage und Fahrtgeschwindigkeit oder? Und könnte es sein dass trotzdem (zumindest Teile) des Gesprächs und des Autogeräusches auf der gleichen Frequenz liegen?


    LG Johanna

    • Offizieller Beitrag

    Hier wäre nun dringend ein Hörbeispiel nötig, weil ja sonst alle meine Antworten theoretisch sind....


    1.

    Du hast bei einer Autobahnfahrt mit gleichmäßigem Fahrgeräusch natürlich bessere Chancen, dass die gleiche Einstellung überall zu Verbesserungen führt.


    2.

    Ein Gespräch und ein Störgeräusch liegen nie auf "der gleichen Frequenz". Beides benutzt immer einen Frequenzbereich oder bestenfalls sogar mehrere Frequenzbereiche. Und dass bei beiden Signalen alle benutzten Bereiche zufällig übereinstimmen ist unwahrscheinlich. Eigentlich nur dann möglich, wenn Dein Sprecher wie ein fahrendes Auto klingt!


    Die Frage ist immer welchen Aufwand man treiben muss. Mit dem Equalizer bist zu jetzt am Ende. Er ist zu unscharf, um damit auch im Bereich von 400Hz bis 2000Hz zu manipulieren. In diesem Bereich wirst du mit ihm immer auch "Stimme" verlieren. Er schneidet nämlich nicht ein Frequenz heraus, sondern ein breites Band. z.b. der 600Hz-Regler schneidet von 300Hz bis 1200Hz mit einer Spitze bei 600Hz. Du brauchst also den Kerbfilter mit einer hohen Flankensteilheit so dass z.b der 600Hz-Kerbfilter "nur" zwischen 540Hz und 660Hz wirkt.

  • Hallo,


    Vielen Dank nochmal für deine Erklärungen. Ich hatte jetzt endlich Zeit ein Hörbeispiel reinzustellen, 20 Sekunden wie du meintest. Ich habe es online in eine zip datei umgewandlt, ich hoffe es hat alles richtig geklappt.


    Das Problem wird wohl sein, dass öfter die Frequenzen des Autogeräusches variieren werden, je nach Fahrtgeschwindigkeit. Aber vielleicht würde es ja schon reichen ein paar Frequenzen rauszuschneiden, die immer mit dabei sind, um das Gespräch verstehen zu können.

    Liebe Grüße,
    Johanna

    • Offizieller Beitrag

    Oweia.. das ist mal richtig schlechte Qualität. Das Interview ist einfach nicht drauf in dem Signal. Ich fürchte hier wirst Du keine Chance haben. Ich habe eine KI für Störgeräusche drüber laufen lassen, aber auch die kann nichts raushören. Im Anhang findest Du das Ergebnis. Man hört sehr schön, wie sie in den ersten 2 Sekunden lernt und dann das Erlernte anwendet. Aber da bleibt nix übrig hinter dem entfernten Rauschen.


    Das wäre was für einen Computer-Forensiker oder einen Geheimdienst. Die hätten sicherlich Mittel den einen oder anderen Wortfetzen noch rauszuholen. Aber ein ganzes Interview wird das niemals mehr werden.


    entrauscht.zip

  • Schade, trotzdem vielen Dank für deine Hilfe! Aber theoretisch müsste es doch trotzdem (wenn auch sehr zeitaufwendig) mit dem Kerbfilter gehen oder? Welches KI Programm hast du da angewendet? Vielleicht versteht man ja noch Teile des restlichen Gespräches...

    • Offizieller Beitrag

    Nein, man müßte das Interview schon wenigstens wahrnehmen um es zu verbessern. In Deinem Hörbeispiel sind ca. 90% der Sprecherzeit gar nicht enthalten. Nur gelegentlich treten einzelne Wortfetzen über die Hörschwelle. Und was nicht da ist, kann man auch nicht isolieren.


    Du hattest das Mikrofon einfach falsch positioniert. Verwende das nächste Mal ein Ansteckmikro. Hier erreichst Du sofort einen Gesprächsanteil von mehr als 95% (Gespräch zu Störgeräuch). Bei dem aktuellen Material liegst du bei geschätzt unter 1%. Da kann auch der Kerbfilter nix mehr hervorholen.


    Also Interview wiederholen! Und beim nächsten Mal nach eine Minute Aufnahme das Material mal probehören....