Übersteuerung und Kratzen aus Sprachdatei entfernen

  • Hallo,


    ich hoffe ich stell diese Frage jetzt nicht doppelt, doch leider konnte ich im Forum nichts passendes finden. Sollte es bereits einen Eintrag hierzu geben, entschuldige ich mich dafür schonmal im Vorfeld.


    Meine Daten: Audacitiy Version 2.1.2, Win 10, Acer Laptop mit Realtek High Definition Audio Soundkarte.


    Mein Problem (bin absoluter Laie und verwende Audacity nur selten, daher bitte ich um Verständnis falls ich mich ungeschickt ausdrücke):
    Ich habe eine Stereo-Aufnahme eines Telefoninterviews bekommen. Also nicht von mir selbst aufgenommen und ich bin mir auch nicht sicher, ob das wirklich Stereo ist. Zwischen beiden Spuren gibt es nur minimale Unterschiede und beide Seiten des Gesprächs sehen in beiden Spuren sehr ähnlich aus. In dieser Aufnahme ist der Fragende klar und laut zu hören, auf der anderen Seite treten bei unwesentlich geringerer Lautstärke aber häufige Übersteuerungen und dadurch Kratzen/Artefakte/Stimmverzerrungen auf (kein Pfeifen oder andere hohe Töne), die jedesmal rein durch ihre Lautstärke einen Stich ins Ohr geben. Ich nehme an, da wurde einfach ein Aufnahmegerät auf Maximum gestellt.


    Was ich bisher versucht habe (auch wenn mir als Total-Laie im Einzelnen nicht klar ist, ob das sinnvoll war bzw. ich keine Ahnung von geeigneten Einstellungen habe): Erst mal normalisiert, dann Leveler und Equalizer ausprobiert. Meist mit den default-Einstellungen. Hat alles nur bedingt was gebracht. Durch den Equalizer wurden die beiden Spuren dann auch noch viel kleiner/leiser (eigtl. logisch?), aber nach Erhöhen der Kopfhörer-Lautstärke waren die Störungen dann trotzdem noch sehr deutlich.
    Dann wollte ich versuchen, ob man die Stimme heraustrennen kann mit den Funktionen von "Vocal Reduction and Isolation" (um so evtl. die Übersteuerung zu umgehen, da evtl. nicht als "Stimme" definiert), dabei ist aber Audacity zum Ende hin aber jedes Mal ausgestiegen, d.h. das Fenster war komplett weg, ich musste Audacity neu starten und die Datei konnte nicht wiederhergestellt werden.


    Für weitere Tipps/Hilfe wäre ich total dankbar, wenn jemand noch eine Möglichkeit sieht. Ich muss mir eine Stunde davon mit dem Kopfhörer antun, um wesentliche Informationen rauszuziehen/zu dolmetschen (die natürlich immer übersteuert sind). So wie es ist macht es meine Ohren kaputt, da ich mir die unverständlichen Stellen auch noch immer wieder und wieder anhören muss. Bei Bedarf schneide ich gerne ein Stück raus und schicke es zur Illustration, um zu zeigen was ich meine.
    Gibt es evtl. auch irgendwelche Tipps, die ich proaktiv dem Aufnehmenden weitergeben könnte? Habe aber leider keine Ahnung welches Equipment da verwendet wird und kann auch nicht fragen, da kein direkter Kontakt möglich ist.


    Vielen, vielen Dank schon im Voraus - Dietlinde

  • Zitat von dietlindems

    (...) und ich bin mir auch nicht sicher, ob das wirklich Stereo ist. Zwischen beiden Spuren gibt es nur minimale Unterschiede und beide Seiten des Gesprächs sehen in beiden Spuren sehr ähnlich aus.


    Definitiv Mono. Aus einem Telefon kann - aus rein technischen Gründen schon - nun mal kein Stereo kommen. Dass das Monosignal auf einer Stereospur aufgenommen wurde, ist ein technischer "Fehler" (eher: Eine vermeidbare Unachtsamkeit) des Interviewers, hat aber weder mit Audacity noch mit dem eigentlichen Problem etwas zu tun. Es vergrößert lediglich die Datei unnötig und eventuell die Bearbeitung der Spur durch die gewählten Effekte (mehr Rechenzeit und -leistung).


    Was mich stutzig macht:
    Du schreibst, dass "beide Seiten des Gesprächs sehen in beiden Spuren sehr ähnlich" aussehen würden. Das halte ich jetzt nicht für besonders kriegsentscheidend zum Thema "kratzende Spitzen", deutet aber möglicherweise die technische Vorgehensweise des Interviewers an. So sollte das Resultat nämlich optimalerweise nicht aussehen. Der Profi nimmt die eigene Stimme auf der einen und den Interviewpartner auf einer anderen Spur auf. Das geht auch im Stereomodus; danach trennt man die Stereospur und stellt beide auf Mono.


    Zitat von dietlindems

    Erst mal normalisiert, dann Leveler und Equalizer ausprobiert. Meist mit den default-Einstellungen. Hat alles nur bedingt was gebracht. Durch den Equalizer wurden die beiden Spuren dann auch noch viel kleiner/leiser (eigtl. logisch?), aber nach Erhöhen der Kopfhörer-Lautstärke waren die Störungen dann trotzdem noch sehr deutlich.


    Das mit dem Leveller dürfte nichts bewirkt haben, das mit dem Equalizer hingegen halte ich für eine gute Idee. Allerdings sind hier "Standard-Einstellungen" fehl am Platze.


    Zitat von dietlindems

    Dann wollte ich versuchen, ob man die Stimme heraustrennen kann mit den Funktionen von "Vocal Reduction and Isolation" (um so evtl. die Übersteuerung zu umgehen, da evtl. nicht als "Stimme" definiert), dabei ist aber Audacity zum Ende hin aber jedes Mal ausgestiegen, d.h. das Fenster war komplett weg, ich musste Audacity neu starten und die Datei konnte nicht wiederhergestellt werden.


    Zu dem Programmausstieg kann ich nichts sagen (kann ich auf die Schnelle nicht reproduzieren), das kann aber u.U. mit der Größe der Datei zu tun haben. Du hattest was von ca. einer Stunde geschrieben; normalerweise sind Musikstücke, die man "voiceless" machen möchte, nicht so lang. Vielleicht hat es damit zu tun, aber das ist derzeit reine Spekulation.
    Im übrigen funktioniert das nur mit Stereodateien, aus denen man einen Mono-Anteil herausrechnen kann, aber das ist hier ja nicht gegeben (eine Stereospur an sich macht noch kein echtes Stereo!).


    Zitat von dietlindems

    Für weitere Tipps/Hilfe wäre ich total dankbar, wenn jemand noch eine Möglichkeit sieht. Ich muss mir eine Stunde davon mit dem Kopfhörer antun, um wesentliche Informationen rauszuziehen/zu dolmetschen (die natürlich immer übersteuert sind).


    Wie bereits erwähnt: Hier kann der Equalizer hilfreich sein.
    Ich würde allerdings vorher mal ein Stück mit so einer scharfen Spitze markieren und eine Frequenzanalyse machen. Dann wird Dir angezeigt, wo - möglicherweise - ein Ausreißer im mittleren Frequenzbereich vorhanden ist. Diese Frequenz (und ggf. Nachbarn) kannst Du dann im Equalizer gezielt "rausziehen".


    Zitat von dietlindems

    In dieser Aufnahme ist der Fragende klar und laut zu hören, auf der anderen Seite treten bei unwesentlich geringerer Lautstärke aber häufige Übersteuerungen und dadurch Kratzen/Artefakte/Stimmverzerrungen auf (kein Pfeifen oder andere hohe Töne), die jedesmal rein durch ihre Lautstärke einen Stich ins Ohr geben. Ich nehme an, da wurde einfach ein Aufnahmegerät auf Maximum gestellt.
    (...)
    Gibt es evtl. auch irgendwelche Tipps, die ich proaktiv dem Aufnehmenden weitergeben könnte? Habe aber leider keine Ahnung welches Equipment da verwendet wird und kann auch nicht fragen, da kein direkter Kontakt möglich ist.


    Riecht für mich auch nach einer Fehlbedienung aus Unwissen / Faulheit / Unaufmerksamkeit. Jedenfalls scheint das ankommende Signal nicht auf dem Aufnahmekanal kontrollgehört worden zu sein, sonst wäre das - eine Stunde lang - aufgefallen und hätte bereits da genervt. Deine Vermutung hinsichtlich des Aufnahmegerätes könnte stimmen.
    Hinzu kommt, dass solche Gespräche heutzutage standardmäßig über sogenannte Voice over IP (VoIP)-Verbindungen geführt werden; auch die "normalen" Anschlüsse werden umgestellt. Der dabei verwendete Codec klingt meist etwas schärfer und wird in den Displays mancher Telefone als "HD" verkauft (was natürlich Quark ist).


    Wie möchtest Du denn "proaktiv" auf den Aufnehmenden zugehen, wenn ...

    Zitat von dietlindems

    kein direkter Kontakt möglich ist

    ?
    Zumal Ratschläge von Laien - so bezeichnest Du Dich zumindest - von der Gegenseite, egal, wie (un)professionell sie agieren mag, meist negativ aufgenommen werden. Das geht hin bis zur Beratungsresistenz. Ich rechne Dir Deinen Willen und die gute Absicht ja hoch an, aber ich bin da eher skeptisch.
    Insbesonders bei diesem Thema müsste man schon mit einem Mindestmaß an technischem Grundwissen über die richtige Vorgehensweise bei Telefoninterviews verfügen, um dann die gegebene Situation zu analysieren und eventuelle Fehler bzw. Verbesserungsmöglichkeiten darin zu identifizieren. Aus meiner Sicht ist das unter den gegebenen Umständen zu komplex und erzeugt im Zweifel mehr böses Blut als dass es wirklich etwas bringt. Das muss anders angegangen werden.

  • Hallo Uli Nobbe,


    vielen Dank für den Input.
    Das mit dem etwas spezifischeren Equaqlizer werd ich mal ausprobieren - auch wenn ich mir da als Laie nicht viel zutraue. Aber vielleicht klappt's ja.


    Wenn ich auch dem "Erzeuger" nicht direkt was weiterleiten bzw. ihm meine Meinung sagen kann werde ich doch zumindest versuchen, den Rat zu professioneller Hilfe durch die "stille Post" zu vermitteln.


    Vielen, vielen Dank noch mal für die ausführliche Antwort und die darin investierte Zeit.

  • Hallo Uli Nobbe,


    Das mit dem etwas spezifischeren Equaqlizer hab ich jetzt mal ausprobiert.
    Ich hoffe ich habe die Frequenzanalyse richtig interpretiert.
    Es gab drei Peaks mit abfallender Höhe von links nach rechts. Ich habe den Bereich mit dem oberen Drittel des ersten Peaks und der Spitze des zweiten Peaks genommen und die Kurve des Equalizers entsprechend angepasst. Der Bereich war 86 - 1000 Hz und -10 bis -36 dB. Es hat ein bisschen was gebracht. Aber die Tonspuren sind jetzt nur noch millimetergroß und ohne alle Lautstärkeregler (auch den des Headsets) auf 100 % gestellt wären sie auch nicht mehr laut genug.
    Ansicht vergrößern hat nichts gebracht, auch nach Auswahl "alles" nichts. Dadurch wird es unmöglich, Fehler exakt zu korrigieren bzw. gute Stellen für einen Wiedereinstieg zu finden wenn ich mal unterbrechen muss. Gibt es dafür evtl. noch einen Rat?


    Noch was: ich bin angemeldet und wollte eigtl. meine 1. Antwort nachträglich ändern (nach dem Equalzer-Versuch). Leider wurde der Beitrag dann nicht gespeichert mit der Begründung "Zugriff verweigert". Das ist mir auch schon bei meiner ersten Frage passiert. Ist das systembedingt oder mach ich was falsch?


    Danke nochmal.

  • Ich habe mal ein Testwort eingesprochen und eine Stelle davon bearbeitet - Screenshots nachfolgend verlinkt.


    * Tonspur 2 vor der Bearbeitung. Das ist zwar nicht die Stelle mit dem höchsten Pegel, aber mit einem markanten Zischlaut. Die der Markierung entsprechende Frequenzanalyse findest Du unter...
    * Frequenzanalyse 2. Die markanteste Stelle ist hier bei 2,7 kHz. Wenn ich die mit dem Equalizer rausziehe, dominiert sie nicht mehr so stark. Das habe ich dann mit dem vorgegebenen Regler bei 2,5 kHz gemacht (die benachbarten Bänder kann man ja ein wenig mit rausziehen, so dass es nicht so hart klingt).


    * Das Ergebnis kannst Du jetzt bei Tonspur 2a sehen. Der markierte Bereich ist kleiner geworden. Logisch, denn ich habe ihm ja jetzt auch seinen elementaren Peak geklaut.
    * Die dazu passende Frequenzanalyse 2a zeigt: Maximalpegel nur noch bei -40 dB @ 3 kHz statt vorher -30 dB, alles etwas ausgeglichener.


    Randnotiz: Das geht natürlich mit der gesamten Tonspur und nicht nur mit einzelnen Abschnitten; ich hatte hier nur den unangenehmsten Laut markiert um die Frequenz zu identifizieren.


    Dass die Tonspur dadurch kleiner wird, hatte ich bereits erwähnt, und damit zu Deiner Frage:


    Zitat von dietlindems

    Aber die Tonspuren sind jetzt nur noch millimetergroß und ohne alle Lautstärkeregler (auch den des Headsets) auf 100 % gestellt wären sie auch nicht mehr laut genug.
    Ansicht vergrößern hat nichts gebracht, auch nach Auswahl "alles" nichts. Dadurch wird es unmöglich, Fehler exakt zu korrigieren bzw. gute Stellen für einen Wiedereinstieg zu finden wenn ich mal unterbrechen muss. Gibt es dafür evtl. noch einen Rat?


    Das mit der Ansicht ändert an der Wiedergabelautstärke natürlich nichts. Eine dünne Tonspur bleibt eine dünne Tonspur.


    Wähle einfach die gesamte Tonspur aus, wähle Effekt > Verstärkung und fertig.


    Tipp: Um das Hören angenehmer zu gestalten, ist der Einsatz des Kompressors hilfreich. Aber das ist eine andere Baustelle, um die wir uns danach kümmern können.


    Zitat von dietlindems

    Noch was: ich bin angemeldet und wollte eigtl. meine 1. Antwort nachträglich ändern (nach dem Equalzer-Versuch). Leider wurde der Beitrag dann nicht gespeichert mit der Begründung "Zugriff verweigert". Das ist mir auch schon bei meiner ersten Frage passiert. Ist das systembedingt oder mach ich was falsch?


    Hier ist es wie in vielen anderen Foren auch: Die mögliche Nachbearbeitung eines abgesendeten Beitrages ist auf eine bestimmte Zeit (z.B. 30 Minuten) begrenzt, danach nicht mehr.
    Ich halte das auch für sinnvoll, weil sonst eine bestehende Konversation u.U. sinnentstellend editiert werden könnte.
    Vielleicht bist Du gerade an diese Zeitgrenze gestoßen.

  • Hallo Uli,


    vielen Dank für die Mühe. Wollte Dir nur schreiben wie die Sache ausgegangen ist.
    Nach Ansicht Deines Beispiels habe ich erkannt, dass meine Herangehensweise richtig war, ich aber bei der Definition des zu entfernenden Bereichs wohl etwas zu "großzügig" rangegangen bin. Nach Einschränken des Bereichs lief es viel besser und ich hatte nach der Verstärkung ein ganz passables Ergebnis (immer im Hinblick auf die schlechte Ausgangsqualität).
    Meine Ohren danken erleichtert und ich habe viel gelernt bei der Sache.
    Toll dass es Euch gibt.


    LG, Dietlinde