Musik im Vordergrund von Gespräch herausnehmen

  • Hallo, wer kann mir helfen?
    Ich habe eine Cassette gefunden, die ca. 1978 aufgenommen wurde. Im Vordergrund hört man sehr laute Musik, im Hintergrund werden Gespräche geführt, die zum Teil deutlich durch die Musik durchtönen, aber leider nicht immer. Es ist wie ein Familienfest aus vergangenen Zeiten, von Generationen vor mir, ich würde den Gesprächston so gerne retten, die Musik jedoch am liebsten in den Hintergrund stellen. Die Aufnahme habe ich bereits als MP3-Format. Habt ihr Tipps oder eine (am besten relativ genaue) Anleitung, wie das zu schaffen ist?
    Ich wäre Euch sehr dankbar, die Gespräche sind ein Schatz, die Musik leider sehr nervenraubend. :)
    Danke im voraus.
    Anke.

  • Zitat von Anke2

    .... Es ist wie ein Familienfest aus vergangenen Zeiten, von Generationen vor mir, ich würde den Gesprächston so gerne retten, die Musik jedoch am liebsten in den Hintergrund stellen. Die Aufnahme habe ich bereits als MP3-Format....


    Ich nehme den 2. Teil deines Beitrags zuerst.


    MP3 ist so ziemlich das schlechteste Ausgangsformat, das es für Audio gibt. Grund ist, das es schon Elemente aus der Aufnahme entfernt hat, damit es so wenig Speicher belegt. Für zukünftige Aufnahmen möglichst immer ein Verlustfreies Format wählen. Dazu gehört nebem dem Format, das Audacity beim Abspeichern des eigenen Projektes verwendet, auch WAV. Dadurch kannst du später die Aufnahme ohne Verluste weiter bearbeiten.


    Zitat von Anke2

    ....Im Vordergrund hört man sehr laute Musik, im Hintergrund werden Gespräche geführt, die zum Teil deutlich durch die Musik durchtönen, aber leider nicht immer...


    Es gibt Möglichkeiten, die Aufnahme zu verbessern und unerwünschte hörbare Elemente zu mindern. Doch das übersteigt die Fähigkeit der günstigen Programme und auch die des bedieners (es sei den, man macht sowas schon viele Jahre oder ist von Beruf Toningineur oder sowas). Eine Anleitung dafür gibt es da leider nicht. Zumindest keine, von der ich mir ein zufriedenstellendes Ergebnis erhoffen würde.


    Die einzige Möglichkeit, da eventuell etwas Besserung reinzubringen, wäre, wenn du etwas mit dem Equilizer in Audacity rumtestest.

  • Hallo Anke,


    Zitat von Anke2

    ... ich würde den Gesprächston so gerne retten, die Musik jedoch am liebsten in den Hintergrund stellen.


    da sehe ich leider wenig bis gar keine Chancen.
    Dein Ausgangsmaterial ist eine einzige Spur, die zudem noch datenreduziert ist (zu mp3 hat Ingmar ja schon was geschrieben; im konkreten Fall wäre wav zwar auch nicht die Weltrettung, aber mp3 macht es - leider - noch schlimmer, als es ist). Hieraus etwas zu extrahieren oder Vordergrund / Hintergrund zu verändern, ist nahezu unmöglich.


    Begründung: Sprache wie auch Musik bestehen aus wechselnden Frequenzen unterschiedlicher Intensität (Lautstärke); dabei ist die menschliche Sprache ein etwas engerer Frequenzbereich als die Musik, aber sie ist ein Bestandteil des musikalischen Frequenzspektrums - und zwar mittendrin. Allein Gesang von Gespräch zu unterschieden, ist - frequenztechnisch - sehr schwer, wenn es sich nicht gerade um außergewöhnliche Tonlagen (Sopran etc.) handelt. Schon beim Mezzosopran bzw. Bariton sehe ich allergrößte Probleme, denn das sprechen die meisten von uns im normalen Umgang miteinander. Und genau da pfeffert der Hase.


    Versuch einer kulinarischen Analogie:
    Dein Wunsch, aus einer Spur (Summe) Vordergrund und Hintergrund neu zu definieren käme dem Versuch gleich, einen Kartoffeleintopf mit Speck - fertig gekocht - mehr nach Speck als nach Kartoffeln schmecken zu lassen. Klar, man könnte Speck hinzufügen, aber kannst Du das bei Deiner Aufnahme auch?
    Nein, Du versuchst, die Kartoffeln in den Hintergrund zu drängen. Und das halte zumindest ich für schlechterdings unmöglich.


    Sorry & Gruß, Uli

  • Zunächst danke ich Euch beiden erst einmal für die netten und hilfreichen Beiträge. Danke!
    Jetzt meine anschließende Frage:
    Das mit dem MP3 -Format wusste ich nicht. Ich arbeite viel mit Fotos und stelle mir nach Eurer Beschreibung vor, das MP3 vermutlich einer JPEG-Komprimierung gleichkommt, von Ton habe ich gar keine Ahnung.
    Allerdings besitze ich auch die alte Cassette noch mit der Aufnahme, also das Original. In welches Format sollte ich die umwandeln, um sie bestmöglichst in Audacity bearbeiten zu können?


    Und Uli, das Beispiel mit der Kartoffelsuppe macht wenig Hoffnung, aber ich bin so ein Mensch, der bei so einer Sache so euphorisch ist und zunächst einmal nichts unversucht lässt. Heißt, wenn ich es will, versuche ich noch möglichst viele Kartoffeln aus der Suppe zu klauben, wenigstens so, dass ich am Ende für mich den Eindruck habe, die Suppe würde mehr nach Speck schmecken. Und die Suppe erst dann mit der guten Gewissheit verlasse, alles dazu getan zu haben, sie speckiger werden zu lassen. :) Ich verstehe trotzdem, was Du meinst.


    Ich wünsche Euch einen schönen Tag und nochmals vielen Dank!
    Anke

  • Hallo Anke,


    da stellst Du interessante Fragen bzw. aus einer guten Perspektive heraus.


    Zitat von Anke2

    Das mit dem MP3 -Format wusste ich nicht. Ich arbeite viel mit Fotos und stelle mir nach Eurer Beschreibung vor, das MP3 vermutlich einer JPEG-Komprimierung gleichkommt, von Ton habe ich gar keine Ahnung.


    Ich ahne, was Du meinst, von daher: Ja. Korrekt aber muss es jedoch "jein" heißen, denn jpeg steht ganz allgemein für ein Kompressionsverfahren, das nicht zwingend verlustbehaftet sein muss, es aber in den meisten Fällen ist.
    Bei Audio ist es nicht anders: Es gibt verlustfreie und verlustbehaftete Kompression; mp3 ist in jedem Fall irreversibel verlustbehaftet.

    Zitat von Anke2

    Allerdings besitze ich auch die alte Cassette noch mit der Aufnahme, also das Original. In welches Format sollte ich die umwandeln, um sie bestmöglichst in Audacity bearbeiten zu können?


    Nutze am besten *.wav (für Spezialisten: PCM), also das originale, nicht verlustbehaftete und nicht komprimierte Format.
    Ich weiß zwar nicht, wie lang die Aufnahme ist und ob es Speicherplatzprobleme geben könnte, aber im allgemeinen stellt das kein Problem dar.


    Zitat von Anke2

    Und Uli, das Beispiel mit der Kartoffelsuppe macht wenig Hoffnung, aber ich bin so ein Mensch, der bei so einer Sache so euphorisch ist und zunächst einmal nichts unversucht lässt. Heißt, wenn ich es will, versuche ich noch möglichst viele Kartoffeln aus der Suppe zu klauben, wenigstens so, dass ich am Ende für mich den Eindruck habe, die Suppe würde mehr nach Speck schmecken. Und die Suppe erst dann mit der guten Gewissheit verlasse, alles dazu getan zu haben, sie speckiger werden zu lassen. :)


    Ich kann Dich sehr gut verstehen. Das mit der Fotografie ist ein schöner Ansatzpunkt - nur, dass ich mit der digitalen Fotografie nicht so viel am Hut habe. Jetzt musst Du Dich in meine fotografische Welt eindenken: Chemisch und, damit es richtig spaßig wird, auch noch schwarz/weiß.
    Angenommen, Du hast ein Bild mit einer Personengruppe, über dem aber ein ärgerlicher grauer Schleier liegt (z.B. Rauch vom nebendran stehenden Grill, was bei der Aufnahme wegen der tief stehenden Sonne so nicht erkennbar war - aber jetzt reflektieren die Rauchteilchen unauslöschbar noch vor und komplett über die Personengruppe hinweg). Der Rauch ist auf dem Foto drauf, nix zu machen.


    Wie man das Problem digital löst, weiß ich nicht. Im Labor hätte ich es vielleicht mit einer besonderen Härte, sprich: Kontrast, probiert. Fakt ist aber: Filtere ich den Rauch weg (digital sollte das ja möglich sein), entferne ich auch einen Aspekt aus der Personengruppe.
    - Deswegen bestehe ich auf schwarz / weiß: Mit Farbe könnte man noch tricksen, aber diese Möglichkeiten haben wir, verglichen mit Deinem Audio, hier vermutlich nicht. -


    Da Sprache und Musik frequenztechnisch nur schwer zu trennen sind, wie ich bereits geschrieben habe, wird es nicht verlustfrei zugehen.
    Nun könntest Du mit dem Equalizer arbeiten, wie Ingmar vorgeschlagen hatte, und erst mal alle Frequenzen jenseits des Sprachbereichs unterdrücken. Klar. Allerdings entfernt das immer noch nicht die Musik aus dem Bereich des gesprochenen Wortes.
    Alternative: Wenn Du ein Teilstück nimmst, in dem nur Musik läuft und keiner spricht und dort die Frequenzen der Musik ermittelst, könntest Du die stärkste Frequenz versuchen zu entfernen. Die Gefahr, dass dabei aber auch der größte Teil der Sprache mit entfernt wird, ist meiner Meinung nach jedoch ziemlich groß.


    Ich sehe hier im Augenblick keinen Ansatzpunkt, wie ich das Problem für mich lösen könnte und kann Dir daher keinen wirklich guten Tipp geben.


    Gruß, Uli

  • Es gibt heute schon Methoden, die weit über die Möglichkeiten einer konventionellen Bearbeitung hinausgehen, die z. B. aus einfacher Filterung oder auch Expandierung bestehen. Natürlich hängt das Ergebnis auch davon ab, welcher Pegelabstand zwischen Nutzsignal und Störgeräusch vorhanden ist. Eine der Möglichkeiten ist beispielsweise Spectral layer von Sony, welches aber recht teuer ist (ca. 400 $). Bis jetzt habe ich auf dem Freeware-Sektor noch nichts derartiges entdeckt, ich glaube aber, dass das nur eine Frage der Zeit ist, dann hat man ein solches Plug-in auch kostenlos zur Verfügung. Es ist ja "nur" Software. Auch in Echtzeit gibt es Möglichkeiten, per DSP-Hardware eine Störtrennung zu bewerkstelligen. Das "Einmal-gemischt-immer-gemischt"-Gesetz hat heutzutage seine Gültigkeit verloren.


    Gruß


    Dieter