Posts by Midimaster

    Naja, weil das über die Vorgehensweise entscheidet. Einen Algorithmus zu schreiben lohnt nur, wenn man "per Hand" deutlich länger braucht, als den Algo zu formulieren und zu testen. Sagen wir es dauert von Hand 10 Stunden, dann bist Du mit einem Free-Lancer, der Dir das für 120,oo EUR macht besser beraten, als einen Algo zu programmieren, der dann 500,oo EUR kostet. Deshalb auch die Frage, ob Geld kein Rolle dabei spielt. Oder ob eben keine Kosten dabei entstehen sollen.


    Möglicherweise musst Du damit ins englische Forum. Bei männlich/weiblich im Wechsel hast Du gute Chancen einen bereits fertigen Erkennungs-Algo zu finden, der sowas kann.


    Ich würde es wahrscheinlich für mich so machen, das ich es bei unter 10Std tatsächlich anhöre und ständig markiere und entferne. Weil auch die Recherche schon mehr Zeit kosten kann als das manuelle Löschen. Bei 100Std Audio-Material sähe die vorgehensweise schon wieder anders aus.


    Kannst Du programmieren? Schau mal hier: https://cloud.google.com/speec…/multiple-languages?hl=de

    Schwer zu sagen bei so wenig Information...

    Sind die beiden Stimmen ineinander, oder immer hintereinander in der Aufnahme?

    Wieviele Stunden Material sind es insgesamt?

    sind die beiden Stimmen beide männlich oder gemischt?

    Sind deutliche Redepausen zwischen den Sprachen?

    Ist es ein kommerzieller Anlass, warum Du es trennen willst?

    Steht Geld zur Verfügung?

    Hast Du die Rechte an den Dateien?

    Kannst Du einen kurzen Ausschnitt (ca 5min) mit mehreren Wechseln als MP3 exportieren und hier als Dateianhang hochladen?

    Regel mal auch an der Wiedergabelautstärke rum. Möglicherweise verwendest Du in AUDACITY als "Aufnahmegerät"...


    ...irgend einen Eintrag mit dem Zusatz "loopback". Das solltest Du dann ändern. Versuche auch mal in AUDACITY statt der WASAPI-Treiber nur mit dem MME-Treiber zu arbeiten

    Die BEHRINGER XENYX ...USB-Mixer haben ein "seltsames" Verhalten. Der Knopf "2TRK/USB TO MAIN" darf nicht gedrückt sein. Sonst steht das Interface in Windows nicht zur Verfügung. Beginne Deine Tests in AUDACITY mit dem 1. Textfenster und wähle MME-Treiber. Stelle dann im 2.Textfenster (das Recordingdevice) ein: irgendwas mit USB ohne "loopback". 3. Textfenster kann "STEREO" sein. 4. Textfenster (Audio-Ausgabe) entweder auf die Lautsprecher oder auch auf das "USB-....". In diesem Fall muss am BEHRINGER ein Aktivmonitor am CONTROL-OUT angeschlossen sein, oder ein Kopfhörer benutzt werden.


    Mit ASIO hat das alles nix zu tun.

    vorher:

    Sollte der gewünschte Bereich nicht gesamt auf den Bildschirm passen, kann du vorher mit dem Werkzeug "Lupe" (Zoomwerkzeug) den Darstellungbereich ändern. Wähle zuerst die Lupe, dann klicke mit der rechten Maus im Sekundentakt so oft in das Audio, bis zu es ausreichend sehen kannst. Denke abschließend daran wieder auf das Werkzeug das aussieht wie ein "I" (Auswahlwerkzeug) zurückzuschalten.


    auswählen:

    Wenn das Werzeug, das aussieht wie ein "I" (Auswahlwerkzeug) aktiv ist:

    Im Sample-Fenster einfach bei gedrückter Maus über den gewünschten Bereich streifen. Das markiert diesen Bereich als "Auswahl".

    Jetzt kannst Du im Menü über "DATEI -EXPORT - AUSGEWÄHLTES AUDIO" nur diesen Teilbereich speichern.

    AUFNAHME

    Wenn die Sprachdatei schon starkes Rauschen enthält, wäre der erste Schritt zu versuchen die Aufnahme in besserer Qualität zu wiederholen. Du sparst dir damit viel Ärger bei der Nachbearbeitung. Wähle am Diktiergerät die höchstmögliche Qualitätsstufe. Auch mit der Distanz Mund zu Diktiergerät solltest du experimentieren.


    LAUTSTÄRKE

    In Audacity importiert, kannst Du dann die Lautstärke sehr leicht hochsetzen.

    Nach der Aufnahme kannst du dann die gesamte Spur als "Auswahl" markieren (Doppelklick in die Samples) und jetzt im Menü auf "EFFEKT - NORMALISIEREN" gehen. Als "Spitzenamplitude" wählst Du "-3dB". Damit ist das Audio jetzt genauso laut wie Standard-MP3s immer sind.


    RAUSCHEN

    Mit der Rauschentfernung kenne ich mich leider nicht aus. Es ist halt immer wichtig um "EFFEKTE" zu benutzen, dass man vorher die Spur als "Auswahl" markiert hat.


    EXPORTIEREN

    Exportieren geht eigentlich immer in Audacity. Ich habe bisher keine Situation erlebt, wo dieser Menü-Eintrag de-aktiviert war . Beschreib mal dein Problem genauer.

    Thema Lautstärke

    Da gibt es mehre Möglichkeiten. Leider schreibst Du nicht, wie "laut" die Samples in den Spuren aussehen. Grundsätzlich wäre es zunächst wichtig, das das aufgenommene Material eine Mindestlautstärke mitbringt. Das ist gegeben, wenn die Sample-Spitzen wenigstens mal den Wert 0.25 erreichen.

    Nach der Aufnahme kannst du dann die gesamte Spur als "Auswahl" markieren (Doppelklick in die Samples) und jetzt im Menü auf "EFFEKT - NORMALISIEREN" gehen. Als "Spitzenamplitude" wählst Du "-3dB". Damit ist das Audio jetzt genauso laut wie Standard-MP3s.


    Wenn das Ausgangsmaterial unter 0.25 laut ist sind Qualitätseinbußen zu hören. Du kannst natürlich auch die Normalisierung durchführen. Entscheide einfach nachher ob das Material brauchbar klingt.

    Ich glaube ich habe einen Bug in Audacity gefunden, wollte aber vorher hier sicherstellen, dass es nicht einfach mein Bedienfehler ist. Ich speichere meine MONO-Mehrspur-Aufnahmen als OGG-Dateien. Wenn ich sie dann in einer folgenden Sitzung wieder öffne, sind die beiden obersten MONO-Spuren zu einer STEREO-Spur zusammengefasst. Was mache ich falsch? Hat vielleicht jemand schon mal was ähnliches beobachtet? Meine Version ist 2.3.3. (gestern noch mal aktualisiert.) Wenn mein Musikerkollege meine Datei in seinem(Audacity (Version 2.1.3) öffnet, dann hat er dort wie erwartet die 2 MONO-Spuren.