Export als WAV 8kHz 16bit PCM

  • Hallo zusammen,


    Ich nutze Audacity 1.2.16 unter Windows. Ich erstelle mir eine neue Monospur 8kHz 16Bit und erzeuge darin Töne und Rauschen Nun exportiere ich das Ergebnis als Wav und das ist nun 22kHz. Warum das?


    Gruß
    Niels

  • Weiss ich nicht, ich habe das gerade unter Windows XP und Audacity 1.2.6 ausprobiert und bei mir geht's. Ich habe allerdings festgestellt, dass der Rauschgenerator aus dem 'Generieren' Menü bei mit immer eine 44100Hz Tonspur erzeugt, egal auf was die Projektrate (links unten) eingestellt ist. Ich muss dann erst die gesamte Tonspur markieren und mit 'Projekt > Quickmix' auf '8000Hz' umrechnen (links vorne in der Tonspur steht dann '8000Hz'). Wenn ich dann die Tonspur als WAV Datei exportiere, habe ich eine WAV Datei mit 8kHz.

  • Hallo zusammen,


    Ich will dieses alte Thema nochmal hochholen. Mit Audacity 1 hatte ich das Ganze irgendwann gut im Griff, dazu gab es in den Exporteinstellungen einen Punkt zur Qualität eines WAV-Exportes. Aber mit Audacity 2.1 komme ich wieder nicht klar. Ich importiere eine 44kHz MP3, mixe sie auf Mono und dann? Projektrate auf 8kHz reicht nicht, irgendwie muss ich wohl erst einmal die Spur auf 8kHz bringen...


    Niels

  • Hallo Niels,


    Zitat von Niels

    Projektrate auf 8kHz reicht nicht, irgendwie muss ich wohl erst einmal die Spur auf 8kHz bringen...


    klicke mal auf den kleinen schwarzen Pfeil im Spurkopf (▼) und wähle dort...

    Code
    Rate > 8000 Hz


    Alles gut?


    Gruß, Uli :cool:

  • Hallo Niels,


    Wenn du ein mp3 einlädst und unten links die Projektrate auf 8000 stellst, dann sollte beim abspeichern als Wave diese auch eine Samplefrequenz von 8000Hz haben.
    Ulis Vorschlag hat den kleinen Haken, das der Ton dann auch ca. 5,5 fach verlangsamt abgespielt wird.
    Preisfrage: Speicherst du immer noch den Ton als Wave ab?


    Gruß Frank

  • Ganz richtig - Frank hat recht, was die Geschwindigkeit betrifft (ist mir auch schon aufgefallen, habe ich aber nicht weiter hinterfragt. Wollte schließlich nicht den gesamten Sinn der Aktion infrage stellen).


    Interessanterweise folgt Frank der Aussage von Markus in der #3 und ich dem Ansatz von Edgar in der #2 - auch wenn sich die Menüführung seither verändert hat.


    Niels hatte ja geschrieben, dass die Veränderung der Projektrate links unten keinen Erfolg bringt.
    Über die erwähnten Exporteinstellungen grübele ich allerdings selber noch - wäre mir neu, dass man da die Samplingfrequenz bestimmen könnte.

  • Zitat von Uli Nobbe:1455368659

    Wollte schließlich nicht den gesamten Sinn der Aktion infrage stellen).

    Och, das ist doch legitim. Das ist genau die Rate, mit der Telefongespräche im ISDN und auch im VoIP bei G.711 und G.729 übertragen werden. Daher wünschen sich viele Telefonanlagen die Wartemusik und ggf. benötigte Ansagen im selben Format, damit sie nicht permanent konvertieren müssen. Zumeist muss noch der Pegel massiv reduziert werden (-15dB). Ich habe die Konvertierung auch schon mit SoX gemacht, aber das ist auch immer ein Befehlszeilengehacke und aktuell habe ich da gerade massives Rauschen nach der Konvertierung. Auch macht es Switch von NCH, allerdings kann man da keine neue Spitenamplitude festlegen und muss auch immer etwas experimentieren.


    Das Anpassen der Projektrate vor dem Import war eine gute Idee, doch leider springt diese beim Import wieder auf die Samplefrequenz der Quelle. Nun habe ich aber noch etwas gefunden: 'Spuren -> Samplefrequenz der Spur ändern'. Meine Windose sagt mir nach dem Export, dass die Datei 128kBit/s hat - das hört sich gut an.


    Zu dem 'alten' Vorgehen habe ich mal eine Doku geschrieben und hier nun angehängt.


    Niels

  • Hallo Niels,


    Zitat


    Das Anpassen der Projektrate vor dem Import war eine gute Idee, doch leider springt diese beim Import wieder auf die Samplefrequenz der Quelle.


    Vor dem Import macht das Anpassen der Rate eigentlich keinen Sinn, vor dem Export dafür umso mehr.


    Zitat


    Meine Windose sagt mir nach dem Export, dass die Datei 128kBit/s hat - das hört sich gut an.


    Für ISDN mit wäre 64Kb/s wohl besser?
    Bei dem erwähnten G.711 würde ich mal Wav mit A-law Encodierung probieren, vielleicht löst das auch andere Probleme?


    Gruß Frank

  • Mag ja sein, dass ich da jetzt aussteige, aber hier werden gerade fröhlich kbps und kHz gewürfelt.
    Klar, es gibt da einen Zusammenhang (auf 8 kHz gewandeltes Stereo-wav im Export = 256 kbps; Mono = logischerweise 128 kbps).


    Das Ziel sind doch die 8 kHz für die Bandbreite in der Telefonübertragung und nicht die ISDN-Datenübertragungsrate - oder habe ich da jetzt etwas verpasst?


    Zitat

    Gespräch in Telefonqualität (etwa 3,1 kHz Bandbreite): 64 kbit/s (ISDN – wobei praktisch keine Techniken der Irrelevanz- und Redundanz-Reduktion („Komprimierung“) angewandt werden.)

    (Quelle: https://de.wikipedia.org/wiki/Daten%C3%BCbertragungsrate)


    Btt: Ich habe es versucht zu reproduzieren wie es Frank und früher auch schon Markus beschrieben haben - klappt bei mir einwandfrei.

  • Zitat von Frank


    Für ISDN mit wäre 64Kb/s wohl besser?
    Bei dem erwähnten G.711 würde ich mal Wav mit A-law Encodierung probieren, vielleicht löst das auch andere Probleme?

    Jo, würde ich auch super finden. Aber ich traue Windows bei der Analyse von WAV-Headern auch nicht weiter, wie ich es kontrollieren kann. Und die Kontrolle ist mäßig. Ich habe die Datei in einen HEX-Editor geladen und versucht anhand von Wikipedia den Formatabschnitt zu analysieren, allerdings passt das nicht wirklich. Ob nun bei mir mit dem Lesen des Artikels und der Dateninterpretation oder mit dem Dateiinhalt lasse ich mal offen ;)
    Mit Dateien von 128kb/s konnte ich auf jeden Fall schon Erfolge erzielen. Aber natürlich wäre A-Law hier ein Traum, dann müsste man vermutlich nicht so die Lautstärke reduzieren und die Wiedergabe wäre u.U. klarer. Jedoch scheinen das auch nicht alle Systeme zu akzeptieren. Und wie exportiere ich in's A-Law?


    Zitat von Uli Nobbe


    Klar, es gibt da einen Zusammenhang (auf 8 kHz gewandeltes Stereo-wav im Export = 256 kbps; Mono = logischerweise 128 kbps).
    Das Ziel sind doch die 8 kHz für die Bandbreite in der Telefonübertragung und nicht die ISDN-Datenübertragungsrate - oder habe ich da jetzt etwas verpasst?

    Tja, genau das ist die Frage. Die Forderung aus der Doku meines aktuellen Patienten sagt: PCM16, 8 kHz, mono. Ich vermute mal, dass man mir das Leben da etwas leichter machen will...


    Zitat von Uli Nobbe


    Btt: Ich habe es versucht zu reproduzieren wie es Frank und früher auch schon Markus beschrieben haben - klappt bei mir einwandfrei.

    Jo, das kann ich ja grundsätzlich bestätigen.


    Niels

  • So, jetzt habe ich mal meine Schritte neu dokumentiert (s.Anhang) und den Import in ein System gewagt, welches laut Handbuch PCM16, 8 kHz, mono verlangt. Leider sagt der Hobel mir, dass das Dateiformat nicht stimmt...


    Niels

  • Wie fast immer sitzt das Problem vor dem PC. In der Doku habe ich 2 Punkte vergessen: 1. das Format anzupassen, 2. die Projektrate anpassen.
    Anbei die aktuelle Doku. Das Ergebnis dieses Vorgehens macht im Test erst einmal einen vernünftigen Eindruck.
    Die Anpassung der Abtastrate der Spur ist in der Tat unerheblich, warum auch immer ich das am Anfang so nicht hinbekommen habe. Diesen Punkt habe ich in der Doku jetzt auch raus gelöscht, da die Doku sonst zu groß für den Anhang geworden wäre. Daher der fehlende Punkt 5.


    Niels

  • Hallo nochmal,


    Schönes Turitorial, wenn auch noch etwas effizienter zu gestalten. Das splitten der Stereospur kannst du eigentlich weglassen, dafür gibt es das Menü "Spuren/Stereospur in Mono umwandeln".
    Das senken der Pegel per Schieberegler im Spurkopf halte ich auch für überflüssig, da es bei späteren Operationen wie "Verstärken" m.M. nicht berücksichtigt wird.
    Den selben Effekt kannst du auch "Normalisieren" erreichen, nur das der Wert -hier -15db- nicht immer neu eingestellt werden muss (wird in der Audacity.cfg dauerhaft eingetragen).
    Der Sinn des Menüs "Spuren/Samplefrequenz der Spur ändern" ist mir allerdings schleierhaft. Es ändert zwar sichtbar die Samplefrequenz, nach dem abspeichern hat die Wave-Datei aber die, die unten links als Projektrate steht.
    Wenn also die Doku "PCM16, 8 kHz, mono" verlangt, einfach unten links die Projektrate auf 8000 stellen und dann als "WAV (Microsoft) signed 16-bit PCM" abspeichern.


    Zitat

    Ich habe die Datei in einen HEX-Editor geladen und versucht anhand von Wikipedia den Formatabschnitt zu analysieren, allerdings passt das nicht wirklich. Ob nun bei mir mit dem Lesen des Artikels und der Dateninterpretation oder mit dem Dateiinhalt lasse ich mal offen ;)


    Eventuell hast du nur den Teil mit der Dateistrukur und dem "LSB" überlesen. Da Microsoft traditionell auf Intel-Prozessoren baut, werden die Werte im Hexeditor byteweise rückwärts gelesen - anders als bei Apple, das ursprünglich auf CPUs von Motorola setzte. Im Apple-Format AIFF kann man die Hexwerte so lesen, wie sei da stehen.
    Als Beispiel mal ein Bildchen mit angehängt.


    Rot gekennzeichnet = Position 0x14=Datenformat der Abtastwerte =0x0100 (rückwärts=0x0001) 1=PCM
    Gelb gekennzeichnet=Position 0x16=Anzahl der Kanäle
    Grün gekennzeichnet=Position 0x18=Samples pro Sekunde je Kanal=0x401F0000(rückwärts ohne führende Nullen=0x1F40)=dezimal 8000
    Blau gekennzeichnet=Position 0x22=Anzahl der Datenbits pro Samplewert=0x10=16


    So sollte es dann auch bei dir aussehen?


    Gruß Frank


    P.S. Das blaue Feld habe ich ein Byte zu früh markiert. :blush:

  • Zitat von Frank

    Schönes Turitorial, wenn auch noch etwas effizienter zu gestalten. Das splitten der Stereospur kannst du eigentlich weglassen, dafür gibt es das Menü "Spuren/Stereospur in Mono umwandeln".

    Das ist aus der Historie aus der V1 geboren, Danke für den Hinweis zur Optimierung!


    Zitat von Frank

    Das senken der Pegel per Schieberegler im Spurkopf halte ich auch für überflüssig, da es bei späteren Operationen wie "Verstärken" m.M. nicht berücksichtigt wird.

    Das ist erforderlich, wenn man wie ich die Spuren mischt, ansonsten werden die dabei übersteuert, wobei 4-6dB reichen. Das habe ich mal aus einem anderen Tutorial für die V1 übernommen.


    Zitat von Frank

    Der Sinn des Menüs "Spuren/Samplefrequenz der Spur ändern" ist mir allerdings schleierhaft. Es ändert zwar sichtbar die Samplefrequenz, nach dem abspeichern hat die Wave-Datei aber die, die unten links als Projektrate steht.

    Jo, habe ich ja auch oben geschrieben. Das war ein Schritt, den ich getan hatte als ich (warum auch immer) nicht weiter kam. ich habe ihn jetzt bewusst für meine Kollegen drin gelassen, dann ist man optisch einfach beruhigt, dass auch da keine 44kHz mer stehen ;)


    Zitat von Frank

    Eventuell hast du nur den Teil mit der Dateistrukur und dem "LSB" überlesen. Da Microsoft traditionell auf Intel-Prozessoren baut, werden die Werte im Hexeditor byteweise rückwärts gelesen - anders als bei Apple, das ursprünglich auf CPUs von Motorola setzte. Im Apple-Format AIFF kann man die Hexwerte so lesen, wie sei da stehen.


    Rot gekennzeichnet = Position 0x14=Datenformat der Abtastwerte =0x0100 (rückwärts=0x0001) 1=PCM
    Gelb gekennzeichnet=Position 0x16=Anzahl der Kanäle
    Grün gekennzeichnet=Position 0x18=Samples pro Sekunde je Kanal=0x401F0000(rückwärts ohne führende Nullen=0x1F40)=dezimal 8000
    Blau gekennzeichnet=Position 0x22=Anzahl der Datenbits pro Samplewert=0x10=16

    Super, Danke! Das mit dem LSB hatte ich tatsächlich erst im 2. Schritt gelesen, primär war ich aber mit den Positionsangaben meines Ultraedit in's Schlingern geraten und habe mich zwischen den nebeneinander stehenden Dezimal- und Hex-Postionsangaben verirrt. Aber Klasse, dass Du das nochmal so schön aufgearbeitet hast, damit ist es echt einfach.


    Anbei mal die optimierte Doku.


    Niels