Beiträge von stephan_g

    Sieh mal nach, ob du für den Soundchip in dem Ding 'nen neueren Treiber bekommen kannst. Das dürfte zwar an der Geschichte mit dem Stereomix nichts ändern (offenbar wirkt die Stummschaltung noch davor), aber dafür läßt sich dann vielleicht wenigstens der Mic-In auch als Line-In betreiben.


    Die Auswahl des Audiogeräts erfolgt unter Einstellungen > Geräte (steht jetzt wahrscheinlich noch jeweils auf den von Windows umgeleiteten Standard-Devices), die Quelle selbst läßt sich dann im Dropdown-Feld in der Pegelregler-Leiste auswählen.


    Wenn du vom Stereomix aufnehmen, dabei aber nichts hören willst, wird ein Workaround herhalten müssen - steck 'nen Kopfhörer oder ein Stereo-Klinkenkabel in die Kopfhörerbuchse.

    Ich denke, die erste Frage beim Thema "Mikrofonwahl für Anfänger" sollte lauten:


    Wo soll's denn rangestöpselt werden?


    Die Ausführung eines vorhandenen Mikrofonanschlusses schränkt die Wahl nämlich schon einmal deutlich ein.


    Bei den an Rechnern meist zu findenden 3,5mm-Monoklinkeneingängen hat man kaum eine Wahl: Ein Mono-Elektret-Mic, geeignet für niedrige Spannungen, sollte es sein. Das läuft mit der bereitgestellten Versorgungsspannung einigermaßen vernünftig und gibt bei entsprechender Konstruktion auch ordentliche Pegel ab. Nur die Maximallautstärke ist etwas eingeschränkt. Ein dynamisches Mic paßt hier schlecht - es stört sich potentiell an der Spannung, ist deutlich leiser (allenfalls was zum direkten Reinsingen o.ä.) und wird meist symmetrisch verkabelt sein und damit bei unsymmetrischem Anschluß Störungen einfangen (BTDT).


    Hat man ein Mischpult o.ä. mit einem symmetrischen Mic-Eingang inklusive 48V-Phantomspeisung zur Verfügung, sieht die Welt etwas anders aus: Sowohl ein hierfür passendes Elektret-Mic (bei entsprechendem Budget auch ein empfindlicheres Großmembran-Mic) als auch ein dynamisches können eingesetzt werden. Hier richtet sich der Mikrofontyp primär nach der Anwendung (Pegel und Rauschabstand, Aufnahmeabstand, Richtcharakteristik, Frequenzgang, ...).


    Und dann gibt es da noch Sachen dazwischen, etwa MD-Recorder mit Stereoklinkeneingängen für passende Stereo-Elektret-Mics (wieder unsymmetrisch wie beim PC).

    Wie ich festgestellt habe, ist der Werte-Anzeigebereich von VU-Meter und Frequenzanalyse gekoppelt, um genau zu sein ist der Minimalwert gleich. Das finde ich aber aus folgendem Grund ungünstig:


    Bei der Frequenzanalyse ergibt sich durch das Binning (effektiv viel kleinere Bandbreite) ein Gewinn an Dynamik! Der liegt bei nicht weniger als 10log(fftsize/2) dB (nagelt mich jetzt nicht auf den Faktor 1/2 fest...), das sind bei einer 16384er FFT schon knackige 39 dB. Das reicht mit 16-Bit-Samples bis -137 dB.


    Außerdem ergibt sich dadurch auch, daß die angezeigte Leistungsdichte bei gegebener RMS-Amplitude vom Signalspektrum abhängt und nur bei Sinussignalen dem Amplitudenwert entspricht, sonst liegt sie drunter - und mit etwas Pech ist in der Frequenzanalyse nichts zu sehen.


    Zum Bleistift:


    Man nehme Minimalpegeleinstellung = -96 dB, dazu 16-Bit-Audio nur mit etwas Dithering-Rauschen. In der auf dB umgestellten Wellenform ist das Signal gut zu sehen, aber in der Frequenzanalyse keine Spur, denn die geht nicht bis ~-130 dBFS runter (sondern nur -96). Man meint, es sei vielleicht irgendwas schiefgelaufen, aber nein, das Ergebnis liegt nur außerhalb des Anzeigebereichs. Und das ist mal richtig blöd und sollte eigentlich niemals nie nicht[tm] vorkommen.


    Um folglich zum Schluß noch den Vorschlaghammer zu schwingen:
    Minimalamplitude Frequenzanalyse := max{eingestellter Minimalpegel - 10log(fftsize/2), min(ermittelte FFT-Werte)} passend abgerundet


    Will heißen, die Untergrenze sollte entweder vom eingestellten Minimalpegel abzüglich FFT-Gewinn oder dem kleinsten von der FFT ausgespuckten Wert bestimmt werden. Die Obergrenze wird ja jetzt schon aus den Werten bestimmt.

    Holla, hier wurden ja inzwischen alle Klarheiten beseitigt ;)


    Nochmal zum Thema dynamisches Mic:
    Nachdem dieses auf dem guten alten Induktionsgesetz basiert, werden hier Membranschwingungen tatsächlich zunächst in Strom und erst über die Schwingspul- und Eingangsimpedanz (in Reihe) in Spannung umgesetzt. Bei typisch 200 Ohm beim Mic und >10 kOhm beim Eingang kann man in guter Näherung von Spannungsanpassung ausgehen. Grundsätzlich könnte man so'n Ding aber auch an einen Stromeingang (Kurzschluß) klemmen, also Stromanpassung... wäre dann aber zum mindesten sehr stark bedämpft und von den Impedanzverhältnissen her etwas ungünstig. Das wäre die Konfig der Wahl für den dynamischen Kopfhörer als Mikrofon (meist für Quellimpedanzen von 0 bis 120 Ohm konstruiert).


    Hysterese ist hier allerdings nicht im Spiel, schließlich wird nichts ummagnetisiert (der Treiber hat einen Permanentmagneten und die Schwingspule ist eh aus Al oder AlCu). Vielmehr sind es Inhomogenität des Magnetfeldes und Verformung der Membran, die beim Schalldruck Grenzen setzen.


    Whatever.

    Ganz einfach: Aussteuerungsanzeige schlichtweg breiter machen, also am rechten Rand ziehen. Dann sollte der Lautstärkekrempel in die nächste Zeile rutschen.


    @Entwickler: Es wäre supertoll, wenn ihr die 3dB-Ticks vielleicht einen Tick früher einblenden könntet (no pun intended). Momentan habe ich so 800-900 px Breite und bei 96 dB Anzeigebereich nur beschriftete Ticks à 6 dB. Es wäre ohne weiteres noch genug Platz, um dazwischen noch unbeschriftete à 3 dB anzuzeigen.

    Kommt i.allg. aufs System an - unter Windows ab Vista können Anwendungen die Samplerate nicht selbst umstellen, sondern diese wird zentral über die Systemsteuerung eingestellt. Bei älteren Fenstern werden die Wünsche der Anwendung an den Treiber übermittelt, und der kann dann damit machen was er will (wenn sonst nichts anderes aktiv ist und die Samplerate tatsächlich von der Hardware unterstützt wird, wird diese dann normalerweise tatsächlich passend eingestellt; bei mehreren Streams unterschiedlicher Samplerate muß irgendein Kompromiß gefunden werden, oft wird dann die höchste verwendet). Bei kleinen Sampleraten wird übrigens oft intern eine Abtastratenwandlung durchgeführt, weil die Hardware es eben doch nicht kann. Meiner Wiedergabekarte hier (eine Envy24HT-Geschichte mit 2 Quarzen) kann ich z.B. minimal 16 kHz entlocken, andere Treiberimplementationen beschränken sich bei ähnlicher Hardware teils auf 32 kHz.

    Bei Mikrofonen wird normalerweise der Feldübertragungsfaktor bei 1 kHz angegeben, soundsoviel mV / Pa bzw. entsprechend dBV / Pa. (Siehe Boré / Peus: Mikrophone, 4. Auflage, im Anhang. Gips als PDF...) 1 Pa wird erreicht bei 94 dB SPL, damit weißt du schon mal die zugehörige Ausgangsspannung bei diesem Pegel.


    Nehmen wir z.B. mal an, wir hätten
    a) ein Großmembran-Mic mit -32 dBV / Pa
    b) ein Kleinmembran-Mic oder Elektret mit -42 dBV / Pa
    c) ein dynamisches Mic mit -54 dBV / Pa,
    ... dann wird a) bei gleicher Lautstärke 10 dB mehr Ausgangspegel liefern als b) und glatte 22 dB mehr als c). Entsprechend weniger dominant werden Rauschen und Störungen des Mikrofoneingangs sein.


    Jedes Mikrofon hat allerdings auch ein gewisses Eigenrauschen. Bei einem dynamischen ist es schlicht thermisches Rauschen bedingt durch die Mikrofonimpedanz (Rauschleistungsdichte 4kT|Z|). Bei einem Exemplar mit Spannungsfolger- oder anderen Verstärkerstufen, also z.B. Kondensator- oder Elektretmic, rauschen diese natürlich auch. Dieses läßt sich bestimmen und mit dem Feldübertragungsfaktor in einen Ersatzgeräuschpegel umrechnen, meist A-bewertet in dB(A) angegeben, schon weil da die Zahlen kleiner sind ;).
    Das ist ganz praktisch, weil man damit quasi weiß, ob einen in einer gewissen Umgebung das Rauschen stört. Wenn man z.B. in einem normalen Wohnraum Aufnahmen machen will, in dem man kaum unter 20 dB(A) Umgebungsgeräuschpegel kommt, wird es ziemlich eagl sein, ob das Mic nun 13 dB(A) oder 7 dB(A) bringt - ganz im Gegensatz zur jeweiligen Preislage.


    Analoges beim Thema maximaler Schallpegel, selbst wenn er nicht direkt durch die Nichtlinearität des eigentlichen Wandlers, sondern durch die Verstärkerstufen begrenzt wird.


    Dazwischen liegt die nutzbare Dynamik des Mikrofons. Diese kann bei hochwertigen Großmembran-Mics über 130 dB betragen, dynamische Exemplare hinken da meist sehr deutlich hinterher.


    Als Beispiel wollen wir mal die beliebte Panasonic-Elektretkapsel WM-61 heranziehen; vermessen z.B. hier. Diese erreicht eine recht gute Empfindlichkeit von ca. -35 dBV/Pa auch noch bei 2 V Versorgungsspannung, wobei allerdings etwas gemogelt wurde, da hier der verbaute FET ab Werk nicht etwa als Sourcefolger, sondern in Sourceschaltung verwendet wird. Das bringt je nach Versorgungsspannung vielleicht 4-5 dB mehr Pegel (sicher keine schlechte Idee bei gurkigen Mikrofoneingängen), geht allerdings auf Kosten von minimal mehr Rauschen und vor allem bald 10 dB weniger Übersteuerungsfestigkeit (Input-IP3 grob geschätzt ca. 152 dB SPL bzw. 161 dB SPL, damit Maximalpegel von ca. 122 bzw. 131 dB, will man die 3. Harmonische unter -60 dBc halten - an sich nicht schlecht, aber bei 10 V Versorgungsspannung gemessen; bei 2 V wird es deutlich schlechter aussehen, nachdem so schon bei ca. 125 / 135 dB offenbar Clipping einsetzt).
    Wenn ich die Rauschmessung bzw. S/N-Spec richtig interpretiert habe, liegt der Ersatzgeräuschpegel bei ca. 31,5 dB(A) - das ist doch ein gewisser Kontrast zu den oben angeführten Werten (die von Großmembran-Mics stammten). Trotzdem, schlägt sich gar nicht so schlecht, das Kapselchen.


    Was dann allerdings handelsübliche Camcorder und anderes Amateur-Videoaufnahmezeug aus solchen Kapseln machen, geht teils auf keine Kuhhaut. Man kann sich ja bei Youtube ein wunderbares Bild machen (Live-Musikaufnahmen sind besonders gut geeignet) - entweder gibt es erst gar keine AGC und der Ton ist völlig übersteuert, oder aber die AGC reagiert viel zu schnell und plättet wirkungsvoll jede Dynamik, um ja den Pegel nicht zuweit unter -10 dBFS abfallen zu lassen. Wer konzipiert solchen Bockmist? Das konnten ja die Leute bei Grundig vor 35 Jahren besser... Und Mithören beim Autofokus durch Übertragung übers Gehäuse habe ich noch gar nicht erwähnt... </rant>

    Zitat von edgar-rft:1270382540

    Da ausserden Integer Zahlenformate nicht null-symmetrisch sind (in Integer Systemen liegt die Null im Bereich der positiven Zahlen, warum das so ist siehe Wikipedia "Binärkomplement") entstehen bei der Umwandlung von unsymmetrischen Integer Formaten in symmetrische Fliesskomma Formate und wieder zurück zwangsläufig Rundungssfehler, weil es in Integer Systemen wegen der "positiven" Null eine positive Zahl weniger als negative Zahlen gibt.


    Aber es wird doch hoffentlich int 0 auf float 0 gemappt, oder? :huh: (Und dann halt die kleinste negative Zahl auf -1. So macht das wohl Foobar2000, weswegen mir Replaygain bei CD-Material stellenweise Track-Peaks von (+)0,999969 statt (-)1,000000 bescheinigt. Mancher Hardlimiter rechnet womöglich auch mit größte positive Zahl = +1.) Es wäre doch auch blödsinnig, immer mit einem Offset von einem halben LSB zu rechnen.


    Was passiert, wenn ich bei Sampleformat 16 Bit PCM einen Effekt anwende - werden die resultierenden Samples als int16 oder float32 gespeichert? Daß eine Aufnahme in 16 Bit auch nur so temporär abgelegt wird, sehe ich schon am Platzbedarf...

    Zitat von edgar-rft:1270382540

    Deshalb gibt es auch bei 16-bit Aufnahmen und 16-bit Export einen Unterschied zwischen "mit Dither" und "ohne Dither". Der Grund liegt darin, dass unsymmetrische Integer Zahlensysteme nicht zur Darstellung null-symmetrischen Audiosignalen geeignet sind.


    Mich interessiert v.a.: Wenn ich eine Aufnahme in 16 Bit PCM habe und diese in WAV 16-Bit abspeichere (ohne Dithering), kommt das ganze dann 1:1 raus? float32 mit seiner 24-Bit-Mantisse müßte dafür doch eigentlich locker fein genug auflösen. Ob die Qualität in Bereichen mit Effekten (Ein-/Ausfaden) optimal ist, interessiert mich dabei nicht wirklich.


    Wäre doch mal fast 'ne Idee für eine Option im Einstellungstab "Qualität", ein Häkchen für:
    if($Zieldatei-Sampleformat == $temp-Sampleformat) {dither_aus();}

    Zitat von edgar-rft:1270382540

    Wenn du meine Privatmeinung zum Thema "Dithering" wissen willst: ich würde das sowieso grundsätzlich ausschalten weil Dithering nur zusätzliches Hintergrundrauschen verursacht. Das darf sich aber jeder selbst aussuchen, deshalb kann das in Audacity eingestellt (oder abgeschaltet) werden.


    So wie jetzt gelöst ist das aber m.E. doof, weil im Standardfall 16 Bit --> 16 Bit unnötig langsam. (Wird beim Export nach 24 / 32 Bit eigentlich auch gedithert? Das wäre erst recht blöd.) Es kommt doch kein normaler Mensch darauf, das Dithering abzuschalten.


    Und natürlich braucht man Dithering, wenn die Bits pro Sample reduziert werden - wie will man sonst korreliertes Quantisierungsrauschen in unkorreliertes überführen? Das ganze läßt sich anhand eines Beispiels mit 8-Bit-Samples ziemlich einfach demonstrieren, wie ich das hier einmal gemacht habe (hat den Vorteil, daß man den Effekt auch leicht "qua Ohrenschein" beurteilen kann). Daß das ganze witzlos ist, wenn ich im Signal schon schönes weißes Rauschen bei -70 dBFS habe und mit 16 Bit abspeichere, ist auch klar. (Analog wird auch kein Mensch bei Export in 24 Bit dithern, weil man beim aktuellen Stand der Technik aufnahmeseitig kaum über 120-130 dB Rauschabstand kommt und eventuelles Quantisierungsrauschen auch wiedergabeseitig im Rauschen unterginge.)

    Ich habe den Eindruck, daß das Exportieren meiner Radio-Mitschnitte eine ganze Ecke schneller geworden ist, seit ich unter Qualität >> Hochwertige Umwandlung das Dithering abgestellt habe.


    Nun werden die allerdings in 16 Bit aufgenommen (portaudio und Windows, grmbl ;-/...) und bearbeitet, und gespeichert wird ebenso in 16 Bit, ergo müßte da nichts gedithert werden.


    Kann das sein oder täusche ich mich da?


    (1.3.11)


    So, hab's gerade mal getestet (Mini-Aufnahme des Grundrauschens, kein Dither vs. shaped), und tatsächlich, das macht 'nen Unterschied. Sieht man in der dB-Ansicht wie der FLAC-Dateigröße. Das sollte aber nicht sein, oder?

    Man öffne ein neues Audacity-Fenster (z.B. 1.3.11, hier unter Windows) und


    a) starte eine Aufnahme (von einer Stereoquelle)


    -oder-


    b) importiere irgendeine (Stereo-)Audiodatei.


    Im Fall b) ergibt sich eine Höhe der angezeigten Tonspur entsprechend 1.2.x.
    Im Fall a) dagegen ist sie sehr viel weniger hoch, und ich ziehe sie dann immer auf.


    Ist diese Inkonsistenz so gewollt?


    A propos Höhe: So manches Mal hätte ich schon einen Reset auf Standardabmessungen gebrauchen können, oder auch die Angleichung der Höhe mehrerer Tonspuren.

    Ein paar Klarheiten lassen sich vielleicht beseitigen, wenn man sich mal Fourier-Synthese und -Analyse zu Gemüte führt. Das ganze führt letztlich zur Fouriertransformation und einer Repräsentation des Zeitsignals im Frequenzbereich. (Man beachte auch die Voraussetzung der Linearität.)


    Eigentlich sind wir ganz gut aufgestellt, wenn es darum geht, eine grobe Vorstellung von den Vorgängen im Frequenzbereich zu erhalten - unser Gehör ist frequenzselektiv. Unsere Frequenz- und Amplitudenskalen freilich sind ziemlich krumm skaliert, nämlich im ersten Fall zuerst linear und dann logarithmisch und im zweiten nur logarithmisch. Das sollte erklären, warum man Spektren bei NF-Messungen üblicherweise doppeltlogarithmisch darstellt. Das ist natürlich nicht umsonst so - so lassen sich einfach viel größere Wertebereiche sinnvoll abdecken. Man vergleiche nur einmal die Tonspur-Darstellung "Wellenform" mit "Wellenform (dB)".

    OP = Operationsverstärker
    Die Implementation realer OPs ist etwas tricky, mit ein paar Faustregeln aber meist recht gut zu bewerkstelligen. Bei sehr eingeschränkten Elektronikkenntnissen würde ich allerdings allenfalls zu komplett fertig konzipierten Bausätzen greifen...


    Was ich mich gerade frage: Gibt es eigentlich einen preisgünstigen fertigen Mic-Pre mit 48V-Phantomspeisung und einstellbarem Gain, der "nur" verstärkt, ohne Röhrenstufen und derlei Brimborium? Unsymmetrischer Ausgang hätte was. Nicht daß man sowas mühselig selber konzipiert und aufbaut, und dann gibt's etwas professionell gemachtes in der Preisklasse Appel+Ei...

    So'n 5532er ist für den Hausgebrauch schon ganz ordentlich in Sachen Rauscharmut (Spannungsrauschen laut Datenblatt typisch 5 nV/sqrt(Hz)) und kostet wenig. Man kann vorne auch noch 'ne rauscharme Differenzstufe dranklöppeln, aber das ist nichts für Anfänger. (Und wenn man schon einen Doppel-OP am Wickel hat, bietet sich eine zweistufige Verstärkerschaltung an.) Deutlich rauschärmere OPs - da gehen nochmal 10-12 dB weniger, wenn die Schaltung drumherum paßt - gehen etwas ins Geld. Mir fallen da z.B. LT1028/1128 ein, oder auch der AD797 (wobei der 'ne Zicke ist, da sollte das Platinenlayout mitsamt Bypass-Cs schon passen; hat aber ein sehr gutes Datenblatt).


    Andere Bauvorschläge gibt's z.B. bei Rod Elliott.

    Hört sich grundsätzlich gar nicht schlecht an, aber dieses breitbandige Rauschen nervt tatsächlich etwas. Bei der Sprachaufnahme waren ja gerade mal 30 dB Dynamik drin. Wenn direkt reingesungen wird, dürfte es ganz OK sein, aber bei größerer Entfernung sehe ich da schwarz.


    Ich fürchte, bei dem Preis hat es nicht mehr für einen ordentlichen Vorverstärker gereicht. Du kannst es ja vielleicht mal mit dem Samson C01U für 'nen Zehner mehr versuchen, das hat in Sachen Rauschen ganz gute Kritiken bekommen...


    Tante EDITh: Ach ja, bringt es was, mit dem Aufnahmepegel zu spielen? Also mal richtig aufreißen?


    Noch ein ganz anderer Tip: FLAC statt WAV ist kleiner und verlustfrei.

    Was ein vernünftiger A/D-Wandler ist, hat heute normalerweise einen Hochpaß auf Digitalebene eingebaut, typisch bei etwa 1 Hz. Hat man sich bei dem Chip in der Hercules (eine CMedia-Geschichte, IIRC) wohl gespart.


    Tja, was wäre dir denn eine vernünftige USB-Soundkarte wert? Beliebt sind z.B. Edirol UA-1EX (ich glaube, die wurde inzwischen von einer UA-1G abgelöst) oder M-Audio Transit. Drunter würde ich nicht gehen. Auch nicht soviel teurer ist eine EMU 0202 USB, aber IIRC hat die nur einen Mono-Mikrofoneingang ohne Phantomspeisung.