Abtastrate (Sample Rate) und Bittiefe (Bit Depth) in der digitalen Audiowelt

In der Welt der digitalen Musikproduktion gibt es viele technische Aspekte, die oft als selbstverständlich hingenommen werden, aber dennoch einen entscheidenden Einfluss auf das Endprodukt haben. Zwei dieser oft übersehenen, aber dennoch kritischen Elemente sind die Samplerate und die Bittiefe. Sie sind die unsichtbaren Architekten, die die Qualität der Musik maßgeblich beeinflussen.
Inhaltsverzeichnis

Wenn man mit der Musikproduktion beginnt, beschäftigt man sich zunächst mit dem Erlernen der DAW, den verschiedenen Effekten wie Equalizer oder Kompressor, dem Aufnehmen, dem Schreiben von MIDI… Aber nur wenige beschäftigen sich mit den Begriffen Samplerate und Bittiefe.

Und dabei sind das zwei so wichtige Aspekte in der digitalen Audiowelt, die nicht wirklich schwer zu verstehen sind – und wenn du sie einmal verstanden hast, wird dir das Leben sehr viel leichter fallen, spätestens beim Exportieren deiner Projekte. Oder beim Importieren von Samples in dein Projekt.

Ein Teil der Schuld liegt bei modernen DAWs wie Ableton Live, die das Konzept von Samplerate (Abtastrate) und Bittiefe so einfach machen, dass sich Produzenten damit gar nicht mehr auseinandersetzen müssen – denn Live konvertiert die Audiodateien automatisch auf die Samplerate des Projekts, ohne darauf hinzuweisen. Bei Pro Tools zum Beispiel muss man die Samples aktiv konvertieren, bevor man sie überhaupt importieren kann.

Um das Konzept zu verstehen, müssen wir uns zunächst den Umwandlungsprozess von analogen Audiosignalen in digitale Audiosignale ansehen.

Was ist digital Audio?

Digitales Audio ist Ton, der in einem digitalen Format aufgezeichnet wurde. Das bedeutet, dass das Audiosignal durch eine Folge von Zahlen dargestellt wird, die von digitalen Geräten wie Computern, digitalen Audioplayern und digitalen Audio-Workstations gespeichert und bearbeitet werden können.

Bei digitalem Audio wird die Schallwelle des Audiosignals in regelmäßigen Abständen gesampelt (aufgenommen) und jedem Sample ein digitaler Wert zugeordnet. Dieser Vorgang wird als Analog-Digital-Wandlung (ADC) bezeichnet.

So werden Schallwellen von analog in digital umgewandelt
So werden Schallwellen von analog in digital umgewandelt

Die Qualität digitaler Audiosignale wird durch zwei Faktoren bestimmt: die Samplerate (wie viele Samples pro Sekunde aufgenommen werden) und die Bittiefe (wie viele Informationen in jedem Sample gespeichert werden).

Passend dazu: ADAT – Alles über die Schnittstelle in digitalen Audiogeräten

Was genau ist die Abtastrate?

Die digitale Abtastrate (Sample Rate) gibt an, wie oft pro Sekunde das analoge Signal aufgenommen wird, um ein digitales Signal zu erzeugen. Je höher die Abtastrate, desto „genauer“ (d. h. häufiger) wird das Signal aufgezeichnet. Allerdings wird auch mehr Speicherplatz benötigt, da mehr Informationen gespeichert werden.

Die Skizze zeigt deutlich den Unterschied einer höheren Samplerate
Die Skizze zeigt deutlich den Unterschied einer höheren Samplerate

Die Samplerate wird in kHz angegeben und kann in der DAW eingestellt werden. Wenn du mehrere Interfaces oder andere digitale Audiogeräte miteinander verbindest, musst du alle Geräte auf die gleiche Samplerate einstellen – die meisten USB- und Thunderbolt-Audio-Interfaces passen ihre Samplerate jedoch automatisch an die der DAW an.

In der Regel sind folgende Sampleraten verfügbar: 44,1 kHz, 48 kHz, 96 kHz, 192 kHz. Diese Zahlen sind nicht zufällig gewählt, sondern haben einen Grund.

44,1 kHz

Diese Samplerate wurde Ende der 1970er Jahre für das Format der Compact Disc (CD) gewählt. Der Grund für diese Wahl ist etwas kompliziert. Sie hängt mit der höchsten Frequenz zusammen, die genau wiedergegeben werden kann (die Nyquist-Frequenz, die der Hälfte der Samplerate entspricht).

Die höchste Frequenz, die die meisten Menschen hören können, liegt bei etwa 20 kHz, so dass eine Samplerate von 40 kHz theoretisch ausreichend wäre. Allerdings wird ein Filter verwendet, um Aliasing zu vermeiden, und dieser Filter ist nicht perfekt – er benötigt eine Übergangsbandbreite. Daher wird 44,1 kHz statt 40 kHz gewählt, um etwas Spielraum für den Filter zu haben.

Die damalige Videotechnologie (die im Mastering-Prozess für CDs verwendet wurde) hatte einen Standard von 13,5 MHz, und 44,1 kHz ist 1/294 dieser Frequenz, was es zu einer praktischen Wahl machte, die den technischen Anforderungen entsprach.

48 kHz

Diese Samplerate wurde zum Standard für Audio in professionellen Videoproduktionen, einschließlich digitalem Fernsehen, digitalem Video, DVDs und digitalem Filmton. Der genaue Grund für die Wahl von 48 kHz ist nicht ganz klar, aber es ist wahrscheinlich, dass es eine höhere Frequenz ist, die noch eine angemessene Menge an Datenspeicherung und Rechenleistung ermöglicht und etwas mehr Raum für Anti-Aliasing-Filter bietet als 44,1 kHz.

96 kHz und 192 kHz

Diese sind einfach Vielfache von 48 kHz und werden in hochauflösenden Audioformaten verwendet. Die Idee dahinter ist, dass höhere Abtastraten höhere Frequenzen reproduzieren können und eine genauere Darstellung des ursprünglichen analogen Signals liefern. Es ist jedoch umstritten, ob diese höheren Frequenzen tatsächlich für den Menschen hörbar sind.

Auch interessant: Die 8 besten Mikrofone für Rapper und Sänger in 2023

Welcher Sample Rate ist der richtige für mich?

Die Wahl der richtigen Abtastrate hängt von verschiedenen Faktoren ab:

  1. 44,1 kHz: Wenn du Musik für CDs produzierst oder deine Aufnahmen hauptsächlich für das Streaming im Internet bestimmt sind, ist 44,1 kHz eine gute Wahl. Dies ist die Standard-Abtastrate für CDs und die meisten Online-Musikvertriebsplattformen.
  2. 48 kHz: Wenn du Audio für Video produzierst, ist 48 kHz die Standard-Abtastrate. Dies ist auch eine gängige Abtastrate für Podcasts und Hörbücher.
  3. 96 kHz oder 192 kHz: Wenn du hochauflösendes Audio produzierst, zum Beispiel für Blu-ray oder spezielle High-End-Audioveröffentlichungen, könntest du eine dieser höheren Abtastraten in Betracht ziehen. Allerdings benötigen Aufnahmen in solchen Formaten so viel Speicher und Rechenleistung, dass es sich für die meisten Anwendungen gar nicht lohnt.
44,1 kHz48 kHz96 kHz192 kHz
100 MB109 MB218 MB436 MB
500 MB545 MB1,09 GB2,18 GB
1 GB1,09 GB2,18GB4,36GB
So groß ist die gleiche Audiodatei in den verschiedenen Sample Rates

Ich empfehle allen Musikproduzenten und Tontechnikern immer in 48kHz zu arbeiten, weil das ein guter Kompromiss zwischen Qualität und Rechenleistung ist. Theoretisch reichen 44,1kHz völlig aus, weil die CD und Spotify & Co. sowieso in 44,1kHz laufen, aber man ist einfach flexibler, weil man später immer noch von 48kHz auf 44,1kHz downsamplen kann – umgekehrt geht das nicht.

Kann man den Unterschied bei höheren Abtastraten hören?

Dies ist in der Audiowelt ein sehr umstrittenes Thema – Tatsache ist, dass unser menschliches Gehör ohnehin nur bis 20 kHz hört und 44,1 kHz dafür völlig ausreichend sind. Höhere Sampleraten können in manchen Fällen bei der Audiobearbeitung von Vorteil sein, aber im fertigen Mix gibt es keinen hörbaren Unterschied zu 44,1 kHz.

Lohnt es sich, höhere Sample Rates zu verwenden?

In bestimmten Fällen kann es sich lohnen, aber ich würde niemandem empfehlen, ein komplettes, großes Projekt in 192 kHz aufzunehmen, da der Speicherplatzbedarf enorm wäre. Aber es gibt bestimmte Fälle, wo dies tatsächlich vom Vorteil sein kann.

Normalerweise geht beim Herunterpitchen eines 44,1 kHz-Samples der größte Teil der hohen Frequenzen des Samples verloren, da oberhalb von 22,1 kHz ohnehin keine Informationen mehr vorhanden sind, die heruntergepitcht werden könnten, um die neue Lücke in den Höhen zu füllen.

Hat das Sample jedoch eine Samplingrate von 96kHz, so enthält es Informationen von bis zu 48kHz – und es bleiben wesentlich mehr hohe Frequenzen erhalten, wenn das Sample heruntergepitcht wird, da diese „ultrahohen“ Frequenzen dann den Bereich von 15-20kHz ausfüllen.

Was ist die Bittiefe (Bit Depth)?

Die Bittiefe gibt an, wie viele mögliche Dynamikwerte jeder der Samples aufnehmen kann. Je höher die Bitrate, desto genauer wird die Dynamik des Songs aufgezeichnet. Sie ist ein Maß für die Auflösung oder Genauigkeit, mit der das ursprüngliche analoge Audiosignal digitalisiert wird.

Der Unterschied zwischen 8 Bit und 16 Bit - eine viel höhere Auflösung
Der Unterschied zwischen 8 Bit und 16 Bit – eine viel höhere Auflösung

In der Praxis sind die gebräuchlichsten Bittiefen in der digitalen Audioaufnahme 16 Bit und 24 Bit.

  • 16 Bit (65.536 Werte): Dies ist die Standard-Bittiefe für CDs und viele digitale Audioformate. Eine Bittiefe von 16 Bit ermöglicht einen theoretischen Dynamikbereich von etwa 96 Dezibel (dB). Das bedeutet, dass das lauteste Signal, das aufgezeichnet werden kann, etwa 96 dB lauter ist als das leiseste hörbare Signal.
  • 24 Bit (16.777.216 Werte): Dies ist die Standard-Bittiefe für professionelle Audioaufnahmen und einige hochauflösende Audioformate. Eine Bittiefe von 24 Bit ermöglicht einen theoretischen Dynamikumfang von etwa 144 dB, was weit über dem Dynamikumfang liegt, den das menschliche Ohr in der Praxis wahrnehmen kann. Das bedeutet, dass mehr Details in den leisen Teilen der Aufnahme erhalten bleiben können, die man vielleicht nicht direkt hört, sondern erst, wenn man die Lautstärke erhöht. Dadurch hat man beim Bearbeiten und Mischen der Aufnahme mehr Spielraum – man muss nicht mehr wie früher „laut“ aufnehmen, weil das Rauschen so gering ist.

Das Problem ist jedoch, dass die digitale Welle nie zu 100 % die Form der analogen Welle haben kann, unabhängig von der Bittiefe. Wenn wir reale Klänge in ein digitales Format umwandeln, versuchen wir, eine gleichmäßige, fließende Schallwelle mit einer Reihe einzelner Werte einzufangen. Aber manchmal ist der genaue Wert, den wir brauchen, nicht verfügbar, also müssen wir auf den nächsten Wert abrunden. Diesen Vorgang nennt man Quantisierung.

So sieht die Quantisierung bei der Umwandlung eines analogen Audiosignals in ein digitales aus
So sieht die Quantisierung bei der Umwandlung eines analogen Audiosignals in ein digitales aus

Durch diese Abrundung wird ein kleines bisschen Zufall in den digitalen Klang eingebracht. Wir hören diese Zufälligkeit als sehr leises Hintergrundgeräusch, ähnlich wie das leise Rauschen, das du in einem ruhigen Raum hören kannst. Dies wird als Grundrauschen bezeichnet.

Manchmal kann die Art und Weise, wie wir den Ton abtasten, sich wiederholende Muster in diesem Rauschen erzeugen, die es bei bestimmten Frequenzen stärker wahrnehmbar machen. Dies wird als korreliertes Rauschen bezeichnet.

Um diese Muster zu vermeiden, können wir bei der Abrundung der Werte eine zusätzliche Zufallsgröße hinzufügen. Dieser Prozess wird Dithering genannt und hilft dabei, das Rauschen gleichmäßiger zu verteilen und weniger auffällig zu machen.

Der Pegel dieses Hintergrundgeräuschs legt den leisesten Ton fest, den wir aufnehmen können – denn unser Signal muss immer lauter als dieser Hintergrundgeräusch sein, damit es sauber bleibt.

Auf der anderen Seite gibt es eine Grenze für den lautesten Ton, den wir aufnehmen können, bevor er zu verzerren beginnt. Dieser Bereich zwischen dem leisesten und dem lautesten Ton ist der zuvor erwähnte Dynamikbereich.

Wann braucht man welche Bittiefe?

24 Bit ist für Aufnahmen sehr praktisch, weil man sich keine Gedanken über Pegel machen muss. Der Dynamikumfang ist so groß und der Noise Floor so niedrig, dass man problemlos mit -15dB aufnehmen kann, weil man später einfach viel Lautstärke hinzufügen kann. Und man stellt sicher, dass das Signal nicht verzerrt wird.

Früher musste man bei 16-Bit-Aufnahmegeräten immer darauf achten, so laut wie möglich aufzunehmen, damit das Grundrauschen nicht hörbar wurde – und dann bestand immer die Gefahr des Übersteuerns. Bei 24 Bit gibt es dieses Problem nicht mehr.

Du solltest also immer in 24 Bit aufnehmen und arbeiten, aber wenn der Song fertig gemastert ist, solltest du den finalen Master in 16 Bit exportieren, da dies der Standard für CDs und Streaming-Dienste ist.

Kann man den Unterschied zwischen 16 Bit und 24 Bit hören?

Nein, man hört den Unterschied nicht, wenn man ein fertig gemastertes Stück hört. Es gibt kaum Musikstücke, die einen größeren Dynamikumfang als 96dB haben (vielleicht Klassik), also macht es sowieso keinen Sinn, einen größeren Dynamikumfang anzubieten.

Fertig produzierte Pop-, Rock-, R&B-, Hip-Hop- und Country-Musik hat in der Regel einen relativ bescheidenen Dynamikumfang – typischerweise um die 10 dB – sodass theoretisch auch 8 Bit ausreichen würden. Dies liegt unter anderem daran, dass die Musik während der Produktion stark komprimiert wird (mit Kompressoren oder Limitern), wodurch der Dynamikumfang des Liedes reduziert wird.

Deshalb arbeiten alle Streaming-Dienste noch mit 16 Bit – und natürlich aus Platzgründen. Der einzige Vorteil von 24 Bit gegenüber 16 Bit ist der größere Dynamikumfang und damit ein geringerer Noise Floor bei der Aufnahme.

Welche Kombination von Samplerate und Bittiefe ist also die beste?

Für Musikproduktionen empfiehlt sich eine Abtastrate von 48 kHz bei einer Bittiefe von 24 Bit, da dies einen guten Kompromiss zwischen Qualität und Dateigröße darstellt. Damit hat man einen sehr großen Dynamikbereich zum Arbeiten und einen nach oben praktisch unbegrenzten Frequenzbereich bis 24 kHz – viel mehr, als wir überhaupt hören können.

Und damit haben wir alle Möglichkeiten, später für alle Medien zu exportieren – und unsere finale Audiodatei, die wir dann auf die Streaming-Plattformen bringen, sollte 44,1 kHz bei 16 Bit haben. Das ist das Format, das Streaming-Dienste und CDs erwarten.

Teile diesen Artikel

Wir recherchieren, testen, prüfen und empfehlen unabhängig die besten Produkte. Wenn du etwas über unsere Links kaufst, erhalten wir ggf. eine Provision.

Weitere Beiträge
Die besten Reverb-Pedale
Gear
Die besten Reverb-Pedale für Gitarristen und Produzenten
Ein Reverb-Pedal kann der Gitarre eine unglaubliche Tiefe verleihen und den Klang enorm bereichern. Egal, ob dein Verstärker bereits einen eingebauten Hall hat oder nicht ...
Read More →
Die besten Chorus-Pedale
Gear
Die 8 besten Chorus-Pedale für Gitarristen und Produzenten
Chorus-Pedale waren in den 80er Jahren besonders beliebt und Legenden wie Kurt Kobain oder John Frusciante machten sie in den 90er Jahren noch populärer. Heute ...
Read More →
Die besten Distortion-Pedale
Gear
Die besten Distortion/Verzerrer Pedale für E-Gitarre
Heute sind Distortion-Pedale beliebter denn je - im digitalen Zeitalter, in dem viele Gitarristen ohne Verstärker oder mit Transistorverstärkern spielen, werden Distortion-Pedale sehr häufig eingesetzt, ...
Read More →
Die besten Laptops für Musikproduktion
Gear
Die 12 besten Laptops für Musikproduktion
Lange Zeit glaubte man, man müsse unbedingt ein Apple-Laptop haben, um unterwegs Musik zu produzieren - das ist längst nicht mehr der Fall. Auch wenn ...
Read More →
Die besten Delay-Pedale
Gear
Die besten Delay-Pedale in 2024
Delay-Pedale gehören zu den beliebtesten Pedalen von Gitarristen - ein Delay-Effekt erzeugt Tiefe und einen atmosphärischen Sound, der mit anderen Mitteln nicht zu erreichen ist. ...
Read More →
Schlagzeug Noten lesen lernen
Uncategorized
Schlagzeug Noten lesen: So geht’s
Schlagzeuger haben ihre eigenen Noten - sie sind besonders wichtig, wenn man Schlagzeug in einer Musikschule lernt. Aber auch für Schlagzeuger, die in vielen verschiedenen ...
Read More →