O formatach plików audio i kompresji

Dźwięk cyfrowy przechowywany jest w postaci plików dźwiękowych. Istnieje wiele formatów plików audio, ponieważ jest wiele sposobów przechowywania danych o dźwięku. Różnice wynikają z potrzeb jakie mamy - wybór formatu wynika z rodzaju danych oraz zastosowania np. czy jest to muzyka, głosowe nagrania lektorskie czy proste dźwięki.

Ze względu na duże ilości danych jakie wymaga plik zawierający dane audio stosuje się kompresowanie danych (znane w informatyce), które polega na zmniejszeniu ilości danych. Na przykład kilkuminutowy utwór muzyczny nieskompresowany potafi zajmować kilkadziesiąt lub więcej megabajtów, a ten sam poddany skompresji może zajmować kilka megabajtów.

Kompresja stratna i bezstratna

Dane dźwiękowe możemy kompresować na wiele sposobów - istnieje wiele formatów i kodeków. Dzielą się one z grubsza na dwa typy kompresji: bezstratną i stratną. W kontekście danych audio kompresja bezstratna polega na zmniejszeniu objętości pliku dźwiękowego bez straty na jakości, natomiast stratna polega na zmniejszeniu objętości pliku ze stratą na jakości dźwięku. Kompresja stratna jest oczywiście bardziej wydajna i oszczędzić może dużo więcej miejsca, jednak wiąże się z pogorszeniem jakości. Należy jednak wziąć pod uwagę, że jeśli kompresja jest ustawiona w odpowiednim i zbalansowanym stopniu, pogorszenie jakości dźwięku jest nieodczuwalne dla przeciętnego odbiorcy. Warto wiedzieć, że większość treści muzycznych i dźwiękowych dostępnych w Internecie to dane skompresowane właśnie stratnie.

Jak każde dane, dźwięk można poddać kompresji o różnym nasileniu, co wiązać się będzie z większa lub mniejszą stratą na jakości. Im mocniej skompresujemy dane, tym więcej danych stracimy i dźwięk będzie gorszej jakości.

Na etapie produkcyjnym nie używa się danych dźwiękowych skompresowanych stratnie. Plik dźwiękowy poddaje się kompresji dopiero na samym końcu na potrzeby emisji dla odbiorcy końcowego np. na potrzeby Internetu. Ta uniwersalna praktyka jest stosowana w wielu w branżach np. graficznej lub filmowej. Zapewnia najlepszą możliwą jakość.

Nagrania lektorskie a format pliku audio

W przypadku nagrań ludzkiego głosu na potrzeby emisji dobrym wyborem jest kompresja stratna o niskim poziomie kompresji. Oczywiście warto tutaj pamiętać o w/w fakcie, że w trakcie produkcji (np. utworu muzycznego, spotu reklamowego, animacji zawierającej głos lektora) warto użyć nagrania nie poddanego kompresji stratnej.

Porównanie - posłuchaj i porównaj jakość

Wszystkie poniższe pliki zawierają to samo nagranie, ale zapisane w innym formacie:

Format wave - jakość źródłowa (44100 Hz 16 bit mono) 706 kbps - 1,11 MB
Format mp3 - 320 kbps - 521 KB
Format mp3 - 160 kbps - 262 KB
Format mp3 - 64 kbps - 107 KB
Format mp3 - 32 kbps - 56 KB

Czy słyszysz różnicę?

Im mocniejsza kompresja tym jakość staje się gorsza. Jednak zauważalnie jakość spada dopiero przy najniższych wartościach bitrate. W tym przypadku oznacza to, że nagrania ludzkiego głosu można kompresować wydajnie bez odczuwalnego pogorszenia jakości. Sytuacja będzie odmienna w przypadku zapisanej w stereo muzyki. Ta nie daje się tak wydajnie kompresować bez odczuwalnego wpływu na jakość.

W praktyce bardzo często korzysta się z kompresji stratnej - w zależności od zastosowania. Na przykład komunikaty i zapowiedzi telefoniczne wykorzystywane w centralach telefonicznych i urządzeniach telekomunikacyjnych zapisywane i przesyłane są przy użyciu kompresji stratnej, ponieważ zarówno jakość połączenia GSM i jakość dźwięku w słuchawce telefonu są stosunkowo niskie. Wyższa jakość dźwięku odtwarzanej zapowiedzi nie byłaby słyszalna. Kompresja audio pozwala zaoszczędzić zasoby w pamięci urządzenia. Kompresję powszechnie również stosuje się w rozrywkowych usługach internetowych (jak YouTube, Spotify, Deezer, Tidal itd) czy komunikacyjnych (Zoom, Microsoft Teams, Discord, Skype).

Najpopularniejsze formaty audio:

wave - brak kompresji. W przypadku nagrań lektorskich doskonałym wyborem będzie plik o parametrach 44100 Hz 24 bit mono.
mp3 - kompresja STRATNA. Dla nagrania lektorskiego dla odbiorcy końcowego dobrym wyborem będzie 160 kbps przy 44100 Hz mono. Na potrzeby produkcji polecam w/w format wave, a jeśli to niemożliwe to mp3 320 kbps mono.
flac - kompresja BEZSTRATNA. Jest to bardzo dobra alternatywa dla stratnych formatów dźwiękowych, ponieważ jest stosunkowo wydajna. Potrafi zaoszczędzić nawet połowę ilość danych w stosunku do bezstratnej kompresji przy zachowaniu identycznej jakości dźwięku.

W przypadku mojej oferty oferuję najwyższą jakość nagrań lektorskich. Klientom wysyłam nagrania w wybranym formacie, również wave. Zapraszam do kontaktu po bezpłatną wycenę!

O formatach plików audio i kompresji

Kompresja stratna i bezstratna

Nagrania lektorskie a format pliku audio

Porównanie - posłuchaj i porównaj jakość

Format wave - jakość źródłowa (44100 Hz 16 bit mono) 706 kbps - 1,11 MB

Format mp3 - 320 kbps - 521 KB

Format mp3 - 160 kbps - 262 KB

Format mp3 - 64 kbps - 107 KB

Format mp3 - 32 kbps - 56 KB

Czy słyszysz różnicę?

Najpopularniejsze formaty audio: