O formatach plików audio i kompresji

Dźwięk cyfrowy przechowywany jest w postaci plików dźwiękowych. Istnieje wiele formatów plików audio, ponieważ jest wiele sposobów przechowywania danych o dźwięku. Różnice wynikają z potrzeb jakie mamy - wybór formatu wynika z rodzaju danych oraz zastosowania np. czy jest to muzyka, głosowe nagrania lektorskie czy proste dźwięki.

Ze względu na duże ilości danych jakie wymaga plik zawierający dane audio stosuje się kompresowanie danych (znane w informatyce), które polega na zmniejszeniu ilości danych. Na przykład kilkuminutowy utwór muzyczny nieskompresowany potafi zajmować kilkadziesiąt lub więcej megabajtów, a ten sam poddany skompresji może zajmować kilka megabajtów.

Kompresja stratna i bezstratna

Dane dźwiękowe możemy kompresować na wiele sposobów - istnieje wiele formatów i kodeków. Dzielą się one z grubsza na dwa typy kompresji: bezstratną i stratną. W kontekście danych audio kompresja bezstratna polega na zmniejszeniu objętości pliku dźwiękowego bez straty na jakości, natomiast stratna polega na zmniejszeniu objętości pliku ze stratą na jakości dźwięku. Kompresja stratna jest oczywiście bardziej wydajna i oszczędzić może dużo więcej miejsca, jednak wiąże się z pogorszeniem jakości. Należy jednak wziąć pod uwagę, że jeśli kompresja jest ustawiona w odpowiednim i zbalansowanym stopniu, pogorszenie jakości dźwięku jest nieodczuwalne dla przeciętnego odbiorcy. Warto wiedzieć, że większość treści muzycznych i dźwiękowych dostępnych w Internecie to dane skompresowane właśnie stratnie.

Jak każde dane, dźwięk można poddać kompresji o różnym nasileniu, co wiązać się będzie z większa lub mniejszą stratą na jakości. Im mocniej skompresujemy dane, tym więcej danych stracimy i dźwięk będzie gorszej jakości.

Na etapie produkcyjnym nie używa się danych dźwiękowych skompresowanych stratnie. Plik dźwiękowy poddaje się kompresji dopiero na samym końcu na potrzeby emisji dla odbiorcy końcowego np. na potrzeby Internetu. Ta uniwersalna praktyka jest stosowana w wielu w branżach np. graficznej lub filmowej. Zapewnia najlepszą możliwą jakość.

Nagrania lektorskie a format pliku audio

W przypadku nagrań ludzkiego głosu na potrzeby emisji dobrym wyborem jest kompresja stratna o niskim poziomie kompresji. Oczywiście warto tutaj pamiętać o w/w fakcie, że w trakcie produkcji (np. utworu muzycznego, spotu reklamowego, animacji zawierającej głos lektora) warto użyć nagrania nie poddanego kompresji stratnej.

Porównanie - posłuchaj i porównaj jakość

Wszystkie poniższe pliki zawierają to samo nagranie, ale zapisane w innym formacie:

Czy słyszysz różnicę?

Im mocniejsza kompresja tym jakość staje się gorsza. Jednak zauważalnie jakość spada dopiero przy najniższych wartościach bitrate. W tym przypadku oznacza to, że nagrania ludzkiego głosu można kompresować wydajnie bez odczuwalnego pogorszenia jakości. Sytuacja będzie odmienna w przypadku zapisanej w stereo muzyki. Ta nie daje się tak wydajnie kompresować bez odczuwalnego wpływu na jakość.

W praktyce bardzo często korzysta się z kompresji stratnej - w zależności od zastosowania. Na przykład komunikaty i zapowiedzi telefoniczne wykorzystywane w centralach telefonicznych i urządzeniach telekomunikacyjnych zapisywane i przesyłane są przy użyciu kompresji stratnej, ponieważ zarówno jakość połączenia GSM i jakość dźwięku w słuchawce telefonu są stosunkowo niskie. Wyższa jakość dźwięku odtwarzanej zapowiedzi nie byłaby słyszalna. Kompresja audio pozwala zaoszczędzić zasoby w pamięci urządzenia. Kompresję powszechnie również stosuje się w rozrywkowych usługach internetowych (jak YouTube, Spotify, Deezer, Tidal itd) czy komunikacyjnych (Zoom, Microsoft Teams, Discord, Skype).

Najpopularniejsze formaty audio:

W przypadku mojej oferty oferuję najwyższą jakość nagrań lektorskich. Klientom wysyłam nagrania w wybranym formacie, również wave. Zapraszam do kontaktu po bezpłatną wycenę!