Formaty audio: rodzaje, cel, różnice

09.04.2019

Formaty audio to typy plików przechowujących cyfrowe dane audio w systemie komputerowym. Dane audio bitmapy (z wyjątkiem metadanych) nazywane są formatem kodowania audio i mogą być nieskompresowane lub skompresowane. Kompresja służy do zmniejszania rozmiaru pliku, co często łączy się z utratą jakości dźwięku. Dźwięk może być również nieprzetworzonym strumieniem bitów w formacie kodowania dźwięku, ale zwykle jest osadzony w formacie danych dźwiękowych z określoną warstwą pamięci.

formaty audio

Czym one są?

Plik audio to zbiór informacji, który składa się z danych dotyczących częstotliwości i amplitudy dźwięku, zapisanych do późniejszego odtwarzania.

Formaty audio mogą pełnić rolę kontenera dla surowych danych, a także korzystać z kodeków audio. Często te pojęcia są zdezorientowane i zdezorientowane.

Kodek koduje i dekoduje surowe dane audio, podczas gdy zakodowane dane są zwykle przechowywane w pliku kontenera. Chociaż większość formatów plików audio obsługuje tylko jeden typ danych kodowania audio (utworzonych za pomocą kodera audio), format kontenera multimedialnego (na przykład Matroska lub AVI) może obsługiwać kilka typów danych audio i wideo.

Odmiany wielkości i jakości

Formaty plików audio można podzielić na następujące grupy:

1. Nieskompresowane - takie jak WAV, AIFF, AU lub surowy PCM bez nagłówków.

2. Formaty z bezstratną kompresją - na przykład FLAC, AudioMonkey (rozszerzenie pliku .ape), WavPack (rozszerzenie pliku .wv), TTA, ATRAC AdvancedLossless, ALAC (rozszerzenie pliku .m4a), MPEG-4 SLS, MPEG- 4 ALS, MPEG-4 DST, WindowsMediaAudioLossless (bezstratny WMA) i skrócony (SHN).

3. Formaty ze stratną kompresją - na przykład Opus, MP3, Vorbis, Musepack, AAC, ATRAC i Windows Media Audio Lossy (skompresowany WMA).

formaty plików audio

Typ podstawowy

Jednym z głównych nieskompresowanych formatów audio jest LPCM. Jego rdzeń jest typem PCM i jest podobny do Digital Audio (format audio CD). Jest to typ najczęściej używany przez interfejsy API niskiego poziomu i konwertery cyfrowo-analogowe. Chociaż LPCM może być przechowywany na komputerze jako surowy format audio, zwykle znajduje się w pliku Windows WAV lub w pliku .aiff na macOS.

WAV i AIFF

Format dźwięku cyfrowego Format AIFF jest oparty na formacie wymiany plików (IFF), a format WAV oparty jest na podobnym rodzaju pliku wymiany zasobów (RIFF). WAV i AIFF są zaprojektowane do przechowywania szerokiej gamy formatów audio, zarówno bezstratnych, jak i stratnych. Dodają po prostu mały nagłówek zawierający metadane przed komponentem audio, aby wskazać format audio (na przykład LPCM z określoną częstotliwością próbkowania, głębokością bitową, numerami sekwencji i liczbą kanałów). Ponieważ WAV i AIFF są szeroko obsługiwane i mogą przechowywać LPCM, są one odpowiednimi formatami plików do przechowywania i archiwizowania oryginalnego nagrania.

format ogg

Nowa generacja

BWF (Broadcast Wave Format) to standardowy format audio stworzony przez European Broadcasting Union jako następca WAV. Ma wiele ulepszeń, w tym możliwość przechowywania bardziej wiarygodnych metadanych w pliku. Jest to główny format nagrywania stosowany w wielu profesjonalnych stacjach roboczych w branży telewizyjnej i filmowej. Pliki BWF zawierają standaryzowany znacznik czasu, który ułatwia synchronizację dźwięku z pojedynczym elementem obrazu. Autonomiczne wielościeżkowe AETA, Sound Devices, Zaxcom, HHB Communications Ltd, rejestratory Fostex, Nagra, Aaton i TASCAM zawsze stosują BWF jako preferowany format.

Dźwięk z kompresją i bez niej

Ten rodzaj danych zapisuje dane w mniejszym woluminie bez utraty informacji. Oryginalne dane można odtworzyć z tej wersji.

Nieskompresowane formaty audio kodują dźwięk i ciszę z taką samą liczbą bitów na jednostkę czasu. Kodowanie minut absolutnej ciszy tworzy plik o tym samym rozmiarze co minuty muzyki. Jednak w skompresowanym formacie muzyka będzie zajmować mniejszy plik niż oryginalne nagranie, a cisza nie zajmie prawie żadnej przestrzeni.

format mp3

Formaty plików audio tego typu obejmują FLAC, WavPack, AudioMonkey, ALAC (Apple Lossless). Zapewniają współczynnik kompresji około 2: 1 (to znaczy, że pliki zajmują połowę przestrzeni PCM). Rozwój w bezstratnych formatach kompresji ma na celu skrócenie czasu przetwarzania przy zachowaniu dobrej jakości dźwięku.

Lossy skompresowany format audio

Pozwala to na dalszą redukcję rozmiaru pliku, usuwanie części informacji audio i upraszczanie danych. To oczywiście prowadzi do tego, że jakość formatów audio staje się znacznie gorsza. Używa różnych metod (często za pomocą psychoakustyki), aby usunąć części dźwięku, które najmniej wpływają na postrzeganą jakość i minimalizują ilość słyszalnego hałasu dodawanego podczas procesu kompresji. Popularny format MP3 jest chyba najbardziej znanym przykładem. Ponadto AAC, który można znaleźć w iTunesMusicStore, jest również szeroko rozpowszechniony. Większość formatów oferuje inny zakres. współczynnik kompresji zwykle mierzone w przepływności. Im niższa prędkość, tym mniejszy plik i większa utrata jakości.

cyfrowy format audio

Jakie formaty są obecnie znane?

.3GP to format kontenera multimedialnego, który może zawierać własne formaty AMR, AMR-WB lub AMR-WB +, a także niektóre wersje otwarte.

.AAC (Advanced Audio Coding) - w oparciu o standardy MPEG-2 i MPEG-4. Pliki AAC są zwykle kontenerami ADTS lub ADIF.

.AAX (Audible.com) to format audiobooka, który jest plikiem M4B ze zmienną przepływnością (zapewniającą wysoką jakość), zaszyfrowaną przy użyciu DRM. MPB zawiera kodowane audio AAC lub ALAC w kontenerze MPEG-4.

.AFF jest standardowym formatem plików audio używanym przez Apple. Można go uznać za odpowiednik WAV.

.AMR (AMR-NB) to rodzaj dźwięku wykorzystywany głównie do nagrywania mowy.

.APE (Ashland Monkey's) - format audio z kompresją bez utraty jakości.

.M4A to dźwięk MPEG-4 używany przez firmę Apple do niechronionej muzyki pobranej ze sklepu iTunes Music Store. Dźwięk w pliku M4A jest zwykle kodowany za pomocą AAC, chociaż ALAC może być również używany bez utraty jakości.

.M4P to wersja AAC firmy Apple z zastrzeżonym zarządzaniem prawami cyfrowymi opracowanym przez firmę Apple do użytku w muzyce pobranej ze sklepu iTunes Music Store.

.MMF - Widok audio Samsunga użyty w dzwonku. Został opracowany przez Yamaha i jest formatem danych multimedialnych.

. MP3 Layer III Audio w formacie .MP3. Jest to najpopularniejszy typ pliku dźwiękowego, który jest obecnie używany. Znany również jako MPEG-1 lub MPEG-2, jest to specyficzny format kodowania dźwięku cyfrowego. Używa formy stratnej kompresji danych dla informacje o kodowaniu stosowanie niedokładnych przybliżeń i odrzucanie częściowych danych. Wszystko to ma na celu zmniejszenie rozmiaru plików, zwykle 10 razy, w porównaniu do CD. Jednocześnie jakość dźwięku jest porównywalna z nieskompresowaną. W porównaniu do jakości dźwięku cyfrowego CD, jakość kompresji MP3 zwykle sięga 75-95%. Tak więc pliki tego typu są w zakresie od 1/4 do 1/20 rozmiaru oryginalnego strumienia cyfrowego audio. Jest to ważne, aby zapewnić transfer i przechowywanie plików, szczególnie w naszych czasach, kiedy wymiana informacji jest bardzo rozpowszechniona. Podstawą tego porównania jest cyfrowy format audio CD, który wymaga 1411200 bps. Powszechnie używanym ustawieniem kodowania MP3 jest CBR 128 kb / s, co daje plik 1/11 (= 9%) rozmiaru oryginalnego pliku jakości CD, czyli z kompresją 91%.

Bezstratna kompresja MP3 działa, zmniejszając (lub przybliżając) dokładność pewnych części ciągłego dźwięku, które są uważane za niedostępne dla słuchowej rozdzielczości większości ludzi. Ta metoda jest powszechnie określana jako kodowanie percepcyjne lub "psychoakustyka". Używa modeli psychoakustycznych, aby odrzucić lub zmniejszyć dokładność elementów, które są mniej słyszalne dla ludzkiego słuchu, a następnie rejestruje pozostałe informacje w skuteczny sposób.

najlepszy format audio

.MPC (wcześniej znany jako MPEGplus, MPEG + lub MP +) to kodek audio open source specjalnie zoptymalizowany pod kątem przezroczystej kompresji stereo / audio z szybkością bitową 160-180 Kb / s.

Format .OGG, .OGA, MOGG to wolny typ otwartego kontenera, który obsługuje wiele innych typów, z których najpopularniejszym jest format audio Vorbis. Oferuje kompresję podobną do MP3, ale mniej popularną. VJGG (Multi-Track-Single-Logical-StreamOgg-Vorbis) jest wielokanałowym lub wielościeżkowym formatem OGG.

.WAV to standardowy format plików audio używany głównie na komputerach z systemem Windows. Zwykle służy do przechowywania nieskompresowanych (PCM) plików audio o jakości CD, co oznacza, że ​​mogą być duże - około 10 MB na minutę. Pliki te mogą również zawierać dane zakodowane za pomocą różnych kodeków, aby zmniejszyć rozmiar (na przykład, przesłać do formatu GSM lub MP3). Pliki WAV wykorzystują strukturę RIFF. Ten format najlepiej zachowuje jakość plików.

.WMA jest formatem Microsoft Windows Media Audio. Zaprojektowany z funkcją zarządzania prawami cyfrowymi (DRM) w celu ochrony przed kopiowaniem. Był on wcześniej dystrybuowany tak szeroko, jak format OGG lub MP3.

.WV to format stworzony dla wideo HTML5.

Do audiobooków

.AOT Audible.com to kontener audiobook o niskiej przepływności z DRM zawierającym kodowanie audio jako kodek mowy MP3 lub ACELP.

.M4B to rozszerzenie audiobooka / podcastu z kodowaniem AAC lub ALAC w kontenerze MPEG-4. Oba formaty mogą zawierać metadane, w tym znaczniki rozdziałów, obrazy i hiperłącza. Ponadto M4B umożliwia zakładki (pamiętając o ostatniej pozycji słuchania), podczas gdy M4A tego nie robi.

Zaprojektowany do określonego celu.

.ACT to skompresowany format audio ADPCM do 8 kb / s. Nagrywa z większości chińskich odtwarzaczy MP3 i MP4 oraz dyktafonów.

.AU to standardowy format plików dźwiękowych używany przez firmę Sun, Unix i Java. Dźwięk w plikach AU może mieć formę PCM lub skompresowany przy użyciu kodeków μ-law, a-law lub G729.

.AWB (AMR-WB) - dźwięk używany głównie do mowy, podobny do specyfikacji ITU-T G.722.2.

.DCT - jest używany przez oprogramowanie NCH. Jest to zmienny format kodeków przeznaczony do dyktowania. Ma informacje o nagłówkach dyktowania i może być zaszyfrowane (zgodnie z wymogami prawa dotyczącego prywatności w medycynie). Można również powiedzieć, że jest to zastrzeżony format oprogramowania NCH.

.DSS - Pliki Olympus DSS są zastrzeżonymi formatami Olympus. To jest dość stary i zły kodek. GSM lub MP3, z reguły, jest preferowane, jeśli mogą być używane przez rejestrator. Umożliwia to przechowywanie dodatkowych danych w nagłówku pliku.

.DVF jest zastrzeżonym, skompresowanym formatem plików dźwiękowych Sony, powszechnie używanym przez dyktafony tej firmy.

.GSM - przeznaczony do użytku w telefonii w Europie. To najlepszy format dźwięku dla głosu o jakości dźwięku w telefonie. Dobry kompromis między rozmiarem pliku a jakością. Warto również zauważyć, że pliki WAV mogą czasami być kodowane przy użyciu kodeku GSM.

.MSV jest zastrzeżonym formatem Sony dla skompresowanych plików głosowych Memory Stick. płyty CD w formacie audio

Formaty internetowe

.FLAC - format pliku dla Bezpłatny Lossless Audio Codec, bezstratny kodek kompresji dźwięku.

.IKLAX to wielościeżkowy format dźwięku cyfrowego, który umożliwia wykonywanie różnych czynności na danych muzycznych, na przykład podczas miksowania i komponowania woluminów.

.IVS jest prawnie zastrzeżoną wersją Digital Rights Management opracowaną przez firmę 3D Solar UK Ltd do użytku w muzyce pobranej ze sklepu muzycznego Tronme, a także do interaktywnej muzyki i odtwarzaczy wideo.

.OPUS (Internet Engineering Task Force) to format kompresji dźwięku stratnej jakości opracowany przez grupę roboczą Internet Engineering Task Force (IETF) i zaprojektowany specjalnie dla interaktywnych aplikacji czasu rzeczywistego w Internecie. Prezentowany jako typ otwarty, standaryzowany za pomocą RFC 6716, jego implementacja referencyjna jest dostarczana zgodnie z licencją BSD dla 3 sekcji.

.RA, .RM - format Real Audio, zaprojektowany do przesyłania strumieniowego audio przez Internet. W tym samym czasie .RA pozwala na przechowywanie plików w offline na komputerze ze wszystkimi danymi audio zawartymi w samym pliku. Programy do formatów audio tego typu są obecnie uważane za przestarzałe.

Najrzadsze

.RAW - Surowy plik może zawierać dźwięk w dowolnym formacie, ale jest zwykle używany z danymi audio PCM. Jest rzadko używany, z wyjątkiem testów technicznych.

.SLN jest zatwierdzonym formatem liniowym PCM używanym przez Asterisk. Przed wersją v.10 standardowe typy audio były 16-bitowe Signed Linea.

.Vox - najczęściej używa kodeku Dialogic ADPCM (Adaptive Differential Pulse Code Modulation). Podobnie jak inne formaty ADPCM, kompresuje dane do 4 bitów. Pliki w formacie Vox są jak pliki wave, z tym, że nie zawierają informacji o samym pliku, więc formaty audio mogą się różnić. Aby to zrobić, musisz najpierw określić częstotliwość próbkowania kodeka i liczbę kanałów.