Tajemství digitálního zvuku:Odhaleno!
Pokud jde o zvuk v našich videích, většina z nás stačí připojit mikrofon a stisknout tlačítko nahrávání.
Digitální zvuk obsahuje více než klikaté čáry na časové ose. Lepší pochopení procesu vám pomůže nahrát a upravit lepší zvuk s každým projektem. Je čas se ponořit a rozluštit digitální zvukový kód. Slibuji, že matematiku omezím na minimum.
Podle čísel
Jak je zvuk přenášen do vašeho fotoaparátu nebo počítače, je digitalizován, což je proces, který převádí zvuky, které slyšíme, na řetězec jedniček a nul. Při přehrávání počítač znovu sestaví číslice a převede je na něco, co slyšíme. Magie, že? Ve skutečnosti je to více matematika než magie. Abychom porozuměli matematice, musíme nejprve znát několik klíčových frází:vzorkovací frekvenci a bitovou hloubku. V digitálním videu je příchozí zvuk vzorkován 48 000krát za sekundu (zkráceně 48 kHz) – něco jako snímek zvuku v daném okamžiku. Vzorkováním 48 000krát za sekundu máme jistotu velmi přesného zobrazení našeho zvuku. Pro srovnání, CD zvuk je vzorkován při 44,1 kHz. Existují některé efektní matematické výpočty – běžně označované jako Nyquistův teorém – které vysvětlují vzorkovací frekvenci.
Jednoduchá verze vypadá takto:pro přesnou reprodukci zvuku musíte samplovat dvojnásobnou rychlostí oproti jeho nejvyšší výšce. Protože se lidský sluch obecně považuje za frekvenci 20 až 20 000 Hz, měli bychom vzorkovat alespoň 40 000krát za sekundu. Vzorkovací frekvence 48 kHz poskytuje toto a další.
Pokud vám v hlavě neplave příliš mnoho informací, dovolte mi to trochu zkomplikovat (zamýšlená slovní hříčka). Každý vzorek zvuku má 16bitovou hloubku. Představte si řetězec jedniček a nul dlouhý 16 číslic. Se 16 bity existuje 65 536 možných gradací, které představují objem každého vzorku. Pro každou sekundu zvuku je tedy odebráno 48 000 vzorků, každý s více než 65 000 variantami. To jistě stačí k rekonstrukci čistého a čistého zvuku pro vaše video. Zatímco zvuk pro digitální video převyšuje kvalitu zvuku CD, při profesionálním záznamu zvuku se používají ještě vyšší vzorkovací frekvence a bitové hloubky. Nové HD-DVD a Blu-ray disky používají kodek Dolby Digital Plus, který podporuje 7.1 kanálů se vzorkovací frekvencí až 96 kHz s 24bitovou hloubkou. Audio svět se neustále mění!
Udělejte to správně
Jakkoli dobrý je zvuk digitálního videa, existují praktické limity. Například digitální zvuk se velmi snadno přetíží nebo zkreslí. V dobách analogových pásek jste mohli na měřičích jít trochu "za nulu" a zvuk by zůstal nedotčen. Jakmile je v digitálním světě všech 16 bitů nastaveno na „1“, není kam jít. Jakákoli hlasitost za tímto bodem je drasticky zkreslená. Digitální zkreslení není jemné bzučení nebo neostrý zvuk, který získáte s analogovým zařízením; je to drsný, ošklivý zvuk, který na svém soundtracku rozhodně nechcete. Některé videokamery mají automatické řízení zisku nebo AGC. Kompromisem je zvuk, který automaticky mění hlasitost, snižuje hlasité zvuky nebo zvyšuje hlasitost tichých zvuků, a dokonce i klimatizaci a další zvuky přivádí na stejnou úroveň. Pokud má vaše videokamera manuální úrovně zvuku, naučte se během nahrávání číst a sledovat měřiče zvuku.
Manuální nastavení zvuku vám umožní dostat do kamery optimální signál, ale také otevřít dveře potenciálnímu zkreslení. Pokud používáte mixér, ujistěte se, že úrovně mikrofonu jsou silné, ale ne příliš silné. Při připojování mixážního pultu ke kameře otestujte úroveň zvuku tím, že se váš talent hlasitě zasměje nebo promluví svým nejsilnějším hlasem. Použijte to jako maximální úroveň a neměňte ji. Vrátíte se s konzistentním, čistým zvukem, který lze snadno upravit v příspěvku.
Velký tlak
16bitový, 48kHz stereo digitální zvuk je asi 11 MB za minutu. To je docela statná velikost souboru, zejména pro hudbu nebo dialogy na delších projektech. Chcete-li ušetřit místo na disku, můžete být v pokušení použít komprimovaný formát souboru, jako je MP3, AAC nebo WMA. Přestože většina editačního softwaru podporuje různé komprimované formáty, měli byste tomuto pokušení odolat. Komprimovaný zvuk je skvělý pro distribuci přes internet nebo pro načtení do vašeho oblíbeného hudebního přehrávače, ale neodpovídá standardu profesionálního videa.
Všechny formáty komprimovaného zvuku používají něco, čemu se říká percepční kódování. Aby bylo dosaženo jejich dramatického zmenšení velikosti, percepční kodéry analyzují zvuk a rozhodují, které části zvuku mohou být vyhozeny, na základě myšlenky, že lidské ucho není schopno slyšet velmi vysoké a velmi nízké frekvence. Porovnejte původní skladbu z CD s komprimovanou verzí a uslyšíte snížené výšky, ochablé basy a obecnou divnost uprostřed. Dalším tajemstvím komprimovaného zvuku je rozdělení bitové rychlosti. Stereo stopa potřebuje přibližně dvojnásobnou bitovou rychlost než mono stopa.
Takže vaše 128kbps MP3 jsou ve skutečnosti dva 64kbps kanály. I když to může znít dobře v metru nebo v autě, video projekt přehrávaný na domácím kině rychle odhalí kompresní artefakty ve zvuku. Pokud musíte ve svých projektech používat komprimovaný zvuk, použijte nejvyšší praktickou bitovou rychlost.
Se vším, co bylo řečeno, existují dobré důvody pro použití komprimovaného zvuku ve vašich projektech. Například mnoho prodejců hudby s výkupem nabízí své skladby ke stažení. Pokud jste našli perfektní trať online a potřebujete ji ještě dnes, kupte si ji. Jen si uvědomte, že obchodujete s kvalitou pro pohodlí. Další ideální aplikací je vyprávění nebo voice-overy. S několika telefonními hovory a e-mailem nebo dvěma si můžete najmout profesionálního hlasatele, který nahraje mluvený komentář pro váš další projekt. Skript pošlete e-mailem spolu s případnými poznámkami; zaznamenají skript, převedou soubor na MP3 a pošlou vám jej e-mailem. V kombinaci s trochou hudby je mono stopa pouze pro hlas zakódovaná rychlostí nad 128 kb/s téměř nerozeznatelná od nekomprimované verze.
Záhada vyřešena
Byly to docela technické věci, ale teď už víte, jak ze svého zvuku vytěžit maximum. Stručně řečeno, zachyťte čistý a hlasitý zvuk při nastavení nejvyšší kvality. Používejte komprimovaný zvuk pouze v případě potřeby a vaše video projekty budou znít nejlépe na jakémkoli systému přehrávání.
Přispívající redaktor Hal Robertson je producent digitálních médií a technologický konzultant.
[Sidebar:Bits and Pieces]
Z nějakého důvodu je mnoho videokamer nastaveno z výroby na 12bitový, 32kHz zvuk. Proč? Přiznám se, že nevím. I když je tato rychlost nahrávání v pořádku pro Billyho narozeninovou oslavu, není ideální pro projekty vyššího profilu. Nastavení 16bitového záznamu, 48 kHz vaší videokamery je lepší než kvalita CD a dokonale odpovídá výstupu na DVD. Nižší nastavení je zhruba kvalita FM rádia a bude vyžadovat převzorkování – buď ve vašem editačním systému, nebo v samostatném audio programu – pro správný výstup. Zkontrolujte nastavení fotoaparátu a podle toho jej upravte.