Digitalizace analogových záznamů

Rozdíl mezi analogovým a digitálním záznamem

Nejprve musíme poznat rozdíl mezi způsobem uložení analogových a digitálních dat. Analogová data se uchovávají na základě převedení do nějakého fyzikálního jevu. Digitální data jsou ale přesně popsaná pomocí číselných hodnot. Při každém použití analogových dat se fyzikální signál zhoršuje. Dochází ke zhoršení kvality záznamu. Naopak digitální data zůstávají pořád stejnými čísly.
Základní princip uvedu na příkladě. První obrázek (Obr.1) ukazuje analogový záznam zvuku jako část grafu funkce sinus. Obrázky (Obr.2) a (Obr.3) ukazují zkreslování signálu po několikanásobném použití dat.

Obr.1

Obr.2

Obr.3

Digitalizace analogového signálu

Digitalizací analogových dat myslíme převod signálu do podoby čísel. Pro vysvětlení uvedu opět příklad (Obr.4). Graf funkce sinus rozdělíme na mnoho dílků a každý dílek změříme a zapíšeme jeho hodnotu číselně. Výsledná tabulka čísel už bude dále neměnná v čase.

Obr.4

K tomu, abychom co nejvěrněji zachytili podobu analogového záznamu potřebujeme velké množství těchto dílků a proto velké množství dat. Právě toto omezení neumožňovalo rozvoj digitalizace ve velké míře (počítače neměly dostatečnou výkonovou ani kapacitní sílu). Nejjednodušší je digitalizace textu a záznam statického obrazu, poté zvuku a nejsložitější je digitalizace video záznamu.

Digitalizace textu

Ukládání textu (jednotlivých znaků) v počítači se řídí podle standardu ASCII (American Standard Code for Information Interchange). ASCII standard zavádí tabulku znaků indexovanou čísly. Původní tabulka ASCII využívala pro každý znak 7 bitů (128 znaků). Prvních 32 znaků je tzv. řídících. Sem patří znaky NULL, CR, LF, BELL, TAB, ... Zbylé znaky jsou znaky anglické abecedy (malé i velké), čísla, interpunkce a různé symboly.
Postupem doby došlo k rozšíření tabulky o extended část. Ke každému znaku se přidal osmý bit, který tabulku rozšířil o dalších 128 znaků. Tyto znaky jsou využity pro lokalizační tabulky jednotlivých zemí.
Pro českou abecedu je standardním rozšířením kódování iso-8859-2. Bohužel firma Microsoft používá ve Windows nekompatibilní tabulku cp1250.
Nejnovějším způsobem kódování textu je kódování Unicode UTF16. Tato tabulka má pro znak vyhrazeno 16 bitů a proto může obsáhnout 65536 znaků. Prvních 256 je uloženo podle standardu iso-8859-1 (západní Evropa), další znaky pokrývají všechny dosud známé tabulky. Přechod na Unicode je celkem složitý a kvůli tomu probíhá pozvolně.
Na ukázku uvádím základní část tabulky ASCII. Pokud chcete vyvolat některý znak z tabulky, stačí držet klávesu <Alt> a zadat decimálně jeho hodnotu na numerické klávesnici.
ascii
Abychom nemuseli text do počítače opisovat ručně vznikla technologie zvaná OCR (Optical Character Recognition). OCR slouží k rozpoznání textů v obrazových datech, z toho vyplívá, že můžeme naskenovat list text do obrázku, a potom z tohoto obrázku extrahovat čistý text pomocí nějakého OCR programu. Technologie OCR je založena na vzorech (matrixích), které popisují tvar jednotlivých znaků pomocí matice nul a jedniček. Tyto vzory se potom vyhledávájí v obrazových datech. Rozvíjí se také rozpoznávání ručně psaných textů a to hlavně kvůli PDA přístrojům s dotykovými displeji.
Nejnovější OCR software (např. gocr, nebo FineReader) umožňujě nejen rozpoznávání znaků anglické abecedy ale i jiných abeced například s diakritikou.

Digitalizace statického obrazu

Obraz se rozdělí na základní jednotky - pixely. Právě počet pixelů udává kvalitu výsledné digitální podoby obrazu. Každý pixel má číselně stanovenou barvu. Počet barev v obrazu se nazývá barevná hloubka. Počet barev se neustále zvyšuje (souvisí to s vývojem zobrazovacích zařízení). Základními hloubkami jsou v dnešní době 16, 24, 32, 48 bitů na pixel. Tyto režimy jsou označované jako High nebo True Color. Stále používaný Grayscale režim může zobrazit 256 odstínů šedé.
Barvy se nejčastěji ukládájí v RGB (Red-Green-Blue) formátu. Každé číslo určuje obsah jednotlivé barvy a při reprezentaci dojde ke smíchání v určitou barvu. Stále nejčastěji se používá 24 bitová hloubka. Ta na každou barvu poskytuje 1 byte (číslo od 0 do 255). RGB formát se zapisuje hexadecimálně a uvozuje znakem #. Např.: #FFFFFF - bílá, #000000 - černá, #008000 - tmavě zelená.
Převod obrazu do digitální podoby umožňují skenery a fotoaparáty. Jejich výkon se určuje právě tím, jakého jsou schopny dosáhnout rozlišení (u fotoaparátů se udává v Megapixelech) a barevné hloubky.
Obrazová data se ukládají v různých obrazových formátech. Nejvěrnějším formátem je formát TIFF, nebo BMP. Obrazová data můžeme i komprimovat a to bezeztrátově pomocí algoritmů GIF nebo PNG, nebo ztrátově pomocí algoritmu JPEG.

Digitalizace zvuku

Tento způsob se příliš nepoužívá, protože zvuková a hudební data už v jiné než digitální podobě těžko najdeme. O tento jev se velmi mnoho zasloužily disky CD-DA (Compact disk Digital audio).
AD převodník najdeme na všech zvukových kartách a při použití správného softwaru můžeme nahrávat do počítače zvuk z mikrofonu nebo Line-In vstupu (třeba z Hi-Fi přehrávače).
Digitální data jsou na CD-DA ve formátu WAV ve frekvenci 44.1 KHz a velikostí čísla 16 bitů. Tento záznam je velmi věrný, přesto se rozšiřuje i záznam 48 KHz na 32 bit. Zvuk můžeme i komprimovat a to ztrátově pomocí algoritmů MPEG3 nebo OGG. MP3 je zatížený patenty, OGG je OpenSource a dosahuje i lepšího výkonu.

Digitalizace videozáznamu

Digitalizace videozáznamů se rozšiřuje až v poslední době, jelikož obrovské toky dat zvládají pouze velmi výkonné počítače. Pro střih videa existují speciální (často profesionální) softwarové balíky, které obsahují i hardwarové AD převodníky. K nejznámějším patří software Pinnacle. Vývoj střihu videa jde neustále kupředu. Kvalita záznamů neustále roste.
Rozlišení obyčejných video záznamů ve formátech DivX, Xvid se pohybuje mezi 560x315 až 640x360 pixelů. Rozlišení DVD videa je asi 720x576. Počet snímků za sekundu se pohybuje mezi 25 až 30 snímky.

Copyleft - Adam Jasco Siska 2006