Tabiiy ovozlar multimediada WAVE (tolqin) tarzida belgilanadi. Ovozlarni kompyuterda saqlash uchun asosan raqamli formatga ogiriladi.
Raqamli audioformat – raqamli ovoz yozish va uni saqlashda ovozli malumotlarni taqdim etish formati.
Audiofayl – ovozning amplituda va chastotasi haqidagi malumotlardan iborat kompyuter fayli.
Audio malumotlarni MB saqlash, izlash va chiqarishda muhim masalalardan biri malumot hajmi hisoblanadi. 11 kGs diskretlash chastotasida va amplitudaning sakkiz bosqichli yozuvida 1 minut ovoz 66 Kbayt xotira talab qiladi. 44 kGs va 16 bit stereo standartda 16 marta koproq xotira talab qiladi. Ya’ni 1 minut WAVE ovozni saqlash uchun 10 Mbayt joy talab qilinadi.
Hozirga kelib ovoz malumotlarini siqadigan audiokodek usullar rivojlanib bormoqda. Dunyo bozorlarida kompressiya/dekompressiya apparat usullarini ishlatadigan ovoz kartalari koproq uchramoqda.
Mashhur audiokodeklar:
• MPEG-1 Layer III (MP3) — kompyuter texnikasida va raqamli ovoz eshittirish qurilmalarida foydalaniladigan audio yozuv kodeki.
• Advanced Audio Codec (AAC) — H.264 (AVC) videokodek bilan birga onlayn videoda qollaniladigan MP3 ga alternativ bolgan kodek.
• Ogg Vorbis (OGG) — kompyuter oyinlarda va fayl almashish tarmoqlarida musiqani uzatish uchun keng ishlatiladigan erkin kodek
• Adaptive multi rate (AMR) — odam ovozining mobil telefonlar va boshqa mobil qurilmalardagi yozuvi.
• G.723.1 — IP-telefoniya ilovalari uchun asosiy kodeklardan biri
• Internet Low Bitrate Codec (iLBC) —IP-telefoniya (xususan, Skype va Google Talk) uchun mashhur bolgan erkin kodek.
Audio malumotlarni siqish (kompressiya) keragidan ortiq statik va psixoakustik signallarni qisqartirish evaziga raqamli oqimning tezligini kamaytirish jarayonini ozida ifodalaydi.
Yoqotishsiz siqish
Audio malumotlarni keragidan kop statikasi evaziga qisqartirish usuli yoqotishsiz siqish deyiladi. Bunday siqish usuli audio signallarning ozining xossalarini hisobga olishga asoslangan.
Bunday ozgartirish usulining qollashni muhim shartlaridan quyidagilarni keltirish mumkin:
• Dastlabki signalni buzmasdan tiklash imkoniyati
• Tez hisoblash algoritmi
Yoqotishlik siqish
Audio malumotlarni yoqotish bilan siqish insonning ovozlarni eshitish qobiliyatini mukammal emasligiga asoslanadi.
Ba’zi hollarda odamning balan ovoz oldida past ovozlarni anglashga qodir emasligini niqoblash effekti deyiladi. Bu xususiyatdan keragidan kop psixoakustik malumotlarni qisqartish algoritmlarida foydalanilgan.
Niqoblash effekti ikkita guruhga bolinishi mumkin:
• Chastotali niqoblash
• Vaqt boyicha niqoblash
Agar analog signalda uning amplitudasini emas, qiymatining ozidan oldingisiga nisbatan ozgarishini kodlashtirilsa, razryadlar soni ancha kamayadi.
Quyida audio malumotlarni siqish dekoderlari ba’zilari bilan tanishib chiqadigan bolsak.
Delta-modulyatsiya: juda ham sodda yondashuv, ba’zan nutqni kodlashtirish uchun ishlatiladi. Unda bir zaryadli kvantlash usuli ishlatiladi. Usulda keyingi qiymat oldingisi bilan aproksimatsiya qilinadi.
MPEG-audio:
Chastotalar diskretlashtirilgan – 32, 44.1, 48kGs (yoki yarmi); qiymatlar freymlarga joylashtiriladi (384/576/1152 freym qiymatlari) va keyin freymlarga ishlov beriladi.
32 ta filtr, har biri diskretlash chastotasining 1/64 polosasi kengligida
Siqilgan potok tezligi (MPEG-1 Layer 3) – 32-320 Kbit/s oraligida
128 Kbit/s tezlikdan boshlab ovoz sifati juda yaxshi
MPEG Layer I: eskirdi
MPEG Layer II (MP2): raqamli radio va televidenie uchun
MPEG Layer III (MP3): kompyuter / internet ilovalar uchun
Malumotlar bazasidan audio malumotlarni chiqarib olish uchun quyidagi usullardan foydalaniladi.
Meta malumotlar asosida chiqarib olish. Ovoz malumotiga qoshimcha atributlarni qoshish: masalan, nutq manbai kim, sana, yozuv uzunligi, kompozitor, orkestr, instrument va h.k. atributlar barcha audio ketma-ketlikka yoki uning ma’lum bir qismiga tegishli bolishi mumkin. Hujjatlarni chiqarib olish standart usuli ham qollanishi mumkin.
Nutqni tanib olish usuli. Bu usul asosan qaerlarda ishlatilishi mumkin. Masalan, foydalanuvchining ovozli komandasini kompyuter interfeysi tomonidan tanishi, zamonaviy "aqlli uylarda" pardani yop, chiroqni yoq kabi buyruqlarni bajarishda ishlatilishi mumkin. Nutqni tanib olish usuli yanada murakkabroq hollarda ishlatilishi mumkin. Masalan, aytilgan gapni grammatik razbor qilishda, MB murojaat qilinganda. Fonetik qoidalar va namunalar asosida ixtiyoriy gapni matnga joylashtirish.
Avvaldan saqlangan ovozli malumotlar asosida gapirayotgan odamni tanib olish. Bu masala oddiy nutqni tanishdan kora murakkabroq sanaladi. Mazkur usul korxona va tashkilotlarda axborot xavfsizligi tizimlari tomonidan ishlatilishi mumkin. Lekin bunday usulni dasturlash juda qiyin boladi. Chunki, inson ovozi (tembri) ozgarib turadi. Masalan, shamollash natijasida.
Bunday usulni soddaroq variantlarda ishlatish mumkin. Masalan, mumkin bolgan soz va jumlalarni qisqartirish bilan. Ovozlarni tolqin formasida solishtirish.
Malumotlarni izlash deganda, albatta yozuvlarni indekslash haqida soz ketadi. Audio malumotlarning indekslashni quyidagi usullari mavjud:
Ovoz kodlarini emas, ovoz bilan bogliq meta malumotlarni (atributlarni) indekslash. Bu holda oddiy matn malumotlarni indekslash bilan bir xil boladi. Yana boshqa usullardan – audio signalni indekslash. Bunda indekslashdan avval audio signallarni segmentlarga (freymlarga) ajratib olish kerak boladi.
MIDI (Musical Instrument Digital Interface — musiqali asboblarning raqamli interfeysi) — elektron musiqa asboblari orasida malumot almashuv formati uchun raqamli ovoz yozish standarti. Bu holda musiqali asboblar ovozi, ovoz effektlari elektron sintezatorlar tomonidan sintez qilinadi. MIDI ovozlarning kerakli korreksiyasi va raqamli yozuvi sekvensor dasturlar tomonidan amalga oshiriladi.
MIDI-komandalar ketma-ketligi ixtiyoriy diskda fayl korinishida saqlanishi mumkin. Ixtiyoriy aloqa kanallari orqali uzatilishi mumkin. MIDI-komandalarni ijro etuvchi qurilma MIDI sintezator deyiladi.
MIDI ning eng katta afzalligi xotiradan nisbatan kichik hajm talab qilishi – 1 minut MIDI-ovoz ortacha 10 Kbayt joy oladi.