Audioni ma‘lumotlar bazasida saqlash

9-ma'ruza: Audioni ma‘lumotlar bazasida saqlash

Reja:

Audio ma‘lumotlar shakllari
Audio ma‘lumotlarni siqish
Audio ma‘lumotlarni MBdan chiqarib olish
MIDI standartlar

Audio ma‘lumotlar shakllari

Tabiiy ovozlar multimediada WAVE (to‘lqin) tarzida belgilanadi. Ovozlarni kompyuterda saqlash uchun asosan raqamli formatga o‘giriladi.
Raqamli audioformat – raqamli ovoz yozish va uni saqlashda ovozli ma‘lumotlarni taqdim etish formati.
Audiofayl – ovozning amplituda va chastotasi haqidagi ma‘lumotlardan iborat kompyuter fayli.
Audio ma‘lumotlarni MB saqlash, izlash va chiqarishda muhim masalalardan biri ma‘lumot hajmi hisoblanadi. 11 kGs diskretlash chastotasida va amplitudaning sakkiz bosqichli yozuvida 1 minut ovoz 66 Kbayt xotira talab qiladi. 44 kGs va 16 bit stereo standartda 16 marta ko‘proq xotira talab qiladi. Ya’ni 1 minut WAVE ovozni saqlash uchun 10 Mbayt joy talab qilinadi.
Hozirga kelib ovoz ma‘lumotlarini siqadigan audiokodek usullar rivojlanib bormoqda. Dunyo bozorlarida kompressiya/dekompressiya apparat usullarini ishlatadigan ovoz kartalari ko‘proq uchramoqda.
Mashhur audiokodeklar:
• MPEG-1 Layer III (MP3) — kompyuter texnikasida va raqamli ovoz eshittirish qurilmalarida foydalaniladigan audio yozuv kodeki.
• Advanced Audio Codec (AAC) — H.264 (AVC) videokodek bilan birga onlayn videoda qo‘llaniladigan MP3 ga alternativ bo‘lgan kodek.
• Ogg Vorbis (OGG) — kompyuter o‘yinlarda va fayl almashish tarmoqlarida musiqani uzatish uchun keng ishlatiladigan erkin kodek
• Adaptive multi rate (AMR) — odam ovozining mobil telefonlar va boshqa mobil qurilmalardagi yozuvi.
• G.723.1 — IP-telefoniya ilovalari uchun asosiy kodeklardan biri
• Internet Low Bitrate Codec (iLBC) —IP-telefoniya (xususan, Skype va Google Talk) uchun mashhur bo‘lgan erkin kodek.

Audio ma‘lumotlarni siqish

Audio ma‘lumotlarni siqish (kompressiya) keragidan ortiq statik va psixoakustik signallarni qisqartirish evaziga raqamli oqimning tezligini kamaytirish jarayonini o‘zida ifodalaydi.

Yo‘qotishsiz siqish

Audio ma‘lumotlarni keragidan ko‘p statikasi evaziga qisqartirish usuli yo‘qotishsiz siqish deyiladi. Bunday siqish usuli audio signallarning o‘zining xossalarini hisobga olishga asoslangan.
Bunday o‘zgartirish usulining qo‘llashni muhim shartlaridan quyidagilarni keltirish mumkin:
• Dastlabki signalni buzmasdan tiklash imkoniyati
• Tez hisoblash algoritmi

Yo‘qotishlik siqish

Audio ma‘lumotlarni yo‘qotish bilan siqish insonning ovozlarni eshitish qobiliyatini mukammal emasligiga asoslanadi.
Ba’zi hollarda odamning balan ovoz oldida past ovozlarni anglashga qodir emasligini niqoblash effekti deyiladi. Bu xususiyatdan keragidan ko‘p psixoakustik ma‘lumotlarni qisqartish algoritmlarida foydalanilgan.
Niqoblash effekti ikkita guruhga bo‘linishi mumkin:
• Chastotali niqoblash
• Vaqt bo‘yicha niqoblash
Agar analog signalda uning amplitudasini emas, qiymatining o‘zidan oldingisiga nisbatan o‘zgarishini kodlashtirilsa, razryadlar soni ancha kamayadi.
Quyida audio ma‘lumotlarni siqish dekoderlari ba’zilari bilan tanishib chiqadigan bo‘lsak.
Delta-modulyatsiya: juda ham sodda yondashuv, ba’zan nutqni kodlashtirish uchun ishlatiladi. Unda bir zaryadli kvantlash usuli ishlatiladi. Usulda keyingi qiymat oldingisi   bilan aproksimatsiya qilinadi.
MPEG-audio:
 Chastotalar diskretlashtirilgan – 32, 44.1, 48kGs (yoki yarmi); qiymatlar freymlarga joylashtiriladi (384/576/1152 freym qiymatlari) va keyin freymlarga ishlov beriladi.
 32 ta filtr, har biri diskretlash chastotasining 1/64 polosasi kengligida
 Siqilgan potok tezligi (MPEG-1 Layer 3) – 32-320 Kbit/s oralig‘ida
 128 Kbit/s tezlikdan boshlab ovoz sifati juda yaxshi
 MPEG Layer I: eskirdi
 MPEG Layer II (MP2): raqamli radio va televidenie uchun
 MPEG Layer III (MP3): kompyuter / internet ilovalar uchun

Audio ma‘lumotlarni MBdan chiqarib olish

Ma‘lumotlar bazasidan audio ma‘lumotlarni chiqarib olish uchun quyidagi usullardan foydalaniladi.
Meta ma‘lumotlar asosida chiqarib olish. Ovoz ma‘lumotiga qo‘shimcha atributlarni qo‘shish: masalan, nutq manbai kim, sana, yozuv uzunligi, kompozitor, orkestr, instrument va h.k. atributlar barcha audio ketma-ketlikka yoki uning ma’lum bir qismiga tegishli bo‘lishi mumkin. Hujjatlarni chiqarib olish standart usuli ham qo‘llanishi mumkin.
Nutqni tanib olish usuli. Bu usul asosan qaerlarda ishlatilishi mumkin. Masalan, foydalanuvchining ovozli komandasini kompyuter interfeysi tomonidan tanishi, zamonaviy "aqlli uylarda" pardani yop, chiroqni yoq kabi buyruqlarni bajarishda ishlatilishi mumkin. Nutqni tanib olish usuli yanada murakkabroq hollarda ishlatilishi mumkin. Masalan, aytilgan gapni grammatik razbor qilishda, MB murojaat qilinganda. Fonetik qoidalar va namunalar asosida ixtiyoriy gapni matnga joylashtirish.
Avvaldan saqlangan ovozli ma‘lumotlar asosida gapirayotgan odamni tanib olish. Bu masala oddiy nutqni tanishdan ko‘ra murakkabroq sanaladi. Mazkur usul korxona va tashkilotlarda axborot xavfsizligi tizimlari tomonidan ishlatilishi mumkin. Lekin bunday usulni dasturlash juda qiyin bo‘ladi. Chunki, inson ovozi (tembri) o‘zgarib turadi. Masalan, shamollash natijasida.
Bunday usulni soddaroq variantlarda ishlatish mumkin. Masalan, mumkin bo‘lgan so‘z va jumlalarni qisqartirish bilan. Ovozlarni to‘lqin formasida solishtirish.
Ma‘lumotlarni izlash deganda, albatta yozuvlarni indekslash haqida so‘z ketadi. Audio ma‘lumotlarning indekslashni quyidagi usullari mavjud:
Ovoz kodlarini emas, ovoz bilan bog‘liq meta ma‘lumotlarni (atributlarni) indekslash. Bu holda oddiy matn ma‘lumotlarni indekslash bilan bir xil bo‘ladi. Yana boshqa usullardan – audio signalni indekslash. Bunda indekslashdan avval audio signallarni segmentlarga (freymlarga) ajratib olish kerak bo‘ladi.

MIDI standartlar

MIDI (Musical Instrument Digital Interface — musiqali asboblarning raqamli interfeysi) — elektron musiqa asboblari orasida ma‘lumot almashuv formati uchun raqamli ovoz yozish standarti. Bu holda musiqali asboblar ovozi, ovoz effektlari elektron sintezatorlar tomonidan sintez qilinadi. MIDI ovozlarning kerakli korreksiyasi va raqamli yozuvi sekvensor dasturlar tomonidan amalga oshiriladi.
MIDI-komandalar ketma-ketligi ixtiyoriy diskda fayl ko‘rinishida saqlanishi mumkin. Ixtiyoriy aloqa kanallari orqali uzatilishi mumkin. MIDI-komandalarni ijro etuvchi qurilma MIDI sintezator deyiladi.
MIDI ning eng katta afzalligi xotiradan nisbatan kichik hajm talab qilishi – 1 minut MIDI-ovoz o‘rtacha 10 Kbayt joy oladi.

9-mavzuga doir savollar:

Audio kodeklarning turlarini sanab bering.
Audio ma‘lumotlarni siqish usullarini aytib bering.
Audio ma‘lumotlarni MBdan izlashning qanday usullari bor?
MIDI nima?

Multimedia ma’lumotlar bazasi

1-ma'ruza

2-ma'ruza

3-ma'ruza

4-ma'ruza

5-ma'ruza

6-ma'ruza

7-ma'ruza

8-ma'ruza

9-ma'ruza

10-ma'ruza

11-ma'ruza