Home - Rasfoiesc.com
Educatie Sanatate Inginerie Business Familie Hobby Legal
Doar rabdarea si perseverenta in invatare aduce rezultate bune.stiinta, numere naturale, teoreme, multimi, calcule, ecuatii, sisteme




Biologie Chimie Didactica Fizica Geografie Informatica
Istorie Literatura Matematica Psihologie

Calculatoare


Index » educatie » » informatica » Calculatoare
» MULTIMEDIA - Definirea sistemelor multimedia. Caracteristici


MULTIMEDIA - Definirea sistemelor multimedia. Caracteristici


1. INTRODUCERE IN MULTIMEDIA

1.1. Definirea sistemelor multimedia. Caracteristici.

Dezvoltarea vertiginoasa a performantelor tehnicilor de calcul si in special progresul continuu in domneiul comunicatiilor a condus la delimtarea unui domeniu aplicativ aparte - cel al sistemelor multimedia. Acest domeniu presupune vizualizarea aplicatiilor care modeleaza in timp real fenomene complexe, permit reprezentarea si gestionarea documentelor in variate moduri, ofera un support pentru ingineria concurenta s.a.md. Putem totusi afirma ca trasatura esentiala a unui sistem multimedia este integrarea in aplicatie a datelor, semnalelor audio si semnalelor video.



Celelalte caracteristici importante pe care trebuie sa le asigure un sistem, respective o aplicatie multimedia, sunt:

Date tipizate pentru fluxuri informationale continue - de multe ori aplicatiile multiedia implica procesarea unui flux continuu date, ceea ce necesita o localizare si o accesare rapida in memoria de date; de mentionat insa ca memoria cache este mai degraba un obstacol din acest punct de vedere, pentru ca la procesarea unui flux de date care se modifica in amre viteza procesorul ar putea raporta frecvent erori de cache

Asigurarea calitatii serviciilor ( Quality of Service - QoS) - De cele mai multe ori, dar in special in aplicatii in care este preponderant video dinamic, nu se urmareste o performanta maxima (de exemplu viteza maxima de transfer) , ci respectarea unui anume parametru de calitate (de exemplu un prag semnificativ de perceptie)

Paralelizarea operatiilor Numeroase functii multimedia presupun segmentarea fluxului de date pentru a permite operatii in paralel; nu trebuie insa exclusa nici tehnica reciproca, de adunare intr-un flux unic a datelor prelucrate partial pentru atingerea rezultatului final

Necesar sporit de memorie - pentru masive de date care nu pot fi localizate decat pentru un interval scurt de timp .

Banda extinsa pentru transferal de date in retele - in special in aplicatiile in care predomina transmisia imaginilor in miscare.

Este evident faptul ca cele mai puternice performante sunt cele solicitate de comunicatiile multimedia. Parametrii cheie care trebuiesc monitorizati in acest gen de aplicatii sunt largimea de banda, intervalul de timp pentru transmisie (latenta) capacitatea de transmisie multipunct, fiabilitatea si sincronizarile necesare. Se vor prezenta in continuare cateva aspecte caracteristice pentru fiecare din aceste cerinte.

1. Banda - Standardele DVI si MPEG pentru compresie video si audio arata ca o calitate acceptabila se obtine doar la fluxuri de date peste 1.5 Mbps. Un standard nu prea pretentios de videoconferinta cum este H.261 indica viteza de 64 Kbps ca limita acceptabila pentru transmisii cvasi-statice intr-o retea WAN, in timp ce o viteza de 384 Kbps (obtinuta prin partajarea pe 6 canale ISDN) duce la rezultate superioare chiar in medii eterogene. Sa notam insa ca foarte multe aplicatii multimedia pot utiliza un trafic asimetric (viteza mare doar pe un sens), dar aplicatii cum sunt videoconferintele implica garantarea unui flux maximal in ambele directii.

2. Latenta - Standardele ITU (International Communications Union) stipuleaza o intarziere totala maxima in retea (end-to-end delay) de pana la 150 ms pentru aplicatii video interactive. Majoritatea aplicatiilor bazate pe comunicatii video si audio se inscriu in clasa aplicatiilor izocrone (care necesita acelasi interval de timp in transmisia oricarui pachet de la sursa la destinatie). E adevarat, aceasta problema se rezolva la destinatie, prin refacerea succesiunii initiale de pachete folosind pachetele care au fost stocate pe masura receptionarii lor, dar chiar acest proces de refacere adduce o intarziere suplimentara. De aceea de regula latenta se compune din 4 segmente: (i) timpul de compresie si impachetare la sursa; (ii) timpul de transmisie efectiva; (iii) timpul de asteptare in coada si de sincronizare la destinatie; (iv) timpul de decompresie, despachetare si extragere. Deoarece un flux video necesita de la 25 la 30 cadre pe secunda, compresia si decompresia in timp real nu poate depasi 30 - 40 ms, iar latenta maxima se situeaza undeva in jur de 60 ms.

3. Fiabilitatea - Comunicatiile traditionale se bazeaza pe o legatura bidirectionala fiabila, in care se folosesc diferite tehnice de control al erorilor: coduri ciclice, sume de control, campuri numaratoare etc.Detectarea unei erori conduce de regula la retransmisia pachetului in care a fost depistata, in baza unui algoritm specific (cele mai raspandite sunt cele de tip ARQ, bazate pe confirmare pozitiva ACK(acknowledge) sau negative NAK (notacknowledge), dar aceste tehnici duc de regula la dublarea si chiar triplarea timpului mediu de transmisie. Iata deci ca in aplicatii video si audio cu timp critic, tehnicile de retransmisie nu sunt folositoare. S-a incercat depasirea acestui impas prin utilizarea comutarii de celule (cazul ATM), la care practic nu se controleaza la eroare decat adresa, nu si informatia propriuzisa, dar viteza sporita de transmise face ca pierderea unei celule sa nu duca la erori semnificative. Un alt remediu este utilizarea de tehnici de corectie anticipative FEC (Forward Error Correction).

4. Sincronizarea - Ori de cate ori fluxurile de date multimedia ajung la destinatie de la diferite surse si pe trasee diferite, este necesara o operatie de sincronizare a acestora. Principial, sincronizarea se bazeaza pe intarzieri calibrate in buffere temporare, dar se poate accepta ca problema se rezolva prin sistemul de operare, in cadrul protocoalelor de tip client - server.

5. Comunicatia multipunct - Exista din ce in ce mai multe aplicatii multimedia cu utilizatori multipli, la care informatia se difuzeaza pe suport broadcast. In literatura de specialitate sunt descrise mai multe modele pentru acest gen de comunicatie, cele mai multe bazate pe arbori sau pe grafuri.

1.2 Parametri de calitate pentru servicii de comunicatie multimedia

In general, toate tipurile de media intr-o aplicatie multimedia pot fi transferate in doua moduri: a) transmisie in timp real si b) descarcare (download). Descarcarea este un proces asincron si de aceea cerintele sunt aceleasi ca pentru orice transfer de date, dar transmisia in timp real are niste cerinte specifice, fie ca e vorba de semnale video sau audio. Pe de alta parte, perceptia umana pentru sunete si imagini este net diferita, deoarece ochiul actioneaza ca un integrator de informatie in timp ce urechea este un diferentiator. De aceea cerintele de calitate se vor prezenta separat pentru audio si pentru video.

1.2.1 Cerinte QoS pentru informatie audio

Parametrii tipici care indica QoS pentru fluxuri audio compresate (de cele mai multe ori) sau necompresate sunt: a) Debitul informational; b) Timpul de tranzit; c) Jitter-ul de intarziere; d) Rata reziduala a erorilor (BER). Acesti parametri vor fi examinati in detaliu.

Debite pentru fluxuri audio necompresate

i) Calitate telefonica: 64 Kbps

Conform standardului G.711 (fara compresie) se esantioneaza semnalul analogic de 8000 de ori pe secunda si se codeaza fiecare esantion pe 8 biti. Rezulta un debit de 64 Kbps.

ii) Calitate CD (stereofonica): 1.4 Mbps

Standardul audio pentru CD impune esantionarea semnalului analogic cu frecventa de 44.1 kHz, si codarea fiecarui esantion pe 16 biti. Rezulta un debit de 705.6 Kbps pentru un canal monofonic. Pentru Compact-discuri (stereofonic), debitul necesar este de 1411.2 Kbps, compatibil cu unul din cele mai populare debite oferite pe linii inchiriate, corespunzator specificatiei T-1 (1.544 Mbps).

Debite pentru fluxuri audio compresate

i) Calitate telefonica: 32, 16, 4 Kbps

Numeroasele tehnici de codare si compresie au permis reducerea succesiva a debitului mai intai la 32 Kbps si apoi la 16 Kbps. La o calitate cu putin mai scazuta, se pot utilize in prezent si debite de 4 Kbps.

ii) Calitate CD (stereofonica):192 Kbps

Dintre multele tehnici de compresie care asigura calitate CD, vom mentiona MUSICAM, care a fost adoptata pentru unele din variantele standardului MPEG. Aceasta solutie permite codarea a doua canale stereofonice la un debit de 192 Kbps. Note that two stereophonic channels are coded in this stream. Variante mai avansate ale MPEG ofera aceeasi calitate la numai 64 Kbps (pentru un canal monofonic).

In tabelul 1 se prezinta cativa indicatori de calitate corespunzand detalierii anterioare :

Tabel 1.

Calitate

Tehnica sau standard

debit

Kbps

Calitate telefonica

Standard

G.711 PCM

64

Standard

G.722 SB-ADCMP

32

Imbunatatit

G.721 ADCMP

48, 56, 64

Calitate redusa

G.728 LD-CELP

16

Calitate CD (stereo)

Consumer CD audio

CD-DA

1411

Consumer CD audio

MPEG audio FFT

192

Imbunatatit (sunet de studio)

MPEG audio FFT

384

Timpul de tranzit pentru fluxuri audio

Timpul de tranzit depinde esential de tipul de aplicatie multimedia. El se poate extinde la limita tehnologica admisibila pentru transmisii unidirectionale, dar are alte restrictii in cazul aplicatiilor interactive. In categoria acestora din urma se pot include:

i)            Conversatie intre persoane. In aceasta situatie principalul pericol il prezinta ecoul audibil, pentru anularea caruia ITU a definit o limita superioara de 24 ms in tranasmisii unidirectionale pentru a permite utilizarea unor tehnici de supresare. In cazul in care se asteapta si un raspuns vocal, timpul de tranzit se situeaza in gama 100 ms . 500 ms.

ii)           Raspuns vocal in realitate virtuala. In aceasta situatie raspunsul trebuie sa ajunga in mai putin de 100 ms, ceea ce impune un timp de transit de circa 40 ms.

Tabelul 2 sintetizeaza cerintele QoS pentru timpul de tranzit la fluxuri audio.

Tabelul 2.

Calitate

Timp de tranzit

Cea mai buna limita superioara

24 ms

Intrare si raspuns vocal

100 ms - 500 ms

Realitate virtuala

< 40 ms

Jitter-ul de intarziere la fluxuri audio compresate

Sunetul in timp real este foarte sensibil la jitter-ul din retea. Daca blocurile de informatie ce contin semnal vocal sosesc cu timpi de intarziere foarte diferiti, sistemul de receptie trebuie sa astepte un timp sufficient de lung, numit Intarziere Offset, care permite receptionarea tuturor blocurilor intarziate. Pe masura ce sosesc, blocurile sunt stocate in buffere (numite si buffere de egalizare sau de compensare). Aceasta intarziere suplimentara induce un jitter, a carui limita de tolerabilitate e dictata de doi parametri:

i) Intarzierea totala maxima tolerata de o anumita aplicatie

ii) Capacitatea bufferelor sistemului de receptie

Tabelul 3 ofera cateva valori tipice pentru jitter-ul admisibil.

Tabelul 3.

Calitate

Debit

Jitter

CD

192 Kbps

< 100 ms

Telefonica

32 Kbps

< 400 ms

Realitate virtuala

20-34 Mbps

<20-30 ms

Rate reziduale de eroare pentru fluxuri audio

In tabelul 4 se prezinta cateva rate tipice de eroare admise pentru diferite tipuri de fluxuri audio for various types of compressed audio streams

Tabelul 4.

Calitate

Debit

Rata reziduala de eroare

CD - cu compresie

192 Kbps

< 10-6

CD - fara compresie

1411 Kbps

< 10-5

Telefonica

32 Kbps

< 10-4

1.2.2. Cerinte QoS pentru informatie video

In cele ce urmeaza se definesc cinci clase de calitate considerate reprezentative pentru aplicatii video.

1) televiziunea de inalta rezolutie (High-definition television - HDTV)

Implica un format de imagine de mare rezolutie, cu 1920 pixels pe linie si 1080 linii pe cadru, cu o rata de afisare de 60 cadre/secunda.

2) televiziune digitala de calitate studio

Standardul care o defineste este Recomandarea ITU CCIR-601. Fiecare cadru contine 525 sau 625 linii si fiecare linie contine 860 esantioane pentru luminanta si 430 esantioane pentru componentele de culoare ale semnalului. Scanarea se face intretesut. The scan scheme is interlaced. Rata de afisare este de 25 sau de 30 cadre/secunda. Fiecare pixel este codat cu 24 biti.

3) televiziune publica de calitate normala

Dintre standardele curente mentionam NTSC care necesita 30 cadre/secunda si o rezolutie verticala de 525 linii si PAL/SECAM care necesita 25 cadre/secunda si o rezolutie verticala de 625 linii

4) televiziune pe caseta video

Calitatea casetelor video poate fi normala (VCR) sau superioara (VHS). Rezolutia este cam jumatate din cea oferita de PAL/ SECAM.

5) videoconferinta la viteza joasa

De viteza joasa se considera videoconferintele care opereaza la 128 Kbps, adica pe doua circuite de baza ISDN agregate. Formatul utilizat este numit CIF (Common Intermediate Format cu o rezolutie spatiala de 352 pixels pe linie si 288 linii pe cadru. Viteza este de 5 pana la 10 cadre/secunda.

Se vor descrie in continuare cativa parametrii tipici QoS pentru fluxuri de date video.

Debit informational pentru video necompresat in timp real

Numarul de esantioane pe linie indicat pentru TV digitala (858 pentru semnale NTSC si 864 pentru PAL sau SECAM) corespunde la 484 linii active pentru un cadru NTSC compatibil cu semnale digitale si respective 576 linii active in cazul PAL/SECAM. Debitele ce rezulta pentru diferite clase de calitate sunt: 2Gpbs pentru HDTV fara compresie si 166 Mbps pentru TV de studio necompresata.

Debit informational pentru video compresat in timp real

In functie de modul in care se face compresia, debitul se inscrie in gamele: 20 . 34 Mbps pentru HDTV, 15 . 25 Mbps pentru TV de studio, 3 . 6 Mbps pentru televiziune broadcast (4 Mbps pentru PAL/SECAM) si 1,2 Mbps pentru calitate VCR (debit asigurat de tehnicile de compresie MPEG-1 sau DVI (Digital Video Interactive), cu mentiunea ca la aceasta viteza, 200 Kbps se aloca pentru sunet, ceea ce duce la un flux total de 1.4 Mbps. Calitatea VCR este compatibila cu sistemul T-1 pentru linii inchiriate si cu rata de transfer pentru CD-ROM transfer rate. Pentru videoconferinta de calitate debitul necesar este de 98 sau 112 Kbps. Pentru sunet fiind alocata o banda de 16 Kbps. Tabelul 5 sintetizeaza principalele cerinte de debit pentru diferite tipuri de fluxuri video.

Tabelul 5.

Calitate Video

Caracteristici

cadre/secunda; biti/pixel

Debit

HDTV(Fara/cu compresie)

60 ; 24

2 Gbps/20-34 Mbps

Studio(Fara compresie)

25 ; 24

166 Mbps

Broadcast

MPEG-2

3-6 Mbps

VCR

MPEG-1,DVI

1.2 Mbps

Videoconference

H 261

112 Kbps

Jitter-ul de intarziere la fluxuri video in timp real

De regual un flux video in timp real este transmis simultan cu un flux audio, in vederea unei receptii sincrone. In aceste situatii, cerintele pentru jitter-ul de intarziere este dictat de fluxul audio. Limitele uzuale sunt cele din tabelul 6.

Tabelul 6.

Calitate

Debit

Jitter de intarziere

HDTV

20-34 Mbps

< 50 ms

Broadcast

3-6 Mbps

< 100 ms

Videoconferinta

112 Kbps

< 400 ms

Rate reziduale de eroare pentru fluxuri video in timp real

Ca o regula generala se poate afirma ca un flux compresat este mai sensibil la erori decat unul fara compresie. Considerand ca erorile au o distributie constanta in timp, se poate aprecia frecventa cu care sunt afectate cadrele (sau intervalul mediu intre doua cadre afectate de eroare Ier

La videoconferinta (100 Kbps) Ier este de o secunda la o rata reziduala de eroare (BER) de 10-5 si de 3 ore la BER 10-9.

La TV broadcast, cu compresie, Ier este de 20 ms daca BER este 10-5 si creste la 4 minute pentru BER =10-9.

La HDTV, cu compresie, la BER =10-5 duce la 4 biti eronati intr-un cadru, adica 240 biti eronati pe secunda, in timp ce la BER =10-9 va rezulta un interval Ier de un minut..

Dupa cum am mai spus, tehnicile de retransmisie nu sunt recomandabile pentru compensarea erorilor depistate in fluxuri audio si video in timp real. In cazul in care se utilizeaza tehnici FEC care permit detectia si corectia de erori negrupate, BER se poate imbunatati de pana la 4 ori. Tabelul 7 arata cateva valori BER tipice in sisteme care folosesc tehnici FEC pe fluxuri cu compresie. Aceste valori trebuie divizate cu 10000 daca nu se folosesc tehnici de corectie FEC.

Tabel 7.

Calitate

Debit

BER

Videoconferinta

112 Kbps

< 10-4

Broadcast

3-6 Mbps

< 10-5

HDTV

20-34 Mbps

< 10-6

Pe langa situatiile prezentate mai sus, in care anumite blocuri erau afectate de eroare, exista si situatii in care anumite blocuri nu ajung la destinatie, fie pentru ca sunt pierdute pe traseu, fie ca durata lor de viata a expirat (a depasit intarzierea offset). Compensarea acestor pierderi se poate face fie prin extrapolare, pe baza informatiei obtinute din blocurile transmise anterior, fie prin interpolare, valoarea blocului lipsa fiind dedusa din valoarea blocurilor anterior si respectiv urmator. Ambele tehnici (extrapolare si interpolare) se numesc tehnici predictive, utilizarea lor permitand ascunderea erorilor. De sigur, la o rata mare de compresie, lipsa informatiei redundante face dificila aceasta compensare.

1.2.3 Cerinte QoS pentru informatia din imagini si texte

Imagini

O imagine de 640*480 pixeli (Format VGA), care este de rezolutie medie, necesita circa 900 Kbytes (640*480*24/8) pentru o reprezentare digitala, la o codificare pe 24 biti (True color). In cazul unor formate comprimate de imagine, de exemplu de tip JPEG (care asigura o rata de compresie de 10-50 ori) se poate ajunge la un debit de cel mult 90 Kbytes. O compresie bazata pe tehnici fractal poate duce theoretic la o reducere a dimensiunii originale de 500 ori, adicala un debit de numai 1.8 Kbytes.

Text

Pentru un ecran de 640*480 pixeli, cu caractere de 8*8 pixels si 2 cu bytes pentru un character vom avea (640/8)*(480/8)=4800 caractere si deci o pagina de text va avea 4800*(2*8)=76.8 Kbiti

1.3. Arhitectura unui sistem multimedia

Se va prezenta in continuare o arhitectura de sistem deschis care permite integrarea de functii multimedia si care are o interfata specializata cu utilizatorul. Structura propusa este fiabila si are un grad inalt de adaptabilitate la solicitari particulare. Una dintre acestea este asigurarea unui dialog multimodal. Prin acest tip de dialog se intelege posibilitatea utilizatorului de a folosi simultan mai multe modalitati de comunicare, in cazul de fata prin atingere, gesturi si voce. Reactia sistemului se materializeaza prin text, grafica, sunet si voce. Mediul aplicatiilor s-a ales la nivelul unei locuinte, permitand monitorizarea si operarea unor echipamente casnice uzuale (TV, Video-recorder, lumini, climatizare, etc.) dar si tehnologii de ultima ora cum ar fi televiziunea digitala interactiva. Faptul ca exista mai multe aplicatii casnice (vor fi noua in exemplificarile ce urmeaza) implica utilizarea mai multor protocoale de comunicatie (in cazul de fata trei).

Principalele facilitati specifice aplicatiilor multimedia sunt:

  • Controlul sensibil la proximitate (Touch Sensitive Control), constituie o modalitate naturala de intrare realizata prin vizarea unei forme grafice pe display si apropierea unui deget de aceasta, avand ca rezultat efectuarea unei operatii anume.
  • Procesarea limbajului natural, in sensul extragerii informatiei dintr-un text vorbit, dar care respecta o sintaxa predefinita, deci o procedura ce permite recunoasterea cuvintelor izolate sau a frazelor scurte ce reprezinta comenzi vocale. Se spune ca un astfel de system este dependent de speaker si independent de limbaj, intrucat fiecare utilizator poate sa defineasca un vocabular propriu.
  • Sintetizarea vocii si a sunetelor, intrucat utilizarea semnalului sonor imbunatateste modalitatea de raspuns a sistemului, permitand chiar dialogarea in limbaj natural. Exista posibilitatea ca sistemul sa aiba raspunsuri preinregistrate care sa corespunda la anumite comenzi, dar exista si programe mai complicate care concateneaza unitati fonetice stocate intr-un dictionar pentru a genera automat un raspuns vorbit.
  • Recunoasterea gesturilor, realizata prin camere video care supravegheza o anumita scena. Se poate folosi o singura camera lucrand intr-un plan 2D, situatie in care se pot recunoaste doar gesturi semantice sau un sistem cu 3 camere lucrand in spatiul 3D care recunoaste si gesturi diectice care dau posibilitatea selectarii unui anume echipament
  • Teleoperarea, care ofera mobilitate pentru utilizatori si implicit siguranta si confort, sau permite solicitarea de asistenta externa. Sistemul de teleoperare presupune un echipament local (de exemplu un transceiver GSM) si un echipament la distanta ( de regula un telefon mobil cu facilitate de afisare grafica).

Arhitectura sistemului care permite integrarea functiilor mentionate mai sus este prezentata in fig. 1.

Fig.1. Arhitectura unui sistem multimedia (FE-unitatea centrala; ISR - Interpretor de comenzi vocale; NLP - Procesorul de limbaj natural; SSS- Sintetizator de voce si sunete; TMU - bloc de teleoperare; BM - Administrator de magistrala; SM - administrator afisaj; GR - Interpretor de gesturi)

Arhitectura prezentata in fig.1. are urmatoarele caracteristici:

  • Module autonome: Fiecare modul din sistem raspunde de executatrea unui task bine determinat si administreaza intrari si iesiri specifice intr-un mod autonom.
  • Informatie distribuita si cooperare: Fiecare modul mentine o anume stare informationala specifica, care contribuie la starea generala a sistemului si decide actiunea ce trebuie efectuata la aparitia unui anume eveniment.
  • Monitorizarea asincrona a evenimentelor: Protocoalele de comunicatie intre module sunt de tip asincron, permitand accesul instantaneu si preluarea controlului sistemului.
  • Module de interfata proiectate cu limbaje de nivel inalt pentru a permite dezvoltari modulare si programare usoara.

In continuare se prezinta functiile si atributiile fiecarui bloc structural.

Unitatea centrala (UC)

UC este modulul care implementeaza inteligenta sistemului si raspunde de intreaga sa functionalitate. In UC sunt monitorizate toate evenimentele si tot de aici, in functie de starea sistemului, se transmit comenzi catre celelalte module.

Administratorul de magistrala (AM)

AM gestioneaza comunicatia intre UC si celelalte module interconectate pe diferite magistrale. El ofera o interfata omogena catre UC, chiar daca alte unitati folosesc magistrale eterogene. La nivelul AM, comenzile de nivel inalt receptionate se transforma in comenzi de nivel scazut catre modulele din sistem.

Administratorul de afisaj (AA)

AA este un modul de intrari si iesiri, care monitorizeaza comenzile pentru control la distanta effectuate prin tastare pe ecran. Fiecare tasta "sensibila" de pe ecran este asociata in AA cu o actiune sau cu o secventa de actiuni cafre sunt communicate UC.

Blocul de teleoperare (BT)

BT este tot un modul de intrari/iesiri care furnizeaza comenzi la distanta pe baza datelor furnizate de la tastatura sau mouse. BT lucreaza la nivel conceptual similar cu AF.

Interpretorul de gesturi (IG)

IG este un modul de intrare, care transpune gesturi sau secvente de gesturi in evenimente de interactiune care sunt apoi communicate UC. IG poate urmari miscari ale utilizatorului in spatiul real.

Interpretorul de comenzi vocale (ICV)

ICV este un modul de intrare, care gestioneaza comenzi vocale simple pe care le transforma in evenimente de interactiune si le transmite spre UC.

Procesorul de limbaj natural (PLN)

PLN este un modul de intrare, care recunoaste fraze vorbite pe care le transforma in evenimente de interactiune si le transmite spre UC.

Sintetizatorul de voce si sunete (SVS)

SVS este un modul de iesire, care gestioneaza reactia audio, in sensul ca reda comenzi vocale prin microfon (local) sau telefon mobil (la distanta) pe baza comenzilor locale primate. .

Fluxul informational pentru administrarea dialogului multimodal

In functie de interactiuni se disting doua tipuri de comenzi: complete si incomplete

Comenzile complete sunt evenimente de interactiune care corespund direct la o actiune sau un set binedeterminat de actiuni ce nu mai necesita altele in continuare (de exemplu <TV_OFF>)

Comenzile incomplete sunt evenimente de interactiune care nu corespund direct la o actiune si ca atare au nevoie de informatie suplimentara pentru a controla sistemul in continuare. Aceste comenzi apar de regula in dialogul dinte utilizator si sistem. De altfel, cele mai multe comenzi incomplete provin de la PLN. Iata, pentru exemplificare, o secventa care va conduce la 'Turn off this device' (limbajul utilizat este engleza).

Intr-o prima etapa, se transmite de catre PLN un mesaj semantic de tip:

< OFF > | < THIS_DEVICE >

Deoarece sensul pentru < THIS_DEVICE > este ambiguu, va trebui clarificat. Cand UC primeste mesajul pot apare doua situatii:

1.Echipamentul definit < THIS_DEVICE > este deja selectat (de ex. TV) si atunci se poate transmite direct comanda < TV_OFF prin AM, comanda cu effect imediat.

2.UC nu stie cine este < THIS_DEVICE > si va trimite prin intermediul AA o solicitare de precizare suplimentara, de exemplu prin BT. Daca acesta identifica echipamentul , fie el < TV >, atunci Uc trimite comanda corespunzatoare < TV_OFF >, prin AM.

Desigur, daca nu se realizeaza efectul dorit, dialogul poate continua, de exemplu UC va trimite un mesaj de dialog de forma < Which device do you want to turn off?>, spre SVS sau AA. Utilizatorul poate selecta echipamentul pe care vrea sa-l deconecteze fie vocal, prin PLN, fie prin gesturi, prin IG, fie prin tastare prin IA. Daca efectul este cel dorit si se identifica echipamentul <TV>, UC va trimite comanda <TV_OFF> spre AM.

In concluzie sa remarcam ca arhitectura propusa este suficient de completa si fiabila pentru a putea fi adaptata cu usurinta la o gama extinsa de aplicatii multimedia.

1.4. Tendinte in evolutia Serviciilor Multimedia

Serviciile multimedia azi

Pasii mari facuti de curand in tranansmisiile multimedia, adica coordonarea video, audio, text si capacitatile audio media este una din cele mai importante dezvoltari in comunicatiile de azi. Multimedia poate oferi ocazii importante pentru furnizorii de astfel de servicii in atragerea de noi clienti sau in marirea interesului celor curenti. Intreprinderile pot utiliza multimedia pentru a imbunatatii comunicarea angajatilor si a mari semnificativ eficacitatea unor functii critice.

Trebuie sa tinem cont ca multimedia se refera la o serie de servicii complexe de prelucrare a informatiei: text, audio, grafica, animatie, video si nu in ultimul rand interactiune cu utilizatorul. Datorita prezentarii informatiei in formate variate, multimedia intensifica experienta utilizatorilor si face ca informatia sa fie asimilata mai usor. Prezentarea informatiei prin serviciile multimedia implica existenta acesteia in mai multe tipuri de format digital. In principal multimedia se refera la informatia audio-video stocata intr-un calculator personal.

Una din cele mai la indemana modalitati de acces la serviciile multimedia este prin piata de telefonie mobila.

Multimedia pe piata de telefonie mobila

Distribuitorii de telefonie mobila se confrunta in mod particular cu conditii de piata dificile deoarece aceasta piata este saturata cam in toate colturile lumii. Un studiu recent din Marea Britanie a aratat ca rata de strapungere a pietei este de 99%. Pentru a combate acest efect, distribuitorii de mobile ofera serviciile multimedia ca un diferentiator al pietei.

In acelasi timp, intreprinderile utilizeaza multimedia pentru a creste productivitatea lucratorilor, pentru a avea instruiri mai eficiente si pentru a reduce costurile de productie. Multe aspecte ale intreprinderilor pot fi imbunatatite din punctul de vedere al relatiilor investitorilor cu departamentul de vanzari prin implementarea de aplicatii ca portale video si emailuri video.

Ca un bine cunoscut initiator al noilor tehnologii, Intel este constient de problemele ce pot sa apara atunci cand tehnologiile noi vor trebui sa interfereze cu cele deja existente. Intel a decis sa isi ajute clientii sa faca din trecerea la multimedia un mare succes prin lucrul cu organizari standard, prin intarirea sistemului existent si prin dezvoltarea de noi produse.

Trecerea la multimedia

Adoptarea sistemului multimedia necesita o infrastructura solida care sa suporte aplicatii multimedia puternice fara deosebire daca punctul final este un PC sau un dispozitiv mobil. Latimea de banda este foarte importanta datorita faptului ca serviciile multimedia se desfasoara in timp real.

In cazul calculatoarelor personale, serviciile multimedia necesita o latime de banda mare sau o conectare in retea echivalenta. Deoarece latimile de banda obisnuite au o rata de download de 3 pana la 6 Mbps si upload de 386 pana la 768 kbps , latimilr de banda sunt adecvate sa suporte un numar de servicii multimedia. Raspandirea larga a conexiunilor bazate pa latimi de banda obisnuite ar trebui sa accelereze trecerea la sisteme multimedia.

Pentru serviciile mobile de tip 3G ultimele implementari de tip CDMA2000 furnizeaza o rata de transfer a datelor de 3.01 Mbps cu un timp mediu de raspuns de 600 kbps. Disponibilitatea benzii in aceste limite ar trebui sa incurajeze distribuitorii de servicii sa ofere o gama larga de servicii multimedia cu posibila exceptie a calitatii transmiterii video.

Tendinte in introducerea serviciilor multimedia

Cu o rata de strapungere a pietei de 99%, piata de celulare din Marea Britanie poate fi considerata una matura, chiar competitiva si tendintele ei in multimedia pot furniza informatii utile asupra posibilului impact al serviciilor multimedia asupra unei piete mai putin matura.

Figura - Comparatie intre veniturile aduse de mesaje si cele traditionale in Marea Britanie

Figura - Tipurile de servicii multimedia in Marea Britanie

Prima figura compara veniturile aduse de primii 5 distribuitori de celulare din Marea Britanie din apeluri traditionale si taxe fixe si din Short Message Service (SMS) si Multimedia Message Service (MMS). De notat ca venitul din SMS si MMS ori depaseste ori se apropie de venitul primit din taxe lunare si apeluri.

A doua figura prezinta tipurile de servicii multimedia si ponderea lor in Marea Britanie. De cand telefonul este mijlocul cel mai uzual pentru serviciile multimedia este important de precizat ca peste 80% din telefoanele mobile comercializate astazi contin o camera video mai ales datorita scaderii costurilor componentelor pentru camere. Prezenta unei camere digitale integrate permite utilizarea de aplicatii multimedia. Prin urmare au crescut si vanzarile acestor telefoane. Ecranele color ale telefoanelor permit de asemenea si rularea de aplicatii video.

Servicii multimedia

Dezvoltarea noilor servicii video este foarte rapida. O implementare video disponibila in retelele 2,5G este serviciul de MMS. Cu noile retele 3G, aplicatiile video pentru telefonie mobila cum ar fi serviciul de mail video, sonerii polifonice, identificator video al celui care initiaza apelul, portale video ar trebui sa devina foarte raspandite.

Iata mai jos o scurta descriere a celor mai cunoscute servicii multimedia.

Serviciu de mesaje multimedia

Serviciul de mesaje multimedia adauga clipuri audio si imagini la mesajul text de tip SMS (Short Message Service). Trecerea la MMS este vazuta ca o evolutie naturala de la SMS. Suplimentar, mesajele MMS pot fi trimise si primite ca emailuri standard eliminand eventualele consecinte de interoperabilitate.

Una din cele mai populare utilizari ale serviciului MMS este aceea de trimitere de poze facute cu ajutorul camerelor integrate in telefoane. Alte aplicatii de tip MMS includ:

  • Rapoarte despre vreme ce contin imagini cu harti
  • Preturile actiunilor la bursa incluzand informatii sub forma grafica despre tendinte
  • Momente cheie din evenimetele sportive ale zilei trimise ca "slide show"
  • Mesaje text cu animatii

Mediile de creare de continut MMS si mecanismele de facturare ale acestor servicii sunt foarte bine definite deci in concluzie acest tip de servicii multimedia este foarte popular.

Posta video

Cele mai multe mobile ofera serviciul de mesagerie vocala. Datorita dezvoltarii suportului in timp real pentru mesagerie video, atat din punct de vedere tehnic, al retelelor si al dispozitivelor, pasul urmator este utilizarea aplicatiilor de acest tip. Inregistrarea unui mesaj video pentru cineva care este indisponibil temporar se asteapta sa devina la fel de uzuala ca si mesajele vocale.

Ca si alte aplicatii multimedia, serviciul de posta video poate sa aduca venituri suplimentare fie printr-o taxa lunara fixa pentru serviciu, fie prin stabilirea unui cost pe mesaj.

Tehnologia de posta video care se bazeaza pe trimiterea unui fisier video de tip MPEG atasat unui e-mail a aparut la mijlocul anilor '90 pe PC-uri. Astazi tehnologia este mult mai avansata datorita costurilor mai reduse ale componentelor, imbunatatirii algoritmilor de comresie si datorita mecanismelor de comunicatie imbunatatite care salveaza mesajele pe un server si le trimite catre client.

Sonerii polifonice

Soneriile polifonice inlocuiesc sunetele de apel asigurate la de tehnologiile clasice atunci cand cel care suna asteapta ca cel sunat sa raspunda la telefon. Soneriile polifonice alterneaza de la melodii cunoscute la mesaje inregistrare si glume.

In cazul soneriilor video, se adauga la un sunet un fisier video si acesta este transmis prin cadrul retelei si rulat in timp ce se asteapta ca cel apelat sa raspunda la telefon. Aceasta tehnologie nu este inca foarte bine stapanita de standardele de transmisie a serviciilor multimedia.

Identificator video

Identificatorul video se foloseste de id-ul celui care suna pentru a reda un fisier video deja inregistrat inainte de a se raspunde la apel. Fisierele video ale apelantilor cunoscuti sunt stocate local in memoria telefonului si nu necesita interventia distribuitorului acestui serviciu.

Aplicatiile incarcate si care ruleaza pe telefon cauta id-ul apalantului si incarca fisierul video corespunzator.

Portal video

Multe companii asigura informarea angajatilor prin portale video pe internet accesate cel mai frecvent de pe PC-uri. Multe companii nu permit inca accesul prin intermediul telefoanelor mobile la portaluri datorita problemelor de securitate ce pot sa apara.

Intre timp, distribuitorii de servicii multimedia pe piata de telefonie ofera si acces la portaluri video de unde utilizatorii isi pot downloada o serie de clipuri pentru telefoane.

Aceste fisiere pot fi vizualizate si accesate prin intermediul IVR (interactive voice response) si continutul este similar cu cel a portalelor vocale.

Standarde

Prin continua dezvoltare a serviciilor de telefonie, distribuitorii si-au diversificat oferta de la dispozitive ce transmit numai vocea la dispozitive multimedia sofisticate ce sunt orientate mai mult pe partea vizuala si sunt mult mai usor de utilizat. Pentru a facilita tranzitia catre servicii exclusiv bazate pe multimedia, s-a dezvoltat o mare varietate de standarde ce asigura transmiterea multimedia de la infrastructura de retea la puncte finale reprezentate de dispozitive mobile.

Datorita naturii treptate a tranzitiei 3G si a standardelor competitive, distribuitorii de telefonie mobila trebuie sa suporte o serie de standarde de transmisie.

Iata in continuare o scurta descriere a principalelor standarde 3G.

Prescurtarea 3G denumeste a treia generatie de servicii wireless si descrie dezvoltarea tehnologiilor wireless pentru servicii personale sau de afaceri, indeosebi in domeniul telecomunicatiilor mobile. Aceasta etapa si-a atins maturitatea in anul 2005.

Dupa cum ii sugereaza si numele, aceasta faza urmeaza primei generatii (1G), respectiv celei de-a doua (2G), in comunicatiile wireless. Etapa 1G a inceput la finele anilor '70 si a durat cam un deceniu. Sistemele respective includeau primele telefoane intr-adevar mobile, cunoscute ca "radiotelefonie mobila celulara". Retelele foloseau traficul de voce analog si erau ceva mai sofisticate decat cele de tip repeater, folosite de operatorii de radio amatori. Faza 2G a inceput in anii '90, iar comunicatiile actuale mai folosesc in buna parte aceasta tehnologie. Telefoanele 2G prezinta codare digitala a vocii, de exemplu CDMA, TDMA si GSM. Fata de momentul conceptiei sale, tehnologia 2G s-a perfectionat continuu, marindu-se latimea de banda si pachetele de trafic, la care s-a adaugat serviciile multimedia. Etapa actuala a comunicatiilor mobile wireless se mai numeste si 2,5G.

3G, cunoscuta si ca 3-G, descrie telefonia mobila de a treia generatie. Serviciile asociate acesteia asigura atat transferul de voce (conversatie telefonica), cat si al datelor de alte tipuri (download, e-mailing, mesagerie instant).

In promovarea serviciilor 3G, videotelefonia a fost descrisa ca aplicatia de capatai, menita sa mature alte tipuri de telefonie. S-a creat o anumita stare de euforie, care a condus la acordarea contra cost a multor licente, mai ales in Europa. Intrucat sumele pentru acordarea de licente s-au strans cu mai multi ani inainte de obtinerea efectiva de venituri din afacerea 3G, multi operatori de telefonie s-au confruntat cu mari dificultati. Aceasta situatie a amanat implementarea solutiilor 3G in majoriotatea tarilor, cu exceptia Japoniei si Coreii, unde accentul nu s-a pus pe acordarea de licente, ci pe dezvoltarea unei infrastructuri IT nationale.

Prima tara care a introdus tehnologia 3G la scara comerciala extinsa a fost Japonoa.

3GPP

3GPP (3rd Generation Partnership Project) este un standard format din mai multe standarde de telecomunicatie ce lucreaz aimpreuna pentru a dezvolta un sistem bazat pe o retea de comunicatii GSM (Global System for Mobile) evoluata.

3GPP este responsabil pentru mentinerea standardelor in stansa legatura cu tehnologiile radio utilizate de GSM. Scopul original al acestui proiect a fost modificat ulterior astfel incat sa includa in dezvoltarea lui specificatiile tehnice ale GSM.

3GPP a definit doua specificatii tehnice pentru tehnologii de acces radio: GPRS si EDGE.

3GPP a pus bazele dezvoltarii de standarde pentru mecanismele de livrare. Unul din cele mai importante este IP Multimedia Subsystem (IMS) care asigura industria de telecomunicatii cu un standard modular bazat pe o infrastructura IP/SIP. IMS incurajeaza distribuitorii de servicii sa beneficieze de avantajul Ip-ului unic pentru a livra mai rapid, mai flexibil si cu un cost eficient servicii multimedia catre retele atat fixe cat si mobile.

GPRS

GPRS(General Packet Radio Service) reprezinta o modalitate de optimizare a aparatelor 2G, astfel incat acestea sa poate trimite si recepta mai repede informatii. Printr-o conexiune GPRS, telefonul este in permanenta conectat pentru transferul de date, care se efectueaza la viteze mari, in general 32-48 kbps. Un avantaj suplimentar consta in faptul ca transferul se poate face in paralel cu desfasurarea unei convorbiri telefonice. Majoritatea mobilelor noi au disponibilitate GPRS.

GPRS tine de o gama de tehnologii menite sa apropie retelele 2G de performantele retelelor 3G. Principala caracteristica a retelei 3G e data de capacitatea de a transfera cantitati mari de date la viteze ridicate (pana la 2 Mbps), ceea ce inseamna aplicatii de tipul video calling, download de material video, web browsing, e-mail etc. Marind viteza retelelor 2G, acestea pot suporta unele din aceste aplicatii, de pilda web browsing-ul sau expedierea si treceptia unor e-mail-uri cu fisiere atasate de mari dimensiuni. Dintre aceste tehnologii, denumite 2,5G si reprezentand ameliorari ale tehnologiei CDS, mai cunoscute sunt DSCSD si EDGE.

EDGE

Introducerea tehnologiei EDGE (Enhanced Data rates for GSM Evolution) marcheaza perfectionari ale suportului pentru transfer de date, operate asupra retelelor GSM. Aceasta tehnologie permite efectuarea unor servicii mobile avansate, cum ar fi descarcarea de material video si clipuri muzicale, messaging multimedia, acces la Internet de mare viteza si e-mail in timp real.

Tehnologia EDGE este o varianta a celei 3G care le asigura mobilelor viteze ridicate ale transferului de date in banda larga. Utilizatorul acesteia are acces la Internet, poate receptiona si expedia informatii din cele mai diverse, incluzand imagini si intregi pagini de web, la o viteza de trei ori mai mare decat cele posibile printr-o retea GSM/GPRS. Prin EDGE, operatorii GSM ofera acces mobil de mare viteza, pentru un numar semnificativ mai mare de clienti si eliberand din potentialul retelei pentru traficul de voce suplimentar.

3GPP2

3GPP2 este un standard tehnic orientat pe CodeDivision Multiple Access 2000 (CDMA2000). CDMA2000 este o tehnologie 3G fara fir care a evoluat pe baza specificatiilor existente pentru CDMA (Code Division Multiple Access).

Caracteristicile sale principale includ rate de tranfer a datelor mai mari, servicii de date intotdeauna conectate si o capacitate de voce a retelei imbunatatita.

Desfasurarea CDMA2000 are 3 faze:

  • Faza 1 - suporta o rata de transfer de pana la 144 kbps si dubleaza capacitatea de voce fata de reteaua CDMA
  • Faza 2 - suporta o rata de transfer de pana la 2.4 Mbps dar trebuie sa fie desfasurata utilizand un spectru separat de voce. Dispozitivele din aceasta faza vor suporta acces la ambele spectre.
  • Faza 3 - suporta o rata de transfer a datelor si a pachetelor de 3 pana la 5 Mbps si integreaza complet reteaua de voce de la faza 1.

Video Standards

Standardul de codare video MPEG-2 a fost dezvoltat acum mai bine de 10 ani si toate sistemele de televiziune digitala din lume il folosesc. MPEG-1 este un algoritm de compresie folosit pentru reducerea dimensiunilor fisierelor video. Compatibil video CD, MPEG-1 a fost introdus introdus in anul 1991 si ofera o rezolutie de 352 x 240 pixeli la 30 cadre pe secunda.

MPEG-2 este un standard de video compresie utilizat pentru broadcast direct pe satelit sau CaTV. MPEG-2 cu cateva modificari este folosit pentru compresia filmelor pe DVD.

MPEG-2 a fost dezvoltat impreuna cu ITU-T si este de asemenea cunoscut ca H.262. Impreuna cu VCEG (Video Coding Experts Group) a format apoi standardul MPEG-4.

MPEG-4 are nevoie de numai 700 kbps pentru a transmite imagine digitala la calitate de DVD. Utilizand faza 2 de implementare a CDMA2000, 3GPP2 a definit o implementare 3G pentru a soporta latimi de banza necesare transmiterii de imagini video de inalta calitate, in format MPEG-4.

Media Streaming

RTP (Real Time Protocol) este un protocol dezvoltat pentru transmiterea de date in timp real, inclusiv audio si video de la un capat la altul al retelei utilizand IP-ul.

RTP suporta multimedia asigurand timp de reconstructie, detectarea de pierderi si identificarea de continut.

Real Time Control Protocol (RTCP) este utilizat in stansa legatura cu RTP si asigura control asupra sesiunii media. RTCP sincronizeaza diferite trasnmisii media si asigura calitatea serviciilor intr-o sesiune RTP (QoS - Quality of Service).

Figura - Tehnologia simplificata de transmitere a serviciilor multimedia

Servicii multimedia pe Web - hipermedia

Cresterea masiva a numarului de servicii si produse Web este data de utilizarea unui tot mai bogat continut informational: imagini, video si sunet.

Combinarea si integrarea acestor medii formeaza multimedia, utilizata pe scara larga in reprezentarea si interschimbarea informatiilor. Diverse obiecte/documente multimedia incluzind hiperlegaturi definesc conceptul de hipermedia .

Pentru a intelege notiunea de hipermedia, trebuie sa intelegem ce inseamna hipertextul. In anul 1965, Ted Nelson inventeaza termenul hipertext (text non-linear), definindu-l drept 'material scris sau grafic interconectat intr-o maniera complexa care in mod conventional nu poate fi reprezentat pe hirtie. El poate contine cuprinsuri ale propriului sau continut si relatiile dintre diverse parti componente; poate de asemeni contine adnotari, adaugiri si note de subsol pentru cei care doresc sa-l examineze.'

In cadrul Laboratorului Media de la MIT, incepind cu anii '70, s-au dezvoltat o serie de sisteme multimedia clasice, surse de inspiratie pentru aplicatiile actuale. Dintre acestea se pot mentiona: Spatial Data Management System, Aspen Movie Map, Project Athena, care definesc si domeniile de interes ale hipermediei: simulari interactive, colaborari stiintifice la distanta, invatamint.

Noduri si legaturi

Conceptul esential prezent in cadrul hipertextului este cel al legaturilor (ce apar in cadrul aceluiasi document si/sau intre documente diferite). Aceasta caracteristica de legare permite organizarea non - lineara a informatiilor.

Un sistem hipermedia este constituit din noduri (concepte) si legaturi (relatii). Un nod reprezinta, in mod uzual, un concept unic (o idee), putind contine text, grafica, animatie, audio, video, imagini sau programe.

Un nod poate avea asociat un tip (detaliu, propozitie, colectie, observatie etc.) inglobind o informatie semantica. Nodurile sint conectate de alte noduri prin intermediul legaturilor. Nodul sursa al unei legaturi se numeste referinta, iar cel destinatie referent, putind fi denumite si ancore. Continutul unui nod se afiseaza la activarea legaturii.

Legaturile sint conexiuni intre noduri (sau concepte) dependente unul de altul, putind fi bidirectionale sau doar unidirectionale (similare comunicatiilor duplex ori simplex). Si legaturilor li se pot asocia tipuri (legatura de specificare, de elaborare, legatura membru, legatura de opozitie etc.), definind natura relatiei dintre noduri. Legaturile pot fi referentiale (pentru realizarea referintelor incrucisate) sau ierarhice (ilustrind relatiile parinte - copil dintre noduri). Activarea marcajelor unei legaturi duce la vizualizarea (activarea) nodurilor.

Sincronizarea

In ultimul timp, hipermedia isi gaseste utilizari in variate domenii ca:

  • televiziune pe Web (TV Web)
  • prezentari multimedia pe CD sau DVD
  • televiziune/video in interactiune cu utilizatorul sau la cerere

In aceste arii trebuie avuta in vedere sincronizarea prezentarilor multimedia.

Trebuie facuta distinctia intre documente hipermedia si obiecte hipermedia. Obiectele in general reprezinta date monomedia (ca filme MPEG si imagini GIF, identificate de URI ori tipuri MIME). Documentele pot fi privite ca o colectie de obiecte, descriind meta-informatiile referitoare la obiectele componente. Aceste informatii includ relatiile temporale, spatiale si de continut intre mai multe obiecte si atributele unor obiecte individuale. Ca exemple de astfel de documente se pot mentiona HSL sau SMIL (prezentat acum citeva numere in cadrul acestei publicatii).

Model matematic

Prezentarea unui document hipermedia temporal poate fi modelata de un digraf aciclic (DAG), nodurile reprezentind obiecte media si arcele reprezentind evolutia in timp a acestora.

Figura - Graful DAG al unei prezentari

Intuitiv, un arc de la virful v1 la virful v2 inseamna ca v1 si v2 sint rulate secvential, v1 inaintea lui v2, fara a se suprapune in timp. In orice moment al unei prezentari, poate exista o multime (posibil vida) de obiecte evoluind pe ecran, acest lucru fiind modelat ca un set de fire de executie concurente, fiecare fir (thread) prezentind un obiect activ. Numarul threadurilor se modifica in mod dinamic pe parcursul prezentarii multimedia.

Modelul de sincronizare, Media Relation Graph (MRG) , se bazeaza pe rafinarea grafului temporal descris. Pentru reprezentarea informatiilor MRG este necesar un limbaj de descriere, de exemplu Hypermedia Synchronization Language (HSL) si Synchronized Multimedia Integration Language (SMIL), bazate pe SGML.

Exista doua nivele de sincronizare multimedia: sincronizare intra-obiect si sincronizare interobiect. Sincronizarea interobiect priveste relatia temporala in cadrul aceluiasi obiect, cum ar fi un video-clip, iar sincronizarea interobiect se refera la relatiile temporale dintre mai multe obiecte. Sincronizarea inter-obiect se poate partitiona in doua subcategorii: sincronizare de nivel scazut si sincronizare de nivel ridicat, cea din urma fiind bazata pe punctele de sfirsit a derularii fiecarui obiect (mai des utilizata).

Planificarea unei prezentari multimedia

In functie de comportamentul in timp, obiectele media pot fi clasificate astfel:

  • obiect marginit

Timpii de inceput si de sfirsit ai evolutiei obiectului sint cunoscuti. De exemplu, texte sau imagini avind atributul durata specificat, resurse video sau audio pre - inregistrate etc. Vom denumi obiectele audio/video continue, iar obiectele text/imagine discrete.

  • obiect neterminat

Timpul de start al unui obiect este cunoscut, dar timpul de sfirsit nu.

  • obiect nepredictibil

Obiect care poate fi inceput de o hiperlegatura si terminat de alta.

Pentru majoritatea documentelor multimedia, duratele obiectelor audio/video nu sunt specificate, deci nu putem obtine timpii lor de sfirsit la nivelul procesarii documentului. Pot apare probleme si la transferul prin retea a unor obiecte continue aflate la distanta. Astfel, toate obiectele care nu au explicit specificat atributul durata vor fi considerate obiecte neterminate. In fapt, prezentarile multimedia pe Web au un caracter nedeterminist. Un obiect, din cadrul unei prezentari, poate fi in una din starile: activat, in executie, oprit, terminat, expirat sau dezactivat.

Protocoale de sincronizare multimedia: analiza si comparatie

Odata cu expansiunea aplicatiilor multimedia distribuite, precum videoconferinta, video la cerere (VoD), invatamant la distanta, jocuri distribuite, filme la cerere, videotelefonie, sincronizarea diferitelor tipuri de fluxuri media (dependente sau independente temporar) a devenit parte integrala a diverselor protocoale, mecanisme si servicii in sistemele de calcul si de comunicatii.

Trasatura esentiala a unui sistem multimedia este integrarea in aplicatie a datelor, semnalelor audio si semnalelor video. Cerintele aplicatiilor multimedia pot fi specificate prin functionalitati si parametri de calitate a serviciului, QoS.

Multicast, multiconexiune, sincronizare sunt cateva din functionalitatile unui flux multimedia, iar largimea de banda, debit, intarziere, procent de erori acceptabil reprezinta parametrii QoS cei mai importanti. Parametrii sunt utilizati de sistemele de comunicatii pentru a garanta executia normala a aplicatiei.

Aplicatiile multimedia pot fi aplicatii in timp real, cu necesitatea garantarii largimii de banda si a debitului cerute de aplicatie, precum si cu impunerea sincronizarii intre utilizatori si intre fluxurile media implicate, respectiv fara constrangeri de timp, mai putin consumatoare, cu privire la banda si debit. Fluxurile media pot fi:

  • discrete - cu valori independente in timp (text, grafice) si timpi de raspuns de ordinul secundelor, respectiv
  • continue - cu valori dependente in timp (voce, video).

Intr-un un flux media exista 3 tipuri de relatii:

  • de continut (dependentele intre obiectele documentului),
  • spatiale (definesc spatiul utilizat pentru prezentarea unui obiect la un periferic de iesire, la un moment dat, intr-o prezentare)
  • temporale (definesc dependentele temporale intre obiecte).

Specificarea acestora poate fi realizata implicit (restituite exact cum au fost capturate) sau explicit (obiecte create sau capturate independent).

O aplicatie multimedia cere, in general, 4 tipuri de sincronizari:

  • inter-media - care face referinta la relatia temporala intre multiple unitati de prezentare ale unui mediu continuu,
  • intra-media - care face referinta la relatia dintre obiectele ce compun fluxul media,
  • conditionala
  • multipunct care fac referinta la prezentarea unui eveniment daca se indeplineste o conditie, respectiv, la producerea acestuia, in acelasi timp in diferite locatii.

Sincronizarea inter-media poate fi in timp real (se reproduc pe durata de restituire aceleasi relatii temporale, prezente in perioada de achizitie) sau artificiala (aplicatiile pot replanifica sincronizarea, existand relatii flexibile de sincronizare intre diferite medii). Relatiile temporale ale unor astfel de aplicatii sunt variabile.

Bibliografie

Sabin Corneliu Buraga - Hipermedia: multimedia + hiperlegaturi

Henri - George Coanda - Protocoale de sincronizare multimedia

Intel - An Introduction to Multimedia Services

www.wordiq.com

https://www.intel.com/technology/atca/proddev.htm






Politica de confidentialitate





Copyright © 2024 - Toate drepturile rezervate