|
La qualità
della voce su IP
E'
indubbio che la soddisfazione degli utilizzatori per quanto riguarda
la percezione della qualità delle comunicazione vocale è
un fattore rilevante.
Nel seguito si analizzano alcune componenti che influenzano la qualità
delle voce e si introduce una metodologia usata nelle reti VoIP
per valutare il livello di qualità di una conversazione tramite
un valore numerico.
L'indicatore
di riferimento é denominato MOS (Mean Opinion Score).
Il MOS è un valore numerico standard utilizzato
per misurare la qualità vocale e creare dei report.
Il MOS ha un range che va da un punteggio massimo di
5, che significa una qualità paragonabile a quella che si
avrebbe parlando direttamente nell'orecchio di una persona, a un
valore di 1, ovvero una qualità della voce inaccettabile
per chiunque.
Nel dettaglio i valori standard del MOS in ordine crescente
sono:
- 1
Scarso (interruzioni continue e incomprensibili)
-
2 Insufficiente (difficoltà nella comprensione)
-
3 Sufficiente (qualità tipica GSM)
-
4 Buono (telefonata tradizionale)
-
5 Eccellente (qualità radio AM).
Un
MOS che va da 4,4 a 4,5 è considerato equivalente a quello
della qualità della voce di una chiamata da un telefono pubblico
sulla rete PSTN.
Gli utenti che indicano un MOS di 4,5 sono molto soddisfatti delle
proprie telefonate.
Un MOS di 4 è considerato ancora accettabile dalla stragrande
maggioranza degli utenti.
Ma quando il MOS scende a 3,5, alcuni utenti iniziano a trovare
la qualità vocale inaccettabile.
La maggior parte delle chiamate dei cellulari ha un rating di MOS
da 3,8 a 4, dove il riconoscimento di chi parla e di quanto viene
detto possono essere compromessi.
Quando
il MOS scende al di sotto di 3,5, gli utenti sono insoddisfatti
e concludono la telefonata.
Un MOS sotto 2,6 è indice di una chiamata terribile. L'utente
che sperimenta un MOS di 2,6 ha bisogno di trovare un'alternativa
di rete per effettuare la chiamata – questo, per esempio,
è il caso che si verifica quando una chiamata wireless viene
terminata e la si riprende tramite il tradizionale collegamento
telefonico.
Nella classica telefonia PCM a 64 kbps la qualità MOS ottenibile
é pari a 4,3.
Lo
standard P.800 definito dall’International
Telecommunication Union (ITU) per la tecnica della misurazione del
MOS è stato aggiornato a metà degli anni '90 e si
svolge secondo questo criterio: a 30 o più persone viene
chiesto di ascoltare da 8 a 10 secondi di un discorso in condizioni
controllate. Gli ascoltatori sono invitati poi a convertire in voto
i loro pareri sulle chiamate con un punteggio della chiamata che
va da 5 a 1 come sopra detto.
La
qualità delle connessioni VoIP dipende da due fattori:
-
il tempo di latenza (latency); ovvero il tempo che intercorre
dal momento che certe parole sono pronunciate da un lato al momento
che queste sono effettivamente sentite dall’altro lato;
-
il grado di rispondenza della voce trasmessa rispetto alla voce
naturale di chi parla.
Gli
elementi della qualità
Una buon livello di chiarezza è la base di una chiamata
vocale accettabile. Con il termine chiarezza intendiamo sia la chiarezza
del discorso sia la fedeltà, l'intelligibilità e la
mancanza di distorsione.
Le seguenti cinque componenti definiscono gli elementi di buona qualità
per una chiamata unidirezionale:
- Frastuono.
Il livello di volume del discorso non può essere troppo
basso (sussurro) o troppo alto (urlo).
-
Distorsione. Maggiore è la distorsione più scarsa
è la comprensione della conversazione. A causa della distorsione
potreste addirittura non essere in grado di riconoscere chi parla.
-
Rumore. Il rumore di fondo esiste in forma statica e di ronzio
in tutte le chiamate. Questo è noto come livello di rumore.
Il rumore può, tuttavia, essere a un livello abbastanza
basso per chi ascolta o può non essere notato affatto.
-
Dissolvenza. Il livello del segnale può cambiare, aumentando
o diminuendo durante la chiamata.
-
Interferenza. Situazione nella quale si riesce ad ascoltare la
conversazione di un'altra telefonata.
I
seguenti quattro elementi completano l'elenco dei fattori da prendere
in considerazione per la qualità della voce. Se combinati
con i cinque precedenti elementi definiscono completamente la qualità
vocale o la qualità di una conversazione:
- Eco.
L’eco è il ritorno del suono della voce di chi parla
e viene quindi sentito da chi parla. Chi ascolta può non
percepire un’eco dovuto a un breve ritardo, però
più è lungo il ritardo sul tragitto di andata e
ritorno, è più difficile per chi ascolta ignorare
l’eco. Se questo diventa molto rilevante, chi parla tende
a fare una pausa in modo che l'eco non interferisca con il discorso.
-
Latenza. È il tempo che impiega una parola a percorrere
il tragitto dal microfono di chi parla al ricevitore di chi ascolta.
Il ritardo della linea telefonica tradizionale (PSTN) è
di solito inferiore ai 30 millisecondi. L’obiettivo della
latenza è di avere un ritardo di 100 ms in una direzione
nelle chiamate VoIP, con un limite massimo di 150 ms. Una latenza
molto elevata costringe chi parla a fare delle pause per essere
sicuro che il suo interlocutore abbia finito di parlare. In alcuni
casi, si arriva ad interrompere la conversazione.
-
Performance di Soppressione del silenzio. La soppressione del
silenzio è impiegata nel VoIP per ridurre il consumo di
larghezza di banda. Quando sono utilizzate queste tecnologie,
l'inizio e la fine delle parole tendono a essere tagliati.
-
Cancellazione dell’eco. Più lunga è la latenza,
più è importante eliminare l'eco. Gli echi possono
verificarsi in una direzione o in entrambe le direzioni.
La
combinazione di questi nove elementi contribuirà alla chiarezza
di una chiamata vocale
Più
di recente é stata introdotta una nuova tecnica per il calcolo
dei punteggi MOS.
Si tratta del fattore R, basato su un’analisi della perdita
dei pacchetti, sul ritardo, sullo jitter (brusca variazione di una
caratteristica di un segnale) e su una stima della percezione da
parte degli utenti.
La tabella mette in relazione la soddisfazione degli utenti nei
confronti della chiamata con il fattore R e l’indicatore MOS.
|