|
Il
mercato delle soluzioni speech
Le novità da ScanSoft Divisione
SpeechWorks®
Come cambia il mercato
Nei
Call Center il tema del confronto tra riconoscimento vocale e soluzioni
DTMF sta provocando un particolare dibattito.
Alcune società (in particolare quelle che svolgono servizi
finanziari) che hanno adottato il riconoscimento vocale evidenziano
i benefici derivanti dall’implementazione, nella customer
satisfaction, nella riduzione dei costi e nel miglioramento della
competitività.
Altri Call Center credono che i loro atteggiamento nei confronti
del sistema Ivr già adottato sia da considerarsi adeguato
e sono scettici sul fatto che l’aggiunta del riconoscimento
vocale sia giustificato e, comunque, non ritengono che i benefici
attesi possano giustificare un nuovo investimento.
Secondo una ricerca che Datamonitor ha condotto alla fine del 2004
il mercato del riconoscimento vocale ha raggiunto un punto di sviluppo
cruciale, dopo che per molti anni le società dell’offerta
di soluzioni speech hanno cercato il modo per sostituire le soluzioni
Ivr che si basano sui toni ottenuti selezionando un numero da tastiera
multifrequenza (touch tone in DTMF).
Dal
campione di Datamonitor nel 2004 il mercato mondiale di Ivr è
valutato pari a 1.300 milioni di dollari, mentre quello dello speech
veniva stimato pari a poco più di 1.000 milioni, contro
appena 150 milioni del mercato 2003.
Sempre secondo la stessa fonte, nel 2005 la spesa per il riconoscimento
vocale supererà quella per le soluzioni Ivr.
Secondo
Ascent Group il 40% delle società contattate hanno deciso
di adottare soluzioni di riconoscimento vocale e altre ancora prevedono
di dotarsene nel breve medio termine.
Il problema resta quello di capire quali applicazioni sono più
adatte ad essere sviluppate sulle nuove piattaforme e come esse
possono essere integrate in un’ottica di miglioramento del
servizio ai clienti.
Inoltre va rilevato che in molti evidenziano i limiti delle attuali
soluzioni basate su Ivr touch tone.
A tal proposito, nel 2003 la Forrest Research ha condotto uno studio
domandando alle società con quale canale ritenevano di poter
risolvere meglio le esigenze dei clienti: il telefono e le reti
commerciali
tradizionali risultavano al primo posto, ma all’ultimo veniva
relegato l’Ivr.
Con la crescente adozione del riconoscimento vocale e la sua possibilità
di essere complementare e/o sostitutivo del DTMF altri studi (Apex
Research 2004) hanno evidenziato che i clienti preferiscono il primo
rispetto al secondo.
In particolare una ricerca ha individuato che, mentre l’82%
delle chiamate si concludevano in modo soddisfacente se veniva impiegato
il riconoscimento vocale tale percentuale scendeva al 57% nel caso
di impiego del DTMF.
Infine una ricerca di The Ascent Group ha evidenziato che i sistemi
più opportuni per migliorare le prestazioni dell’IVR
sono l’adozione del riconoscimento vocale e l’aumento
delle funzionalità del sistema.
Una delle domande che le aziende pongono più di frequente
riguarda il livello di miglioramento che può essere raggiunto
mediante l’aggiunta del riconoscimento vocale al proprio sistema
Ivr. La risposta
dipende da molti fattori, ad esempio l’applicazione specifica
e il livello di impiego raggiunto dall’Ivr. Nel caso siano
state individuate le corrette aree di applicazioni consolidando
l’uso della piattaforma con l’impiego del riconoscimento
vocale si possono ottenere miglioramenti dal 10% al 20%.
Le società possono avere vari obiettivi per impiegare il
riconoscimento vocale. Non sorprende che al primo posto si trovi
la riduzione dei costi e che al secondo si proponga di aumentare
la soddisfazione del cliente (tutte le società campionate
hanno citato queste motivazioni). Ma va anche evidenziato che per
il 90% dei casi il motivo
può essere l’ottenimento di un vantaggio competitivo
e nell’85% dei casi si cerca di aumentare la produttività
degli operatori di call center.
Una ricerca ScanSoft sui motivi per cui le aziende adottano soluzioni
vocali è sostanzialmente in linea con la precedente analisi.
Infatti il 43% cita la volontà di aumentare il livello di
soddisfazione del cliente, un altro 43% cita l’obiettivo della
riduzione dei costi, un 9% si propone di incrementare il fatturato
e il restante 5% cita la differenziazione con i competitori.
Gartner ha evidenziato che negli Usa il costo di una soluzione di
riconoscimento vocale incide da 0,20 a 0,45 dollari al minuto e
che tale costo va confrontato con i compensi dovuti agli operatori
di call center, compensi che variano da 7 a 18 dollari al minuto
a seconda dei diversi settori di attività (meno nel comparto
finanziaro e di più in quello dell' higt-tech).
Infine
una ricerca sul ROI del Kelsey Group ha rilevato un periodo di recupero
dell’investimento da 6 a 9,5 mesi con un incremento dell’automazione
rispetto alla soluzione touch-tone esistente variabile dal 30% al
55%.
La visione di ScanSoft
Nel corso di un Forum dedicato ai principali
Partner che operano in area EMEA e tenutosi a Malta (20 -22 Aprile
2005) ScanSoft ha confermato che le "tecnologie vocali"
stanno diventando l'area di business più importante nell'ambito
del mercato CRM.
ScanSoft
nasce nel 1993 evolvendo da Business Unit di Xerox e negli anni
più recenti e’ entrata nel mercato delle tecnologie
vocali automatiche attraverso le acquisizioni di Learnout&Hauspie
(2001), Philips Speech Processing (2002) e SpeechWorks (2003). Il
dinamismo di ScanSoft nello Speech e’ continuato attraverso
una crescita organica e nuove acquisizioni che ne hanno ulteriormente
ampliato l’offerta. Basti citare le più recenti:
- Rhetorical, TTS provider, a dicembre 2004
- Phonetic, soluzioni auto-attendant, a gennaio
2005
- Advanced Recognition Technology (ART), embedded
speech systems, ancora a gennaio 2005.
Oggi
migliaia di aziende in 17 paesi sono clienti della Divisione SpeechWorks®.
Nel campo delle tecnologie vocali i sistemi di riconoscimento vocale
automatico supportano attualmente 48 lingue, mentre i sistemi i
tipo text-to-speech operano con 22 lingue.
Secondo Frost & Sullivan la società è market leader
per ASR (Automatic Speech Recognition) e per TTS (Text To Speech)
in base al numero di licenze vendute.
In base ai dati di Gartner, ScanSoft nel 2004 ha consegnato 63.900
porte sw di speech recognition, circa il 43% del totale.
"Mentre
si sta delineando uno scenario in cui la voce sarà l'interfaccia
più impiegata per le interazioni atomatiche con i clienti
e le applicazioni debbono essere affidabili e semplice da usare
- ha dichiarato Peter Mahoney, vice
president of worldwide marketing for SpeechWorks, divisione di ScanSoft
- i riconoscimenti internazionali che
ci vengono attribuiti confermano che soluzioni tipo OpenSpeech Dialog
permettono alle aziende di costruire soluzioni con linguaggio naturale,
in modo da rendere i servizi di interazione particolarmente graditi
ai loro clienti".
Secondo
ScanSoft il mercato dello speech sta attraversando un momento di
particolare cambiamento.
Si sta passando da una situazione in cui le funzionalità
di processo della voce sono collocate su sistemi centralizzati (ad
esempio in un Ivr di un Call Center) o sono embedded all'interno
di un terminale (ad esempio in un telefonino) ad una nuova architettura
che integra entrambe queste situazioni.
La tavola sotto riportata mostra l'evoluzione verso la soluzione
convergente di speech distribuito.
Nella
nuova architettura tutti i componenti presenti vengono usati ed
interagiscono tra di loro. Ad esempio attraverso un telefono cellulare
si possono gestire alcune parti di apertura e chiusura di una conversazione,
mentre il sistema centralizzato é dedicato al riconoscimento
vocale vero e proprio.
Questo genere di architettura portera’ vantaggi all'operatore,
che può contare su una maggiore affidabilità del servizio
e, soprattutto, su una gestione centralizzata più efficace:
si pensi alla possibilità di aggiornamento dei servizi e
di proporne dei nuovi agli utenti. Gli utenti potranno beneficiare
invece di servizi piu’ piu’ veloci, flessibili e facili
da utilizzare.
La posizione sul mercato
Da
evidenziare il recente lancio di Open Speech Dialogue,
il nuovo gestore di dialoghi che consente la realizzazione di vere
e proprie “Conversational Applications” su qualsiasi
piattaforma IVR compatibile con lo standard VXML.
Tra
l’ampia offerta di soluzioni si segnalano:
-
RealSpeak, Sistema Vocale per soluzioni complesse
che permette di gestire le informazioni che nei Call Center hanno
forma originaria di dati, possono essere dati contabili, informazioni
sui clienti, indirizzi, numero di telefono. Viene impiegato per
gestire messaggi e-mail o di tipo sms.
- SpeechSecure, permette
di certificare l’identità di chi chiama un Call Center
attraverso parametri biometrici. Garantisce la gestione in modalità
automatica di transazioni finanziarie, ma può anche essere
applicato per gestire password di accesso su web e per prevenire
frodi.
La
tavola seguente evidenzia le potenzialità di impiego delle
soluzioni offerte da ScanSoft.
Gli
impieghi che vedono come protagonista le soluzioni speech ed il
telefono cellulare sono sempre più significativi.
Molto interessante é il caso applicativo realizzato con Vodafone
Australia per la gestione delle attivazioni delle Sim prepagate.
Vedere demo:
Ma gli sviluppi maggiori riguardano le possibilità di operare
in multimodalità.
In tal caso i comandi di imput si effettuano con la voce (superando
i limiti di interfaccia del device) mentre l'output può essere
reso attraverso il video a colori. Si può, ad esempio, trattare
di un indirizzo e di un'altra informazione evidenziati su una mappa.
A seconda del dispositivo impiegato é
così possibile avere maggiore integrazione e convergenza
e passare da una tradizionale chiamata "buia" ad una chiamata
"colorata" con informazioni tramite Mms o condivise in
cobrowsing tra un cliente ed un operatore di Call Center.
Mobile Dictation
Nel corso del Forum di Malta ha attirato particolare attenzione
la dimostrazione del funzionamento di Mobile Dictation.
La dimostrazione, estramente efficace, riguarda i servizi più
usati dall'utente in movimento tramite il proprio telefonino:
-
messaggeria istantanea (AOL)
-
ricerca su web (Google)
-
invio o gestione e-mail (Outlook Microsoft).
Per
effettuare la demo:
|