20 Marzo, 2019 | Di Wellnet

Conversation Design: perché ai robot serve una sceneggiatura?

Samantha: Is that weird? You think I'm weird?

Theodore: Kind of.

Samantha: Why?

Theodore: Well, you seem like a person but you're just a voice in a computer.

Samantha: I can understand how the limited perspective of an unartificial mind might perceive it that way. You'll get used to it.

Questo dialogo è tratto dal film Lei di Spike Jonze, in cui Joaquin Phoenix (Theodore) si innamora di un software di intelligenza artificiale (Samantha, doppiata da Scarlett Johansson), in pratica un assistente vocale in grado di apprendere ed elaborare non solo comandi e richieste, ma anche emozioni. Il film è uscito nel 2013 e intendeva rappresentare un prossimo futuro nel quale si può conversare con il proprio computer come se fosse un altro essere umano. Ebbene, chiediamo scusa per la banalità, ma il futuro è adesso.

A distanza di sei anni, infatti, la situazione descritta nel film (non l’innamoramento, ma la conversazione naturale tra umano e macchina) non ci sembra più così assurda. Questo perché il settore dei vocal assistant ha fatto passi in avanti giganteschi e promette di non accontentarsi, aprendo scorci sui futuri utilizzi di questa tecnologia degni della fantasia di uno scrittore di fantascienza.

Conversation Designer: da nuove tecnologie derivano nuove figure professionali

Lo sviluppo dei vocal assistant ha portato alla nascita di nuovi rami nel mondo del digital marketing e, con essi, di nuove figure professionali. Tra queste, il conversation designer, ovvero colui che si occupa di progettare “il ponte” che collega l’umano con il robot.

Il lavoro del conversation designer, infatti, consiste nel disegnare quasi letteralmente le interazioni che un utente potrebbe avere con un vocal assistant, tenendo conto degli obiettivi e dei bisogni del primo così come delle limitazioni del secondo.

A questo ruolo di “architetto” delle conversazioni si affianca quello di sceneggiatore: il conversation designer deve, infatti, scrivere i dialoghi del robot in modo che aiutino l’utente a raggiungere ciò di cui ha bisogno.

Il tutto, con due obiettivi bene in mente:

Creare conversazioni naturali e intuitive per gli utenti, adatti ai diversi device.
Aiutare gli utenti a soddisfare la loro richiesta.

Il primo step: la definizione della user persona

Quando si scrive una sceneggiatura, una delle prime cose da fare è definire i personaggi. Nel caso del conversation designing, sono solo due: l’utente e il bot. Nella nostra metafora cinematografica, il “personaggio” dell’utente viene interpretato dalla cosiddetta user persona: un profilo fittizio che rappresenta l’utilizzatore medio dell’assistente vocale che stiamo progettando.

Facciamo un esempio. Supponiamo di dover progettare un’app vocale che aiuti a trovare biglietti aerei a poco prezzo. Probabilmente, tra le nostre user persona dobbiamo prendere in considerazione il profilo di un utente piuttosto giovane. Ecco chi potrebbe essere.

User Persona: Anna Travel, 27 anni, web designer con la passione per il mondo dell’animazione.

User Goal: Anna vuole viaggiare in posti esotici e lontani, visitando il lato meno turistico delle sue mete e cercando di spendere il meno possibile.

User Context: Anna utilizzerà l’app vocale a casa mentre organizza il suo prossimo viaggio.

Il secondo step: la definizione della system persona

Il secondo personaggio è il robot. In questo caso, dobbiamo definire la system persona: un altro profilo fittizio che si basa sulla user persona e che indica con che tone of voice il software parlerà con l’utente.

Considerando la user persona, scegliamo come system persona Rob Bot: 30 anni, amichevole, informale, disponibile e simpatico.

La voce e i “dialoghi” devono rappresentare questa personalità. Scegliamo quindi una voce maschile tra quelle robotiche che ci forniscono le piattaforme di sviluppo di app vocali più utilizzate (come Google e Amazon) oppure possiamo far registrare le battute da un attore e utilizzare quelle (opzione più naturale ma molto meno flessibile).

Il terzo step: progettare la conversazione

Avendo ben chiari i personaggi, il conversation designer può progettare la conversazione. L’obiettivo, come dicevamo, è renderla il più efficace e naturale possibile. Per questo, si seguono alcune regole.

Il principio cooperativo

In linguistica, il principio cooperativo descrive come le persone realizzano una comunicazione conversazionale efficace in situazioni sociali comuni. In una conversazione cooperiamo istintivamente se il contributo alla conversazione sarà:

informativo quanto richiesto;
vero;
pertinente all'argomento;
chiaro, senza ambiguità.

Progettando il vocal assistant, il conversation designer deve seguire queste regole con attenzione se vuole riuscire a costruire una conversazione naturale e produttiva.

I contesti di conversazione

Un altro concetto fondamentale per creare conversazioni naturali è quello dei contesti.

Se per un bot è molto semplice capire cosa diciamo, non è altrettanto semplice capire cosa intendiamo. Quello che fa la differenza è, appunto, il contesto.

Quando parliamo tra esseri umani, infatti, facciamo spesso riferimento a cose, persone o concetti senza nominarli direttamente, ma mantenendoli sottintesi. Questo perché comunichiamo all’interno di un contesto (o più di uno) che ci aiuta a decifrare ciò che diciamo. Per un software è più complesso e per questo è molto importante indicargli, per ogni flusso di conversazione, quali risposte dell’utente fanno parte dello stesso contesto e quali no.

Facciamo un esempio.

vocal assistant

In questa conversazione, il problema è abbastanza evidente. Tra umani avremmo capito senza problemi che Anna si riferiva ancora a Parigi come destinazione del suo viaggio, questo perché il contesto della conversazione era un viaggio da Milano a Parigi. Per l’assistente vocale non è così scontato e bisogna, in fase di sviluppo, ricordarsi di “farglielo presente” e progettare la conversazione di conseguenza. Più o meno così:

vocal assistant

Altri trucchi per una conversazione naturale

Il conversation designer deve tener conto di altre regole per rendere la conversazione più naturale.

Follow-up: il bot guida la conversazione attraverso domande mirate. “Ecco i voli che ho trovato. A quale sei interessato?”
Riferimenti a elementi sullo schermo: nel caso si utilizzi un device con schermo, fare riferimento a ciò che viene mostrato semplifica l’interazione con l’utente. “Il bagaglio a mano dev’essere grande come questo. -Immagine- Vuoi sapere quanto costa portare un bagaglio in stiva?”
Variazioni: ripetere le stesse cose sempre nello stesso modo rende l’interazione poco scorrevole. È buona prassi aggiungere variazioni alle proprie risposte. “Il volo parte alle 5 meno un quarto” e ancora “Il volo parte alle 4 e 45”.
Turni: una conversazione efficace si svolge a turni evitando di interrompere l’altra persona. Il bot dovrebbe sempre dare un segnale all’utente per fargli capire quando è il suo turno per parlare. Ad esempio, può fargli domande, oppure non monopolizzare la conversazione con interventi troppo lunghi.
Pertinenza: siamo sicuri che il vocal assistant sia uno strumento adatto a ogni situazione? Sebbene la tentazione sia forte, bisogna anche considerare l’effettiva utilità dello strumento. Ad esempio: utilizzare un vocal assistant per permettere agli utenti di scoprire se sul volo è compreso il pasto può essere utile; al contrario, elencargli tutte le pietanze nel menù potrebbe non esserlo.

Il quarto step: prototipare la conversazione

Adesso che il conversation designer conosce la user persona, la system persona e le regole da seguire per progettare la conversazione, è ora di costruire un prototipo.

In questo modo, è più semplice immaginare tutti i possibili casi di utilizzo dell’assistente vocale, inserire tutte le possibili risposte e capire verso quale direzione l’utente potrebbe portare la conversazione. Nella nostra esperienza, abbiamo deciso di rappresentare graficamente questo processo attraverso dei diagrammi, come quello qui sotto.

conversazione

Il quinto step: “suonare” naturali

Come abbiamo già sottolineato, anche la voce dell’assistente vocale incide sulla conversazione con l’utente. Con questo obiettivo bene in mente, dobbiamo anche fare in modo che la voce del bot sia il più naturale possibile. A questo fine, possiamo utilizzare l’SSML (Speech Synthesis Markup Language), un linguaggio di markup orientato ai sistemi di conversione del testo in parlato, con il quale possiamo “controllare” come vengono pronunciate le nostre frasi dal vocal assistant.

Ovviamente, le limitazioni tecniche sono ancora molte, ma tantissimi problemi sono già stati risolti e, in un futuro non molto lontano, le conversazioni come quelle tra Theodore e Samantha saranno non solo possibili, ma del tutto ordinarie.

Wellnet

Wellnet è una nuova realtà nel panorama delle agenzie digitali italiane: 70 expertise complementari e integrate, con sedi a Milano, Torino Cuneo e Modena, frutto della fusione di tre realtà di successo preesistenti.