Innovatie

Spraakgestuurde user interfaces: onzichtbare brug tussen mens & technologie

0

Spraakgestuurde user interfaces maken de wereld groter. Ook voor de digitaal minder vaardigen. Binnenshuis en daarbuiten is grootschaliger gebruik van voice-technologie niet ver weg. Want: de beste techniek vraagt niet langer om lezen, schrijven of het handmatig bedienen van apparaten, maar is onzichtbaar.

‘Hey Google, zet de thermostaat op 20 graden.’

‘Siri, bel Anna.’

‘Speel het nummer met de tekst Old man take a look at my life.’

In steeds meer huishoudens vind je spraakgestuurde user interface-technieken. Siri deed in 2011 zijn intrede als nieuwe feature op de Apple iPhone. Opeens konden we handsfree de telefoon opdracht geven om iemand te bellen of het antwoord op een vraag te googelen. De inmiddels geïntroduceerde ‘huisassistenten’ Google Home en Alexa van Amazon werken op eenzelfde manier: via een ontvanger wordt een gesproken opdracht gehoord. Dit is bijvoorbeeld een zoekvraag of een handeling om uit te voeren. De huisassistent beantwoordt door de speaker en voert de opdracht uit via de internetverbinding.

Over de individuele voordelen van spraakgestuurde interfaces is al veel geschreven. Met name over de mogelijkheden die het binnenshuis biedt. Van de broodbakmachine en het espresso-apparaat, tot de verwarming en lichten die via de digitale huisassistent en een internetverbinding aangestuurd kunnen worden. Spraakcommando’s in huis zijn de toekomst. En geef ons eens ongelijk. Het is toch heerlijk om op de bank te ploffen en eenvoudigweg Alexa te vragen om de lampen te dimmen.

Maar voice user interface biedt de samenleving zoveel meer dan ‘gemak’. Nu zijn het de digitale koplopers die de nieuwste technologieën in huis nemen. Maar ook – of juist – voor een minder digitaal vaardige groep biedt het volop mogelijkheden. Het volgende voorbeeld illustreert de verstrekkende voordelen van voice.

Voice verandert levens

Neem Roel. Roel is achter in de 70 en woont in de stad. Zijn familie en vrienden wonen ver weg. Met de laptop en een mobiele telefoon kan hij net uit de voeten. Maar van harte gaat het niet, het is toch elke keer weer zoeken naar de juiste knopjes en buttons.

Van zijn zoon krijgt hij een Google Home. Die installeert zichzelf en koppelt andere intelligente apparaten in de buurt automatisch. ‘Ik heb een Chromecast gevonden, zal ik die toevoegen?’ Een gesproken beaming van Roel volstaat. Vaarwel ingewikkelde handelingen, lange instructieteksten en bestanden die geïnstalleerd moeten worden. Integendeel: in een paar minuten is alles ingesteld. Vanaf dat moment heeft Roel toegang tot het wereldwijde web, zónder daarvoor een smartphone of computer in handen te moeten hebben.

Zijn blijdschap is groot als hij aan Google vraagt om Neil Diamond te spelen. Daar had hij vroeger een plaat van, maar sinds de lp-speler stuk is, kan hij die niet meer draaien. Of het volume ook harder kan. Of juist zachter. Google Home doet het voor hem. Bovendien volgt automatisch meer muziek in het genre van Neil Diamond. Maar ook een simpele vraag naar het weer van morgen beantwoordt de huisassistent. En dankzij de koppeling aan zijn iPhone belt Roel voortaan eenvoudig familie en vrienden: ‘Bel mijn zoon.’ Muziek, radioprogramma’s, recepten… Zijn wereld is letterlijk groter geworden en het enige wat hij hoeft te doen is zijn stem te laten horen.

amazon echo spraakgestuurde technologie

Een onzichtbare brug

Roel had ook Anna kunnen heten en jaren jonger of jaren ouder kunnen zijn. Hij had analfabeet kunnen zijn of een aandoening hebben die hem aan huis kluistert. Dat verandert niets aan de veelbelovende mogelijkheden van spraakgestuurde interfaces. De interactie met technologie door het gebruik van je stem kan ervoor zorgen dat een beperkte wereld groter wordt. Zelfs wanneer je je stem niet als aansturing kan gebruiken, zijn er oplossingen. Door slim gebruik te maken van bijvoorbeeld machine learning en webcams, kan het mogelijk gemaakt worden een interface aan te sturen met behulp van gebarentaal (pdf) en zelfs reacties op je scherm in gebarentaal terug te krijgen. En net zoals deze vis nu al mondbewegingen kan mimieken, gebaseerd op de tekst die Alexa uitspreekt, is het goed voor te stellen dat er in de toekomst ‘speakers’ beschikbaar komen die volledig in gebarentaal antwoorden.

Buitenshuis zijn ook veel kansen. Denk aan formulieren die je voortaan gesproken in kunt vullen. Dat zou een wereld van verschil zijn voor mensen die moeite hebben met lezen en schrijven (geschat wordt dat 250.000 Nederlanders analfabeet zijn, daarnaast is er een grote groep laaggeletterden). In grote distributiecentra geven werknemers via hun headset met microfoon de juiste orders door aan een digitale assistent, waarna de robot ze verzamelt.
Is er op kantoor nieuw printerpapier nodig? Eén voice-command en de voorraad wordt aangevuld. In vergaderingen verwerken voice-assistenten de notulen en to do’s, waar nodig kan benodigde informatie real-time worden opgevraagd en gedeeld.

Voice maakt technologie menselijk

In de online en digitale wereld werken ontwerpers en marketeers al jaren aan een zo gebruiksvriendelijk mogelijke interface. Maar al die eerdere vormen (UX, UI) speelden zich af op het scherm van een smartphone, tablet of computer. En als die je al tegenstaan, tja, dan pak je ze er ook niet snel bij.

Spraakgestuurde user interfaces daarentegen brengen complexere vormen van interactie dichterbij, zonder af te schrikken. Zoals designer Cheryl Platz omschrijft: ‘Voice user interfaces staan ons toe om volledig menselijk te blijven in onze interacties.’ In plaats van ons aan te moeten passen aan de technologie, komt de technologie nu onze kant weer op en is het niet langer alleen toebedeeld aan de digitaal vaardigen.

Rome is niet in een dag gebouwd

Natuurlijk zijn er nog uitdagingen te overwinnen. Ontwikkelaars integreren steeds meer menselijke conversatietechnieken in de voice commands, om zo de interactie met het apparaat natuurlijker te maken. Zo brengt Google de pretty-please functie als stimulans voor gebruikers om vriendelijk te communiceren met het apparaat. Net zoals in een gesprek van mens-tot-mens. Maar een gesprek met een voicegestuurd apparaat is nog lang niet hetzelfde als een gesprek tussen twee personen. Met name in de conversation flow zijn er nog wat hiaten. Niet iedereen praat even duidelijk of spreekt een woord hetzelfde uit. Is het puzzel of puu-zel? Om over de regionale, dialectische verschillen nog niet te spreken.

Op dit moment worstelen voice assistenten zoals Google Home en Alexa ook nog met het plaatsen van een vraag binnen een context. De technologie herinnert zich tot ongeveer één eerder gestelde zin. Je kan Google Home gerust vragen: ‘waar gaat de film Titanic over?’. En kort daarna de vraag: ‘welke acteurs spelen daar in?’ Maar een langer gesprek, waarbij de voice assistant dieper in het geheugen moet graven om te begrijpen dat je het over de film Titanic hebt, is nog niet mogelijk. Om een gesprek meer natuurlijk te laten voelen, moet de assistent meer contextuele factoren onthouden. Niet alleen binnen het onderwerp van het gesprek, maar ook over de gebruiker. Net zoals een gesprekspartner in het echte leven zou doen.

smart speaker buiten

Welkom in mijn huis

Een drempel die inmiddels is weggenomen, is de technische beschikbaarheid. De Google Home is sinds oktober 2018 verkrijgbaar in Nederland, en in het Nederlands. Dankzij de Nederlandse commando’s is een belangrijke barrière doorbroken, want het bedienen van een apparaat in een vreemde taal bleek voor veel gebruikers lastig (sowieso is praten tegen een apparaat iets wat nog wel eens gek voelt). Op Black Friday vlogen de Google Homes dan ook als warme broodjes over de toonbank.

Toekomstmuziek

Recent onderzoek van eMarketer voorspelt dat maar liefst 36 miljoen Amerikanen dit jaar een voice-assistant in huis hebben. In Nederland zijn (nog?) geen cijfers bekend. Wel richt het Nederlandse bedrijfsleven zich al massaal op de spraakgestuurde interfaces. Bol.com, de NOS, Transavia, Rabobank en Coolblue bijvoorbeeld hebben al apps ontwikkeld voor de Nederlandse Google Assistant. Even een cadeau shoppen, je banksaldo, het nieuws of vluchttijden checken: het kan nu allemaal met een gesproken commando. De wereld wordt groter en vrijwel niemand wordt buitengesloten met behulp van deze technologie.

Wat denk jij, volgt Nederland deze trend? Welke mogelijkheden voorzie jij?