Tech

Snapt een robot ooit het verschil tussen Isle of dogs en I love dogs?

0

Column – En toen kwam de Google Assistant, zo las ik op het Brusselse terras, waar ik bier dronk, uit een flesje. Daarover later meer. En ik herinnerde me de ophef, een paar maanden geleden, over Google Duplex. Hoe zou het zijn met Duplex?

In mei dit jaar werd Duplex aangekondigd, en het kreeg veel aandacht. Menigeen was enthousiast (“stunning demo“) over het Google Duplex-robotje dat in staat was een afspraak te maken.

De opdracht was: “Hé Duplex, maak voor mij een afspraak bij de kapper, op dinsdagochtend.”

Duplex: “Geen probleem. Ik maak een afspraak en hou je snel op de hoogte.”

Duplex belt de kapper, met dank aan de contactenlijst.

Kapper: “Hallo, kan ik u helpen?”

Duplex: “Hi, ik bel om een afspraak te maken voor een dames-knipbeurt voor een klant van mij. Uhm. Het liefst op 3 mei aanstaande.”

Vooral de “uhm” kreeg veel bijval in de zaal. Een robot uhmmt namelijk niet. Nog nooit vertoond.

Kapper: “Natuurlijk, een seconde graag.”

Duplex: “Mm-hmm.” (de zaal lacht luid)

Kapper: “Natuurlijk, hoe laat dacht u?”

Duplex: “Om 12 uur”

Kapper: “We hebben geen plaats om 12 uur. De eerste mogelijkheid is kwart over een.”

Duplex: “Heeft u plaats tussen 10 en 12 uur?”

Kapper: ‘Dat hangt er van af; wat moet er precies gebeuren?’

Duplex: “Gewoon een dames-knipbeurt, dat is het.”

Kapper: “Ok, er is plaats om 10 uur.”

Duplex: “10 uur is prima.”

Kapper: “Ok, wat is de voornaam?”

Duplex: “De voornaam is Lisa.”

Kapper: “Ok, perfect, dus we zien Lisa om 10 uur op 3 mei.”

Duplex: “Mooi, dank u.”

Kapper: “Mooi, fijne dag verder. Tot ziens!”

De zaal: whooeoeoeoeoeeooee klap klap whoehoehoe!

Praten met een robot

Zou de kapper door hebben dat ze te maken had met een robot? Misschien niet. Met dank aan de uhm en mm. Heeft de robot hiermee voldaan aan de Turing-test (een jury kan niet vaststellen of ze te doen heeft met een mens of een machine)?

Een computer praat met een mens, de mens praat met een computer. In de dialoog hierboven begrijpt de computer (Duplex) de mens (de kapster). Het is knap, maar niet schokkend.

De kapper-dialoog haalde ruim de pers. Blijkbaar was het nieuwswaardig genoeg. Vooral de uhh’s end euhmm’s en “mmm, let me see” werden als een doorbraak gezien. De computer die de weifelende mens nadoet.

De nieuwe Google Pixel 3 heeft een optie om – als een onbekend of ongewenst persoon je belt – een ingebouwde robot sprekend de telefoon op te nemen. “Zeg je naam en vertel even waarom je belt”, zegt ‘ie dan. Als de beller antwoordt, zal de robot dit in schrift weergeven aan mij. En vervolgens kan ik op een knopje drukken: “Wie is dit?”, of “Vertel me meer…”, en dit door de robot laten uitspreken. Ook deze bot kent de truc van de uhmm’s en mm’s. Dat maakt hem anders en overtuigender dan de uhmm-loze Rob Jetten, de verse talking head van D66.

Praten met de helpdesk

Een ander voorbeeld van mens-machine. Net gebeurd, maar het lijkt iets meer uit de prehistorie.

De mens praat, het systeem praat terug. De Ziggo-helpdesk.

“SPREEK UW POSTCODE IN OP DEZE WIJZE: TWAALF VIERENTACHTIG ANTOON BERNARD”, zo beveelt de klanten-computer van Ziggo mij. Ik zeg “KAREL THEO” voor de letters KT.

Is niet goed. Wordt niet herkend. Het moet Karel Theodoor zijn. Opnieuw. KAREL THEODOOR.

“GEEF NU UW HUISNUMMER, ZONDER TOEVOEGING.”

“Tien,” zeg ik.

U wordt doorverbonden.

Even later krijg ik een mens (denk ik). “Mag ik uw huisnummer en postcode?”, vraagt hij. Natuurlijk, dat mag. Maar op mij komt het ongeïnteresseerd over.

Controle op Schiphol

Nog een mens-machinevoorbeeld.

Op Schiphol wordt je paspoort zonder tussenkomst van een mens gecontroleerd. Het systeem leest het paspoort, maakt een foto van mijn gezicht, vergelijkt deze foto met die op het paspoort, controleert openstaande boetes (zo stel ik me voor), en geeft als uitkomst een groen of rood licht. Bij een rood licht moet een mens, een douanier, komen helpen.

We zitten in het begin-tijdperk van het mens-machinebegrijpen. Hoe een mens een machine begrijpt, hoe een machine een mens begrijpt. De computer (robot) begint schoorvoetend het gesproken woord van de mens te begrijpen. De mens begint heel langzaam een sprekende computer te begrijpen, maar het is kinderspel.

Isle of dogs

Nog een voorbeeld.

De film ‘Isle of dogs krijgt een hoge waardering op IMDb. Het is een in animaties gemaakt verhaal over een jongen die op zoek gaat naar zijn verloren hond. Wes Andersen als regisseur, dat gaat goed. Alle honden zijn door de boze Japanse burgemeester verbannen naar Trash Island. Mooie dialogen. Maar het gaat om de titel.

Een computer die ‘Isle of dogsleest, zal dit interpreteren als Eiland van de honden. Een computer daarentegen die ‘Isle of dogshoort zal het interpreteren als ‘I love dogs‘, ik hou van honden.

Een mens zal het niet anders vergaan. Tenzij hij leest èn hoort tegelijk. Een mens kan zeggen “Ik hoor mezelf zeggen”. Heeft een computer dat vermogen?

Requiem pour L.

Nog een voorbeeld.

Ik lees een recensie in de Groene Amsterdammer over een toneelstuk, Requiem pour L. Het is een verhaal over het vieren van het leven, en het vieren van het sterven. Veertien zangers en musici, merendeels Afrikanen, maken muziek en dansen, terwijl op de achtergrond een film wordt getoond van een stervende vrouw. L. Geluidloos. Vertraagd. Alleen haar gezicht is te zien. Heel langzaam verdwijnt het leven, terwijl het beroemde Requiem in D-mineur van Mozart verafrikaansd wordt gespeeld.

Lees de titel en je leest Requiem pour L. Zeg de titel hardop tegen jezelf en je hoort ‘Requiem pour elle‘, requiem voor haar. Weer de vraag, zou een computer dit kunnen?

100 Pap

Ok, laatste voorbeeld, iets moeilijker. Het biertje op het terras in Brussel. We vragen ernaar. Een van mijn dochters woont in Brussel, en ze vertelde me het verhaal. Ze bestelt twee flesjes 100 Pap.

Flesjes op tafel.100 Pap, staat op het etiket.

Het Frans voor 100 is ‘cent’. Cent pap. Zeg het hardop. Je hoort ‘sans pap‘. Zeg het tegen een Brusselaar en hij begrijpt het. Het is jargon voor Sans Papiers, les sans-papiers, de vreemdelingen die zonder identiteitsbewijs of paspoort in het multiculturele Brussel verblijven. Door een flesje bier 100 pap te kopen draag je er aan bij om slaapplaatsen voor hen mogelijk te maken. ‘Une bière pour du logement‘. Het fundamentele humanitaire recht op een slaapplaats.

Maar een robot die dit etiket leest, zal hij het ooit snappen? Zal de computer die dit hardop tegen zichzelf zegt de stap naar de vreemdelingen maken?

 

Tekening: Sterre Steins Bisschop

Woordspelingen

Allemaal overwegingen. De Ziggo postcode-dialoog is super-simpel, zou je zeggen, maar gaat nog stroef. De kapper-dialoog is iets uitdagender, maar speelt zich af binnen een beperkt en gesloten domein. Interessanter zijn de voorbeelden (Isle of dogs, Requiem pour L, 100 Pap) die een woordspeling in zich hebben. Die je eventueel pas gaat begrijpen als je het hardop uitspreekt. En waarbij je een ongewone neurale associatie moet kunnen maken die niet bepaald lineair vanzelfsprekend is. Menselijk gedrag dus. Uhh’s en umm’s.

Artificial intelligence en taal

Tijdens Web Summit 2018 in Lissabon wordt robot Sophie getoond. Ze kan nu ook lopen, ze heeft alleen haar benen laten liggen in Las Vegas. Even later, in een drukbezochte persconferentie, bestaat de gelegenheid om vragen te stellen aan Sophie. Er zijn problemen met de internetverbinding. Haar benen liggen dus in Las Vegas, haar hersens liggen in de tijdelijk onbereikbare cloud. Maar toch, even later: “What’s the next trend in AI?”, vraagt een journalist. Sophie antwoordt: “AI is not a trend, it’s a reality“.

Een mooi antwoord, maar niet het antwoord op de vraag.

Taal is de meest complexe en onderscheidende verworvenheid van de mens. Het ultieme communicatievehikel.

Denk er over na. Er valt nog zo veel te doen.

En, mocht je in Brussel zijn, bestel 100-Papbier. Wat is er bevredigender dan bier-drinkend een goed doel te steunen?