Het semantic web (of “Web 3.0″) is hot. Specialist op het gebied van content TextWise biedt een miljoen dollar voor het beste semantische concept. Reuters biedt een gratis webservice aan die teksten semantisch maakt. Yahoo kondigt semantic web support aan. Technology visionair Nova Spivack voorspelt tijdens de laatste The Next Web conferentie in Amsterdam dat in 2010 het semantic web gemeengoed zal zijn. Maar, wat is het semantic web eigenlijk?
Over de term Web 3.0 bestaat veel onduidelijkheid. Sommigen vinden het “semantic web” hetzelfde als “Web 3.0″. Anderen vinden het semantic web onderdeel van Web 3.0. Nova Spivack bijvoorbeeld geeft als expanded definitie van Web 3.0:
het intelligente -semantic- web;- een altijd en overal aanwezige verbinding met het internet. Dit staat ook wel bekend als het ubiquitous of pervasive web. Het web breekt hiermee als het ware uit het computerscherm en wordt ook op allerlei andere plaatsen beschikbaar: mobiele apparaten, maar ook apparaten die nog uitgevonden moeten worden. Een simpel voorbeeld hiervoor is een fotolijstje dat je foto’s via internet ophaalt;
- network computing, waarbij software als services wordt aangeboden en gebruikt;
- het gebruik van open technologieën: open API’s, open data formaten, open source software;
- het gebruik van open identity zoals bijvoorbeeld OpenID.
Ik zou daar zelf nog aan toe willen voegen:
- De vergaande aanwezigheid van persoonlijke profielen en voorkeuren op internet.
Maar ongeacht of je het semantic web als onderdeel van Web 3.0 ziet of gelijk stelt aan Web 3.0, wat wordt er eigenlijk precies mee bedoeld?
Neem de woorden Paris Hilton. De meeste mensen denken dan in eerste instantie waarschijnlijk niet aan het Hilton hotel in Parijs.

Kortom, de betekenis -ofwel de semantiek- van de twee woorden kan verschillend worden opgevat.
Semantiek wordt vaak in één context genoemd met syntax. Als we de zin “Max houdt van Lieke” nemen, dan geeft de syntax aan hoe de zin is opgebouwd. De semantiek is dat Max Lieke leuk vindt. Als we “houdt van” in een hartje veranderen, dan verandert de syntax. De semantiek is echter dezelfde gebleven.

Bij het voorbeeld van Paris Hilton zien we juist twee verschillende betekenissen bij een gelijke syntax.
In de communicatie tussen computers op het internet speelt met name de syntax een belangrijke rol. Als je een webpagina opvraagt doe je een request aan een webserver. Die zoekt de pagina voor je op en geeft hem terug in HTML formaat. De browser op je computer kan die HTML syntax omzetten naar een fraai vormgegeven pagina. De betekenis van wat er in die pagina staat blijft de computer onbekend.
Eenzelfde fenomeen zien we als we gaan zoeken op internet. Een zoekmachine doorzoekt miljarden pagina’s van het internet op zoek naar de zoekwoorden die je hebt ingegeven. Vervolgens toont de zoekmachine een lijst met pagina’s waarin die zoekwoorden voorkomen. De zoekmachine weet wel dat de zoekwoorden voorkomen in de pagina’s in de lijst, de inhoud van die pagina’s is hem echter onbekend.
Dus net als een papagaai die je woorden leert kunnen webapplicaties deze prima nazeggen, maar snappen ze niet goed wat ze zeggen.

Het huidige web kun je daarom beschouwen als een web van documenten. Weliswaar zijn deze op een handige manier gelinkt maar wat er precies in die documenten staat is voor webapplicaties onduidelijk. Voor mensen is die inhoud echter juist datgene wat interessant is. Documenten gaan over mensen, gebeurtenissen, bedrijven, landen, sport, eten etcetera. In feite over alle onderwerpen die je maar kunt verzinnen. Je hebt het dan dus niet meer over documenten, maar over “entiteiten” die in documenten voorkomen. De truc is dus om ook computers te laten begrijpen waar die entiteiten in documenten over gaan. Dat is in feite de definitie van het semantic web:
Het semantic web geeft betekenis aan entiteiten in webpagina’s en relaties tussen entiteiten
Het semantic web is dus, in tegenstelling tot het huidige web, een web van entiteiten.

Nu kun je beweren dat de huidige applicaties ook best veel begrijpen van de inhoud van een webpagina. Als ik een Hyves account heb, dan weet Hyves prima wat mijn naam is, wie mijn vrienden zijn, en ook nog dat deze vrienden personen zijn. Hyves is dus ook al intelligent wat dat betreft. Dat klopt, deze intelligentie is echter beperkt tot Hyves zelf. De eigenschappen van personen zijn -vermoed ik- velden in een database en daarom herkent Hyves deze als kenmerken van een persoon. Andere applicaties kennen deze velden niet. Die zien simpelweg een pagina met tekst. Hen ontgaat dus dat “Max” een naam is en dat “Lieke” een vriendin is. Zou de informatie semantisch opgeslagen zijn, dan zou deze informatie voor elke applicatie op het web toegankelijk zijn.
Het semantic web maakt de betekenis van entiteiten en relaties tussen entiteiten beschikbaar op het hele internet. De betekenis van entiteiten blijft dus niet beperkt tot een enkele webapplicatie.
Nu we weten wat het semantic web is, volgt natuurlijk onherroepelijk de vraag wat je er aan hebt. Neem het voorbeeld van Paris Hilton. Zou een zoekmachine begrijpen dat ik het Hilton hotel in Parijs bedoel, dan kan hij de resultaten met de vrouw Hilton uit de lijst met zoekresultaten weglaten. Hiermee vind je dus sneller wat je zoekt. Dit klinkt nog niet heel spectaculair. Het gaat echter verder: als de applicatie begrijpt dat het Hilton een hotel in Parijs is, dan kan hij mij meer diensten aanbieden. “Ik begrijp dat het Hilton een hotel in Parijs is, zal ik ook direct een vlucht voor je naar Parijs boeken? Zal ik ook direct een transer van de luchthaven naar het hotel regelen? Zal ik een restaurant voor je reserveren waar je ’s avonds kunt eten?” Dit maakt het antwoord op je zoekvraag ineens veel waardevoller.

Misschien komt bovenstaande je bekend voor. Bij het boeken van een vlucht krijg je nu ook al de vraag of je een auto wilt huren. Die vraag is echter tot stand gekomen door samenwerking tussen webapplicaties van bijvoorbeeld Transavia en Hertz. In een semantic web zijn minder van zulke afspraken nodig omdat veel informatie universeel beschikbaar is.
Het is dus duidelijk dat een semantisch web leidt tot een grotere beschikbaarheid van informatie. Er zijn ruwweg twee benaderingen die de wereld naar zo’n semantisch web moeten gaan leiden: de bottom-up en de top-down benadering.
De bottom-up benadering zegt: “voorzie alle documenten in het internet van extra informatie en maak ze daardoor te beter te begrijpen voor webapplicaties”. Die extra informatie (”annotaties”) beschrijft entiteiten in webpagina’s en hun relaties. Annotaties kunnen gebeuren in de vorm van RDF of Microformats. Belangrijkste voorvechter van de bottom-up benadering is mede-grondlegger van het internet Tim Berners-Lee. In een podcast afgelopen februari stelt Berners-Lee vast dat alle bouwstenen voor het semantisch web er nu zijn en developers er dus mee aan de slag kunnen.

De aanhangers van de top-down benadering, met als belangrijkste kopstuk Alex Iskold, vinden de bottom-up benadering onpractisch. Ze zien niet gebeuren dat alle pagina’s van het internet geannoteerd gaan worden. Daarom pleiten zij voor de ontwikkeling van applicaties die data in documenten beter gaan begrijpen. Denk hierbij aan het kunnen herleiden van de betekenis van entiteiten uit de context van een pagina. Maar denk met name aan applicaties die natuurlijke taal kunnen begrijpen. Zoekmachines Hakia en Powerset zijn voorbeelden van applicaties die natuurlijke taal -tot nu toe uitsluitend engels- proberen te begrijpen zoals mensen die begrijpen.
Maar wat ook de benadering wordt, het web zal steeds betekenisvoller worden. Entiteiten zullen een wolk aan eigenschappen en relaties om zich heen verzamelen. Hierin schuilt het gevaar van information overload. We hebben alleen behoefte aan informatie die ons persoonlijk interesseert. De behoefte aan op de persoon toegesneden informatie zal daarom steeds belangrijker worden.
Persoonlijke voorkeuren kunnen onder controle van de gebruiker vallen. De APML (Attention Profile Markup Language) werkgroep houdt zich hiermee bezig. Je profiel in APML kun je zien als een bestand met jouw persoonlijke voorkeuren. Webapplicaties kunnen dat bestand lezen en je vervolgens van gefilterde informatie voorzien.
Een nog grotere hoeveelheid profielinformatie zal echter buiten de controle van de gebruiker vallen. Op dit moment wordt door organisaties als Google, Amazon en Yahoo ook al het klikgedrag van bezoekers vastgelegd. In een semantisch web zal deze informatie veel rijker worden. Er is immers veel meer bekend over degene die door de site klikt. Bovendien wordt het web pervasive, overal in ons leven zullen we het tegenkomen: in de browser, op je mobiel, in de auto, in apparaten in je huis. Op steeds meer plaatsen komen webapplicaties dus iets over ons te weten. De profielen die buiten je weten over je worden opgebouwd zullen dan ook zeer groot zijn. Laatst was er een item op RTL nieuws over een discotheek in Berlijn waar 80 camera’s alle handelingen van bezoekers vastlegden. Koppel in een toekomstscenario deze informatie via gezichtsherkenning aan een semantisch profiel op internet en je kunt je een voorstelling maken van de reikwijdte van dergelijke ontwikkelingen.
Een bekend voorbeeld van een dergelijk scenario is onderstaand filmpje.
Hoe gaat het verder? Specialist op het gebied van content TextWise biedt een miljoen dollar voor het beste semantische concept. Reuters biedt een gratis webservice aan die entiteiten in teksten herkent en in RDF omzet.
>.
Yahoo kondigt Semantic Web support aan. Van alle kanten werken bedrijven dus hard aan de ontwikkeling van het semantic web. Nova Spivack voorspelt tijdens de laatste The Next Web conferentie in Amsterdam dat in 2010 het semantic web gemeengoed zal zijn. We zullen zien!















[...] Update: Op Frankwatching een tweede artikel over het ’semantic web’ en de presentatie. [...]
Iedereen denkt wel dat web 3 een semantisch web is, maar dat wordt het niet. Het wordt een decentraal web. Iedereen onderhoudt verbindingen met mensen en informatiebronnen die voor hem interessant zijn. Tags worden irrelevant.
Een tijdje terug had ik een discussie met mijn “neefje” Eduard (edwords) over het semantische web. Mijn insteek heeft te maken met mijn achtergrond: docent Engels en al zo’n 25 jaar geïnteresseerd in “machinevertalen”: met de computer een tekst vertalen. Als ik zie hoe traag dit zich ontwikkelt, denk ik dat het semantische web ook nog even wachten is.
De enige “redding” die ik zie, is: kennis van de wereld om ons heen gekoppeld aan het “ontleden” van tekst in context. Als ik zeg “Ik loop naar die bank”, en vlak daarvoor heb ik gezegd dat ik geld ga opnemen, kan software raden dat ik naar het gebouw van een financiële instelling (bank) loop. Als ik dezelfde zin gebruik en vlak daarvoor meld dat ik in een bos rondwandel, zou de conckusie kunnen zijn dat ik even wil gaan zitten op een bank.
Zelfs de huidige generatie vertaalsoftware (bijvoorbeeld Babelfish met Systran als engine) komt niet veel verder dan “woordjes ruilen”. Een mooi voorbeeld van een letterlijke vertaling kwam ik deze week bij een van mijn leerlingen tegen: “She is standing very strongly in her shoes”. Babelfish bakt er zelfs nog minder van: “She stands very strong in its shoes”.
Jaren geleden (in het DOS-tijdperk) had Symantec/Peter Norton (waar ik toen werkte) het produkt Q&A. In die software kon je in gewone mensentaal een vraag stellen om informatie uit de database op te halen. De software gooide dan gewoon de woorden die niet relevant waren weg, en hield dan bijvoorbeeld over “auto’s”, “onder 10.000 gulden” en “provincie Zuid-Holland”. Met die query ging ie op pad en meestal kwam er precies uit wat je wilde zien. Niet echt Artificial Intelligence, maar het werkte wel.
Zo lang vertaalsoftware niet de mogelijkheid heeft om een zin echt goed te analyseren èn die analyse te combineren met de context waarin die zin staat, denk ik dat we nog even zullen moeten wachten op het semantische web…
[...] frankwatching.com/archive/2008/04/11/de-betekenis-van-web-30-en-het-semantic-web [...]
[...] Een veel genuanceerdere en duidelijkere uitleg vindt u hier. [...]
[...] Het semantische web – Web3.0 – komt eraan. Kortweg betekent dit dat er entiteiten aan informatie worden gekoppeld. Bovendien legt het sematische web relaties tussen die verschillende entiteiten. Meer theoretische uitleg staat op Wikipedia. Voor wie het te abstract vindt een conreet voorbeeld (met dank aan Frankwatching): [...]
Hoi,
Leuk artikel! Lekker vlot geschreven en er staat in prima bewoordingen uitgelegd wat het probleem nu feitelijk is bij het zoeken op het internet.
Groet,
Robert
Peter ik heb eindelijk even de tijd gevonden om je artikel eens op mijn gemak te lezen: wat een indrukwekkend openingsartikel! Inderdaad, je hebt op een heel prettige en duidelijke manier Web 3.0 en het semantisch web uitgelegd. Van harte welkom hier, je bent een echte versterking van het team en ik verheug me nu al op wat nog gaat komen!
Erg goed artikel! Dank!
[...] gekregen, via de reactie, waarop het Web 3.0 duidelijk wordt weergeven. Voor geinteresseerde: De betekenis van Web 3.0 en het semantic web Het is mij nu duidelijk wat er gaande is over het Web 3.0. Het huidige web bestaat uit [...]
Vet artikel Peter! Ik ben blij dat we erover hebben kunnen sparren en dat je al die verschillende concepten hebt gedistilleerd in een strak overzicht.
[...] zie ik veel aandacht voor social networking en de technieken die hiertoe bijdragen. De opkomst van WEB 3.0 zal daarbij zeer veel aandacht krijgen. Zelf ben ik al langere tijd bezig met een aantal [...]
[...] en nieuwe media Open source: in hoeverre ben je moreel verplicht terug te geven? Web 3.0 en het semantische web Inkopen links voor Pagerank groot [...]
Ik vind het heel goed artikel. Zal ik zeker vertalen naar het arabisch en binnenkort op mijn website te zien(in het arabisch natuurlijk).
Ik moet zeggen dat ik enkel uw blog volg in Nederland.
Proficiat, het is echt een rijke blog.
[...] المصدر: Frankwatching [...]
Ik heb gezien dat die menheer van arab librarians de atikel op zijn blog gezet heeft en nochthans zonder mijn toelating.
Maar ik zal vragen dat hij het delete.
Hier is de vertaling
ik heb het zelf vertaald en online gezet op 03/05, bedankt nogmaal voor de artikel
http://www.cashflowec.com/index.php?page=view_art&art_id=1519
De vraag is nu hoe bedrijven voor zoekmachine optimalisatie hier op in kunnen spelen?
In het geval van Paris Hilton. Hoe kan de website over het hotel in Parijs haar site aanpassen, of is dit niet nodig, om in web 3.0 beter te scoren?
Vandaag voor het eerst frankwatching bezocht.
Veel leuke en leerzame artikelen.
Beknopt beschreven en duidelijk.
[...] Het is interessant dat Europa het voortouw wil nemen in de ontwikkeling van Web 3.0. Ze willen blijkbaar zich inmengen in iets waar men nog volop over loopt de discussiëren, iets waar men zelf nog niet eens van weet wat het precies is. Hebben we hier te maken met een briljante zet van de EU of een slecht geïnformeerde overheid? [1] Bekel, Peter ‘De betekenis van Web 3.0 en het semantic web’ Frankwatching, april 2008 http://www.frankwatching.com/archive/2008/04/11/de-betekenis-van-web-30-en-het-semantic-web/ [...]
[...] ingeburgerd… de politie maakt er echter (helaas) nauwelijks gebruik van. Onderstussen staat web 3.0 al op de drempel en ik vrees dus al het ergste voor onze organisatie. Natuurlijk weet ik dat er [...]
Mooi artikel als begin van mijn zoektoch naar de betekenis van web 3.0! Bedankt!
[...] het gemak: de betekenis van het semantisch web [...]
[...] Cloud computing, web operating systems, open source software zullen dan pas echt doorstoten. (cfr. Frankwatching). Gaan we dan toch nog succesvolle campagnes maken die volledig steunen op User Generated [...]
[...] http://www.frankwatching.com/archive/2008/04/11/de-betekenis-van-web-30-en-het-semantic-web/ [...]
[...] is ineens hoop. Waar allerlei webgoeroes al jaren praten over het semantische web, daar lijkt dit sinds afgelopen dinsdag ineens de heilige graal bij uitgevers te [...]
[...] Mijn conclusie is dat de hype rondom WolframAlpha wellicht iets te groot is, en dat de verwachtingen te hoog zijn. Het gaat echter in mijn opinie wel om een serieuze nieuwe ontwikkeling binnen de zoekmachinemarketing, en kan wellicht een van de eerste stappen zijn richting het semantische web (web3.0). [...]
[...] met behulp van wiskundige modellen. De functionaliteit achter Wolfram Alpha is gebaseerd op het semantisch web. Deze techniek wordt beschouwd als de volgende fase van het internet waarbij alle informatie is [...]
[...] van eerdere artikellijsten die niets in perspectief plaatsten. Echter, met de ontwikkeling van het semantische web, worden de mogelijkheden ongekend groot. Stel je voor dat je verschillende tijdslijnen naast [...]
[...] Semantics, in aansluiting op data-portability. Data van personen zit steeds minder in aparte silo’s maar is op alle platforms beschikbaar. Neem als voorbeeld Twitterberichten in Facebook of Hyves. Objectgerelateerde data is de volgende stap. Het verdwijnen van silo’s leidt tot meer beschikbare informatie over een persoon of object en daarmee tot een betekenisvoller web. [...]
[...] Semantic Web: je kunt het ook het “verknoopte” web noemen. Eigenschappen en relaties van mensen en onderwerpen zijn op het hele web bekend en met elkaar verbonden. Over “Peter Bekel” is alle informatie beschikbaar die er over hem te vinden is op het web. Zo ontstaan superprofielen van mensen en onderwerpen en komen ze als het ware lost te staan van de context van één enkele site. [...]
[...] denk dat ik veel plezier ga beleven aan Web2.0! Misschien zou ik me nu al bezig moeten houden met Web3.0 en zelfs met Web4.0, maar het lijkt me leuk om eerst de kennis die ik nu heb opgedaan over Web2.0 [...]
[...] Enige tijd terug schreef FrankWatching dit: [...]
[...] in de lessen van mijn docenten beschouwd als iets nieuws, terwijl nu alweer wordt gesproken over web 3.0. De huidige tentamens zijn daarnaast nog steeds gebaseerd op het leren van feitjes uit boeken. [...]