Op 13 oktober 2020 was de jaarlijkse IPTC
conferentie en een van de onderwerpen die daar m’n aandacht trok was een
initiatief (voor de initiatiefnemers zie later in dit artikel) om tot een industrie
standaard te komen voor wat ze zelf noemen “digital content attribution”.
Het gaat hier om het verifiëren van de afkomst van
beeldmateriaal en zien wat er ‘onderweg’ precies mee gebeurd is. Hun doel is
dat consumenten beter in staat zijn om de betrouwbaarheid van beeldmateriaal te
beoordelen.
Andy Parsons van Adobe (een van de initiatiefnemers van CAI)
presenteerde het initiatief en het kan hier op Youtube teruggekeken worden (vooral
de moeite waard vanwege de voorbeelden die hij liet zien).
Echtheid van informatie heeft ons altijd al bezig gehouden (Ik
schreef hier al een aantal malen over; hier
en hier
). Het is echter niet eenvoudig om te bepalen wat onecht is. Het blijkt
eenvoudiger om te bepalen wat wél echt
is.
Een paar decennia geleden we kregen informatie van geprinte
media uit voornamelijk betrouwbare bronnen. De situatie tegenwoordig is heel
anders:
- Vooruitgang in techniek
- Mogelijkheden tot verspreiding van content (1 telefoon naar miljoenen anderen)
- Snelheid van verspreiding is nu seconden waar dat minuten, uren of dagen was
- Er bestaat content met de bedoeling om te misleiden
- Gebrek aan transparantie
Er zijn een aantal mogelijkheden om het hoofd te bieden aan
de moeilijkheden die hierdoor ontstaan. Andy onderscheidt drie ‘pijlers’:
- Educatie
- Detectie
- Attribution (Toeschrijven aan)
Voor wat betreft de eerste pijler, mensen moeten de verschillende
mogelijkheden kennen die er bestaan om beeld te manipuleren plus de termen
waarmee die geclassificeerd worden als Cheapfake, deepfake, e.d.
De tweede pijler benoemde ik eerder al even, het is een
wapenwedloop. De mensen die beelden manipuleren staan altijd een stap voor op
diegenen die ze proberen te herkennen.
Het voorbeeld van de Deepfake Detection Challenge van o.a.
Facebook liet zien dat weliswaar 65% van het nepmateriaal er uit wordt gehaald
maar dan blijft er nog altijd een immense hoeveelheid over die er doorheen
glipt. De herkenningspercentages zullen wellicht verbeteren maar de ‘good guys’
zullen altijd een stap achter blijven lopen.
Het CAI initiatief concentreert zich op de derde pijler
‘Attribution’. Het volgen van het beeldmateriaal tijdens de reis die het aflegt
van opname naar publicatie. Het gaat hierbij om vertrouwen over wie, wat en hoe.
Deze informatie wordt dan vastgelegd in een robuustere, fraudebestendiger
‘schil’ dan EXIF of XMP alleen (want die informatie blijkt te vaak niet meer
(correct) aanwezig op het web).
Schematisch betreft het een structuur voor het opslaan en
uitlezen van cryptografische verifieerbare gegevens door een zogenaamde
‘actor’. Dit kan een mens zijn maar ook hard- of software. Twee andere termen
die nog een rol spelen zijn ‘Claims’ en ‘Assertions’ . Assertions representeren
informatie en Claims pakken die in, in verifieerbare pakketten.
Iedere actor die het beeldmateriaal maakt of bewerkt creëert
daarmee ook een Assertion met informatie over wat er gedaan is, wanneer en
namens wie. Een dergelijke Assertion is feitelijk een cryptografische
hashwaarde. Wanneer deze digitaal ondertekend wordt (door een vertrouwde
partij) wordt het een ‘Claim’. De handtekening garandeert als het ware de integriteit
van de Claim. Zo’n Claim reist dan mee met de foto en er worden meerdere aan
toegevoegd wanneer er andere partijen zijn die iets met het beeld doen
(bewerken, publiceren, etc). Iedere nieuwe Claim refereert naar de vorige
waardoor het een ketting wordt.
Claims bevaten dus feiten over de
creatie van het beeld, auteurschap, bewerkingsacties, details van het apparaat
waarmee het beeld gecreëerd is, de software die gebruikt is en nog veel meer. Deze
feiten tonen de herkomst van een bepaald beeld aan.
Claims kunnen aan het beeldmateriaal worden toegevoegd of
centraal (in de cloud) worden beheerd, dat is afhankelijk van de workflow en de
mogelijkheden die leveranciers zullen gaan bieden.
Een belangrijk onderdeel in het proces zijn de organisaties
die de Claims gaan ondertekenen. Zij gaan dezelfde rol vervullen als dat
Certification Authorities voor webbrowsers doen; het afgeven van certificaten
die de betrouwbaarheid van websites garanderen (het ssl slotje).
Hoe werkt het vanuit (Adobe) gebruikersperspectief?
- 1. Creëer een beeld
- 2. Breng wijzigingen aan en schrijf deze terug naar het bestand
- 3. Bereken een unieke vingerafdruk, de assertion (hash)
- 4. Onderteken de Claim en sla die op (online of offline)
- 5. Bewaar de handtekening-URL in de XMP ruimte van het beeldmateriaal
Een preview van de ‘Creator’s view’ in Photoshop. (Het betreft een screenshot van de eerdergenoemde video en hij is daarom niet zo scherp..)
In deze Creators view zie je informatie over de herkomst van de foto die je geopend hebt.
Van een afbeelding die je op internet hebt gevonden, kun je
de herkomst ook opvragen.
En nu?
De CAI initiatiefnemers zijn niet de kleinste; Adobe,
Microsoft, BBC, CBC, New York Times, Stanford Center for Blockchain Research,
Truepic, University of California – Berkeley, WITNESS en Twitter.
Gezien alle nepnieuws wat er tegenwoordig is denk ik zelf
dat er een grote behoefte is aan een dergelijk initiatief mits de ondersteuning
maar voldoende is. Met initiatiefnemers als Adobe, Microsoft, BBC, CBC, New
York Times, Stanford Center for Blockchain Research, Truepic, University of
California – Berkeley, WITNESS en Twitter lijkt dit zeker mogelijk. Laten we
hopen dat er snel gemakkelijk te gebruiken praktische toepassingen komen!
Voor diegenen die zich nader
willen verdiepen in deze materie is er een (Engelstalige) White paper “Setting the Standard for
Content Attribution” beschikbaar.