vrijdag 22 augustus 2008

‘Keywording’

Dit keer gaat het over metadata die je aan een foto kunt meegeven om het later terugzoeken te vergemakkelijken. De camera zelf genereert al metadata zoals sluitertijd, diafragma, datum en tijdstip van de opname; de zogenaamde EXIF data maar er is ook data die bedoeld is om ingevuld te worden door de fotograaf, de IPTC velden. Een van de belangrijkste IPTC velden die gebruikt wordt betreft het Keyword (trefwoord) veld.

Bij het lezen van 'The DAM Book' van Peter Krogh (een echte aanrader, zie http://www.thedambook.com/ ) was ik er van overtuigd dat het grondig toepassen van trefwoorden de waarde van mijn archief zou verhogen. Echter bleek dit in de praktijk toch lastiger dan tevoren gedacht. Waar ik gisteren nog het begrip 'milieu' gebruikte was dat vandaag 'natuur' en het dreigde op een rommeltje uit te lopen.

Ik moest er dus voor zorgen dat ik een consistente lijst met trefwoorden ging aanleggen volgens het uitgangspunt van de 'controlled vocabulary' maar tijdens die zoektocht kwam ik terecht op een artikel van Dan Heller die een zeer selecte toepassing van Keywords propageert. Hoewel zijn uiteenzetting mij weer aan het twijfelen heeft gezet is het zeer de moeite van het lezen waard: http://www.danheller.com/blog/posts/keywording-and-future-of-stock.html

'Slim' omgaan met trefwoorden:

In het kort komt het er op neer dat hij het afraadt om vervoegingen, meervoudsvormen, vertalingen en dergelijke als trefwoord op te nemen. Een intelligente zoekmachine zou deze variaties op wat hij de 'stam' noemt zelf moeten kunnen distilleren (niet dat dat nu al het geval is…). Het probleem is volgens Dan 'trefwoord-vervuiling' met als gevolg vals-positieve zoekresultaten. De foto die jij of een klant zoekt komt niet boven de rest uit waardoor je hem niet zult vinden.

Een foto is bijvoorbeeld voorzien van de trefwoorden 'vrouw' en 'oude man'. Op de zoekopdracht 'oude vrouw' zal deze foto onterecht toch getoond worden omdat beide woorden voorkomen. Een vals positief resultaat dus. Dit probleem wordt verergerd door systemen die automatisch trefwoorden aan foto's toevoegen (vooralsnog voornamelijk Photo stock bureaus hebben hier applicaties voor).

De kunst van het toekennen van trefwoorden zit hem niet zozeer in het accuraat beschrijven van wat er zich op de afbeelding bevindt maar met name in de conceptuele begrippen zoals toekomst, geluk, e.d. omdat alleen de menselijke geest in staat is om die te koppelen aan het betreffende beeld.

Context:

Tenslotte hanteert Dan het begrip 'Contextualisatie ', dat wil zeggen dat de relatie tussen trefwoorden onderling wordt aangegeven in plaats van de huidige situatie waarin alle trefwoorden dezelfde waarde hebben.

Context toekennen aan trefwoorden onderling is helaas nog niet mogelijk, de syntax daarvoor ontbreekt domweg nog. Een notatie als oude:man maakt de context tussen oude en man duidelijk waardoor de afbeelding niet bij een zoekopracht oude vrouw tevoorschijn zal komen. Maar zoals gezegd, deze syntax ontbreekt nog en wordt dus niet herkend door zoekmachines in de markt hoewel Adobe al eerste stappen heeft gezet met de zogenaamde 'hierarchical keywords' in Bridge waarmee context tussen keywords in de afbeelding kan worden vastgelegd.

Wordt vervolgd…

0 reacties: