dinsdag 4 december 2012

Meta data jungle


Na het recente S.M.A.R.T artikel al weer een saai stuk hoor ik je vragen?
Tja, ik probeer het natuurlijk zo leuk mogelijk op te schrijven maar zaken als EXIF, IPTC en XMP blijven, zeker voor de niet-professionele fotograaf, een beetje ondoorgrondelijke materie. Eigenlijk is dit juist voor hen omdat de professional zich er (hopelijk!) al voldoende in verdiept heeft.

Waarom zou je je überhaupt in deze materie willen verdiepen?
Zolang foto’s nog steeds niet goed op hun werkelijke inhoud (terug)gevonden kunnen worden zijn we nog altijd afhankelijk van wat er ooit aan extra gegevens (metadata) aan de foto’s is meegegeven, al dan niet automatisch. Het is dan goed dat je enige kennis van zaken hebt.
Over onderwerpen als Exif, Iptc en Xmp is natuurlijk heel veel te vinden op internet, waaronder wikipedia (en dan met name de engelstalige editie) of metadata.org maar dat is over het algemeen gefragmenteerde informatie. Overigens dan wel weer vaak diep en gedetailleerd uitgewerkt.
Dit artikel is daarentegen meer bedoeld om inzicht te verschaffen in waar je nu als fotograaf mee te maken krijgt en hoe de verschillende standaarden en technieken zich ten opzicht van elkaar verhouden. Wil je daarna meer weten, sla dan zeker de genoemde bronnen er nog even op na! Je kunt ook een vraag of reactie achterlaten op dit artikel, hieronder.

Metadata?
Een foto is net als ieder ander computerbestand een reeks nullen en enen. De computer weet aan de opbouw daarvan dat het a) een afbeelding betreft en b) hoe die er op je beeldscherm moet uitzien. Echter zitten er nog meer zaken in het bestand verwerkt die je niet meteen ziet en één daarvan is metadata. Dat zijn overigens gewoon gegevens over het betreffende bestand. Bijvoorbeeld over hoe groot het bestand is of wanneer die voor het laatst is bewerkt. Er worden ook specifieke ‘foto zaken’ als metadata opgenomen (was de flitser aan of niet, de sluitertijd, diafragma, etc) en er is zelfs ruimte gereserveerd waar je een eigen beschrijving of trefwoorden kunt registreren! Hiervoor gebruik je echter meestal een applicatie die dat ‘onder water’ voor je regelt. Je bent je er in de meeste gevallen misschien niet eens van bewust wanneer het gebeurt.

Zoals gezegd worden er in het fotobestand zelf dus gegevens opgenomen die geen onderdeel uitmaken van de afbeelding. Je kunt dit zelf snel even checken door bijvoorbeeld een (niet al te groot) JPG afbeelding te openen in kladblok. Je zult in de eerste regels waarschijnlijk meteen al zaken herkennen. 

Deze gegevens zijn niet alleen ‘leesbaar’ voor mensen maar ook voor applicaties. Die herkennen het ‘soort’ meta data aan ‘kopjes’ die er voor zijn gereserveerd. Deze secties worden Image Resource Blocks genoemd (IRB).

Welke metadata?
Helaas bestaan er een heel aantal standaarden, in de inleiding heb ik de belangrijkste al even genoemd:

Exif
Staat voor Exchangeable Image File Format en hier worden voornamelijk gegevens in bewaard die door de camera zelf zijn gegenereerd zoals datum van de opname, locatie (GPS), sluitertijd, diafragma, flitsvermogen, brandpuntsafstand, merk en type van camera en objectief enz, enz.


Omdat je er zelf nauwlijk iets aan toe kunt voegen lenen Exif gegevens zich met name voor statistische analyses zoals “met welk objectief of brandpuntsafstand heb ik nu de meeste foto’s gemaakt?”. 

Er zijn applicaties (Exif Tool) waarmee je wel Exif informatie kunt manipuleren. Daarbij is het belangrijk om te weten dat Exif formeel alleen maar ASCII tekens ondersteund. Bij gebruik van leestekens die hier buiten vallen zullen je foto’s elders in de wereld heel andere meta data tonen..
Kortom, behalve dat Exif er ook niet expliciet voor gemaakt is leent het zich ook niet zo goed om eigen gegevens in onder te brengen.

IPTC
Staat voor International Press Telecommunications Council en IPTC is zowel een standaard als een sectie binnen je foto bestand. De begrippen worden helaas (te) vaak door elkaar gehaald in het dagelijks verkeer en dat is verwarrend.

Met de IPTC standaard is namelijk niets mis, dat gaat over de gegevens die je als gebruiker zelf toevoegt aan je afbeeldingen zoals de namen van de personen op je foto.
Echter wordt de IPTC metadata sectie NIET meer gebruikt. (Het gaat hier om IPTC IIM) In plaats daarvan is er een andere ruimte voor IPTC gereserveerd binnen je foto’s, namelijk de XMP sectie... (Volg je het nog?). Als we het dus over IPTC-Core en/of over IPCT Extension hebben dan gaat dus feitelijk over XMP.


Je eigen gegevens kun je dus prima kwijt in je foto’s maar tegenwoordig alleen op een andere plek in je bestanden dan voor 2005. Gelukkig regelt je beheer software (catalogus programma, photo browser, DAM applicatie) dit, als het goed is, allemaal voor je maar het kan geen kwaad je hiervan bewust te zijn. Bij het selecteren van een programma zul je hier dan rekening mee willen houden.

Nog even voor de volledigheid; je kunt natuurlijk altijd nog gegevens schrijven binnen de oude IPTC (IIM) sectie maar veel programma’s lezen deze niet meer of niet correct uit. Veiliger is dus om je IPTC gegevens binnen de XMP ruimte te schrijven zoals de moderne DAM applicaties dat netjes (automatisch) voor je zullen doen. Bij de meeste DAM applicaties zul je dus echt zelf nadere actie moeten ondernemen om nog in de ‘oude’ IPTC sectie te schrijven. 

PLUS
Plus is een metadata standaard, specifiek voor licentiedoeleinden. Daarnaast is er tooling beschikbaar waarmee tekensets kunnen worden gegenereerd ter identificatie van (ondermeer) copyrighthouders, gebruikers en gebruikersvoorwaarden. Ik zal er hier verder niet op ingaan omdat ik de indruk heb dat het voornamelijk op de amerikaanse markt is toegesneden. Later kom ik hier vast nog eens op terug.DUBLIN CORE

Dit is oorspronkelijk een standaard uit de bibliotheekwereld en het omvat vijftien basis componenten. Vijf daarvan komen overeen met IPTC velden. Binnen DAM applicaties ben ik nimmer Dublin Core velden tegengekomen.


XMP
Staat voor Extensible Metadata Platform, een standaard die door Adobe is ontwikkeld. XMP is gebaseerd op het (bekendere) XML formaat en het is niet alleen geschikt om vooraf gedefinieerde gegevens over je foto’s in kwijt te kunnen (IPTC) maar ook eigen gedefinieerde velden. Daarmee is het een zeer flexibele standaard, met name voor de toekomst.

XMP kan op twee manieren in combinatie met je foto’s ingezet worden:

De eerste manier is met behulp van een separaat (XMP) bestand. Deze bestanden noemen we ook wel sidecar bestanden en ze hebben altijd dezelfde naam als het beeldbestand. Stel, je hebt een bestand 2012_10_0100.NEF. Wanneer je nu wat aanpassingen hebt aangebracht met bijvoorbeeld Adobe Camera Raw, dan zie je in dezelfde directory een extra bestand verschijnen: 2012_10_0100.XMP. Wanneer je dit bestand nu weg zou gooien dan zijn ook al je bewerkingen weg.


Sidecar bestanden zijn een logisch antwoord op de gesloten (RAW) bestandsformaten van de camera leveranciers. RAW bestanden kunnen eigenlijk alleen (veilig) bewerkt worden met software van dezelfde fabrikant als die van de camera maar dat wil je misschien wel niet altijd. Cameravreemde fabrikanten beschikken echter niet over alle informatie van alle RAW formaten en daardoor lopen ze te veel risico om fouten in de bestanden aan te brengen. En dit geeft weer een verhoogd risico op corruptie en onbruikbare bestanden, iets dat een fotograaf natuurlijk nooi wil. Eerder schreef ik dit artikel over PIEware waarin ik wat dieper op deze materie in ga.


Vrijwel alle RAW converters werken tegenwoordig dan ook met deze sidecar bestanden, hoewel de onderlinge uitwisselbaarheid vaak weer niet optimaal is. Ik zal daarover hier niet verder uitwijden maar me richten op de tweede manier om gebruik te maken van XMP, namelijk als een sector binnen het beeldbestand, vergelijkbaar dus met hoe dat gaat bij IPTC en EXIF.

Welke van de beide XMP methodes je gebruik ligt overigens sterk aan de software die je gebruikt, vaak kun je daarin zelf ook nog keuzes maken. Gebruik je het JPG of DNG bestandsformaat dan kun je rustig kiezen voor XMP als sectie binnen het bestand en zijn separate sidecar bestanden niet nodig. (Over de keuze al dan niet voor het DNG RAW formaat heb ik eerder geschreven en zal ik op deze plek verder niet ingaan. Link1, Link2)

XMP omvat dus ondermeer de standaarden IPTC Core, IPTC extensions, Dublin Core en Plus.

Nadere orientatie?
Eerder heb ik al aangegeven dat je nauwlijks of geen handelingen hoeft te verrichten om metadata naar je hand te zetten. De achtergrondinformatie over de verschillende bestaande standaarden heb ik met name gegeven om wat meer inzicht te verschaffen. In de dagelijkse praktijk zal de metadata afhandeling plaatsvinden binnen de applicaties die je daarvoor gebruikt. Op photometadata.org staan handleidingen met betrekking tot dit onderwerp voor een aantal veelgebruikte applicaties:

Wanneer je vóór 2005 al metadata hebt toegevoegd en/of aangepast in je foto’s dan heb je meer reden om je in deze materie te verdiepen dan wanneer je nog niet zo lang geleden bent begonnen. Voor 2005 waren er namelijk nog nauwlijks applicaties die de gegevens in de XMP sector wegschreven zoals dat nu de voorkeur heeft. Al die data staat dus nog in de ‘oude’ IPTC (IIM) sector. Je huidige DAM applicatie zal daar wel goed mee om moeten kunnen gaan en deze velden op zijn minst moeten uitlezen. Test dit dus goed voordat je tot aanschaf overgaat van een (nieuwe) applicatie.

Karakter sets (ASCII, ANSI, UTF-8, ETC):
Voordat je concrete meta data aan je afbeeldingen gaat toevoegen is het goed je een beetje te verdiepen in de te gebruikern karakters, vooral wanneer het waarschijnlijk is dat je vreemde leestekens zult gaan gebruiken of wanneer je EXIF velden gaat muteren.
Het is namelijk niet vanzelfsprekend leestekens (vooral vreemde) overal ter wereld correct zullen worden weergegeven. Het ASCII teken 227 bijvoorbeeld (ALT+227) geeft op ons toetsenbord een Ò te zien maar in Amerika een π en in centraal Europa een Ń.


Ik zal er hier niet al te diep op ingaan maar onhoud dat UTF-8 volgens wikipedia het beste geschikt voor toepassingen rondom meta data. Ook niet-ASCII tekens zullen dan correct worden weergegeven op iedere pc. Je kunt je natuurlijk ook beperken tot het gebruik van alleen ‘gewone’ leestekens.

Wat nu?
Wanneer je rekening wilt houden met alle aspecten die ik hier heb genoemd kun je daar misschien wel een dagtaak aan krijgen. En dat terwijl je helemaal niet achter je computer wilt zitten maar liever naar buiten gaat om foto’s te maken!
Aan de andere kant wil je hoogstwaarschijnlijk wel dat anderen jouw foto’s te zien krijgen, zowel nu als in de toekomst. Een goede organisatie is dan van belang en ik hoop dat de kennis daarvoor met behulp van dit artikel iets is toegenomen zodat je jezelf op cruciale momenten de goede vragen kunt stellen. Bijvoorbeeld bij de aanschaf van een (nieuw) beheer/catalogus programma om je foto’s mee te beheren.

Wanneer je de opgedane kennis wilt gebruiken om je foto’s beter vindbaar te maken op internet (SEO – Search Engine Optimization) dan komt daar nog heel wat meer bij kijken. Deze verdieping op de materie zal ik een andere keer aanbrengen.