Blogi: Aineisto hallussa

Wednesday, May 4, 2011

Kuvien metatietomallit: Exif, IPTC, XMP

Kuvien metatiedot, kuten tiedot kuvausajasta, kuvassa esiintyvistä henkilöistä, kuvaajasta ja hakusanoista, tallennetaan kolmeen erityyppiseen metatieto malliin (schema). 

Exif (Exchangeable image file format) on Japanilaisten kameravalmistajien luoma malli. Kamerat tallentavat Exif -tietoihin mm. tietoja kamerasta, linssistä, valotusajasta ja sen semmoisista. Exif -määritykset eivät ole päivittyneet sitten 2002. Käytännössä Exif-tiedot ovat usein "kiva tietää" katerogiaan kuuluvia. Monet valokuvaajat poistavat (strip) kaikki tai osan Exif-tiedoista niiden sisältämien "liikesalaisuuksien" kuten kameran sarjanumeron takia.

IPTC (IPTC IIM) on sanomalehdistön (International Press Telecommunications Council) kuvien jakeluun kehittämä malli, jota on päivitetty useasti. IPTC on lähinnä käyttäjän tallentamaa tietoa, kuten headline (otsikko), caption (kuvateksti), copyright ja niin edelleen. IPTC:stä on kaksi settiä: core (uudistettu 2004) ja extended (2008). Extended toi mm. lisenssikäsittelykenttiä. Olen itse kirjoittanut ensimmäiset softat näiden lukuun jo 1993, jolloin mm. Adobe Photoshop ei ollut metatiedoista vielä kuullutkaan. Silloin IPTC-kenttiä tuki vasta Associated Pressin kehittämät ohjelmistot.

XMP (Adobe Extensible Metadata Platform) on Adoben kehittämä metatiedon xml-standardi. XMP ei sinänsä ole Exifin tai IPTC:n kaltainen malli, vaan rakenne, johon voidaan tallentaa monenlaista metatietoa, kuten vaikkapa IPTC-tiedot IPTC4XMP mallilla. XMP:hen tallennetaan myös mm. kuvankäsittelyohjelman ns. parametriseen kuvankäsittelyyn liittyviä tietoja, joita vain kyseinen ohjelma ymmärtää.

Vuoteen 2004 metatiedot tallennettiin aina tiedoston, kuten JPEG, TIFF tai PSD-tiedoston otsikossa oleviin kiinteisiin kenttiin. Tämän jälkeen on tullut mahdolliseksi tallentaa näihin tiedostoihin XMP-rakenne. Samassa tiedostossa voi olla samanaikaisesti vanhanmallinen kiinteisiin kenttiin perustuvaa metadataa ja XMP-rakenteeseen tallennettua tietoa. Sama kenttä ei kuitenkaan aina tarkoita täysin samaa vanhassa ja uudessa rakenteessa.

XMP-tiedot voidaan tallentaa myös kuvan rinnalle niin sanotuksi sidecar-tiedostoksi, jolloin sen pääte on yleensä .xmp, mutta se voi olla myös sovelluksen omassa päätteessä, kuten .bib Bibble -ohjelman tapauksessa.

Metatietojen käsittely riippuu käytetyistä ohjelmista. Jokaisella on omat erikoisuutensa. Niinpä pahimmillaan kuvasta voi löytyä metatietoja otsikosta, xmp-rakenteesta, sidecar-tiedostosta ja näiden sisältäkin eri kentistä loogisesti samaa tietoa. Kun tietoja muutetaan eri käsittelyvaiheissa, voi vanhat tiedot jäädä Exif-kenttiin, mutta muutokset tallentua xmp-rakenteeseen. Päättele siinä sitten, mikä on viimeisintä voimassaolevaa tietoa. Monet kuvakatalogiohjelmat tallentavat lisäksi muutetut metatiedot omaan tiedostoonsa tai tietokantaan, jolloin niihin tehdyt muutokset eivät yleensä siirry kuvatiedoston mukana eteenpäin.