Mere viden om PDF/A
PDF/A er ISO-standarden for langtidsarkivering af elektroniske dokumenter.
Den officielle ISO standard hedder ISO 19005-1:2005
PDF/A kaldes også PDF/A-1
Der findes to niveauer af PDF/A-1:
PDF/A-1b - Eksakt visuel reproduktion af dokument
PDF/A-1a - Eksakt visuel reproduktion af dokument PLUS evt. oplysninger om tekst i Unicode format samt dokumentets opbygning.
Fælles for begge niveauer er følgende træk:
- PDF-dokumenterne gemmes i version 1.4 (Kom med Adobe Acrobat 5)
- Fonte indlejres i PDF-dokumenterne
Vi kan anbefale bogen "PDF/A in a Nutshell: Long term archiving with PDF"
Der arbejdes på en nyere PDF/A-2 standard, der kommer til at bygge på PDF Standard 1.7 (Kom med Adobe Acrobat 8)
Hvorfor PDF/A?
For at sikre at elektroniske dokumenter der skabes i dag også kan åbnes og læses om 50 år og mere, er det nødvendigt at benytte nogle filformater som gerne skulle kunne "overleve" i mange år.
Dokumenter skrevet på papir for 50 år siden kan stadig læses den dag i dag. Sågar kan oldgamle papyrusruller stadig læses. Billeder taget i starten af sidste århundrede er måske blevet lidt gule og støvede, men de kan stadig ses. Mange kan sikkert genkalde programmer fra 80'erne og de tidlige 90'ere. Programmer der den dag i dag ikke eksisterer mere. F.eks. Lotus 1-2-3, Wordperfect osv. De fleste tekstbehandlingsprogrammer har længe kunnet åbne dokumenter fra WordPerfect, men vil de blive ved med det? Og hvad med regneark fra Lotus 1-2-3 - Hvlike programmer kan åbne dem? Der er mange andre eksempler på programmer med egne filformater der ikke længere eksisterer. Så dette kan vi også forvente af fremtiden. Nye programmer og formater vil opstå og gamle vil gå tabt.
Nu hvor flere og flere benytter digitale filformater til f.eks. billeder og dokumenter, er det vigtigt at vi sikrer at disse også kan åbnes, ses og læses af efterkommere (og it-systemer) om mange mange år. Og er vi sikre på at det faktisk kan lade sig gøre?
Helt sikre på dette kan vi formentligt aldrig blive, men vi kan i hvert fald gøre vores bedste. Det bedste her og nu er altså at prøve og blive enige om nogle standarder og formater, som alle forpligter sig til at benytte og videreføre. Dette er PDF/A i en nødeskal. Denne ISO-standard er blevet til på baggrund af et bredt internationalt samarbejde, og er pt. et format der må anses for et være ét der er til at stole på - også om 50 år.
Det skal nævnes at formatet TIFF CITT GRP. 4 (også kaldet TIF gruppe 4) er et format der længe har været anset for at være brugbart til langtidsarkivering. PDF formatet har i Danmark ikke været anset for at være brugbart af f.eks. Statens Arkiver, da det er et propræritært format ejet af Adobe. TIFF-formaet er fuldstændigt åbent. Dog kan TIFF kun indeholde billeder af tekst, og ikke selve teksten som PDF kan. Derfor er det nødvendigt at sikre at dette også kan lade sig gøre på lang sigt.
Links til mere information:
PDF/A Competence Center - http://www.pdfa.org
"The Basics" - Grundlæggende om PDF/A: www.pdf-tools.com/public/downloads/whitepapers/whitepaper-pdfa.pdf
Engelsk artikel på Wikipedia - http://en.wikipedia.org/wiki/PDF/A
ADOBE: PDF as a standard for archiving - http://www.adobe.com/products/acrobat/pdfs/pdfarchiving.pdf