„Portable Document Format“ – Versionsunterschied

[ungesichtete Version][ungesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Änderung 40961200 von Seewolf (Diskussion) wurde rückgängig gemacht. Es handelt sich nicht um eine Meinung, sondern um Tatsachen.
Änderung 40961318 von Seewolf (Diskussion) wurde rückgängig gemacht.
(Eine dazwischenliegende Version von einem anderen Benutzer wird nicht angezeigt)
Zeile 44: Zeile 44:
=== Einsatz auf Web-Seiten ===
=== Einsatz auf Web-Seiten ===


Das Format findet inflationären und weitgehend unreflektierten Einsatz auf Web-Seiten, insbesondere im akademischen Bereich. Problematisch daran ist, dass Texte von öffentlich finanzierten Lehranstalten nur noch in einem kommerziellen, [[proprietär]]en Dateiformat veröffentlicht werden, ohne dass dies in den aller meisten Fällen der Sache nach notwendig und sinnvoll ist.
Das Dateiformat wird auf vielen Web-Seiten eingesetzt, besonderes oft im akademischen Bereich. Problematisch daran ist, dass Texte von öffentlich finanzierten Lehranstalten nur noch in einem kommerziellen, [[proprietär]]en Dateiformat veröffentlicht werden, ohne dass dies in den aller meisten Fällen der Sache nach notwendig und sinnvoll ist.


Prinzipiell beruht die Zugänglichkeit von Informationen im Web darauf, dass Texte dargestellt werden können, ohne dass darauf bestanden wird, dass diese Texte auf eine ganz bestimmte, eng definierte Weise anzuzeigen sind, das heißt, dass die jeweils realisierbare Darstellung einer [[Extensible Hypertext Markup Language|(X)HTML]]-Seite dem Betriebssystem und dem Web-Browser und nicht zuletzt den Optionen des Seitenbesuchers überlassen wird.
Prinzipiell beruht die Zugänglichkeit von Informationen im Web darauf, dass Texte dargestellt werden können, ohne dass darauf bestanden wird, dass diese Texte auf eine ganz bestimmte, eng definierte Weise anzuzeigen sind, das heißt, dass die jeweils realisierbare Darstellung einer [[Extensible Hypertext Markup Language|(X)HTML]]-Seite dem Betriebssystem und dem Web-Browser und nicht zuletzt den Optionen des Seitenbesuchers überlassen wird.


Die weitaus meisten auf akademischen oder schulischen Web-Seiten verfügbaren PDFs enthalten keine Texte, die zu ihrer Präsentation genau in der Schrift und mit genau dem Layout dargestellt werden müssen, die ihr Verfasser, in aller Regel jemand mit keinerlei typographischer und kaum lesetechnisch-ergonomischer Qualifikation, benutzt hat. Selbst recht kurze, völlig unkomplizierte gelegentlich geradezu banale Texte, die jeder Web-Browser als (X)HTML-Datei problemlos – und mit [[CSS]] auch recht sauber definiert – darstellen könnte, werden nur im aufwendigen PDF-Format präsentiert, für dessen Darstellung jeder Seiten-Besucher ein Zusatzprogramm installieren und starten muss. Ein solcher unnötiger Einsatz des PDF-Formats beschränkt den Zugang zu Informationen. (Siehe auch [[Barrierefreiheit]].)
Die weitaus meisten auf akademischen oder schulischen Web-Seiten verfügbaren PDFs enthalten keine Texte, die zu ihrer Präsentation genau in der Schrift und mit genau dem Layout dargestellt werden müssen, die ihr Verfasser, in aller Regel jemand mit keinerlei typographischer und kaum lesetechnisch-ergonomischer Qualifikation, benutzt hat. Selbst recht kurze Texte einer alles andere als ungewöhlichen oder unkomplizierten Aufmachung, die jeder Web-Browser in Form einer (X)HTML-Datei problemlos – und mit [[CSS]] auch recht sauber definiert – darstellen könnte, werden nur im aufwendigen PDF-Format präsentiert, für dessen Darstellung jeder Seiten-Besucher ein Zusatzprogramm installieren und starten muss. Ein solcher unnötiger Einsatz des PDF-Formats beschränkt den Zugang zu Informationen. (Siehe auch [[Barrierefreiheit]].)


== Sicherheitslücken durch menschliches Versagen ==
== Sicherheitslücken durch menschliches Versagen ==

Version vom 9. Januar 2008, 07:26 Uhr

Das Portable Document Format (PDF; deutsch: übertragbares Dokumentenformat) ist ein plattformübergreifendes Dateiformat für Dokumente, das von der Firma Adobe Systems entwickelt und 1993 mit Acrobat 1 veröffentlicht wurde. PDF ist ein kommerzielles (proprietäres), aber offengelegtes Dateiformat, das im PDF Reference Manual von Adobe dokumentiert ist und für das Anzeigeprogramme für verschiedene Betriebssysteme verfügbar sind. Bestimmte Methoden beim Umgang mit PDF wurden zur Erleichterung des Datenaustausches in der Druckvorstufe (als PDF/X) und zur Langzeitarchivierung von PDF-Dateien (als PDF/A) von der ISO genormt.

Übersicht

Grundlagen und Software

Aus Texten, Bildern und Grafiken – gemischte oder einzeln – lassen sich mit entsprechenden Programmen PDF-Dokumente/-Dateien erzeugen (z. B. mit kostenlosen Programmen wie dem PDFCreator und Openoffice oder kostenpflichtigen wie Adobe Acrobat) und mit entsprechenden Leseprogrammen darstellen (z. B. Adobe Reader, Ghostview, Foxit, Vorschau). Der Ersteller einer PDF-Datei kann diese in vielfältiger Weise vor Missbrauch schützen, indem er die Sicherungsmechanismen des PDF aktiviert. Dadurch sollen u. a. das Copyright besser gewahrt oder durch Verschlüsselung der Zugriff Unbefugter verhindert werden. Je nach Bedarf kann bereits das Öffnen des PDF ein Passwort erfordern, oder das Kopieren von Inhalten aus dem PDF oder das Ausdrucken des PDF wird nicht zugelassen. Die hierfür im PDF implementierten Schutzmechanismen sind jedoch niemals hundertprozentig zuverlässig und insbesondere einfachere Formen der Verschlüsselung sind leicht zu überwinden.

In der Startphase war der Adobe Reader kostenpflichtig. Erst die kostenfreie Weitergabe der Software ermöglichte die Verbreitung im heutigen Ausmaß. Im Oktober 2006 wurde die derzeit aktuelle Version des PDF-Dateiformats 1.7 veröffentlicht, die in der neuen Version eingeführten Merkmale erfordern Acrobat ab Version 8.

Erzeugung und Umwandlung

PDF ist eine vektorbasierte Seitenbeschreibungssprache, die die freie Skalierbarkeit der Darstellung erlaubt. PDF-Dateien beschreiben das mit dem Erstellungsprogramm erzeugte Layout in einer vom Drucker und von Voreinstellungen unabhängigen Form weitgehend originalgetreu. Das ist einer der wesentlichen Vorteile von PDF gegenüber fortgeschrittenen Beschreibungs- und Auszeichnungssprachen wie SGML oder HTML, wenn es um die Forderung nach unbedingter Layout-Treue geht.

Um eine Darstellung auch auf Ausgabegeräten mit kleiner Fläche – wie beispielsweise PDAs oder Mobiltelefonen – zu optimieren, können in einem PDF Auszeichnungen (nicht unähnlich HTML-Tags) eingelagert werden, die ein Umbrechen der Seiteninhalte – dann zwangsläufig unter Einschränkung der Layouttreue – ermöglichen. Solche Auszeichnungen ermöglichen es zudem einem Vorleseprogramm, sehbehinderten Nutzern den PDF-Inhalt vorzulesen und erleichtern das Konvertieren des PDF-Inhalts in andere Formate.

Ein häufig verwendetes Programm zur Erzeugung von PDF-Dateien ist Adobe Acrobat Distiller, der aus PostScript-Dateien PDFs erstellt. Acrobat Distiller ist als Desktopprodukt verfügbar für Windows und Mac OS; Serverversionen sowie der kostenlose Adobe Reader existieren auch für andere Plattformen. Diverse Office- und DTP-Programme von Drittherstellern bieten einen direkten PDF-Export an und sind auf einer Reihe von Plattformen verfügbar. Des Weiteren ist es mit pdfLaTeX möglich, aus LaTeX direkt eine PDF-Datei zu erzeugen. Mit inzwischen zahlreichen Werkzeugen und Programmierbibliotheken lassen sich auf unterschiedlichste Weise mit unterschiedlicher Spezialisierung PDF-Dateien erstellen, die Erzeugung von PDF-Dateien ist nahezu auf jeder Plattform möglich.

Adobe räumt Entwicklern teilweise das Recht ein, eigene Anwendungen zur Generierung und Bearbeitung von PDF-Dokumenten zu entwickeln, behält sich aber das Copyright über die Spezifikationen vor[1]. PDF als Seitenbeschreibungssprache kann als Weiterentwicklung des Grafikmodells von PostScript angesehen werden, das ebenfalls offengelegt ist. Ende Februar 2007 hat Adobe angekündigt, die PDF-Spezifikation in der Version 1.7 in die ISO-Normierung einzubringen, und arbeitet hierfür mit dem amerikanischen Branchenverband AIIM zusammen, der das Sekretariat des ISO-Komitee TC 171 innehat. Adobe drohte Microsoft bei Integration des offenen Standards PDF mit kartellrechtlichen Klagen.

Verwendung und Eigenschaften

Eine PDF-Datei kann Dokumente eines Ursprungsprogramms einschließlich aller Farben, Raster- und Vektorgrafiken sehr präzise wiedergeben. Dies gilt grundsätzlich ebenfalls für Schriften.

Dokumente im PDF können einen Umfang von einer oder hunderttausenden Seiten haben. Dabei ist die Seitengröße durch das PDF-Format selbst nicht begrenzt. In Adobe Acrobat gibt es jedoch durch die Implementierung bedingt Grenzen (bis Version 3 auf 45 mal 45 Zoll, bis Version 6 auf 200 mal 200 Zoll, und seit Version 7 auf das 75000-fache, das sind 15.000.000 mal 15.000.000 Zoll).

PDF basiert auf dem gleichen Grafikmodell wie PostScript. Beide sind Seitenbeschreibungssprachen. PDF erlaubt gegenüber PostScript zahlreiche zusätzliche Funktionen – neben der Strukturierung von Dokumenten sind interaktive Elemente wie Lesezeichen, Kommentare oder Formularfelder möglich. Auch das Grafikmodell für die Seiteninhalte wurde gegenüber PostScript erweitert; um Funktionen wie Transparenz oder optionalen oder schaltbaren Inhalt (in der Acrobat-Bedienungsoberfläche als Ebenen bezeichnet) oder die Unterstützung von ICC-Profilen und OpenType-Schriften.

Schriften (mit Ausnahme von Pixelschriften) und Vektorgrafiken können beliebig ohne Qualitätsverlust vergrößert werden. Große Netzwerkpläne und Datenmodelle lassen sich unter diesen Voraussetzungen verlustfrei auf einer PDF-Seite unterbringen.

Aus PDF-Dokumenten lassen sich Textpassagen, Tabellen und Grafiken (auch Ausschnitte davon) leicht in anderen Anwendungsprogrammen durch Kopieren und Einfügen der jeweiligen Elemente weiterverarbeiten, falls der Ersteller des Dokumentes dies zugelassen hat. Text kann nicht nur zur Weiterverarbeitung in anderen Anwendungen, sondern auch zum Durchsuchen oder zur Verwendung mit anderen Ausgabemedien, wie beispielsweise Screenreadern, extrahiert werden. Durch die Textsuche im einzelnen Dokument oder die Volltextrecherche innerhalb einer PDF-Dokumentensammlung lassen sich sehr einfach Detailinhalte auffinden. Dies funktioniert selbst dann, wenn der Text grafisch verzerrt, z. B. in Kreis- oder Kurvenform dargestellt ist.

Eine Besonderheit von PDF ist der optionale Dokumentenschutz mit 40- oder 128-Bit-Verschlüsselung. Durch Vergabe eines Benutzerpasswortes ist es so möglich, das Dokument nur einem beschränkten Personenkreis zugänglich zu machen. Weiterhin kann der Autor mit einem separatem Besitzerpasswort gezielt die Rechtevergabe des betreffenden Dokuments festlegen. So kann verhindert werden, dass Benutzer das Dokument abändern, ausdrucken oder Teilinhalte kopieren können. Auch ohne Kenntnis des Benutzerpasswortes lassen sich diese Rechteeinschränkungen jedoch mithilfe diverser Werkzeuge insbesondere dann leicht entfernen, wenn zwar ein Besitzerpasswort verwendet, das Öffnen des Dokuments jedoch kein Passwort erfordert.

Durch entsprechende Werkzeuge lassen sich auch Rechte vergeben, die es ermöglichen PDF-Dokumente mit Notizen, Kommentaren und Dateianhängen zu versehen oder Formulareinträge abzuspeichern. Ursprünglich konnten diese Merkmale nur mit Adobe Acrobat genutzt werden, seit Version 7 ist es jedoch auch mit dem kostenlosen Adobe Reader möglich, Notizen und Kommentare hinzuzufügen und interaktive Formularfelder auszufüllen, sofern das entsprechende Dokument vom Verfasser mit den notwendigen Berechtigungen versehen wurde.

PDF wurde als ein Austauschformat für fertiggestellte Dokumente konzipiert. Inzwischen gibt es eine Reihe von Programmen bzw. Erweiterungen für Adobe Acrobat, mit denen sich PDF-Dateien bearbeiten lassen. Das Format ist jedoch nicht mit Dateiformaten von Textverarbeitungsprogrammen oder Grafikprogrammen vergleichbar und eignet sich, abgesehen von der Notiz- und Kommentarfunktion, nur begrenzt zur Weiterverarbeitung von Dokumenten. Es ist allerdings innerhalb gewisser Grenzen möglich, beispielsweise Tippfehler zu entfernen. Vorteile im Desktop Publishing sind für Grafiker und Designer die Einbindung aller Elemente für die Druckerstellung.

PDF-Dokumente können abhängig vom Einzelfall sowohl größer als auch kleiner als die Dateien der Ursprungsanwendung sein. Die Größe eines Dokuments hängt von der Art der enthaltenen Daten, von der Effizienz des Erstellungsprogramms und davon ab, ob Schriften eingebettet wurden. Schriften können entweder vollständig, als Untermenge der tatsächlich im Dokument verwendeten Zeichen oder aber überhaupt nicht eingebettet werden. Soll ein Dokument zuverlässig darstellbar sein, unabhängig davon, ob auf der Zielplattform die verwendeten Schriften installiert sind, müssen mindestens die tatsächlich verwendeten Zeichen eingebettet werden.

PDF wurde im Laufe seiner Entwicklung mehrfach auf spezielle Anforderungen für die Verwendung im Internet angepasst. So musste ein Dokument ursprünglich vollständig verfügbar sein, um dargestellt werden zu können. Inzwischen ist es möglich, PDF-Dokumente zu linearisieren, so dass Teile eines Dokuments bereits während des Ladevorgangs dargestellt werden können. Seit der Version 1.5 der PDF-Spezifikation können mehrere Objekte in einem PDF zusammengefasst und dann komprimiert werden, was insbesondere bei den für Dokumentstruktur erforderlichen, zahlreichen, kleinen Objekten zu einer deutlich besseren Kompression führt (Bilddaten oder die eigentliche Beschreibung einer Seite konnten schon immer komprimiert werden).

Bei der Archivierung gedruckter Dokumente als PDF-Dateien wird ein gemischter Ansatz bevorzugt, um sowohl das Originaldokument weitestgehend zu erhalten als auch Durchsuchbarkeit zu gewährleisten. Durch geschickte Kombination der von PDF prinzipiell unterstützten Bildkompressionsverfahren wird sehr starke Kompression erreicht (typischerweise 1:200), indem Hintergrund (typischerweise flächige Strukturen und Farbverläufe) und Text (scharfe Ränder, dafür nur wenige Farben) mit verschiedenen, dafür speziell geeigneten Verfahren komprimiert und anschließend übereinandergelegt werden. Der eigentliche Text wird per OCR-Verfahren extrahiert und unsichtbar eingebettet.

Einsatz auf Web-Seiten

Das Dateiformat wird auf vielen Web-Seiten eingesetzt, besonderes oft im akademischen Bereich. Problematisch daran ist, dass Texte von öffentlich finanzierten Lehranstalten nur noch in einem kommerziellen, proprietären Dateiformat veröffentlicht werden, ohne dass dies in den aller meisten Fällen der Sache nach notwendig und sinnvoll ist.

Prinzipiell beruht die Zugänglichkeit von Informationen im Web darauf, dass Texte dargestellt werden können, ohne dass darauf bestanden wird, dass diese Texte auf eine ganz bestimmte, eng definierte Weise anzuzeigen sind, das heißt, dass die jeweils realisierbare Darstellung einer (X)HTML-Seite dem Betriebssystem und dem Web-Browser und nicht zuletzt den Optionen des Seitenbesuchers überlassen wird.

Die weitaus meisten auf akademischen oder schulischen Web-Seiten verfügbaren PDFs enthalten keine Texte, die zu ihrer Präsentation genau in der Schrift und mit genau dem Layout dargestellt werden müssen, die ihr Verfasser, in aller Regel jemand mit keinerlei typographischer und kaum lesetechnisch-ergonomischer Qualifikation, benutzt hat. Selbst recht kurze Texte einer alles andere als ungewöhlichen oder unkomplizierten Aufmachung, die jeder Web-Browser in Form einer (X)HTML-Datei problemlos – und mit CSS auch recht sauber definiert – darstellen könnte, werden nur im aufwendigen PDF-Format präsentiert, für dessen Darstellung jeder Seiten-Besucher ein Zusatzprogramm installieren und starten muss. Ein solcher unnötiger Einsatz des PDF-Formats beschränkt den Zugang zu Informationen. (Siehe auch Barrierefreiheit.)

Sicherheitslücken durch menschliches Versagen

PDF-Dateien können mitunter unbeabsichtigt vertrauliche Informationen beinhalten, die zwar nicht unmittelbar sichtbar sind, aber durch Textsuche gefunden werden können. Einerseits können sehr wohl vorhandene Informationen durch Objekte verdeckt sein oder sich außerhalb des Seitenanzeigebereichs befinden, andererseits kann ein PDF Metadaten enthalten, die nur beim Aufruf entsprechender Dialoge angezeigt werden und gelegentlich unbemerkt bleiben. Insbesondere beim „Schwärzen“ von Textpassagen ist es nicht ausreichend, die jeweilige Textpassage abzudecken, sondern sie muss vollständig aus dem PDF entfernt werden.

Prominente Fallbeispiele

  • Eine Datei, welche den Tod eines italienischen Agenten behandelte, der im März 2005 die Journalistin Giuliana Sgrena aus irakischer Geiselhaft befreite. US-Soldaten erschossen ihn dabei kurz nach dieser Aktion. Der veröffentlichte Bericht war zensiert. Doch fanden sich in der veröffentlichten Datei die redaktionellen Überarbeitungen durch Kopieren des Textes und Abspeichern in eine neue Datei.
  • Das Weiße Haus in Washington veröffentlichte George W. Bushs Rede zum „Plan für den Sieg im Irak“. Die Dateiangaben legten den Ghostwriter offen, nämlich Peter Feaver, Professor für Politikwissenschaften von der Duke Universität in North Carolina, welcher seit Juni 2005 das National Security Council berät.
  • Nach der Ermordung des libanesischen Politikers Rafiq Hariri fanden sich in einer öffentlich publizierten PDF der UNO die vorher gelöschten Verweise auf Namen syrischer Funktionsträger, welche im Verdacht standen, für das Attentat verantwortlich zu sein.

Vermeidung

Es ist nicht immer einfach, ungewollte Informationen in einem PDF zu vermeiden, insbesondere dann nicht, wenn man nicht ausschließlich selbst das PDF (sowie das Dokument, aus dem es generiert wurde) erstellt und bearbeitet hat. Es ist wichtig, dass beim Schwärzen von Textpassagen ein Werkzeug eingesetzt wird, das die betreffenden Inhalte vollständig entfernt. Genauso wichtig ist das Prüfen der Metadaten (in Acrobat zu finden über Datei/Eigenschaften). Acrobat Professional 8 bietet hierfür weitgehende Unterstützung, insbesondere durch eine spezielle Funktion zum Entfernen versteckter Informationen.

PDF in Betriebssystemen

Das Einsatzgebiet von PDF ist vielfältig. So ist es nicht verwunderlich, dass mit dem Betriebssystem Mac OS X von Apple erstmals PDF als Standardformat für die Bildschirmausgabe wie auch die Druckausgabe verwendet wurde. Die Vorteile liegen auf der Hand: Mit Hilfe von PDF ist erstmals echtes WYSIWYG möglich. Die PDF-Erzeugung kann aus jeder Anwendung heraus erfolgen, die einen Druckdialog besitzt. Da PDF auch zur Erzeugung der Druckdaten verwendet wird, ist es daher möglich, PostScript auf Nicht-Postscript-Druckern auszugeben.

Unter Windows, Mac OS Classic und Mac OS X, GNU/Linux und den Unix-Betriebssystemen Solaris, HP/UX und AIX gibt es den kostenlosen Adobe Reader / Acrobat Reader.

Unter Mac OS X ist die PDF-Anzeige Bestandteil des Betriebssystems. Für unixbasierte Systeme gibt es zusätzlich das Programm Xpdf, das auf die grundlegendsten Funktionen (Anzeige auf Bildschirm, Durchsuchen des Dokuments, Ausdrucken) reduziert ist, sowie einige weitere Programme (Okular und Evince), die an ihre Desktop-Umgebung angepasst sind. Die Open-Source Programme eignen sich auch, vermeintliche „Sicherheitsmerkmale“ von PDF-Dokumenten zu umgehen – so ist es teilweise möglich, Dokumente auszudrucken, obwohl der Autor dem Betrachter des Dokuments diese Möglichkeit eigentlich verwehren wollte.

Siehe auch: Display Postscript

Angaben der Seitengeometrie

Die verschiedenen Boxen im PDF

Angaben zur Seitengeometrie in einem PDF-Dokument sind vor allem in der Druckindustrie sehr wichtig. Sie beschreiben, in welchem Bereich einer Seite sich derjenige Inhalt befindet, der dem beschnittenen Endformat entspricht und wo ein weiterverarbeitendes Programm (beispielsweise zum Ausschießen, also dem Montieren von Seiten auf einem Druckbogen) mit einer Beschnittzugabe rechnen kann. Moderne DTP-Programme legen diese Information beim Direktexport nach PDF im PDF mit ab. Werden PDFs über PostScript ausgegeben, sind die entsprechenden Angaben meist nicht enthalten. Adobe Acrobat Distiller ist für die PostScript-Ausgabe aus bestimmten Programmen in der Lage, den Nettoseitenbereich aus den Beschnittmarken abzuleiten, sofern diese mit ausgegeben wurden.

MediaBox

Sie definiert die Größe des Ausgabemediums und den Medienrahmen des PDF-Dokumentes. Das Dokument ist noch nicht beschnitten und enthält in der Regel die im PDF-Generator eingestellte PostScript-Seitengröße. Die MediaBox muss immer die größte aller Boxen sein, da sie alle anderen (nachfolgend erläuterten) Boxen mit einschließen muss und es ist die einzige Box, die in einem PDF stets enthalten sein muss.

CropBox

Die CropBox (in Adobe Acrobat als Maskenrahmen bezeichnet) beschreibt den Bereich einer PDF-Seite, der auf dem Bildschirm bzw. dem Drucker ausgeben werden soll. Voreingestellt sind die Werte der Media-Box.

BleedBox

Eine Bleedbox beinhaltet Informationen über die Anschnittrahmen, die die Größe des Endformates zuzüglich des vorgesehenen Beschnitts definiert. In der Druckindustrie wird ein Beschnitt in der Regel von 3 bis 5 mm pro Seite benötigt. Ein Anwendungsbeispiel sind Bilder, die im Anschnitt (also direkt am Seitenrand) liegen. Für eine A4-Seite, die an eine Druckerei geliefert werden soll, ergibt sich bei einem Beschnitt von 3 mm somit für die BleedBox eine Breite von 210 mm + 6 mm und eine Länge von 297 mm + 6 mm, also 216 mm × 303 mm. Voreingestellt sind die Werte der Crop-Box.

TrimBox

Die TrimBox ist das Endformat einer PDF-Datei ohne Beschnitt und wird auch „Endformatrahmen“ genannt.

Art Box

Art Box (auch „Bounding Box“ genannt) stellt den Objektrahmen dar, das heißt diese Box beschreibt den Seitenausschnitt, der beim Platzieren der PDF-Seite in einem anderen Programm verwendet werden soll – vergleichbar mit der Größenangabe für das Importieren einer EPS-Datei.

Formularprozesse

PDF-Dokumente können für Formularprozesse neben Text und grafischen Elementen interaktive Formularelemente enthalten. Komplette Formulare lassen sich somit in einem PDF-Dokument bündeln; die im Dokument erfassten Daten können über verschiedene Wege zum Herausgeber des Formulars zurückgesendet werden.

  • Drucken und ausfüllen: Das per Hand ausgefüllte Formular kann auf herkömmlichen Wegen per Post oder Fax versendet werden.
  • Ausfüllen und Drucken: Das elektronisch ausgefüllte Dokument kann ausgedruckt und auf herkömmlichen Wegen versendet werden.
  • Ausfüllen und über eine HTTP-Verbindung senden: Das elektronisch ausgefüllte Formular kann elektronisch über den Webbrowser oder aus Adobe Acrobat heraus versendet werden.
  • Ausfüllen, abspeichern und beispielsweise per E-Mail senden: Das elektronisch ausgefüllte Formular kann elektronisch per E-Mail o.ä. versendet werden.

Bei der letztgenannten Möglichkeit ist der pdf-FormServer oder das kommerzielle Adobe Acrobat nötig, bzw. ab Adobe Reader 7 nur der kostenlose Reader, sofern das Abspeichern des PDF freigeschaltet wurde, ansonsten genügt der kostenlose Adobe Reader.

Druckvorstufen

In der Druckvorstufe werden häufig eine Reihe von speziellen Werkzeugen und Verarbeitungssystemen verwendet. Hierzu zählen u.a. Asura(Preflight), Speedflow, PitStop Professional, Prinergy, Apogee, Helios PDF Handshake, Prinect Printready und Puzzleflow. Sehr weitreichende Funktionen sind bereits in der Professional-Version von Adobe Acrobat enthalten.

Konvertierung anderer Formate zu PDF

XML

PDF-Dokumente können aus XML-Daten mit Hilfe geeigneter Transformationen (XSL-FO) erstellt werden.

HTML

Aus einer HTML-Datei können PDF-Dokumente recht schnell und einfach mit dem Programm HTMLDOC erzeugt werden. Dieses Programm verfügt sowohl über eine Konsolen-Schnittstelle als auch über eine grafische Benutzeroberfläche. Damit ist es sowohl auf einem Client zur direkten Bedienung durch den Benutzer als auch zum Servereinsatz, z. B. zur On-the-fly-Generierung von PDF-Dokumenten geeignet.

Ein Perl-Modul HTML::HTMLDoc erleichtert Perl-Entwicklern die Schnittstelle zur Kommandozeile.

TeX

Das Satzprogramm TeX erhielt mit dem von Hàn Thể Thành entwickelten pdfTeX die Fähigkeit, aus TeX-Quellen direkt PDF zu erzeugen.

DVI

Aus DVI-Dateien können mit Hilfe des Treibers dvipdfmx PDF-Dateien erzeugt werden.

Normen und Standards

In verschiedenen Gremien der ISO werden seit 1997 Normen auf der Grundlage von PDF erarbeitet und verabschiedet. Hierbei werden, basierend auf bestimmten PDF-Versionen, Mindestanforderungen sowie Einschränkungen definiert. Adobe Systems hat in diesem Zusammenhang den betreffenden Gremien der ISO das Recht übertragen, die jeweils nötigen Spezifikationen zeitlich unbegrenzt zum kostenlosen Herunterladen bereitzustellen.

ISO 15930 PDF/X Format für die Übermittlung von Druckvorlagen
PDF/X-1a = ISO 15930-1 (2001) bzw. ISO 15930-4 (2003)
PDF/X-2 = ISO 15930-5 (2003)
PDF/X-3 = ISO 15930-3 (2002) bzw. ISO 15930-6 (2003)
PDF/X-4 = ISO 15930-7 (in Bearbeitung, erwartet für Herbst 2007)
PDF/X-5 = ISO 15930-8 (in Bearbeitung, erwartet für Herbst 2007)
ISO 19005 PDF/A PDF Archive Format für die Langzeitspeicherung
PDF/A-1 = ISO 19005-1 (2005)
ISO ??? PDF/E PDF Engineering Format für technische Dokumente aus den Bereichen: Ingenieurwesen, Architektur und Geo-Informationssysteme (in Bearbeitung, erwartet für Herbst 2007)
ISO ??? PDF 1.7 Am 29. Januar 2007 kündigte Adobe an, die derzeit aktuelle Version 1.7 der PDF-Spezifikation in die ISO-Normierung einbringen zu wollen.

Siehe auch

Quellen

  1. PDF Reference, fifth Edition (PDF-Datei), Kapitel 1.5 'Intellectual Property'

Literatur

  • Philipp Mayr: Das Dateiformat PDF im Web – eine statistische Erhebung., In: NFD – Nachrichten für Dokumentation, Jg. 53, 2002, S. 475-481,
Wiktionary: PDF – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Linkkatalog zum Thema PDF bei curlie.org (ehemals DMOZ)