Arbeiten mit PDF-Dokumenten

Der folgende Eintrag ist teilweise schon etwas älter und war bisher Teil einer bunten Linksammlung. Hierfür ist die Passage inzwischen aber zu umfangreich geworden. Falls also ein Link nicht mehr funktioniert, bitte einen Kommentar dazu schreiben.

Babinszki World – Net Distillery – Kostenloser Online Service zur Umwandlung von PostScript in PDF. Funktioniert einwandfrei, allerdings sind die so erzeugten Dateien im Ausgabesystem für jederman frei zugänglich. Man sollte daher inbesondere persönliche Dokumente nach dem Download mit identisch benannten, jedoch leeren Dateien überschreiben. Möglichst bevor der Google-Cache die Daten zwischengespeichert hat.

doc2pdf – Kostenloser Online Service um OpenDocument, Word, Excel, Powerpoint, HTML, Text und Bilddateien ins PDF Format zu konvertieren. Funktioniert einwandfrei, Qualität scheint mir aber etwas schlechter als bei Babinszki zu sein.

Adobe Druckertreiber – Fügt einen virtuellen Drucker hinzu, mit dem sich PostScript-Dateien erstellen lassen. Hierzu einfach die Ausgabe in eine Datei umleiten.

doPDF 5.0 – Installiert einen virtuellen Drucker, mit dem sich PDF-Dateien aus nahezu jeder Anwendung heraus erstellen lassen. Hierzu muss lediglich die Druckausgabe in eine Datei umgeleitet werden. Ghostscript oder andere zusätzliche Programme werden dabei nicht benötigt. doPDF ist kostenlos und in vielen Sprachen, darunter Deutsch, verfügbar.

PDFCreator** **- Installiert ebenfalls einen virtuellen Drucker, um PDF-Dateien aus beliebigen Anwendungen heraus erstellen zu lassen. Voraussetzung ist allerdings Ghostscript. Bietet viele praktische Einstellungsmöglichkeiten, u.a. können Dateinamen automatisch mit Tags wie z.B. dem aktuellen Datum versehen werden.

WordToPDF – Konvertiert .doc und .rtf Dateien nach PDF. Benötigt allerdings sowohl Ghostscript als auch einen Postscript-Druckertreiber (z.B. den oben genannten von Adobe). Das Programm ist in der Basisversion für den nicht-kommerziellen Gebrauch kostenlos. Interessant für Nutzer älterer Versionen von Microsoft Word, da diese noch keine PDF-Konvertierung beherrschen.

Zwei weitere (von mir bislang nicht geteste) Programme wären FreePDF XP und pdf24-creator. Letzteres installiert sich ebenfalls als virtueller Drucker, beide sehen auf den ersten Blick recht vielversprechend aus.

pdftk ist ein hervorragendes Open Source Programm zur Manipulation von PDF-Dateien. Es ermöglicht das Splitten, Zusammenfügen, Ver- und Entschlüsseln, (De)Komprimieren sowie Reparieren von PDF-Dateien. Zudem können Wasserzeichen eingefügt und Metadaten bearbeitet werden. Während pdftk über die Kommandozeile bedient wird, stellt PDFTK Builder eine grafische Oberfläche für das Programm zur Verfügung. Allerdings werden hierbei nicht alle Funktionen von pdftk unterstützt.

Verschlüsselte PDF-Dateien verlangen entweder für das Öffnen oder für die Nutzung bestimmter Funktionen die Eingabe eines Passworts. Dabei können unterschiedliche Passwörter für Leserechte einerseits und alle übrigen Rechte andererseits vergeben werden. Am häufigsten trifft man auf Dokumente, die man lesen, aber nicht drucken kann, obwohl man was gerne würde. Ebenso kann man solche Dokumente nicht teilen oder mit anderen zusammenfügen. Um ein Dokument von seinen Einschränkunen zu befreien, muss es entschlüsselt werden. Hierfür bietet sich der Guaranteed PDF Decrypter an, für dessen Nutzung drei Fälle unterschieden werden müssen: Lässt sich das Dokument öffnen, so kann der Decrypter sämtliche Restriktionen sofort und ohne Verzögerung entfernen, unabhängig von der Länge des Passworts bzw. Schlüssels. Man erhält dann eine entschlüsselte Kopie des Dokuments und genießt fortan völlige Freiheit bei der Manipulation des selbigen. Ist jedoch bereits das Lesen des Dokuments durch einen 40-Bit Schlüssel geschützt, so nimmt die Entschlüsselung laut Dokumentation bis zu einem Tag in Anspruch, wobei dieser Wert auch von der verfügbaren Rechenkraft abhängt. Hierbei sei angemerkt, dass der Decrypter sowohl mehrere physische Rechenkerne nutzen kann, als auch auf Wunsch eine vorhandene nVidia GPU! Mit einer der kostenpflichtigen Decrypter Varianten kann man über ein vorhandenes Netzwerk sogar mit mehreren Computern gleichzeitig an der Entschlüsselung einer PDF-Datei arbeiten. In diesem Fall dürfte sich der ganze Vorgang erheblich beschleunigen. Nun noch zum traurigen dritten Fall: Wenn bereits für das Lesen ein 128- oder 256-Bit Schlüssel benötigt wird, können nur noch spezielle PDF-Bruteforce-Programme helfen. Das ist dann in der Regel nicht mehr praktikabel. Noch ein kleines Anwendungsbeispiel: Ich habe probeweise 250 lesbare, aber geschützte PDF-Dokumente, die jeweils nur aus einer DIN-A4 Seite bestanden mit der Kommandozeilenversion des Guaranteed PDF Decrypters entschlüsselt. Hierfür kopiert man zunächst die Programmdateien des Decrypters in den Ordner, in dem die PDF-Dateien liegen. Dann öffnet man die Kommandozeile, navigiert in den genannten Ordner und gibt folgenden Befehl ein:**

for %i in (*.pdf) do guapdf /y %i**

Hiermit wird in einer Schleife über alle vorhandenen PDF-Dateien iteriert, und jedes mal der Befehl “guapdf /y aktuelledatei.pdf” ausgeführt. Der Parameter /y sorgt dafür, dass beim Entschlüsseln nicht nachgefragt und alles flüssig abgearbeitet wird. Das Ergebnis war einwandfrei, alle Dateien ließen sich öffnen, es traten keine Qualitätsverluste oder sonstige Schäden auf. Und natürlich standen einem nun alle denkbaren Funktionen zur Verfügung. Um das nochmals zu verdeutlichen, habe ich die 250 einzelnen Dateien anschließend noch mit dem PDFTK Builder zu einem einzigen Dokument zusammengefügt. Das funktioniert nur deshalb, weil die Dateien tatsächlich keiner Einschränkung mehr unterlagen.