albatros | texte
Sonntag, 21. Juni 2015

WordPress nach EPUB und weiter

WordPress und andere Blogsysteme haben zwar eine Exportfunktion, bieten aber sonst keine komfortablen Exportmöglichkeiten. Heraus kommt eine WordPress-XML-Datei, mit der man erst einmal wieder etwas anfangen können muß. Mit anderen Worten: WordPress ist ein Datensilo, das auch mit den üblichen Tools wie wget nicht mehr zu befreien ist.

Zehn Jahre lang Texte im Web an unterschiedlichen Stellen: Darunter war soviel Gutes, daß man daraus getrost ein E-Book machen könnte. Aufgabenstellung: WordPress-XML nach EPUB/PDF.

Für WordPress gibt es Plugins, Konverter für die Kommandozeile gibt es anscheinend nicht. Ein interessanter Weg führt jedoch über das Schweizer Taschenmesser für E-Books, Calibre: Man kann damit nämlich beliebige RSS-Feeds als Nachrichtenquellen abonnieren, timer-gesteuert einlesen und nach EPUB konvertieren. Diese Python-Lösung ist eigentlich für den E-Book-Reader für unterwegs, fernab der Datennetze gedacht. Damit geht aber noch mehr, denn aus EPUB geht es direkt aus Calibre per Export weiter in viele andere Formate. Eine Alternative zur Weiterverarbeitung ist dann Pandoc, das auch von EPUB nach LaTeX, OpenDocument-Text (ODT) und MediaWiki umsetzt. Und natürlich nach MarkDown. Beziehungsweise mit Sigil – zur Not redigiert man den EPUB-Quelltext direkt mit irgendeinem fähigen Editor.

Die Grenze dieses Workflows liegt in der Zahl an Artikeln, die per RSS auf einmal ausgeliefert werden können, hier wird man ggf. über spezielle Export-Kategorien oder -Tags nachhelfen müssen, für die es ja jeweils eigene Feeds gibt. Und natürlich müssen es Volltext-Feeds sein. ;) Just a work-around. Still diggin'.

Sie sind nicht angemeldet