Wie Modernes Publizieren Open-Source-Projekten hilft
Das Projekt “Modernes Publizieren” ist in dreifacher Weise im Open Source Gedanken verwurzelt:
- Zum einen baut das Projekt ausschließlich auf freier Software auf.
- Zum anderen ist auch alle für das Projekt selbst entwickelte Software unter Open-Source-Lizenzen freigegeben.
- Die dritte Verbindung ist vielleicht die Bemerkenswerteste: Existierende Programme wurden im Rahmen des Projektes verbessert, so dass die Neuerungen allen Nutzer:innen zur Verfügung stehen. “Modernes Publizieren” hilft damit selbst Menschen, welche die Hauptergebnisse des Projekts nicht verwenden.
Wir nehmen heute einen kurzen Blick auf die Verbesserungen, die in andere Projekte rund um den Dokumentenkonverter pandoc eingeflossen sind.
Pandoc Lua Filter
Pandocs Lua Filter sind ein mächtiges Werkzeug und ein bequemer Weg zur Anpassung des Konvertierungsprozesses. Eine Sammlung von nützlichen, vorgefertigten Filtern wird auf GitHub gepflegt. Das Nutzen der Filter wurde vereinfacht, indem jetzt direkt nutzbare Zip-Dateien zum Download angeboten werden. Die Methode zur automatischen Erzeugung dieser Zip-Dateien wurde als Teil des Projektes entwickelt.
Zusätzlich wurden wir durch unsere Arbeit auch auf Fehler in einigen der Filter aufmerksam, deren Behebung jetzt ebenfalls allen Nutzer:innen zugute kommt.
Pandoc-scholar
Pandoc-scholar vereinfacht die Konvertierung von wissenschaftlichen Artikeln in bekannte Publikationsformate.1 Unterstützt werden unter anderem die Ausgabe von PDF, Word docx, LibreOffice ODT, sowie HTML-Webseiten.
Im wissenschaftlichen Publikationsbereich zunehmend wichtiger wird das XML-Format JATS, kurz für “Journal Article Tag Suite”. Die Ausgabe dieses Formates wurde im Rahmen des Projektes verbessert und verfeinert.
Ein weiteres Ergebnis ist die Veröffentlichung von pandoc-scholar “Docker Containern”. Nutzer:innen müssen sich nicht mehr um die Installation von Abhängigkeiten sorgen, sondern können einen der vorgefertigten Container verwenden. Erweiterungen und der Einbau in existierende Systeme wurden dadurch ebenfalls erleichtert. Eine Veröffentlichung des Docker-Containers sowie der Anleitung zu seinem Bau folgen in 2021.
Der Großteil der Verbesserungen in den letzten drei pandoc-scholar-Versionen gingen aus den Anforderungen von “Modernes Publizieren” hervor.
Pandoc
Der Dokumentenkonverter Pandoc hat lange Zeit nur recht einfache Tabellen unterstützt. Tabellen mit spaltenübergreifenden Feldern konnten beispielsweise nicht eingelesen werden. Dieses Manko ist seit diesem Jahr behoben. Da komplexere Tabellen für das Projekt im HTML-Format gespeichert werden, war es essentiell, diese wieder in andere Formate konvertieren zu können. Die volle Unterstützung von Pandoc zum Einlesen von HTML-Tabellen ist daher ebenfalls dem Projekt zu verdanken.
Pandoc ausprobieren? Hier geht’s zur Installationsanleitung und zur Dokumentation.
-
Siehe auch: Krewinkel A, Winkler R. 2017. Formatting Open Science: agilely creating multiple document formats for academic manuscripts with Pandoc Scholar. PeerJ Computer Science 3:e112 https://doi.org/10.7717/peerj-cs.112 ↩︎