Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
ebook:word2cleanhtml [2025/07/01 14:31] walter [A Über HTML] |
ebook:word2cleanhtml [2025/07/01 14:48] (aktuell) walter [Einsatz von Sigil] |
||
---|---|---|---|
Zeile 4: | Zeile 4: | ||
===== A Über HTML ===== | ===== A Über HTML ===== | ||
- | *Word -> HTML, dies Öffnen mit HTML-Programm (z. B. KompoZer), hier Bereinigung und Vorbereitung des CSS, dann Import in EPUB-Programm; erhalten bleiben Fuß-/Endnoten und Verlinkungen, verloren gehen Querverweise und Indexeinträge | + | *Word -> HTML, dies Öffnen mit HTML-Programm (z. B. KompoZer, https://kompozer.de.softonic.com/download), hier Bereinigung und Vorbereitung des CSS, dann Import in EPUB-Programm; erhalten bleiben Fuß-/Endnoten und Verlinkungen, verloren gehen Querverweise und Indexeinträge |
*Überlegenswert ist eine Vorbereitung der HTML-Konvertierung mit dem Tool Mammoth .docx to HTML converter; allerdings gehen dabei ebenfalls Querverweise und Indexeinträge verloren; einfachster Nutzungsweg über WordPress; Näheres zu finden bei [[https://www.wgv-projekte.de/pam-intrawiki_software/doku.php?id=wp:plugins#mammoth_docx_converter]] | *Überlegenswert ist eine Vorbereitung der HTML-Konvertierung mit dem Tool Mammoth .docx to HTML converter; allerdings gehen dabei ebenfalls Querverweise und Indexeinträge verloren; einfachster Nutzungsweg über WordPress; Näheres zu finden bei [[https://www.wgv-projekte.de/pam-intrawiki_software/doku.php?id=wp:plugins#mammoth_docx_converter]] | ||
*Achtung: spezielle Bereinigungsprogramme wie Word to Clean HTML (nur über Website verwendbar: https://word2cleanhtml.com/) sind nicht zu empfehlen, weil sie wie eine Blackbox arbeiten und nicht mehr können als übliche HTML-Programme | *Achtung: spezielle Bereinigungsprogramme wie Word to Clean HTML (nur über Website verwendbar: https://word2cleanhtml.com/) sind nicht zu empfehlen, weil sie wie eine Blackbox arbeiten und nicht mehr können als übliche HTML-Programme | ||
Zeile 17: | Zeile 17: | ||
===== C Über EPUB-Programme ===== | ===== C Über EPUB-Programme ===== | ||
- | *Word -> Jutoh, hier Weiterverarbeitung und EPUB-Check; dann Publikation; erhalten bleiben Fuß-/Endnoten, Verlinkungen, Indexeinträge und Querverweise | + | *Word -> Jutoh (https://www.jutoh.com/), hier Weiterverarbeitung und EPUB-Check; dann Publikation; erhalten bleiben Fuß-/Endnoten, Verlinkungen, Indexeinträge und Querverweise |
- | *Word -> Calibre, hier Weiterverarbeitung und EPUB-Check; dann Publikation; erhalten bleiben Fuß-/Endnoten, Verlinkungen und Querverweise; verloren gehen Indexeinträge | + | *Word -> Calibre (https://calibre-ebook.com/download), hier Weiterverarbeitung und EPUB-Check; dann Publikation; erhalten bleiben Fuß-/Endnoten, Verlinkungen und Querverweise; verloren gehen Indexeinträge |
===== Wenn es um den Erhalt von Indexeinträgen geht, bleiben nur drei Möglichkeiten ===== | ===== Wenn es um den Erhalt von Indexeinträgen geht, bleiben nur drei Möglichkeiten ===== | ||
Zeile 25: | Zeile 25: | ||
*Word -> FrameMaker, hier Weiterverarbeitung und EPUB-Check; dann Publikation | *Word -> FrameMaker, hier Weiterverarbeitung und EPUB-Check; dann Publikation | ||
- | **Es empfiehlt sich, //Sigil// als letzte Instanz vor der Publikation zu verwenden | ||
- | ** | ||
===== Fazit ===== | ===== Fazit ===== | ||
- | Das einzige Programm, das Word-Dateien in EPUB konvertieren kann und dabei sämtliche Merkmale erhält, ist Jutoh. | + | **Das einzige Programm, das Word-Dateien in EPUB konvertieren kann und dabei sämtliche Merkmale erhält, ist Jutoh.** |
+ | ===== Einsatz von Sigil ===== | ||
- | - **Mammoth-DOCX-Converter**: Hierbei handelt es sich um ein WordPress-Plugin. Näheres zu finden bei [[https://www.wgv-projekte.de/pam-intrawiki_software/doku.php?id=wp:plugins#mammoth_docx_converter]] | + | **Es empfiehlt sich, //Sigil// (https://sigil-ebook.com/) als letzte Instanz vor der Publikation zu verwenden**, egal, wie man zum EPUB gekommen ist. Nur in Sigil lässt sich //alles//, was zu einem E-Book dazu gehört, überarbeiten. Voraussetzung ist allerdings, dass z. B. auf dem Weg über Jutoh alle Merkmale einer Word-Datei korrekt konvertiert wurden. Ein direktes Einladen von .docx-Dateien in Sigil ist nicht möglich. |
- | - **Word to Clean HTML**: Hierbei handelt es sich um eine Website (https://word2cleanhtml.com/), in die das HTML, das man mit Word erzeugt hat (Speichern unter - HTML), einladen kann. Der HTML-Code wird dann auf Knopfdruck bereinigt: | + | |
- | * Leerzeilen werden entfernt. | + | Möglich wäre etwas anderes: der Aufbau einer EPUB-Datei von Grund auf. |
- | * Ersetzt werden | + | |
- | * <b> durch <strong>, <i> durch >em> | + | |
- | * Nicht-ASCII-Zeichen durch HTML-Entitäten | + | |
- | * typografische Anführungszeichen durch ihre ASCII-Äquivalente | + | |
- | * feste Leerzeichen durch normale Leerzeichen. | + | |
- | * Einzüge werden mit Tabulatoren erzeugt, nicht mit Leerzeichen. | + | |
- | * Das Tool schafft allerdings nur kleine Textmengen auf einmal (noch nicht herausgefunden, welche Mengen). | + |