Benutzer-Werkzeuge

Webseiten-Werkzeuge


ebook:word2cleanhtml

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
ebook:word2cleanhtml [2025/07/01 14:31]
walter [A Über HTML]
ebook:word2cleanhtml [2025/07/01 14:48] (aktuell)
walter [Einsatz von Sigil]
Zeile 4: Zeile 4:
 ===== A Über HTML ===== ===== A Über HTML =====
  
-  *Word -> HTML, dies Öffnen mit HTML-Programm (z. B. KompoZer), hier Bereinigung und Vorbereitung des CSS, dann Import in EPUB-Programm;​ erhalten bleiben Fuß-/​Endnoten und Verlinkungen,​ verloren gehen Querverweise und Indexeinträge+  *Word -> HTML, dies Öffnen mit HTML-Programm (z. B. KompoZer, https://​kompozer.de.softonic.com/​download), hier Bereinigung und Vorbereitung des CSS, dann Import in EPUB-Programm;​ erhalten bleiben Fuß-/​Endnoten und Verlinkungen,​ verloren gehen Querverweise und Indexeinträge
   *Überlegenswert ist eine Vorbereitung der HTML-Konvertierung mit dem Tool Mammoth .docx to HTML converter; allerdings gehen dabei ebenfalls Querverweise und Indexeinträge verloren; einfachster Nutzungsweg über WordPress; Näheres zu finden bei [[https://​www.wgv-projekte.de/​pam-intrawiki_software/​doku.php?​id=wp:​plugins#​mammoth_docx_converter]] ​   *Überlegenswert ist eine Vorbereitung der HTML-Konvertierung mit dem Tool Mammoth .docx to HTML converter; allerdings gehen dabei ebenfalls Querverweise und Indexeinträge verloren; einfachster Nutzungsweg über WordPress; Näheres zu finden bei [[https://​www.wgv-projekte.de/​pam-intrawiki_software/​doku.php?​id=wp:​plugins#​mammoth_docx_converter]] ​
   *Achtung: spezielle Bereinigungsprogramme wie Word to Clean HTML (nur über Website verwendbar: ​ https://​word2cleanhtml.com/​) sind nicht zu empfehlen, weil sie wie eine Blackbox arbeiten und nicht mehr können als übliche HTML-Programme   *Achtung: spezielle Bereinigungsprogramme wie Word to Clean HTML (nur über Website verwendbar: ​ https://​word2cleanhtml.com/​) sind nicht zu empfehlen, weil sie wie eine Blackbox arbeiten und nicht mehr können als übliche HTML-Programme
Zeile 17: Zeile 17:
 ===== C Über EPUB-Programme ===== ===== C Über EPUB-Programme =====
  
-  *Word -> Jutoh, hier Weiterverarbeitung und EPUB-Check; dann Publikation;​ erhalten bleiben Fuß-/​Endnoten,​ Verlinkungen,​ Indexeinträge und Querverweise +  *Word -> Jutoh (https://​www.jutoh.com/​), hier Weiterverarbeitung und EPUB-Check; dann Publikation;​ erhalten bleiben Fuß-/​Endnoten,​ Verlinkungen,​ Indexeinträge und Querverweise 
-  *Word -> Calibre, hier Weiterverarbeitung und EPUB-Check; dann Publikation;​ erhalten bleiben Fuß-/​Endnoten,​ Verlinkungen und Querverweise;​ verloren gehen Indexeinträge+  *Word -> Calibre ​(https://​calibre-ebook.com/​download), hier Weiterverarbeitung und EPUB-Check; dann Publikation;​ erhalten bleiben Fuß-/​Endnoten,​ Verlinkungen und Querverweise;​ verloren gehen Indexeinträge
  
 ===== Wenn es um den Erhalt von Indexeinträgen geht, bleiben nur drei Möglichkeiten ===== ===== Wenn es um den Erhalt von Indexeinträgen geht, bleiben nur drei Möglichkeiten =====
Zeile 25: Zeile 25:
   *Word -> FrameMaker, hier Weiterverarbeitung und EPUB-Check; dann Publikation   *Word -> FrameMaker, hier Weiterverarbeitung und EPUB-Check; dann Publikation
  
-**Es empfiehlt sich, //Sigil// als letzte Instanz vor der Publikation zu verwenden 
-** 
 ===== Fazit ===== ===== Fazit =====
-Das einzige Programm, das Word-Dateien in EPUB konvertieren kann und dabei sämtliche Merkmale erhält, ist Jutoh.+**Das einzige Programm, das Word-Dateien in EPUB konvertieren kann und dabei sämtliche Merkmale erhält, ist Jutoh.**
  
 +===== Einsatz von Sigil =====
  
-  - **Mammoth-DOCX-Converter**:​ Hierbei handelt es sich um ein WordPress-Plugin. Näheres zu finden bei [[https://www.wgv-projekte.de/pam-intrawiki_software/doku.php?​id=wp:​plugins#​mammoth_docx_converter]] +**Es empfiehlt ​sich//Sigil// (https://sigil-ebook.com/​) ​als letzte Instanz vor der Publikation zu verwenden**egal, wie man zum EPUB gekommen ist. Nur in Sigil lässt sich //alles//was zu einem E-Book dazu gehörtüberarbeitenVoraussetzung ist allerdings, dass z. B. auf dem Weg über Jutoh alle Merkmale einer Word-Datei korrekt konvertiert wurdenEin direktes Einladen von .docx-Dateien in Sigil ist nicht möglich
-  - **Word to Clean HTML**: Hierbei handelt es sich um eine Website ​(https://word2cleanhtml.com/), in die das HTMLdas man mit Word erzeugt hat (Speichern unter HTML)einladen kannDer HTML-Code wird dann auf Knopfdruck bereinigt:​ + 
-    * Leerzeilen werden entfernt. +Möglich wäre etwas anderes: der Aufbau einer EPUB-Datei von Grund auf. 
-    * Ersetzt werden  +
-      * <b> durch <​strong>,​ <i> durch >​em>​ +
-      * Nicht-ASCII-Zeichen durch HTML-Entitäten +
-      * typografische Anführungszeichen durch ihre ASCII-Äquivalente +
-      * feste Leerzeichen durch normale Leerzeichen. +
-    * Einzüge werden mit Tabulatoren erzeugt, ​nicht mit Leerzeichen+
-    * Das Tool schafft allerdings nur kleine Textmengen ​auf einmal (noch nicht herausgefunden,​ welche Mengen).+
ebook/word2cleanhtml.1751373086.txt.gz · Zuletzt geändert: 2025/07/01 14:31 von walter