Montag, 28. Januar 2008

Kopieren von Word-Texten in Wisysig-Editor

Ein Gespräch mit dem Schriftsteller, Journalisten und Lektor Peter H. Gogolin (http://ph-gogolin.blogspot.com/ und http://www.literaturbuero-gogolin.de/) brachte mich auf das alte Thema, wie Autoren vorhandene Texte, die sie mit einer Textverarbeitung geschrieben und lokal gespeichert haben, online publizieren können.

Zwei Möglichkeiten bieten sich unter anderem an:

Online-Publikation über ein Blog, oder der Einsatz einer CMS-Software (Content-Management-System), die auf dem eigenen Webspace installiert wird. Wenn es schnell und einfach gehen soll, ist die Einrichtung eines Blogs, zum Beispiel über Google bzw. blogger.com, die einfachste Methode. Bei Google einen Account anlegen, ein Blog anlegen, ein Standard-Layout wählen, das man später beliebig ändern kann, und die Texte in das Feld kopieren, in welchem ein neuer Beitrag (so genannter Post) einzugeben ist.

Einerlei, welche Methode man anwendet: in beiden Fällen wird man bei der Eingabe des Textes auf ein Eingabefeld stoßen, bei dem ein Wisywig-Editor verwendet wird, der eine Formatierung des Textes zulässt. Es gibt ein paar gängige Online-Wisyiwig-Editoren, die sowohl bei Blogger-Diensten als auch bei den verschiedenen Blog- oder Content-Management-Systemen verwendet werden (FCK-Editor, Tinymce etc.), und die sich im großen und ganzen einheitlich verhalten. Das Kopieren formatierter Texte ist jedenfalls stets möglich.

Über einen Button kann man auf den dahinterstehenden Quelltext umschalten. Auf diesen Aspekt konzentriert sich dieser Beitrag.

Vorhandene Texte zu übertragen, geht dabei ganz einfach, in dem man im parallel laufenden Textverarbeitungsprogramm den Text markiert, kopiert (über "Kopieren" oder mit STRG-C), das Fenster wechselt und den Text (über Einfügen oder STRG-V) in das Wisywig-Feld einfügt.

Das Besondere dabei: die Formatierungen werden direkt mitübertragen, und dabei automatisch in die für Webseiten geltenden Formatierungscodes übertragen. Das ist eine bemerkenswerte Leistung der Editoren, die ein blitzschnelles Übertragen formatierter Texte zulässt.

Dabei tritt beim Einsatz von MS-WORD-Texten ein typisches Problem auf, das Autoren verzweifeln lässt. Diese Dokumente arbeiten, unsichtbar im Hintergrund, mit einer Unmenge von kryptisch anmutenden Code, der leider automatisch mit übertragen wird. Das bläht den Quelltext auf, was noch nicht so schlimm sein muss; auch sieht der Quelltext häßlich aus, was aber im Grunde auch niemand etwas angeht. Sobald Sie aber manuell in den Quelltext eingreifen wollen, oder dort etwas nachsehen wollen, wird das unübersichtliche Code-Wirrwarr lästig.

Beispiel: ein beliebiger Textausschnitt aus einem Dokument mit Prüfungsaufgaben, bewusst übertrieben formatiert

  1. Ein Steuerpflichtiger gibt seine ESt-Erklärung für das Kalenderjahr 2003 am 30.4.2004 beim Finanzamt ab. Der Steuerbescheid wird vom Finanzamt am 17.7.2004 mittels gewöhnlichen Briefs zur Post gegeben. Er sieht eine Abschlusszahlung von 2.330 Euro vor.

- Wann ist der Steuerbescheid unanfechtbar (formell bestanskräftig)

- Wann wird der Steuerbescheid materiell bestandskräftig (= Ende der Festsetzungsfrist)
----------------------

Nach Übertragung in das HTML-Textfeld erscheinen im Quellcode:



ol type="1" start="1">
<li class="MsoNormal" style=""><span style="font-size: 11pt; font-family: Arial;">
Ein Steuerpflichtiger gibt seine
<strong>ESt-Erkl&auml;rung</strong> f&uuml;r das
Kalenderjahr 2003 am 30.4.2004 beim Finanzamt
ab</span><span style="font-size: 11pt; font-family:
Verdana;">. Der Steuerbescheid wird vom Finanzamt am
17.7.2004 mittels <strong>gew&ouml;hnlichen
Briefs</strong> zur Post gegeben.</span><span
style="font-size: 11pt; font-family: Arial;"> Er sieht
eine Abschlusszahlung von 2.330 Euro vor.
<o:p></o:p></span></li> </ol>
<p class="Textfeld"><!--[if !supportLists]--><span
style="font-size: 8pt;">-<span style="font-family:
&quot;Times New Roman&quot;; font-style: normal; font-variant: normal;
font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none;
font-stretch: normal;">&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;
</span></span><!--[endif]--><em><span
style="font-size: 10pt;">Wann ist der Steuerbescheid
<strong>unanfechtbar </strong><u>(formell
bestanskr&auml;ftig)</u>
<o:p></o:p></span></em></p>
<p class="Textfeld"><!--[if !supportLists]--><span
style="font-size: 8pt;">-<span style="font-family:
&quot;Times New Roman&quot;; font-style: normal;
font-variant: normal; font-weight: normal; font-size: 7pt;
line-height: normal; font-size-adjust: none; font-stretch:
normal;">&nbsp;&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&
nbsp; </span></span><!--[endif]--><em>
<span style="font-size: 10pt;">
Wann wird der Steuerbescheid <u>materiell bestandskr&auml;ftig
</u> (= Ende der Festsetzungsfrist)
<o:p></o:p></span>
</em></p>
<p class="MsoNormal"><
!--[if !supportEmptyParas]-->&nbsp;<
!--[endif]--><o:p></o:p></p>


-------------

In diversen Foren wird dann nach Möglichkeiten gefragt, solche Texte umzuwandeln, insbesondere, ob es geeignete Konverter gibt, die Word-Texte in HTML umwandeln.

Die Antworten sind enttäuschend und bei der Suche nach einem wirkliche funktionierenden Programm vergeht viel Zeit. Meine damaligen Recherchen über eine Umwandlungssoftware, allerdings schon 2 Jahre alt, waren faktisch erfolglos. Es kam nichts wirklich brauchbares heraus.

Weitere Experimente waren: Abspeichern von Word-Dokumenten innerhalb von Word als Rich-Text-Datei. Nur einfachste Formatierungen können in diesem Format gespeichert werden (fett, kursiv etc). Danach Datei schließen, neu aufrufen, kopieren und übertragen. Ergebnis: Die Methode funktioniert nicht: die speziellen Word- Formatierungen blieben erhalten.

Selbst ein Abspeichern als reine Textdatei mit Zeilenumbrüchen würde die Formatierungen mitschleppen. Aber diese Methode scheidet sowieso aus, weil ja Formatierungen wie fett, kursiv, Einrückungen und Aufzählungszeichen erhalten bleiben sollen.

Als einzige halbwegs brauchbare Möglichkeit, immer unter der Prämisse der Geschwindigkeit, blieb für mich ein Übertragen der Texte auf eine leere Datei im Freewareprogramm "OpenOffice.org" (landläufig OpenOffice genannt), dort speichern im hauseigenen Format, dann aus diesem Textdokument heraus nochmal markieren, kopieren und in das HTML-Eingabefeld übertragen. Damit werden nicht alle Formatierungen beseitigt, aber die meisten.

Eine mindest genauso gut funktionerende Variante ist das direkte Öffnen der Worddatei im Open Office-Programm. Das Programm akzeptiert Worddokumente, wandelt es also automatisch ins hauseigene Format um. Meiner Erfahrung nach scheitert die Umwandlung nur bei sehr komplexen Formatierungen, z.B. auf spezielle Weise positionierte Textfelder. Die Positionierungen werden u.U. verhackstückt. Ansonsten funktioniert das erstaunlich problemlos.

Wenn man dann diesen Text im OO-Dokument kopiert und überträgt, scheinen nochmehr von den Spezial-Formatierungen verschwunden zu sein. Es erscheinen fast nur noch die üblichen HTML-Formatierungen, die der Wisywig-Editor automatisch angelegt hat.

Selbst wenn man viele Dokumente hat, die übertragen werden sollen, scheint mir diese Prozedur noch immer schneller zu sein, als tagelang nach Konverter-Lösungen zu suchen. Vor allem, da diese Aktion in der Regel einmalig ist. Gleichzeitig kann man die Text für künftige Verwendungen im OpenOffice-Format abspeichern.

Start

Und es geht los.

Quereinsteiger - Manifest

Der berufstätige Webworker ist überfordert. Webworker, das sind alle, die Webseiten erstellen, schreiben, programmieren, administrieren. Sie können sich nicht auf ein Teilgebiet konzentrieren, wie etwa ein Programmierer oder Designer in einem IT-Unternehmen, sondern müssen Allrounder sein: Kaufmann, Selbstvermarkter, Kundenbetreuer und -babysitter, Designer und php-Programmierer. Sie müssen organisieren, sich mit Personalwesen herumschlagen, über Steuern Bescheid wissen, Rechnungswesen beherrschen, sich um Server, Hosting, Apache- und PHP-Einstellungen kümmern.

Und wenn ein Projekt ansteht, sei es ein eigenes oder für Dritte, sei es kommerziell oder nicht kommerziell, ist die Zeit stets zu knapp. In dieser Situation dann muss der Webworker sich mit HTML-, CSS-, PHP- oder mysql-Tücken herumschlagen, mit htaccess und mod_rewrite. Er muss in Windeseile experimentieren, Aufsätze recherchieren und lesen, dann, immer noch überfordert, in Foren nachfragen.

Diesen überforderten Webworkern ist dieses Blog gewidmet. Ich gebe hier Lösungen, Studien und Erfahrungen aus den letzten neun Jahren weiter, die das Arbeiten rationell machen sollen.

Warum Quereinsteiger? Nun diesen Leuten gilt meine besondere Sympathie. Webworker, die nebenher noch andere Berufe haben oder hatten, die anfingen, Webseiten zu schreiben, zunächst für sich, dann vielleicht auch für Freunde, Vereine. Im Laufe der Zeit kamen vielleicht auch kommerzielle Aufträge über Seiten für Unternehmen hinzu. Für sie ist der Zeitdruck besonders schlimm - denn sie haben Inhalte zu transportieren, und wollen keine php-Programmierer oder CSS-Spezialisten werden.

Diese Autodidakten gibt es in Hülle und Fülle. Journalisten, Physiker, Steuerfachleute, Dozenten aller Branchen, Autoren, Künstler, Fotografen, Theaterschauspieler und und und ... Ich gehöre auch dazu. Seit 1989, um genau zu sein, als ich die ersten Schritte machte.

Ich werde hier nicht nur Praktisches weitergeben, sondern dazwischen auch meine Experimente, für alle, die kreativ und avantgardistisch sind. Denn dieses andere Extrem ist auch in mir.