Home Sonderzeichen Umwandlung von 8-bit-Zeichen Silbentrennung
 Die Anleitung zu UDO
 Die UDO-Syntax
 Sonderzeichen

Universeller Zeichensatz

Mit den im vorherigen Abschnitt beschriebenen Befehlen ist es möglich, Quelltexte auch mit 8-Bit-Zeichen systemweit weiterzugeben.

Werden Quelltexte jedoch über das Internet ausgetauscht, kann es passieren, dass irgendwo auf dem Übertragungswege 8-Bit-Zeichen umgewandelt oder angepasst werden. Dies wäre bei Quelltexten, die mehrere Zeichensätze verwenden fatal.

Um nun den Austausch von Quelltexten auch hier zur ermöglichen, bietet UDO einen "universellen Zeichensatz" an. Es handelt sich hierbei nicht wirklich um einen Zeichensatz, sondern vielmehr um eine Möglichkeit, 8-Bit-Zeichen durch Folgen mehrere 7-Bit-Zeichen zu emulieren.

Da die nötigen Abfragen und Umwandlungen sehr rechenintensiv sind, muss man UDO mitteilen, dass die folgenden Zeilen "universelle Zeichen" enthalten. Dies geschieht durch den Einsatz des Schalters !universal_charset.

Nach der Angabe von !universal_charset [on] betrachtet UDO jede einzelne Zeile und wandelt enthaltene universelle Zeichen in 8-Bit-Zeichen um. Die folgende Tabelle zeigt, welche Zeichen wie umgewandelt werden:

Platzhalter x aus Beispiel
(!"x) aeiosuyAEIOU (!"a) = ä
(!'x) aeiouyAEIOUY (!'e) = é
(!`x) aeiouAEIOU (!`i) = ì
(!^x) aeiouAEIOU (!^o) = ô
(!&x) ae, oe, AE, OE (!&AE) = Æ
(!~x) anoANO (!~n) = (~n)
(!,x) cC (!,C) = Ç
(!.x) aA (!.A) = Å
(!_x) ao (!_a) = ª
(!\x) oO (!\O) = Ø

Das deutsche `ß' wird durch den Platzhalter (!"s) erzeugt. Kennt das Zielformat ein Zeichen nicht, so wird das naheliegendste Zeichen benutzt, z.B. `a' statt `â'.


Copyright © www.udo-open-source.org
Letzte Aktualisierung am 5. November 2006

Home Sonderzeichen Umwandlung von 8-bit-Zeichen Silbentrennung