Über Unicode

4D - Documentation   Français   English   German   Spanish   4D Programmiersprache, Befehle nach Themen   4D Programmiersprache, Befehle alphabetisch   4D Programmiersprache, Konstanten nach Themen   Back   Previous   Next

Version 11


Überblick

In Datenbanken, die mit 4D Version 11 erstellt wurden, speichern und arbeiten die Programmiersprache und die Datenbank-Engine nativ mit Unicode Zeichen. Das erleichtert die internationale Verwendung von 4D Anwendungen. Unicode ist ein standardisierter einheitlicher Zeichensatz, der praktisch alle gängigen Sprachen auf der Welt bedienen kann. Ein Zeichensatz besteht aus einer Tabelle, in der jedem Zeichen eine Nummer zugeordnet ist, z.B. "a"->1, "b"->2, "5"->15, "oe"->662. Während im ASCII-Code die Basiswerte zwischen 1 und 127 liegen, liegt bei Unicode die Obergrenze über 65.000. Dies bedeutet, dass praktisch jedes Zeichen aller Sprachen darstellbar ist.

Es gibt verschiedene Arten, Zahlenwerte in Unicode zu codieren: UTF-16 codiert sie in Zahlen mit 16-bit, UTF-32 in Zahlen mit 32-bit und UTF-8 in Zahlen mit 8-bit. Es gibt auch UTF-7 Codierung.

4D arbeitet im allgemeinen mit UTF-16, wie Windows und Mac OS. In Sonderfällen wie z.B. für Internet-Anforderungen verwendet 4D den Satz UTF-8, da er kompakter und für gängige Zeichen, d.h. a-z,0-9, leichter lesbar ist.

Warnung: Folgende Zeichencodes sind in 4D Version11 für Unicode reserviert und dürfen nie in einen Text eingefügt werden:

0
65534 (FFFE)
65535 (FFFF)

ASCII Kompatibilitätsmodus

Bisherige Versionen von 4D arbeiteten mit der erweiterten ASCII Tabelle von Macintosh (siehe Abschnitt ASCII Codes). Datenbanken, die aus einer früheren 4D Version konvertiert wurden, funktionieren weiterhin in diesem Modus, der "ASCII Kompatibilitätsmodus" genannt wird.

Sie können den Modus Unicode für konvertierte Datenbanken über den Selektor Unicode Mode der Routinen Get database parameter und SET DATABASE PARAMETER oder über die Option Unicode-Modus in den Einstellungen der Datenbank auf der Seite Anwendung/Kompatibilität aktivieren:

Hinweis: Dieser Modus gilt immer für eine Datenbank. So kann es z.B. eine Unicode-Datenbank mit Komponenten ohne Unicode geben., und umgekehrt.

In den meisten Fällen beeinträchtigt diese Einstellung nicht die eigentliche Funktionsweise der Anwendungen, da 4D alle notwendigen Zeichenumwandlungen intern regelt. Außerdem haben die gängigen Zeichen (a-z, 0-9) usw. in Unicode und ASCII (Windows and Mac OS) denselben Wert (von1 bis127).

Bestimmte Anweisungen der Programmiersprache, insbesondere bei Befehlen, die Zeichensätze enthalten, müssen angepasst werden. So gibt zum Beispiel die Anweisung Char(200) in Unicode einen anderen Wert als in ASCII zurück. Die unterschiedliche Funktionsweise im Unicode Modus und im ASCII Kompatibilitätsmodus wird bei allen davon betroffenen Befehlen beschrieben.


4D - Documentation   Français   English   German   Spanish   4D Programmiersprache, Befehle nach Themen   4D Programmiersprache, Befehle alphabetisch   4D Programmiersprache, Konstanten nach Themen   Back   Previous   Next