Acerca de Unicode

4D - Documentation   Français   English   German   Español   English   4D v11 SQL, Comandos por temas   4D v11 SQL, Lista alfabética de comandos   4D v11 SQL, Constantes por temas   Regresar   Anterior   Siguiente

versión 11


Presentación

En las bases de datos creadas con 4D versión 11 de 4D, el lenguaje así como el motor de la base de datos almacenan y manipulan nativamente los caracteres en Unicode.

Este principio facilita la internacionalización de las aplicaciones 4D. El unicode es un juego de caracteres estándar unificado que administra prácticamente todo los lenguajes utilizados en el mundo. Un juego de caracteres es una tabla de correspondencia caracter/valor numérico, por ejemplo "a"->1, "b"->2, "5"->15, "oe"->662, etc. Mientras que con ASCII, el valor numérico de base está generalmente entre 1 y 127, con Unicode el límite superior supera 65 000, lo que significa que puede representar casi todos los caracteres de todos los lenguajes.

Hay diferentes maneras de codificar los valores numéricos Unicode: UTF-16 los codifica en enteros de 16-bits, UTF-32 utiliza enteros de 32-bits y UTF-8 enteros de 8-bits. 4D utiliza principalmente UTF-16 (como Windows y Mac OS). Algunas veces, esencialmente para necesidades específicas relacionadas con Internet, 4D utiliza UTF-8 que tiene la ventaja de ser más compacto y tener mejor legibilidad para los caracteres comunes (a-z,0-9).

Advertencia: en unicode en 4D v11, los códigos de los siguientes caracteres están reservados y nunca deben incluirse en un texto:

0
65534 (FFFE)
65535 (FFFF)

Modo compatibilidad ASCII

Las versiones anteriores de 4D funcionaban con la tabla ASCII extendida de Macintosh (ver la sección Códigos ASCII). Por defecto, las bases de datos convertidas de una versión anterior de 4D continúan funcionando en este modo llamado "Modo compatibilidad ASCII".

Es posible aplicar el modo Unicode a las bases de datos convertidas vía el selector Modo Unicode de los comandos Get database parameter y SET DATABASE PARAMETER o vía la opción Modo Unicode que se encuentra en la página Aplicación/Compatibilidad de las Preferencias:

Nota: este modo se especifica para cada base de datos. Por lo tanto es posible tener una base Unicode coexistiendo con los componentes no-Unicode (o viceversa).

En la mayoría de los casos, el funcionamiento inicial de las aplicaciones no se afecta por este parámetro, 4D maneja internamente las conversiones de caracteres que sean necesarias. Además, los caracteres más comunes (a-z, 0-9, etc.) tienen el mismo valor (de 1 a 127) en Unicode y en ASCII (Windows y Mac OS).

Sin embargo, ciertas instrucciones del lenguaje, que utilizan comandos que trabajan con cadenas de caracteres, podrían necesitar adaptaciones. Por ejemplo, la instrucción Char(200) no devolverá el mismo valor en Unicode que en ASCII. Este manual describe las diferencias de funcionamiento entre el modo Unicode y el modo compatibilidad ASCII para cada comando relacionado.


4D - Documentation   Français   English   German   Español   English   4D v11 SQL, Comandos por temas   4D v11 SQL, Lista alfabética de comandos   4D v11 SQL, Constantes por temas   Regresar   Anterior   Siguiente