Logo DLSI

Tema 9 - Internacionalización (I18N) y Localización (L10N)

Curso 2024-2025

¿A qué llamamos "locale " ?

  • A lo que hace que funcione la internacionalización (I18N).

  • Consta de una serie de parámetros culturales escritos en un archivo, en una variante de un idioma hablado en un territorio.

  • Estos parámetros incluyen el juego de caracteres empleado, el código del lenguaje, la representación de fecha y hora, números, moneda, direcciones, teléfono y medidas.

    idioma[_territorio][.codeset][@modifier]
  • Ejemplos: en_GB, en_NZ, es_MX, ca, ca@valencia.

  • La parte del idioma se codifica en iso-639, la del territorio en iso-3166 y el archivo con los datos en iso-15924.

  • Cada parámetro puede tener asociado un locale diferente, podemos tener los mensajes en un idioma, la representación de la moneda de otro, etc…​

  • Los ajustes del locale se suelen hacer para cada usuario.

  • Por defecto se usa el locale de "C" (locale POSIX).

I18N vs. L10N

  • La internacionalización de un proyecto consiste en prepararlo de forma que sea capaz de trabajar y presentarse en una multitud de idiomas.

  • La localización toma un programa previamente internacionalizado y le proporciona la suficiente información para que se adapte al idioma y configuración del usuario actual.

Información del "locale" actual

  • Comprobamos los locales disponibles.

  locale -a

  # El sistema nos respondera con algo similar a esto...
  C
  ca_ES.utf8
  C.UTF-8
  es_ES.utf8
  POSIX
  • En Sistemas Operativos de la familia GNU/Linux tenemos las locales disponibles en el archivo "/etc/locale.gen". Es un fichero de texto que se edita como administrador.

  • Luego debemos ejecutar: "sudo locale-gen".

  • Una prueba de cambio temporal al locale catalán: "LANG=ca_ES.utf8 cal"

GNU Gettext

  • Es un marco de trabajo y un conjunto de herramientas que permiten internacionalizar un proyecto.

  • Empleado por la mayoría de proyectos de software libre.

  • El ajuste del idioma (y del resto de locales) se deduce de la elección del idioma hecha por el usuario para su sesión de trabajo.

GNU Gettext: API (I)

  • El API se encuentra en las cabeceras: #include <locale.h> e #include <libintl.h>.

  • Se puede simplificar a tres funciones:

  • char *setlocale(int category, const char *locale);:

    • category: LC_ALL, LC_MESSAGES, LC_TIME, etc…​

    • locale: Una cadena que especifica la configuración regional deseada, p.e. : "es_ES.UTF-8", "POSIX", "C" o "", en este último caso lee el locale de variables de entorno como LANG o LANGUAGE.

  • Se emplea para establecer o consultar la configuración de la localización del programa.

  • Devuelve un puntero a una cadena que representa la configuración regional activa después del cambio, o NULL si la configuración no es válida o no puede ser establecida.

GNU Gettext: API (II)

  • char *bindtextdomain(const char *domainname, const char *dirname);:

    • domainname: Suele ser el nombre la apliación.

    • dirname: La ruta hasta el directorio raíz donde se almacenan los archivos de traducción.

  • Indica el directorio donde se encuentran los archivos de traducción para un dominio de texto específico.

  • Devuelve la ruta configurada para el dominio especificado o NULL en caso de error.

GNU Gettext: API (III)

  • char *textdomain(const char *domainname);

    • domainname: Es el nombre del dominio a activar. Si es NULL, no cambia el dominio activo y devuelve el actual. Suele coincidir con el nombre de la aplicación.

  • Devuelve el nombre del dominio de texto activo.

I18n de un proyecto (I)

  • Creamos un directorio "po" en la raíz del proyecto.

  • Extraemos las cadenas a traducir de los archivos de código fuente: xgettext:

    xgettext -d intlapp -k_ -o po/intlapp.pot ./src/app.vala
  • Esto genera un archivo llamado: intlapp.pot. Lo copiamos a un fichero llamado según el código del idioma al que lo queramos traducir, por ejemplo catalán: ca.po

  • También podemos realizar este último paso de este modo: msginit:

    msginit -l es -o po/ca.po -i po/intlapp.pot

I18n de un proyecto (II)

  • El contenido de un fichero ".po" es algo así:

  # Catalan translations for intlapp package
  # Traduccions al catala del paquet <<intlapp>>.
  # Copyright (C) 2013 THE vala-i'S COPYRIGHT HOLDER
  # This file is distributed under the same license as the intlapp package.
  # your name <your.mail@here.is>, 2013.
  #
  msgid ""
  msgstr ""
  "Project-Id-Version: intlapp\n"
  "Report-Msgid-Bugs-To: \n"
  "POT-Creation-Date: 2013-10-30 19:59+0100\n"
  "PO-Revision-Date: 2013-10-30 20:02+0100\n"
  "Last-Translator: name <name@provider>\n"
  "Language-Team: Catalan\n"
  "Language: ca\n"
  "MIME-Version: 1.0\n"
  "Content-Type: text/plain; charset=UTF-8\n"
  "Content-Transfer-Encoding: 8bit\n"

I18n de un proyecto (III)

  #: ../src/app.vala:29
  msgid "Aplicacion borrada\n"
  msgstr "Aplicacio esborrada\n"

  #: ../src/app.vala:33
  msgid "Aplicacion comenzada\n"
  msgstr "Aplicacio comencada\n"

  #: ../src/app.vala:25
  msgid "Aplicacion creada\n"
  msgstr "Aplicacio creada\n"

  #: ../src/app.vala:36
  msgid "Aplicacion terminada\n"
  msgstr "Aplicacio acabada\n"

I18n de un proyecto (IV)

  • Una vez traducido, se compila para hacer más eficiente su carga: msgfmt:

    msgfmt -c -v -o intlapp.mo ca.po
  • El significado de las extensiones es éste:

    po

    Portable Object

    pot

    Portable Object Template

    mo

    Machine Object

  • Fíjate que los archivos ".mo" se llaman igual que la aplicación…​no como el idioma en el que contienen las cadenas traducidas.

I18n de un proyecto (V)

  • Los archivos *.mo se instalarán en "/usr/share/locale", en el directorio del idioma correspondiente, y dentro de él, en el directorio "LC_MESSAGES".

  /usr/share/locale/ca/:
  LC_MESSAGES

  /usr/share/locale/ca@valencia/:
  LC_MESSAGES

  /usr/share/locale/es_ES/:
  LC_MESSAGES
  • Es decir: /usr/share/locale/idioma/LC_MESSAGES/app.mo

I18n de un proyecto (VI)

  • Y en nuestro código…​procedemos a (1)iniciar gettext y (2)marcar las cadenas a traducir.

 int main(string[] args) {
      string localedir;
     ///////////////////////////////////
      / Inicio y preparacion para I18N //
      //////////////////////////////////////////////////////////////////////
      if (Config.DEVELOPMENT_MODE == "ON") { // App not installed,
                                       // catalogs are here
        localedir = "src/po";
      } else {
        localedir = Config.PACKAGE_LOCALE_DIR;
      }
      Intl.setlocale (LocaleCategory.MESSAGES, "");
     Intl.bindtextdomain (Config.GETTEXT_PACKAGE, localedir);
      Intl.bind_textdomain_codeset (Config.GETTEXT_PACKAGE, "UTF-8");
      Intl.textdomain (Config.GETTEXT_PACKAGE);
      ///////////////////////////////////////////////////////////////////////
 }

I18n de un proyecto (VII)

  • Los valores de la configuración podrían ser estos:

 namespace Config {
     public const string DEVELOPMENT_MODE   = "ON";
     public const string GETTEXT_PACKAGE    = "intlapp";
     public const string PACKAGE_LOCALE_DIR = "/usr/local/share/locale/";
     public const string PROJECT_DIR = "/home/usuario/proyectos/ejemplo-i18n";
 }
  • En modo desarrollo "intlapp.mo" se encuentra en:

  src
  |-- po
      |-- ca
          |-- LC_MESSAGES
              +-- intlapp.mo

I18n de un proyecto (VIII)

  • El marcado de cadenas lo hacemos así:

class Dca.Application : GLib.Object {
    public Application () {
      stdout.printf ( _("Aplicacion creada\n") );
    }
   ~Application () {
      stdout.printf ( _("Aplicacion borrada\n") );
    }
   public void run () {
      stdout.printf ( _("Aplicacion comenzada\n") );
    }
    public void exit () {
      stdout.printf ( _("Aplicacion terminada\n") );
    }
}
  • En realidad , ocurre esto: #define _(x) gettext(x)

I18n de un proyecto (IX)

  • El mantenimiento de los ficheros ".po" lo haremos de este modo:

    • Extraemos el fichero .pot como ya hemos visto…​(xgettext )

    • Al fichero .po (catalan.po ) le adjuntamos las modificaciones que haya habido: msgmerge -s -U po/catalan.po po/intlapp.pot

Gettext en C, C++

  • Debes incluir la cabecera libintl.h: #include <libintl.h>

  • En la llamada a xgettext te puede ser útil la opción: -k_ ← símbolo de subrayado!

  • También puedes llamar a xgettext con la opción -a, la cual extrae todas las cadenas aunque no estén marcadas.

  • Si no está definida la macro "_", definela tú: #define _(x) gettext(x)

  • No sólo para C o C++, si al usar la variable LANG probando tu aplicación no cambia el locale para el idioma, prueba con la variable LANGUAGE.

  • En el ejemplo visto en Vala, recuerda que la adaptación de gettext a este lenguaje introduce un espacio nombres llamado Intl, en lenguajes como C o C++ no existe dicho espacio de nombres, por lo que los identificadores carecen de él:

  setlocale (LC_MESSAGES, "");
  bindtextdomain (GETTEXT_PACKAGE, localedir);
  bind_textdomain_codeset (GETTEXT_PACKAGE, "UTF-8");
  textdomain (GETTEXT_PACKAGE);

Edición de ficheros .po

Show-time:

  • Veamos un primer ejemplo sencillo de I18N + L10N en C.

  • Y unsegundo ejemplo con un lenguaje orientado a objetos como es vala. En este caso el idioma original es el castellano y traducimos al catalán.

  • En este vídeo puedes ver un caso real de uso de Gettext en lenguaje D.

Práctica individual:

  • Prepara para I18N el código de alguna práctica tuya o algún código que crees en el laboratorio para ello.

  • Traduce los mensajes que pueda emitir a varios idiomas (castellano, catalán, inglés, etc…​).

  • Después de haber creado una primera versión, añade o elimina cadenas para que puedas probar la herramienta msgmerge.

Entrega:
  • Comprime todo lo relacionado con tu entrega en un fichero .tgz, el cual es el que tendrás que entregar.

  • La práctica o prácticas se entregará/n en (y sólo en) pracdlsi en las fechas y condiciones allí indicadas.

Aclaraciones

En ningún caso estas transparencias son la bibliografía de la asignatura.