Codigo Unicode
Enviado por A7Ziggler • 3 de Octubre de 2013 • 458 Palabras (2 Páginas) • 308 Visitas
Unicode (acrónimo formado del idioma inglés por «Universal» Universal y «Code» Código - el cual significa Código Universal o Unicódigo) permite prácticamente universalizar las diferentes escrituras con el objetivo de crear un sistema de caracteres que sea compatible y legible en todo el mundo sin importar ni el idioma, ni la plataforma ni el programa de la computadora.
Unicode intenta codificar los caracteres esenciales “grafemas” más que las representaciones variantes para dichos caracteres. En caso de los caracteres chinos, esto lleva a veces a constantes controversias sobre la distinción entre caracteres esenciales y sus representaciones variantes.
En procesamiento de textos, Unicode juega el papel de proveer un único punto de código (code point) para cada carácter. En otras palabras, Unicode representa un carácter de forma abstracta, y deja la representación visual (tamaño, dimensión, fuente o estilo) a otro software, como un navegador web o un procesador de texto. No obstante, esta simplicidad se complica con las concesiones hechas por los diseñadores de Unicode, con la esperanza de animar una mayor "adopción" de Unicode.
Los primeros 256 puntos de código son idénticos a los especificados en ISO 8859-1, para facilitar la conversión del texto ya existente escrito en lenguajes europeos occidentales. Muchos de los caracteres esenciales se codificaron varias veces en distintos puntos de código para preservar distinciones utilizadas por codificaciones heredadas y permitir conversiones de aquellas codificaciones a Unicode (y viceversa) sin perder ningún tipo de información. Por ejemplo, la sección de formas anchas (en: Full width) de los puntos de código abarca un alfabeto latino completo, separado de la sección de alfabeto latino principal. En fuentes CJK (fuentes para chino, japonés y coreano), estos caracteres fueron representados tanto en su forma ancha como en la estándar, más angosta.
Además de que Unicode permite combinaciones de caracteres, también dispone de versiones pre-compuestas de la mayoría de combinaciones de letras diacríticas en uso. Estas versiones facilitan las conversiones desde y hacia las más simples codificaciones heredadas y permiten que las aplicaciones utilicen Unicode como un formato de texto interno sin tener que implementar combinaciones de caracteres. Por ejemplo, é puede representarse en Unicode como U+0065 (letra latina minúscula e) seguido de U+0301 (acento agudo), pero puede también representarse directamente por el pre-compuesto U+00E9.
El estándar Unicode también incluye un número de elementos relacionados, como las propiedades de caracteres, formas de normalización de textos y órdenes de visualización bidireccional.
Una de las principales ventajas de utilizar el estándar de UNICODE es que el número de representaciones es mucho más amplio que por ejemplo
...