ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

La historia Loquendo


Enviado por   •  28 de Mayo de 2014  •  Trabajo  •  2.220 Palabras (9 Páginas)  •  211 Visitas

Página 1 de 9

Loquendo

De Wikipedia, la enciclopedia libre

Loquendo es una corporación multinacional de tecnología de software, con sede central en Turín, Italia, que provee reconocimiento, síntesis y verificación de voz y aplicaciones de verificaciones e identificaciones.[1] Loquendo, que fue fundada en 2001 por la empresa Telecom Italia, también tiene oficinas en el Reino Unido, España, Alemania, Francia y los Estados Unidos.[2]

Los productos actuales de Loquendo se pueden encontrar en los GPS, ya sean incorporados al auto o portables, en dispositivos para los discapacitados, teléfonos inteligentes, libros electrónicos, cajeros automáticos con voz, videojuegos de computadora, artefactos domésticos controlados por voz y otros productos.

Sus productos fueron recipientes de varios premios incluyendo “Speech Engine Leader” entregado por “Speech Technologies” en 2007, 2008 y 2009.[3] También fue considerado por “Speech Technologies” el líder del mercado en 2009 y 2010.[4]El 30 de septiembre de 2011, Nuance (uno de los principales competidores de Loquendo) anunció que adquirió Loquendo.[5]

Historia

Loquendo era, originalmente, un grupo de investigación creado a mediados de los años setenta por Anibal Colina.

Construido por recomendación de la Universidad de Padua, aplicando la técnica de los llamados difonos (la unión de una consonante y una vocal, 150 en el idioma italiano) el grupo creo el primer sintetizador de voz con gran inteligibilidad en 1975[6] era llamado MUSA (por sus siglas en inglés, MUltichannel Speaking Automaton), que demostró lo que era posible con la tecnología de ese tiempo. Los resultados logrados en esos años fueron condensados en un disco de audio de 45 rpm, con miles de copias producidas y distribuidas por los medios de comunicación masivos. Fue principalmente distribuida la versión italiana de la canción Frère Jacques con mejor calidad de sonido (MUSA manejaba hasta 8 canales de síntesis en paralelo).

La evolución de este prototipo, con el incremento de número de los difonos (alrededor de 1000), el refinamiento de las herramientas de los análisis lingüísticos y el mejor manejo de la forma de onda llevó a una marcada mejora de la voz sintética. Esto llevó a la creación del «sintetizador de voz» en un circuito integrado desarrollado internamente en CSELT.

En los años noventa nació «ELOQUENS», un sintetizador de voz multi-plataforma para varios sistemas operativos incluyendo DOS, Windows, System 7 y Unix y también para tarjetas telefónicas con muchos canales, como las usadas por las operadoras de teléfono italianas para obtener la dirección y la identidad del suscripto de un número de teléfono.[7]

A finales de los noventa la sintetización de voz tomó un nuevo camino, en vez de usar difonos se empezó a usar la selección y la concatenación de unidades acústicas de longitud variable. Esto provocó en “ACTOR” – “La voz que parece humana” que empezó a adquirir una gran audiencia dado al gran número de servicios telefónicos y aplicaciones creadas por empresas relacionadas con Loquendo.En los años 2000 el sintetizador fue puesto a la venta como un producto comercial, incluyendo un número de herramientas para editar la voz sintética con distintas emociones. También se lanzó una biblioteca SW para que se pueda usar en varios productos pequeños, como celulares, navegadores, computadoras PDA hasta más grandes como servidores telefónicos.

Reconocimiento de voz

Poco después de las investigaciones en síntesis de voz, comenzaron a investigar el reconocimiento de voz y al principio de los ochentas produjeron un primer prototipo capaz de reconocer diez dígitos y unos comandos simples.

Aplicando el modelo oculto de Márkov, en 1984, se llevó a cabo el desarrollo de un decodificador de voz que podía reconocer palabras conectadas y oraciones. Esto se llevó a cabo con la colaboración de ELSAG, otra compañía del grupo.

La necesidad de producir reconocimientos de voz independiente para aplicaciones telefónicas llevó a la creación de bases de datos con grabaciones de cientos de personas distintas y, en 1987, la primera gran base de datos, obtenida grabando a más de mil personas llamando por toda Italia.

Este material permitió el uso de los modelos de Márkov y usando un sofisticado algoritmo llevó al desarrollo de “AURIS”, el primer reconocedor de voz que podía “dar vuelta” en una variedad de dispositivos con procesadores de señales digitales (DSP).

En los noventa una colaboración europea comenzó y, junto a otras compañías y universidades de toda Europa, se adquirió una base de datos de voz muy grande, con voces de más de 65000 personas.[8]

Este material, combinado con un nuevo acercamiento al modelo oculto de Márkov y a la red neuronal artificial, produjo “FLEXUS” el primer reconocedor de voz flexible, que permitía a varios servicios telefónicos usar reconocimientos de voz en sus interfaces humanas. Combinando “FLEXUS” y “ACTOR” en un mismo sistema surgió “Dialogos”, permitiendo la creación de servicios telefónicos de vanguardia.

El nacimiento de Loquendo como una compañía llevó al desarrollo de muchos lenguajes y al estreno de reconocedor en la forma de un software de biblioteca, para la creación de varias aplicaciones telefónicas.

Las campañas de grabaciones de voz se expandieron y no sólo fueron en Europa, sino que se movieron hasta los países mediterráneos luego a América del Sur, Centro y del Norte y finalmente países en el Este. Se recolectaron incontables horas de voz de cientos de miles de personas en las regiones. Las grabaciones fueron recolectadas para las conexiones telefónicas, entre otros usos.

Codificación de voz

Las actividades de investigación de codificación de voz empezaron aún antes que las de reconocimiento y síntesis, el objetivo era armar un equipo como un CODEC para incrementar lo más posible el número de conversaciones telefónicas que podían fluir por un mismo cable (o conexión satelital), sin perder claridad de voz.

A finales de los setentas, estudios y experimentos llevaron a la creación de algoritmos para codificar la señal de voz telefónica y armar la CCITT, normativa europea conocida como codificación A-law. Este estándar se utilizó a continuación, en el CODEC para 64 líneas telefónicas kbit / s RDSI.

En los años siguientes se construyeron codecs más fuertes (usado en intercambios telefónicos) y, con el PAN-Europa en un consorcio GSM, el codec a utilizar en teléfonos móviles de segunda generación.Al mismo tiempo se construyó

...

Descargar como (para miembros actualizados) txt (15 Kb)
Leer 8 páginas más »
Disponible sólo en Clubensayos.com