Aquí tienes algunos de los proyectos y demostraciones en los que participo o he participado:
THOFU: Tecnologías del HOtel del FUturo
El objetivo principal del proyecto es diseñar el hotel del futuro, desde los espacios y su construcción,
pasando por los objetos que residen en él, sin olvidar la interacción con los huéspedes, así como su interacción con Internet.
El Grupo Gesfor lidera este proyecto con un presupuesto de 23 millones de euros.
En este proyecto, nuestro grupo participará en el paquete de trabajo relacionado con el diseño de nuevas interfaces
inteligentes y adaptativas en el contexto de un hotel altamente tecnológico, investigando sobre nuevos paradigmas de
interacción y analizando su usabilidad y la experiencia de usuario.
Consorcio estatal (CENIT) financiado por el Ministerio de Ciencia e Innovación (CEN-2010-1019). Periodo: Septiembrer 2010 - Diciembre 2013
EmoLib: identificación de la emoción de un texto
EmoLib es una librería que extrae la afectividad y las emociones de un texto de entrada (en inglés),
etiquetándolo según los sentimientos que expresa. EmoLib ha sido implementada
usando el lenguaje de programación Java.
Esta demostración ha sido desarrollada por Alexandre Trilla dentro del marco de su tesis doctoral.
evMIC: Entornos Virtuales Multimodales Inmersivos y Colaborativos
El objetivo principal de este proyecto es crear una plataforma interoperable, centrada en el usuario, que permita la creación de entornos virtuales de aprendizaje , superando las limitaciones actuales y alineándose con la actual definición de lo que será "El Internet del Futuro".
Además de contribuir en la redacción de los estados de la cuestión sobre tecnologías del habla, procesamiento multimodal, gráficos y realidad virtual,
nuestro grupo participará en el desarrollo de interfaces de coimunicación con el entorno virtual que incluyen habla expresiva, análisis afectivo multimodal, y modelado y síntesis de avatares 3D.
Proyecto Singular Estratégico (PSE) financiado pel Ministerio de Industria, Turismo y Comercio (TSI-020301-2009-25). Periodo: 2009 - 2011
INREDIS: Interfaces de Relación entre el Entorno y las personas con Discapacidad
El objetivo principal del proyecto es el desarrollo de tecnologías de base que permitan crear canales de comunicación e interacción entre las personas con algún tipo de necesidad especial y su entorno.
Technosite lidera este proyecto con un presupuesto de 23.6 millones de euros.
Además de contribuir en la redacción de detallados estados de la cuestión sobre tecnologías del habla, procesamiento multimodal y gráficos y realidad virtual,
nuestro grupo participará en el desarrollo de plataformas experimentales que incorporan síntesis del habla expresiva, análisis afectivo multimodal, y modelado y síntesis de avatares 3D.
Consorcio estatal (CENIT) financiado por el Ministerio de Industria, Turismo y Comercio (CEN-2007-2011). Periodo: 2007 - 2010
CTH-MD: Conversión de texto en habla multidominio mediante clasificación automática de dominio
Los ficheros wav OK son los clasificados correctamente por el sistema respecto al etiquetado manual, mientras que los ficheros KO representan:
i) el dominio neutro para los dominios ALEGRÍA (HAPPY) y SENSUAL, y ii) el dominio erróneo para los ficheros MISSCL.
Quiero agradecer a David García su ayuda en el desarrollo de esta demo.
MAGNUS: Mouse Advanced GNU Speech
Se trata de una aplicación que permite controlar el ratón de un ordenador mediante comandos de voz en catalán.
Esta aplicación pretende mejorar la accesibilidad de las personas con movilidad reducida al ámbito de las TIC.
Este trabajo constituye el Proyecto Final de Carrera de Alexandre Trilla.
Socios del proyecto:
Coordinador: Departamento de Educación de la Generalitat de Catalunya
Sección de Acústica de Enginyeria i Arquitectura La Salle
SAVE: Síntesis AudioVisual Expresiva
El proyecto se centra en la investigación sobre una interfaz multimodal de salida de alta
expresividad que permita la comunicación con la persona proporcionándole una percepción de gran naturalidad.
Se propone el estudio y desarrollo de un sistema de síntesis audiovisual expresivo basado en una cabeza parlante
foto realista.
Proyecto subvencionado por el Ministerio de Ciencia y Tecnología (TEC2006-08043/TCM). Duración: 2007 - 2009
SALERO: Semantic AudiovisuaL Entertainment Reusable Objects
Nuestro grupo participa en este proyecto internacional con el objetivo de desarrollar
nuevas técnicas de Conversión de Texto en Habla multilingüe para conseguir síntesis expresiva en el contexto
de las producciones mass media (p.ej. películas, juegos, televisión, etc.)
Proyecto subvencionado por la Comisión Europea (IST-FP6-027122). Duración: 2006 - 2009
SAM, UN METEORÓLOGO VIRTUAL
Sistema automático de elaboración de predicciones meteorológicas bajo demanda (TV, Internet y dispositivos móviles) mediante un personaje virtual llamado Sam.
Nuestro grupo ha desarrollado el conversor de texto en habla de alta calidad basado en corpus que incorpora esta aplicación meteorológica.
Participantes en el proyecto:
Corporación Catalana de Radio y Televisión (CCRTV)
El Grupo de Tecnologías Interactivas de la Universitat Pompeu Fabra
El Área de Tecnologías del Habla de Enginyeria i Arquitectura La Salle
Proyecto financiado por la CCRTV y el CIDEM (RDITSCON04-0005). Duración: Mayo 2004 - Abril 2005
IntegraTV-4all
Servicios adaptados de ocio, información y teleasistencia a través de la
televisión con funcionalidades avanzadas de comunicación por voz en lenguaje
natural para personas con discapacidades sensoriales y personas de edad avanzada.
Nuestro grupo ha desarrollado un despertador audiovisual integrado en el menú del televisor de hotel,
como resultado de la mejora del locutor virtual de partida (ver apartado anterior).
Socios del proyecto:
Coordinador: TMT Factory
Fundación ONCE
Universidad Politécnica de Madrid (UPM)
Universidad Carlos III de Madrid
El Área de Tecnologías del Habla de Enginyeria i Arquitectura La Salle
Proyecto subvencionado por el Ministerio de Ciencia y Tecnología (FIT-350301-2004-2).
Duración: Septiembre 2004-Diciembre 2005
LOCUTOR VIRTUAL
Puedes descargarte aquí tres vídeos de la primera versión de nuestro locutor virtual fotorrealista:
Proyecto subvencionado por el Ministerio de Ciencia y Tecnología
mediante el Programa de Fomento de la Investigación Técnica (FIT-150500-2002-410). Duración: Año 2002
CONVERSOR de TEXTO en HABLA ONLINE (CATALÁN)
Demostración interactiva que sintetiza un texto en Catalán y genera un fichero de audio para ser descargado.
Además, la demostración permite especificar distintos parámetros de la voz, como el ritmo y la emoción.
INTERFAZ DE AJUSTE DE PESOS PARA SÍNTESIS DEL HABLA (CATALÁN)
Esta es una plataforma web basada en la computación evolutiva y diseñada para encontrar el ajuste óptimo de pesos de la función
de coste para conversión texto en habla basada en selección de unidades:
(acceso restringido: envíame un e-mail para pedirme un login).
ITP - Interfaz de tratamiento del habla
Se trata de un interfaz para el etiquetado de la voz (automático y/o manual).
Esta aplicación permite obtener las marcas de pitch, las marcas de segmentación, la curva de pitch, el espectrograma
y las características prosódicas de la señal de voz.
Funciona bajo plataformas Windows.
(En desarrollo)
ALGTEC (ÁLGEBRA y TECNOLOGíA)
Es una aplicación multimedia que ayuda y motiva al alumno de Ingeniería al aprendizaje del Álgebra.
Presenta conceptos algebraicos aplicados al mundo tecnológico mediante un profesor virtual.
Primera versión: basada en Agentes de Microsoft y conversión de texto a voz
En un futuro se pretende incorporar a nuestro Locutor Virtual