imatge

Contents copyright © 2012
La Salle (URL)
All rights reserved


Francesc Alías Pujol

falias@salle.url.edu

idioma/language
  salle_logo

PROYECTOS Y DEMOSTRACIONES

Aquí tienes algunos de los proyectos y demostraciones en los que participo o he participado:

THOFU: Tecnologías del HOtel del FUturo

El objetivo principal del proyecto es diseñar el hotel del futuro, desde los espacios y su construcción, pasando por los objetos que residen en él, sin olvidar la interacción con los huéspedes, así como su interacción con Internet. El Grupo Gesfor lidera este proyecto con un presupuesto de 23 millones de euros.

En este proyecto, nuestro grupo participará en el paquete de trabajo relacionado con el diseño de nuevas interfaces inteligentes y adaptativas en el contexto de un hotel altamente tecnológico, investigando sobre nuevos paradigmas de interacción y analizando su usabilidad y la experiencia de usuario.

Consorcio estatal (CENIT) financiado por el Ministerio de Ciencia e Innovación (CEN-2010-1019). Periodo: Septiembrer 2010 - Diciembre 2013

EmoLib: identificación de la emoción de un texto

EmoLib es una librería que extrae la afectividad y las emociones de un texto de entrada (en inglés), etiquetándolo según los sentimientos que expresa. EmoLib ha sido implementada usando el lenguaje de programación Java.

Esta demostración ha sido desarrollada por Alexandre Trilla dentro del marco de su tesis doctoral.

evMIC: Entornos Virtuales Multimodales Inmersivos y Colaborativos

El objetivo principal de este proyecto es crear una plataforma interoperable, centrada en el usuario, que permita la creación de entornos virtuales de aprendizaje , superando las limitaciones actuales y alineándose con la actual definición de lo que será "El Internet del Futuro".

Además de contribuir en la redacción de los estados de la cuestión sobre tecnologías del habla, procesamiento multimodal, gráficos y realidad virtual, nuestro grupo participará en el desarrollo de interfaces de coimunicación con el entorno virtual que incluyen habla expresiva, análisis afectivo multimodal, y modelado y síntesis de avatares 3D.

Proyecto Singular Estratégico (PSE) financiado pel Ministerio de Industria, Turismo y Comercio (TSI-020301-2009-25). Periodo: 2009 - 2011

INREDIS: Interfaces de Relación entre el Entorno y las personas con Discapacidad

El objetivo principal del proyecto es el desarrollo de tecnologías de base que permitan crear canales de comunicación e interacción entre las personas con algún tipo de necesidad especial y su entorno. Technosite lidera este proyecto con un presupuesto de 23.6 millones de euros.

Además de contribuir en la redacción de detallados estados de la cuestión sobre tecnologías del habla, procesamiento multimodal y gráficos y realidad virtual, nuestro grupo participará en el desarrollo de plataformas experimentales que incorporan síntesis del habla expresiva, análisis afectivo multimodal, y modelado y síntesis de avatares 3D.

Consorcio estatal (CENIT) financiado por el Ministerio de Industria, Turismo y Comercio (CEN-2007-2011). Periodo: 2007 - 2010

CTH-MD: Conversión de texto en habla multidominio mediante clasificación automática de dominio



Los ficheros wav OK son los clasificados correctamente por el sistema respecto al etiquetado manual, mientras que los ficheros KO representan: i) el dominio neutro para los dominios ALEGRÍA (HAPPY) y SENSUAL, y ii) el dominio erróneo para los ficheros MISSCL.

Quiero agradecer a David García su ayuda en el desarrollo de esta demo.

MAGNUS: Mouse Advanced GNU Speech

Se trata de una aplicación que permite controlar el ratón de un ordenador mediante comandos de voz en catalán. Esta aplicación pretende mejorar la accesibilidad de las personas con movilidad reducida al ámbito de las TIC.

Este trabajo constituye el Proyecto Final de Carrera de Alexandre Trilla.

Socios del proyecto:
  • Coordinador: Departamento de Educación de la Generalitat de Catalunya
  • Sección de Acústica de Enginyeria i Arquitectura La Salle

SAVE: Síntesis AudioVisual Expresiva

El proyecto se centra en la investigación sobre una interfaz multimodal de salida de alta expresividad que permita la comunicación con la persona proporcionándole una percepción de gran naturalidad. Se propone el estudio y desarrollo de un sistema de síntesis audiovisual expresivo basado en una cabeza parlante foto realista.

Proyecto subvencionado por el Ministerio de Ciencia y Tecnología (TEC2006-08043/TCM). Duración: 2007 - 2009

SALERO: Semantic AudiovisuaL Entertainment Reusable Objects

Nuestro grupo participa en este proyecto internacional con el objetivo de desarrollar nuevas técnicas de Conversión de Texto en Habla multilingüe para conseguir síntesis expresiva en el contexto de las producciones mass media (p.ej. películas, juegos, televisión, etc.)

Proyecto subvencionado por la Comisión Europea (IST-FP6-027122). Duración: 2006 - 2009

SAM, UN METEORÓLOGO VIRTUAL

Sistema automático de elaboración de predicciones meteorológicas bajo demanda (TV, Internet y dispositivos móviles) mediante un personaje virtual llamado Sam.

Nuestro grupo ha desarrollado el conversor de texto en habla de alta calidad basado en corpus que incorpora esta aplicación meteorológica.

Participantes en el proyecto:
  • Corporación Catalana de Radio y Televisión (CCRTV)
  • El Grupo de Tecnologías Interactivas de la Universitat Pompeu Fabra
  • El Área de Tecnologías del Habla de Enginyeria i Arquitectura La Salle
Proyecto financiado por la CCRTV y el CIDEM (RDITSCON04-0005). Duración: Mayo 2004 - Abril 2005

IntegraTV-4all

Servicios adaptados de ocio, información y teleasistencia a través de la televisión con funcionalidades avanzadas de comunicación por voz en lenguaje natural para personas con discapacidades sensoriales y personas de edad avanzada.

Nuestro grupo ha desarrollado un despertador audiovisual integrado en el menú del televisor de hotel, como resultado de la mejora del locutor virtual de partida (ver apartado anterior).

Socios del proyecto:
  • Coordinador: TMT Factory
  • Fundación ONCE
  • Universidad Politécnica de Madrid (UPM)
  • Universidad Carlos III de Madrid
  • El Área de Tecnologías del Habla de Enginyeria i Arquitectura La Salle
Proyecto subvencionado por el Ministerio de Ciencia y Tecnología (FIT-350301-2004-2).
Duración: Septiembre 2004-Diciembre 2005

LOCUTOR VIRTUAL

Puedes descargarte aquí tres vídeos de la primera versión de nuestro locutor virtual fotorrealista:
Proyecto subvencionado por el Ministerio de Ciencia y Tecnología mediante el Programa de Fomento de la Investigación Técnica (FIT-150500-2002-410). Duración: Año 2002

CONVERSOR de TEXTO en HABLA ONLINE (CATALÁN)

Demostración interactiva que sintetiza un texto en Catalán y genera un fichero de audio para ser descargado. Además, la demostración permite especificar distintos parámetros de la voz, como el ritmo y la emoción.

INTERFAZ DE AJUSTE DE PESOS PARA SÍNTESIS DEL HABLA (CATALÁN)

Esta es una plataforma web basada en la computación evolutiva y diseñada para encontrar el ajuste óptimo de pesos de la función de coste para conversión texto en habla basada en selección de unidades:


(acceso restringido: envíame un e-mail para pedirme un login).

ITP - Interfaz de tratamiento del habla

Se trata de un interfaz para el etiquetado de la voz (automático y/o manual). Esta aplicación permite obtener las marcas de pitch, las marcas de segmentación, la curva de pitch, el espectrograma y las características prosódicas de la señal de voz.
Funciona bajo plataformas Windows.

(En desarrollo)

ALGTEC (ÁLGEBRA y TECNOLOGíA)

Es una aplicación multimedia que ayuda y motiva al alumno de Ingeniería al aprendizaje del Álgebra. Presenta conceptos algebraicos aplicados al mundo tecnológico mediante un profesor virtual.

  • Primera versión: basada en Agentes de Microsoft y conversión de texto a voz
  • En un futuro se pretende incorporar a nuestro Locutor Virtual
  • Funciona bajo plataformas Windows.


  • (En desarollo)