imatge

Contents copyright © 2012
La Salle (URL)
All rights reserved


Francesc Alías Pujol

falias@salle.url.edu

idioma/language
  salle_logo

PROJECTES I DEMOSTRACIONS

Aquí tens alguns dels projectes i demostracions en els que participo o he participat:

THOFU: Tecnologies de l'HOtel del FUtur

L'objectiu principal del projecte és dissenyar l'hotel del futur, des dels espais i la seva construcció, passant pels objectes que resideixen en ell, sense oblidar la interacció amb els clients, així com la interacció amb Internet. El Grup Gesfor lidera aquest projecte amb un pressupost de 23 milions d'euros.

En aquest projecte, el nostre grup participarà en el paquet de treball relacionat amb el disseny de noves interfícies intel·ligents i adaptatives en el context d'un hotel altament tecnològic, investigant sobre nous paradigmes d'interacció i analitzant la seva usabilitat i l'experiència d'usuari.

Consorci estatal (CENIT) finançat pel Ministerio de Ciencia e Innovación (CEN-2010-1019). Període: Setembre 2010 - Desembre 2013

EmoLib: identificació de l'emoció d'un text

EmoLib és una llibreria que extreu l'afectivitat i les emocions d'un text d'entrada (en anglès), etiquetant-lo segons els sentiments que expressa. EmoLib ha estat implementada usant el llenguatge de programació Java.

Aquesta demostració ha estat desenvolupada per l'Alexandre Trilla dins del marc de la seva tesi doctoral.

evMIC: Entornos Virtuales Multimodales Inmersivos y Colaborativos

L'objectiu principal d'aquest projecte és crear una plataforma interoperable, centrada en l'usuari, que permeti la creació d'entorns virtuals d'aprenentatge, superant les limitacions actuals i alineant-se amb l'actual definició del que serà la "Internet del Futur".

A més de contribuir en la redacció dels estats de la qüestió sobre tecnologies de la parla, processat multimodal, gràfics i realitat virtual, el nostre grup participarà en el desenvolupament d'interfícies de comunicació amb l'entorn virtual que inclouen parla expressiva, anàlisi afectiu multimodal, i modelat i síntesi d'avatars 3D.

Projecte Singular Estratègic (PSE) finançat pel Ministerio de Industria, Turismo y Comercio (TSI-020301-2009-25). Durada: 2009 - 2011

INREDIS: Interfaces de Relación entre el Entorno y las personas con Discapacidad

L'objectiu principal del projecte és el desenvolupament de tecnologies de base que permetin crear canals de comunicació i interacció entre les persones amb algun tipus de necessitat especial i el seu entorn. Technosite lidera aquest projecte amb un pressupost de 23.6 milions d'euros.

A més de contribuir en la redacció de detallats estats de la qüestió sobre tecnologies de la parla, processat multimodal, gràfics i realitat virtual, el nostre grup participarà en el desenvolupament de plataformes experimentals que incorporen síntesi de la parla expressiva, anàlisi afectiu multimodal, i modelat i síntesi d'avatars 3D.

Consorci estatal (CENIT) finançat pel Ministerio de Industria, Turismo y Comercio (CEN-2007-2011). Durada: 2007 - 2010

CTP-MD: Conversió de text a parla multidomini mitjançant classificació automàtica de domini



Els fitxers wav OK són els classificats correctament pel sistema, respecte a l'etiquetatge manual, mentre que els fitxers KO representen: i) el domini neutre pels domninis ALEGRIA (HAPPY) i SENSUAL, i ii) el domini erroni pels fitxers MISSCL.

Vull agrair a en David García el seu suport pel desenvolupament d'aquesta demo.

MAGNUS: Mouse Advanced GNU Speech

Es tracta d'una aplicació que permet controlar el ratolí d'un ordinador mitjançant comandes de veu en Català. Aquesta aplicació pretén millorar l'accessibilitat de les persones amb mobilitat reduïda a l'àmbit de les TIC.

Aquest treball constitueix el Projecte Final de Carrera d'Alexandre Trilla.

Membres del projecte:
  • Coordinador: Departament d'Educació de la Generalitat de Catalunya
  • Secció d'Acústica d'Enginyeria i Arquitectura La Salle

SAVE: Síntesi AudioVisual Expressiva

El projecte se centra en la investigació sobre una interfície multimodal de sortida d'alta expressivitat que permeti la comunicació amb la persona proporcionant-li una percepció de gran naturalitat. Es proposa l'estudi i el desenvolupament d'un sistema de síntesi audiovisual expressiu basat en un cap parlant foto realista.

Projecte subvencionat pel Ministerio de Ciencia y Tecnología (TEC2006-08043/TCM). Durada: 2007 - 2009

SALERO: Semantic AudiovisuaL Entertainment Reusable Objects

El nostre grup participa en aquest projecte internacional amb l'objectiu de desenvolupar noves tècniques de Conversió de Text a Parla multilingüe per tal d'aconseguir una síntesi més expressiva en el context de les produccions mass media (p.ex. pel·lícules, jocs, televisió, etc.)

Projecte subvencionat per la Comissió Europea (IST-FP6-027122). Durada: 2007 - 2009

EN SAM, UN METEORÒLEG VIRTUAL

Sistema automàtic d'elaboració de prediccions meteorològiques sota demanda (TV, Internet i dispositius mòbils) mitjançant un personatge virtual, en Sam.

El nostre grup ha desenvolupat el conversor text-parla d'alta qualitat basat en un corpus que incorpora aquesta aplicació meteorològica.

Participants en el projecte:
  • Corporació Catalana de Ràdio i Televisió (CCRTV)
  • El Grup de Tecnologies Interactives de la Universitat Pompeu Fabra
  • Àrea de Tecnologies de la Parla d'Enginyeria i Arquitectura La Salle
Projecte finançat per la CCRTV i el CIDEM (RDITSCON04-0005). Durada: Maig 2004 - Abril 2005

IntegraTV-4all

Serveis adaptats d'oci, informació i teleassistència a través de la televisió amb funcionalitats avançades de comunicació per veu emprant llenguatge natural per a persones amb discapacitat sensorial i persones d'edat avançada.

El nostre grup ha desenvolupat un despertador audiovisual integrat al menú del televisor d'un hotel, com a resultat de la millora del locutor virtual de partida (veure apartat següent).

Membres del projecte:
  • Coordinador: TMT Factory
  • Fundación ONCE
  • Universidad Politécnica de Madrid (UPM)
  • Universidad Carlos III de Madrid
  • Àrea de Tecnologies de la Parla d'Enginyeria i Arquitectura La Salle
Projecte subvencionat pel Ministerio de Ciencia y Tecnología (FIT-350301-2004-2).
Durada: Setembre 2004-Desembre 2005

LOCUTOR VIRTUAL

Des d'aquest punt et pots descarregar tres vídeos de la primera versió del nostre locutor virtual fotorealista:

Projecte subvencionat pel Ministerio de Ciencia y Tecnología mitjançant el Programa de Foment de l'Investigació Tècnica (FIT-150500-2002-410). Durada: Any 2002.

CONVERSOR TEXT-PARLA ONLINE

Demostració interactiva que sintetitza un text en Català i genera un fitxer de so per a ser descarregat. A més, la demostració permet especificar diferents paràmetres de la veu, com el ritme i l'emoció.

INTERFÍCIE D'AJUST DE PESOS PER A SÍNTESI DE LA PARLA

Aquesta és una plataforma web que utilitza la computació evolutiva dissenyada per a trobar l'ajust òptim dels pesos de la funció de cost per a conversió text a parla basada en selecció d'unitats:


(accés restringit: envia'm un e-mail per a demanar-me un login).

ITP - Interfície de Tractament de la Parla

Es tracta d'una interfície per a l'etiquetatge de la parla (automàtic i/o manual). Aquesta aplicació permet obtenir es marques de pitch, les marques de segmentació, la corba de pitch, l'espectrograma i característiques prosòdiques del senyal de veu.
Funciona sota plataformes Windows.

(En desenvolupament)

ALGTEC (ÀLGEBRA i TECNOLOGIA)

És una aplicació multimèdia que ajuda i motiva a l'alumne d'Enginyeria en l'aprenentatge de l'Àlgebra. Presenta conceptes algebraics aplicats al món tecnològic mitjançant un professor virtual.

  • Primera versió: basada en Agents de Microsoft i conversió de text a parla
  • En un futur es pretén incorporar el nostre Locutor Virtual
  • Funciona sota plataformes Windows.


  • (En desenvolupament)