Aquí tens alguns dels projectes i demostracions en els que participo o he participat:
THOFU: Tecnologies de l'HOtel del FUtur
L'objectiu principal del projecte és dissenyar l'hotel del futur, des dels espais i la seva construcció,
passant pels objectes que resideixen en ell, sense oblidar la interacció amb els clients, així com la
interacció amb Internet.
El Grup Gesfor lidera aquest projecte amb un pressupost de 23 milions d'euros.
En aquest projecte, el nostre grup participarà en el paquet de treball relacionat amb el disseny de noves interfícies
intel·ligents i adaptatives en el context d'un hotel altament tecnològic, investigant sobre nous paradigmes
d'interacció i analitzant la seva usabilitat i l'experiència d'usuari.
Consorci estatal (CENIT) finançat pel Ministerio de Ciencia e Innovación (CEN-2010-1019). Període: Setembre 2010 - Desembre 2013
EmoLib: identificació de l'emoció d'un text
EmoLib és una llibreria que extreu l'afectivitat i les emocions d'un text d'entrada (en anglès),
etiquetant-lo segons els sentiments que expressa. EmoLib ha estat implementada
usant el llenguatge de programació Java.
Aquesta demostració ha estat desenvolupada per l'Alexandre Trilla dins del marc de la seva tesi doctoral.
evMIC: Entornos Virtuales Multimodales Inmersivos y Colaborativos
L'objectiu principal d'aquest projecte és crear una plataforma interoperable, centrada en l'usuari, que permeti la creació d'entorns virtuals d'aprenentatge, superant les limitacions actuals i alineant-se amb l'actual definició del que serà la "Internet del Futur".
A més de contribuir en la redacció dels estats de la qüestió sobre tecnologies de la parla, processat multimodal, gràfics i realitat virtual,
el nostre grup participarà en el desenvolupament d'interfícies de comunicació amb l'entorn virtual que inclouen parla expressiva, anàlisi afectiu multimodal, i modelat i síntesi d'avatars 3D.
Projecte Singular Estratègic (PSE) finançat pel Ministerio de Industria, Turismo y Comercio (TSI-020301-2009-25). Durada: 2009 - 2011
INREDIS: Interfaces de Relación entre el Entorno y las personas con Discapacidad
L'objectiu principal del projecte és el desenvolupament de tecnologies de base que permetin crear canals de comunicació i interacció entre les persones amb algun tipus de necessitat especial i el seu entorn.
Technosite lidera aquest projecte amb un pressupost de 23.6 milions d'euros.
A més de contribuir en la redacció de detallats estats de la qüestió sobre tecnologies de la parla, processat multimodal, gràfics i realitat virtual,
el nostre grup participarà en el desenvolupament de plataformes experimentals que incorporen síntesi de la parla expressiva, anàlisi afectiu multimodal, i modelat i síntesi d'avatars 3D.
Consorci estatal (CENIT) finançat pel Ministerio de Industria, Turismo y Comercio (CEN-2007-2011). Durada: 2007 - 2010
CTP-MD: Conversió de text a parla multidomini mitjançant classificació automàtica de domini
Els fitxers wav OK són els classificats correctament pel sistema, respecte a l'etiquetatge manual, mentre que els fitxers KO representen:
i) el domini neutre pels domninis ALEGRIA (HAPPY) i SENSUAL, i ii) el domini erroni pels fitxers MISSCL.
Vull agrair a en David García el seu suport pel desenvolupament d'aquesta demo.
MAGNUS: Mouse Advanced GNU Speech
Es tracta d'una aplicació que permet controlar el ratolí d'un ordinador mitjançant comandes de veu en Català.
Aquesta aplicació pretén millorar l'accessibilitat de les persones amb mobilitat reduïda a l'àmbit de les TIC.
Aquest treball constitueix el Projecte Final de Carrera d'Alexandre Trilla.
Membres del projecte:
Coordinador: Departament d'Educació de la Generalitat de Catalunya
Secció d'Acústica d'Enginyeria i Arquitectura La Salle
SAVE: Síntesi AudioVisual Expressiva
El projecte se centra en la investigació sobre una interfície multimodal de sortida d'alta
expressivitat que permeti la comunicació amb la persona proporcionant-li una percepció de gran naturalitat.
Es proposa l'estudi i el desenvolupament d'un sistema de síntesi audiovisual expressiu basat en un cap parlant
foto realista.
Projecte subvencionat pel Ministerio de Ciencia y Tecnología (TEC2006-08043/TCM). Durada: 2007 - 2009
SALERO: Semantic AudiovisuaL Entertainment Reusable Objects
El nostre grup participa en aquest projecte internacional amb l'objectiu de desenvolupar
noves tècniques de Conversió de Text a Parla multilingüe per tal d'aconseguir una síntesi més expressiva en el context
de les produccions mass media (p.ex. pel·lícules, jocs, televisió, etc.)
Projecte subvencionat per la Comissió Europea (IST-FP6-027122). Durada: 2007 - 2009
EN SAM, UN METEORÒLEG VIRTUAL
Sistema automàtic d'elaboració de prediccions meteorològiques sota demanda (TV, Internet i dispositius mòbils) mitjançant un personatge virtual,
en Sam.
El nostre grup ha desenvolupat el conversor text-parla d'alta qualitat basat en un corpus que incorpora aquesta aplicació meteorològica.
Participants en el projecte:
Corporació Catalana de Ràdio i Televisió (CCRTV)
El Grup de Tecnologies Interactives de la Universitat Pompeu Fabra
Àrea de Tecnologies de la Parla d'Enginyeria i Arquitectura La Salle
Projecte finançat per la CCRTV i el CIDEM (RDITSCON04-0005). Durada: Maig 2004 - Abril 2005
IntegraTV-4all
Serveis adaptats d'oci, informació i teleassistència a través de la televisió amb funcionalitats avançades
de comunicació per veu emprant llenguatge natural per a persones amb discapacitat sensorial i persones d'edat
avançada.
El nostre grup ha desenvolupat un despertador audiovisual integrat al menú del televisor d'un hotel,
com a resultat de la millora del locutor virtual de partida (veure apartat següent).
Membres del projecte:
Coordinador: TMT Factory
Fundación ONCE
Universidad Politécnica de Madrid (UPM)
Universidad Carlos III de Madrid
Àrea de Tecnologies de la Parla d'Enginyeria i Arquitectura La Salle
Projecte subvencionat pel Ministerio de Ciencia y Tecnología (FIT-350301-2004-2).
Durada: Setembre 2004-Desembre 2005
LOCUTOR VIRTUAL
Des d'aquest punt et pots descarregar tres vídeos de la primera versió del nostre locutor virtual fotorealista:
Projecte subvencionat pel Ministerio de Ciencia y Tecnología
mitjançant el Programa de Foment de l'Investigació Tècnica (FIT-150500-2002-410). Durada: Any 2002.
CONVERSOR TEXT-PARLA ONLINE
Demostració interactiva que sintetitza un text en Català i genera un fitxer de so per a ser descarregat. A més, la demostració permet especificar diferents paràmetres de la veu, com el ritme i l'emoció.
INTERFÍCIE D'AJUST DE PESOS PER A SÍNTESI DE LA PARLA
Aquesta és una plataforma web que utilitza la computació evolutiva dissenyada per a trobar l'ajust òptim dels pesos de la funció
de cost per a conversió text a parla basada en selecció d'unitats:
(accés restringit: envia'm un e-mail per a demanar-me un login).
ITP - Interfície de Tractament de la Parla
Es tracta d'una interfície per a l'etiquetatge de la parla (automàtic i/o manual).
Aquesta aplicació permet obtenir es marques de pitch, les marques de segmentació, la corba de pitch, l'espectrograma
i característiques prosòdiques del senyal de veu.
Funciona sota plataformes Windows.
(En desenvolupament)
ALGTEC (ÀLGEBRA i TECNOLOGIA)
És una aplicació multimèdia que ajuda i motiva a l'alumne d'Enginyeria en l'aprenentatge de l'Àlgebra.
Presenta conceptes algebraics aplicats al món tecnològic mitjançant un professor virtual.
Primera versió: basada en Agents de Microsoft i conversió de text a parla
En un futur es pretén incorporar el nostre Locutor Virtual