Os investigadores de atlanTTic Fernando Pérez-González e Alberto Pedrouzo, coordinados polo centro de investigación Gradiant, ocuparanse da dirección científica do proxecto europeo Trumpet (Trustworthy Multi-site Privacy Enhancing Technologies), que pretende desenvolver unha ferramenta eficaz que evite as fugas de información e perdas de privacidade do denominado aprendizaxe federado, un potente concepto creado por Google en 2016, que se emprega en medicina, defensa, telecomunicacións ou farmacia.
En concreto, o proxecto Horizonte Europa Trumpet, no que tamén participan tamén Reino Unido e Israel e que conta cun investimento de cinco millóns de euros en tres anos, centrarase na loita contra o cancro e farao a través dos seus dous socios sanitarios, os hospitais oncolóxicos de Liege, en Bélxica, e de IRST-IRCCS, en Emilia-Romaña, Italia.
A aprendizaxe federada na actualidade sábese que presenta unha serie de vulnerabilidades en canto á privacidade, que impiden que os hospitais con unidades oncolóxicas poidan compartir información das e dos pacientes ao incumprir o Regulamento Xeral de Protección de Datos Europeo (General Data Protection Regulation –GDPR-).
“Os algoritmos empregados hoxe en día en aprendizaxe federado para compartir información pódense reverter, tendo o risco de extraer deles datos persoais. Polo tanto, non poden ser empregados sen a axuda doutras ferramentas. O que imos facer no proxecto é concibir solucións para paliar esta vulnerabilidade”, explica Fernando Pérez-González, investigador do Centro de Investigación en Tecnoloxías de Telecomunicación da Universidade de Vigo, atlanTTic.
Ata este momento, Trumpet celebrou a súa primeira reunión de equipo, un consorcio do que forman parte nove organizacións: dous hospitais (Centre Hospitalier Universitaire de Liège e Instituto Romagnolo per lo Studio dei Tumori Dino Amadori), tres centros de investigación (Gradiant, Commissariat à l’Énergie Atomique et aux Énergies Alternatives, e Institut National de Recherche en Informatique et en Automatique), unha universidade (atlanTTic – Universidade de Vigo) e tres pemes (Time.Lex, Technovative Solutions y Arteevo Technologies).
Pioneiros en cifrado homomórfico
Os investigadores galegos foron elixidos para o proxecto, principalmente polos tres lustros que levan traballando con cifrado homomórfico, a tecnoloxía na que se comparte e traballa con información sen que o dato persoal poida ser descifrado por persoas non autorizadas.
Segundo explica Fernando Pérez, “a lexislación é moi garantista co individuo e iso non o podemos perder de vista, pero si se pode chegar a un modelo que permita a compartición de datos entre hospitais porque iso melloraría a investigación en tratamentos ou axudaría na diagnose. Os algoritmos funcionan mellor cando se adestran aportando moitos datos. A función de autocompletar de Google beneficiase do adestramento con datos de centos de millóns de usuarios, e por iso é tan efectivo”.
AtlanTTic é un dos centros de investigación pioneiros en España en cifrado homomórfico, no que se centra a tese de doutoramento de Alberto Pedrouzo, porén, “trátase dun sistema custoso e complexo”, matiza o investigador, e Trumpet tratará de acadar, nos próximos tres anos, unha solución híbrida que manteña as vantaxes do cifrado homomórfico pero que gañe en velocidade e facilidade de implantación.
Ademais de desenvolver mecanismos para conseguir que o procedemento sexa efectivo sen perder privacidade, os investigadores de atlanTTic deberán tamén cuantificar en que medida é vulnerable o sistema, o que se denomina métrica de privacidade, na que Pedrouzo e Pérez son expertos. “Quérese medir a filtración da privacidade para certificar o cumprimento da GDPR á hora de implementar o aprendizaxe federado”, sinala Pedrouzo.
Ampliar o foco para salvar máis vidas
Segundo a Organización Mundial da Saúde, o cancro será a primeira causa de morte en 2030 con 21,6 millóns de casos novos cada ano, de aí a urxencia de ampliar o foco ao máximo coa fin de salvar o maior número de vidas. “En investigación médica, canto máis coñecemento, máis fiabilidade e, polo tanto, máis certezas. Se se dispón de moita información para adestrar ao algoritmo, mellor”, engade Pérez.