Pubblica ammnistrazoine: servizio UE per il multilinguismo

Il multilinguismo e la diversità linguistica sono al centro del progetto europeo. Per questo motivo, l'Unione europea è attiva nel promuovere il multilinguismo e nel sostenere lo sviluppo di tecnologie per abbattere le barriere linguistiche.

eTranslation è un blocco di costruzione della traduzione automatica, finanziato grazie al Connecting Europe Facility (CEF) Telecom, che aiuta le amministrazioni pubbliche europee e nazionali a scambiare informazioni in tutta Europa. Fornisce capacità di traduzione automatica (eTranslation) che permetterà a tutte le infrastrutture di servizi digitali dell'UE (DSI) di diventare multilingue.
A differenza dei traduttori web generici, eTranslation garantisce la riservatezza e la sicurezza di tutti i dati tradotti. È adattato a una terminologia specifica e a tipi di testo utilizzati frequentemente in Europa in diversi contesti (ad esempio, documenti di gara, testi legali, terminologia medica). eTranslation si basa sul servizio di traduzione automatica della Commissione europea, al fine di creare una piattaforma più flessibile e scalabile, e che offre soluzioni personalizzate per diversi servizi online.
Le tecnologie linguistiche vanno ben oltre la semplice traduzione automatica. Tra gli altri, offrono anche applicazioni per:
- analisi del testo (come il riconoscimento delle entità nominate);
- anonimizzazione dei dati;
- riassunto automatico del testo;
- discorso al testo.
Inoltre, le tecnologie linguistiche possono essere sviluppate e personalizzate per qualsiasi scenario specifico in cui viene elaborato il linguaggio umano.

Nel contesto di eTranslation, segnaliamo due progetti di successo:

- Il Multilingual Anonymisation toolkit for Public Administrations è un progetto che mira a introdurre strumenti di Natural Language Processing (NLP) e a sviluppare un toolkit per l'anonimizzazione dei testi in campo medico e legale. Il progetto copre tutte le lingue dell'UE, comprese quelle che sono normalmente sottoutilizzate, come il lettone, il lituano, l'estone, lo sloveno e il croato.

Il toolkit di anonimizzazione multilingue è basato sulla tecnica del Named-Entity Recognition (NER), quindi è in grado di riconoscere e rendere anonimi nomi e cognomi comuni in tutti i paesi dell'UE. Il toolkit fornisce supporto alle pubbliche amministrazioni e permette loro di rispettare i requisiti del GDPR eseguendo l'anonimizzazione e la de-identificazione dei dati, in particolare nel settore sanitario e legale. Questa demo fornisce maggiori informazioni sul progetto e i suoi risultati.

- Il progetto OCCAM (OCR, ClassificAtion & Machine Translation) si concentra sull'integrazione della classificazione delle immagini, delle memorie di traduzione (TM), del riconoscimento ottico dei caratteri (OCR) e della traduzione automatica (MT) per supportare la traduzione automatica dei documenti scansionati, un tipo di documento che non poteva essere precedentemente elaborato dal servizio CEF eTranslation. I moduli scansionati contengono tipicamente un testo modello, per il quale le traduzioni sono disponibili nelle memorie di traduzione.

Il progetto mira a riconoscere tale testo dalle immagini scannerizzate e a tradurlo automaticamente. Colmando questa lacuna, OCCAM contribuisce direttamente ad abbassare la barriera linguistica. Maggiori informazioni sul progetto possono essere trovate in questo demo.

Il Connecting Europe Facility (CEF) in Telecom è uno strumento chiave dell'UE per facilitare l'interazione transfrontaliera tra le amministrazioni pubbliche, le imprese e i cittadini, attraverso la realizzazione di infrastrutture di servizi digitali (DSI) e reti a banda larga.
I progetti sostenuti contribuiscono alla creazione di un ecosistema europeo di servizi digitali interoperabili e interconnessi che sostengono il mercato unico digitale.

Condividi
Aggiornato al:
18.02.2022
Article ID:
98908682