O proxecto Nós presenta a súa folla de ruta para a dixitalización do galego

A conversión entre texto e voz e a tradución automática entre os fitos inmediatos

O Proxecto Nós, que busca incrementar a presenza do galego nos sistemas dixitais de procesamento da linguaxe natural -como os tradutores automáticos, ou bots conversacionais coma o Siri de Apple-, xa ten obxectivos concretos ao longo de 2022. Estes foron avanzados na xornada de presentación do proxecto realizada esta mañá na Cidade da Cultura, onde responsables e técnicos de diferentes áreas presentaron os resultados dunha iniciativa liderada pola USC e para o que a Xunta achegou neste 2022 uns 600.000 euros. O obxectivo é incrementar o nivel de oferta de servizos en galego que, conforme explicou Elisa Fernández Rei, atópase no penúltimo chanzo nunha posible escala de servizos ofrecidos nas linguas europeas. En concreto, o proxecto Nós incluirá 8 subproxectos, 28 'demostradores' (webs ou apps que amosan como funciona un servizo), 50 casos de transferencia tecnolóxica, 60 investigadores e técnicos e un investimento final (desde diferentes fontes de financiamento) de 15 millóns de euros. O proxecto está concibido a catro anos.

Os investigadores explicaron que o proxecto Nós está dividido en diferentes obxectivos que pretenden desenvolver tecnoloxías, integrar corpus lingüísticos e realizar produtos demostrativos que poidan ser empregados por institucións e empresas para servizos ao público. Os resultados do Proxecto Nós estarán dispoñíbles en código aberto para facilitar o seu uso por terceiros. As liñas de investigación en curso en 2022 son as de síntese de voz, o recoñecemento da fala, a tradución automática e a xeración de texto. Para vindeiros anos tamén está previsto avanzar en liñas de corrección e avaliación lingüística e extracción e clasificación.

Ao longo de 2022 comezarán a estar dispoñibles prototipos con diferentes niveis de desenvolvemento. Deste xeito, aproximadamente en decembro será accesible un demostrador de conversor de texto a voz, con ao redor de 30 horas de gravación, así como un prototipo de recoñecedor da fala, que convirta voz a texto a nivel experimental. Tamén para finais de 2023 estímase a dispoñibilidade dun tradutor automático de texto entre o galego e o castelán e galego e inglés, e que podería incluír outras linguas adicionais. Os investigadores tamén sitúan a publicación de demostradores de xeración automática de texto en galego en decembro, a partir da información metereolóxica, integrando predicións operativas e calidade do aire.

Os responsables do proxecto incentivaron que o obxecto do proxecto de crear 'demostradores' (prototipos funcionais) para crear impacto social e económico do proxecto na sociedade. Deste xeito, Manuel González defendeu a creación dun 'living lab', definido como un "espazo de innovación aberto e inclusivo, no que se produza a cocreación e a participación" ao redor das tecnoloxías lingüísticas. Nel estaría integradas institucións, empresas, entidades e asociacións. González destacou que o proxecto Nós debera ter "sustentabilidade" porque os "produtos quedan axiña anticuados" e continuamente aparecen "novas necesidades sociais".