▲
A Microsoft anunciou recentemente duas grandes iniciativas em Paris. O objetivo é duplo: preservar a rica herança linguística e cultural da Europa e, ao mesmo tempo, fortalecer a posição do continente na era da Inteligência Artificial. Essas ações se somam aos compromissos digitais europeus anteriores da empresa, que visam expandir a infraestrutura de IA e nuvem, reforçar a privacidade dos dados, aumentar a cibersegiliência e impulsionar a competitividade digital da Europa.
Os novos passos da Microsoft buscam tornar idiomas e bens culturais europeus mais acessíveis online. Além disso, a empresa quer que esses elementos estejam mais bem representados nos modelos de linguagem grandes, conhecidos como LLMs.
O Desafio Linguístico e Cultural na Era da IA
A Europa tem mais de 200 idiomas e um legado cultural de milênios. Essa herança é fundamental para a expressão criativa e a atividade econômica, facilitando a comunicação, a inovação e o comércio. No entanto, o conteúdo online tem sido cada vez mais dominado pelo inglês, que muitas vezes reflete uma perspectiva americana.
Isso significa que o comércio e a cultura europeus correm o risco de serem mal representados nos dados usados para treinar os modelos de linguagem atuais. Brad Smith, vice-presidente e presidente da Microsoft, ressaltou que “uma IA que não compreende as línguas, histórias e valores da Europa não pode servir plenamente seu povo, suas empresas ou seu futuro”.
Para mostrar o desequilíbrio, a Microsoft usou o Llama 3.1, um modelo de código aberto. Ele tem um desempenho mais de 15 pontos menor em grego e mais de 25 pontos menor em letão do que em inglês. Isso coloca o modelo no topo da lista para o inglês, em um nível intermediário para o grego e quase na parte inferior para o letão. Esse padrão é visto em vários testes importantes de LLMs.
Leia também:
A falta de dados diversificados pode levar a modelos de IA que não funcionam tão bem para usuários que falam outras línguas, criando uma barreira digital. Essa questão é fundamental para garantir que a IA seja realmente útil e inclusiva para todos.
Microsoft investe em IA para Diversidade Linguística
Para resolver essa questão, a Microsoft vai concentrar sua experiência em seus centros de inovação em Estrasburgo, na França. Lá, equipes do Centro de Inovação Aberta (MOIC) e do Laboratório de IA para o Bem (AI for Good Lab) vão trabalhar para desenvolver e organizar conjuntos de dados multilíngues na plataforma Microsoft Azure.
Essas equipes vão colaborar com instituições culturais, parceiros acadêmicos e empresas de tecnologia de toda a Europa. O objetivo é aumentar a disponibilidade de dados de treinamento em dez idiomas europeus sub-representados, incluindo estoniano, alsaciano, eslovaco, grego e maltês. Esta iniciativa é um passo importante para que a Meta tenta atrair talentos de IA e outras empresas possam desenvolver modelos mais equilibrados.
A Microsoft também abriu um edital para receber propostas de textos digitais, transcrições e outros materiais que sejam adequados para o desenvolvimento de IA. As inscrições para as bolsas, que incluem créditos no Azure e suporte técnico e de engenharia, estarão disponíveis no site do AI for Good Lab a partir de 1º de setembro de 2025.
Essa abordagem colaborativa visa criar uma base de dados mais robusta e representativa. O resultado esperado é uma inteligência artificial que entenda e interaja melhor com a riqueza cultural e linguística da Europa.
Ações da Microsoft no Patrimônio Cultural
Em uma segunda frente, a Microsoft vai expandir seu programa Cultura IA neste outono, com a criação de uma réplica digital de alta fidelidade da Catedral de Notre Dame, em Paris. Em parceria com o Ministério da Cultura francês e a especialista em digitalização de patrimônio Iconem, o projeto vai capturar a icônica catedral gótica de 862 anos em detalhes finos.
Este projeto se baseia em trabalhos anteriores do Cultura IA que já preservaram digitalmente locais importantes. Entre eles, estão a Antiga Olímpia na Grécia, o Monte Saint-Michel na França, a Basílica de São Pedro em Roma e os locais de desembarque dos Aliados na Normandia. Melhora proteção de dados e informações históricas são cruciais para esses projetos.
A empresa de tecnologia afirma que essas iniciativas se apoiam em mais de 40 anos de experiência da Microsoft em localização. Por exemplo, o Windows hoje oferece suporte a mais de 90 idiomas, incluindo todas as línguas oficiais da União Europeia e dialetos regionais como o basco, catalão, galego, luxemburguês e valenciano.
O Microsoft 365 também disponibiliza interfaces do Office em mais de 30 idiomas europeus. Ao integrar os idiomas e o patrimônio cultural da Europa em suas plataformas de IA e nuvem, a Microsoft busca proteger a herança do continente e capacitar seus negócios e cidadãos na era digital.
A empresa reforça que essas ações são puramente de apoio. Elas contribuem com dados abertos, ferramentas e conhecimentos, sem a inclusão de ativos proprietários. O foco é fortalecer um ecossistema digital mais inclusivo.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via Neowin