Microsoft investe na preservação da herança cultural e linguística da Europa com foco em IA

Iniciativas na Europa buscam ampliar o reconhecimento e a representação dos idiomas e patrimônios culturais na inteligência artificial
Atualizado há 1 dia atrás
Microsoft investe na preservação da herança cultural e linguística da Europa com foco em IA
Europa promove a valorização de idiomas e culturas na inteligência artificial. (Imagem/Reprodução: Neowin)
Resumo da notícia
    • A Microsoft anunciou ações para preservar idiomas e cultura europeia na era da IA.
    • O objetivo é fortalecer a representatividade dos bens culturais e linguísticos nos modelos de linguagem grandes.
    • Essas ações podem melhorar a acessibilidade e a diversidade digital na Europa.
CONTINUA DEPOIS DA PUBLICIDADE

A Microsoft anunciou recentemente duas grandes iniciativas em Paris. O objetivo é duplo: preservar a rica herança linguística e cultural da Europa e, ao mesmo tempo, fortalecer a posição do continente na era da Inteligência Artificial. Essas ações se somam aos compromissos digitais europeus anteriores da empresa, que visam expandir a infraestrutura de IA e nuvem, reforçar a privacidade dos dados, aumentar a cibersegiliência e impulsionar a competitividade digital da Europa.

Os novos passos da Microsoft buscam tornar idiomas e bens culturais europeus mais acessíveis online. Além disso, a empresa quer que esses elementos estejam mais bem representados nos modelos de linguagem grandes, conhecidos como LLMs.

O Desafio Linguístico e Cultural na Era da IA

A Europa tem mais de 200 idiomas e um legado cultural de milênios. Essa herança é fundamental para a expressão criativa e a atividade econômica, facilitando a comunicação, a inovação e o comércio. No entanto, o conteúdo online tem sido cada vez mais dominado pelo inglês, que muitas vezes reflete uma perspectiva americana.

CONTINUA DEPOIS DA PUBLICIDADE

Isso significa que o comércio e a cultura europeus correm o risco de serem mal representados nos dados usados para treinar os modelos de linguagem atuais. Brad Smith, vice-presidente e presidente da Microsoft, ressaltou que “uma IA que não compreende as línguas, histórias e valores da Europa não pode servir plenamente seu povo, suas empresas ou seu futuro”.

Para mostrar o desequilíbrio, a Microsoft usou o Llama 3.1, um modelo de código aberto. Ele tem um desempenho mais de 15 pontos menor em grego e mais de 25 pontos menor em letão do que em inglês. Isso coloca o modelo no topo da lista para o inglês, em um nível intermediário para o grego e quase na parte inferior para o letão. Esse padrão é visto em vários testes importantes de LLMs.

Leia também:

A falta de dados diversificados pode levar a modelos de IA que não funcionam tão bem para usuários que falam outras línguas, criando uma barreira digital. Essa questão é fundamental para garantir que a IA seja realmente útil e inclusiva para todos.

Microsoft investe em IA para Diversidade Linguística

Para resolver essa questão, a Microsoft vai concentrar sua experiência em seus centros de inovação em Estrasburgo, na França. Lá, equipes do Centro de Inovação Aberta (MOIC) e do Laboratório de IA para o Bem (AI for Good Lab) vão trabalhar para desenvolver e organizar conjuntos de dados multilíngues na plataforma Microsoft Azure.

Essas equipes vão colaborar com instituições culturais, parceiros acadêmicos e empresas de tecnologia de toda a Europa. O objetivo é aumentar a disponibilidade de dados de treinamento em dez idiomas europeus sub-representados, incluindo estoniano, alsaciano, eslovaco, grego e maltês. Esta iniciativa é um passo importante para que a Meta tenta atrair talentos de IA e outras empresas possam desenvolver modelos mais equilibrados.

CONTINUA DEPOIS DA PUBLICIDADE

A Microsoft também abriu um edital para receber propostas de textos digitais, transcrições e outros materiais que sejam adequados para o desenvolvimento de IA. As inscrições para as bolsas, que incluem créditos no Azure e suporte técnico e de engenharia, estarão disponíveis no site do AI for Good Lab a partir de 1º de setembro de 2025.

Essa abordagem colaborativa visa criar uma base de dados mais robusta e representativa. O resultado esperado é uma inteligência artificial que entenda e interaja melhor com a riqueza cultural e linguística da Europa.

Ações da Microsoft no Patrimônio Cultural

Em uma segunda frente, a Microsoft vai expandir seu programa Cultura IA neste outono, com a criação de uma réplica digital de alta fidelidade da Catedral de Notre Dame, em Paris. Em parceria com o Ministério da Cultura francês e a especialista em digitalização de patrimônio Iconem, o projeto vai capturar a icônica catedral gótica de 862 anos em detalhes finos.

Este projeto se baseia em trabalhos anteriores do Cultura IA que já preservaram digitalmente locais importantes. Entre eles, estão a Antiga Olímpia na Grécia, o Monte Saint-Michel na França, a Basílica de São Pedro em Roma e os locais de desembarque dos Aliados na Normandia. Melhora proteção de dados e informações históricas são cruciais para esses projetos.

A empresa de tecnologia afirma que essas iniciativas se apoiam em mais de 40 anos de experiência da Microsoft em localização. Por exemplo, o Windows hoje oferece suporte a mais de 90 idiomas, incluindo todas as línguas oficiais da União Europeia e dialetos regionais como o basco, catalão, galego, luxemburguês e valenciano.

O Microsoft 365 também disponibiliza interfaces do Office em mais de 30 idiomas europeus. Ao integrar os idiomas e o patrimônio cultural da Europa em suas plataformas de IA e nuvem, a Microsoft busca proteger a herança do continente e capacitar seus negócios e cidadãos na era digital.

A empresa reforça que essas ações são puramente de apoio. Elas contribuem com dados abertos, ferramentas e conhecimentos, sem a inclusão de ativos proprietários. O foco é fortalecer um ecossistema digital mais inclusivo.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

Via Neowin

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.