Microsoft anunciado hoje a disponibilidade de sua tecnologia baseada em inteligência artificial para legendagem de imagens por meio dos Serviços Cognitivos do Azure. A empresa também afirma que o sistema agora pode descrever imagens tão bem quanto os humanos.
O novo marco deve ajudar os desenvolvedores a melhorar a acessibilidade em seus próprios aplicativos. Com a legendagem de imagens com tecnologia de IA, os usuários podem visualizar conteúdo importante em imagens, como os resultados da pesquisa e fotos em uma apresentação, por exemplo. A gigante do software advertiu, no entanto, que os resultados podem não ser perfeitos o tempo todo.
Mais importante ainda, Saqib Shaikh, gerente de engenharia de software do grupo de plataforma AI da Microsoft, disse que a legendagem de imagens pode ajudar pessoas com deficiência visual, gerando uma descrição de foto, comumente chamada de texto salgado, em uma página da web ou documento. Sua equipe também usa o sistema do aplicativo Seeing AI talking camera para descrever fotos para pessoas cegas ou com baixa visão.
Shaikh disse:
“O ideal é que todos incluam texto alternativo para todas as imagens em documentos, na web, nas redes sociais – pois isso permite que pessoas cegas acessem o conteúdo e participem da conversa. Mas, infelizmente, as pessoas não. Portanto, existem vários aplicativos que usam legendas de imagens como forma de preencher o texto alternativo quando ele está faltando. ”
A Microsoft também afirma que o novo sistema é duas vezes melhor do que o modelo de legendagem de imagens que está em uso desde 2015. E foi capaz de produzir legendas que “eram mais descritivas e precisas” do que as criadas por pessoas reais para as mesmas imagens.
Ainda neste ano, a tecnologia de legendagem de imagens também será incorporada ao Microsoft Word e Outlook para Windows e Mac e ao PowerPoint para Windows, Mac e web. Será interessante ver como o sistema funciona no mundo real em comparação com os modelos de IA concorrentes.