Os moderadores do Facebook não tem a capacidade de ver cada imagem que é postada nessa gigantesca rede social, então ele está construindo um sistema de inteligência artificial para ajudá-los. Em um post de hoje, o Facebook apresenta um sistema a que ele deu o nome de Rosetta, que usa um processo avançado para identificar texto em imagens e vídeos e depois transcrevê-lo em algo legível por máquina. Particularmente falando, o Facebook está achando essa ferramenta muito útil na transcrição de texto em memes.
Ferramentas de transcrição de texto não são exatamente algo novo, mas o Facebook encara desafios diferenciados por conta do tamanho de sua plataforma e à variedade de imagens que observa. Disseram que o Rosetta está ativo agora, extraindo texto de 1 bilhão de imagens e quadros de vídeo diariamente, tanto no Facebook, quanto no Instagram.
No momento, não está suficientemente esclarecido o que o Facebook está fazendo com os dados que são coletados. É útil para recursos básicos, como a pesquisa de fotos e os leitores de tela. Entretanto, também parece que o Facebook está começando a direcioná-lo para objetivos muito mais amplos, como descobrir o que seria interessante colocar em seu Feed de notícias e, mais importante ainda, descobrir quais os memes são apenas memes bobos e quais estão realmente espalhando o discurso de ódio ou outros comentários ofensivos.
O Facebook diz que a extração de texto e o aprendizado de máquina estão sendo utilizados para “identificar automaticamente o conteúdo que viola nossa política de discurso de ódio” e que isso está acontecendo em vários idiomas. Dadas as conhecidas questões de moderação da empresa, um sistema em bom funcionamento que possa sinalizar automaticamente imagens potencialmente problemáticas pode ser uma ajuda real.
Memes são a linguagem da web e o Facebook quer entendê-los melhor.
As equipes de inteligência artificial do Facebook fizeram avanços substanciais ao longo dos anos tanto na visão computacional quanto no reconhecimento da linguagem natural. Hoje, eles anunciaram alguns de seus últimos trabalhos que combinam avanços nos dois campos. Um novo sistema, codinome “Rosetta”, ajuda as equipes no Facebook e no Instagram a identificar texto nas imagens para entender melhor o assunto e classificá-las mais facilmente para pesquisa ou sinalizar conteúdo abusivo.
Não são todos os memes; A ferramenta examina mais de um bilhão de imagens e quadros de vídeo diariamente em vários idiomas em tempo real, de acordo com um post no blog da empresa.
O Rosetta faz uso de recentes avanços no reconhecimento óptico de caracteres (OCR) para primeiro digitalizar uma imagem e detectar o texto que está presente, no ponto em que os caracteres são colocados dentro de uma caixa delimitadora que é analisada por redes neurais convolucionais que tentam reconhecer os caracteres e determine o que está sendo comunicado.
Essa tecnologia já existe há algum tempo – o Facebook trabalha com o OCR desde 2015 -, mas implementá-la nas vastas redes da empresa oferece um alto grau de escala que motivou a empresa a desenvolver novas estratégias de detecção e reconhecimento de caracteres.
O Facebook tem muitas razões para se interessar pelo texto que acompanha os vídeos ou fotos, especialmente quando se trata de suas necessidades de moderação de conteúdo.