Topo

O que as inteligências artificiais do Facebook conseguem fazer

Mike Schroepfer, chefe de tecnologia do Facebook, foi o apresentador da vez na F8 - Reprodução
Mike Schroepfer, chefe de tecnologia do Facebook, foi o apresentador da vez na F8 Imagem: Reprodução

Rodrigo Trindade

Do UOL, em São Paulo

03/05/2018 04h00

Enquanto o primeiro dia da conferência de desenvolvedores F8 focou em novas funcionalidades para os produtos do Facebook, o segundo, realizado nesta quarta-feira (2), serviu como vitrine para os avanços em inteligência artificial que a empresa tem feito. E deu para ter uma boa ideia daquilo que o cérebro da rede social já consegue fazer. Saca só:

Aprender com sua foto de comida no Instagram

O Facebook tem aproveitado a base de dados de bilhões de imagens do Instagram, sua outra rede social, para aprimorar o reconhecimento de objetos de seus robôs. Em vez de educar suas máquinas com base na análise manual de fotos, feitas por pessoas e suas anotações, a empresa passou a usar fotos públicas acompanhadas de hashtags que servem para identificar especificamente os elementos da imagem.

Sabe aquela foto do x-salada que você postou, com hashtag, em seu perfil? Ela ajuda os robozinhos do Facebook a saberem que aquele lanche não é apenas um hambúrguer qualquer.

VEJA TAMBÉM

"Dependemos quase inteiramente de bases de dados curadas manualmente e identificadas por humanos. Se uma pessoa não gasta o tempo para legendar algo específico em uma imagem, até o sistema mais avançado de visão computacional não será capaz de identificá-la", declarou Mike Schroepfer, chefe de tecnologia do Facebook.

Por meio do Instagram, o Facebook tem em mãos bilhões de imagens curadas e identificadas pelos próprios usuários, o que acelerou esse processo de aprendizagem de máquina. “Produzimos resultados incríveis que são de 1% a 2% melhores que qualquer outro sistema nas referências [do banco de dados] ImageNet”, completou o executivo.

Filtros do Instagram para o corpo inteiro

Na apresentação, o Schroepfer também demonstrou uma tecnologia de mapeamento de imagens em 3D, aplicável a vídeos. Sabe os filtros do Instagram Stories? Pense em uma utilidade semelhante, só que não se limita apenas a rostos, podendo ser aplicada ao corpo humano em movimento em vídeos.

Essa é a DensePose, uma visual de realidade aumentada criadas pela empresa, com lançamento aberto ao público nas próximas semanas.

Proteger contra terrorismo ou bullying

Saindo do campo imagético, o Facebook também falou sobre seus esforços para criar uma inteligência artificial com compreensão de linguagem. Com base nela, a empresa quer filtrar melhor, de forma automática, o que é inapropriado para a plataforma.

Mark Zuckerberg tem destacado a dificuldade de implementação deste tipo de tecnologia, dadas as nuances da linguagem em diferentes contextos e idiomas. Para conteúdo terrorista e spam, as ferramentas têm funcionado bem, assim como para ajudar na prevenção de suicídios, usando como base o texto publicado por usuários.

O maior desafio continua sendo o combate ao discurso de ódio, mais difícil de identificar de forma automática. Exemplos de imagem foram mostrados para explicar a ambiguidade que o texto pode apresentar, dificultando a atuação de um filtro por inteligência artificial. Para isso a empresa contratará 20 mil moderadores de conteúdo, capazes de tirar dúvidas levantadas por computadores.

Com o aperfeiçoamento dessas tecnologias, a rede social quer dar mais seguranças aos seus usuários, seja no uso da plataforma ou na vida real, com a coibição da divulgação de conteúdo terrorista. Esta é uma área em que a inteligência artificial já é muito eficaz, pois no primeiro trimestre deste ano, mais de 2 milhões de peças de "propaganda terrorista" foram detectadas por sistemas, 99% delas antes de qualquer humano vê-las.

Compreensão de ambientes

Outro produto é a House 3D, que acelerará o treinamento de sistemas robóticos para entender o ambiente em que eles estão. Desta forma, o desenvolvimento de assistentes caseiros autônomos será acelerado, criando robôs mais inteligentes na interação com diferentes locais.

Tradução de línguas

Em vez de usar métodos tradicionais de tradução a Multilingual Unsupervised and Supervised Embeddings (Muse) trabalha sem precisar de treinamentos em idiomas específicos ou de traduções intermediárias, a fim de converter um texto em outro.

Multilingual Unsupervised and Supervised Embeddings  - Divulgação - Divulgação
Palavras próximas são usadas para facilitar tradução pela Muse
Imagem: Divulgação

Esta é uma ferramenta de processamento natural de idiomas que classifica texto a partir de associações de palavras multilíngues, ou seja, que estão em mais de um dicionário. O Facebook apresentou como exemplo o futebol - e palavras associadas a ele. Com os casos do inglês e do turco, ele mostrou como palavras se assemelham ("goal" e "gol", especificamente), o que induz a tradução de outros termos como "soccer" e "futbol" e "ball" e "top" (bola).

Este é o ponto de partida para a fórmula complexa criada pela rede social, a qual facilita traduções de novos produtos e funções para línguas além do inglês, que é o idioma usado primeiramente no desenvolvimento.