Tecnologia

17 de outubro de 2021 12:30

Facebook cria projeto para ensinar inteligência artificial pela perspectiva humana

Iniciativa Ego4D usará mais de 2.200 horas de vídeo em primeira pessoa para permitir a criação de sistemas que entendam o mundo a partir do centro de ação

↑ Facebook diz que inteligência artificial precisa entender ponto de vista em primeira pessoa (à direita), e não apenas em terceira pessoa (à esquerda) (Foto: Reprodução / Facebook)

O Facebook está trabalhando em um projeto para criar sistemas de inteligência artificial que saibam analisar imagens a partir da perspectiva de um ser humano, e não apenas como um observador.

A expectativa da empresa é que a iniciativa ajude dispositivos de realidade aumentada e realidade virtual a entenderem melhor o ponto de vista em primeira pessoa.

“A inteligência artificial geralmente aprende com fotos e vídeos capturados em terceira pessoa, mas a inteligência artificial de próxima geração precisará aprender com vídeos que mostram o mundo a partir do centro de ação”, afirmou o Facebook.

A iniciativa, batizada de Ego4D, prevê pesquisas a partir de mais de 2.200 horas de vídeo em primeira pessoa que foram gravadas em um projeto que acompanhou a rotina de 700 voluntários.

Segundo o Facebook, o material foi coletado em parceria com 13 universidades e laboratórios de 9 países, e permitiu a criação de um conjunto de dados 20 vezes maior que qualquer outro disponível para pesquisadores.

Como funciona o projeto do Facebook

A empresa definiu cinco pilares para guiar o desenvolvimento de sistemas de inteligência artificial que serão treinados com essas imagens.

Um deles é chamado de “memória episódica”, que pode indicar o que e quando algo aconteceu. De acordo com a companhia, esse conceito poderá ajudar usuários a encontrarem objetos perdidos, por exemplo.

O segundo conceito é o de “previsão”, em que a inteligência artificial ajudaria com o que deve ser feito a seguir, como mostrar o próximo passo para preparar uma refeição.

Há ainda o pilar de “manipulação de mãos e objetos”, que seria capaz de entender o que um usuário está fazendo. O Facebook diz que ele poderia ser útil para ensinar a tocar um instrumento musical.

O quarto pilar é chamado de “diarização audiovisual”, que entenderia quem disse algo e quando isso aconteceu, e poderia resumir o assunto discutido em uma aula.

O quinto pilar é o de “interação social”, em que a inteligência artificial ajudaria o usuário a prestar mais atenção em um ponto específico, o que permitiria, por exemplo, ouvir melhor uma pessoa em um local barulhento.

Para o Facebook, a criação de sistemas de inteligência artificial a partir de uma nova perspectiva pode “desbloquear uma nova era de experiências imersivas”.

Fonte: G1

Comentários

MAIS NO TH