Ciência e Tecnologia

Facebook cria projeto para ensinar inteligência artificial pela perspectiva humana

Iniciativa Ego4D usará mais de 2.200 horas de vídeo em primeira pessoa para permitir a criação de sistemas que entendam o mundo a partir do centro de ação

Por G1 17/10/2021 12h30
Facebook cria projeto para ensinar inteligência artificial pela perspectiva humana
Reprodução - Foto: Assessoria
O Facebook está trabalhando em um projeto para criar sistemas de inteligência artificial que saibam analisar imagens a partir da perspectiva de um ser humano, e não apenas como um observador. A expectativa da empresa é que a iniciativa ajude dispositivos de realidade aumentada e realidade virtual a entenderem melhor o ponto de vista em primeira pessoa. "A inteligência artificial geralmente aprende com fotos e vídeos capturados em terceira pessoa, mas a inteligência artificial de próxima geração precisará aprender com vídeos que mostram o mundo a partir do centro de ação", afirmou o Facebook. A iniciativa, batizada de Ego4D, prevê pesquisas a partir de mais de 2.200 horas de vídeo em primeira pessoa que foram gravadas em um projeto que acompanhou a rotina de 700 voluntários. Segundo o Facebook, o material foi coletado em parceria com 13 universidades e laboratórios de 9 países, e permitiu a criação de um conjunto de dados 20 vezes maior que qualquer outro disponível para pesquisadores. Como funciona o projeto do Facebook A empresa definiu cinco pilares para guiar o desenvolvimento de sistemas de inteligência artificial que serão treinados com essas imagens. Um deles é chamado de "memória episódica", que pode indicar o que e quando algo aconteceu. De acordo com a companhia, esse conceito poderá ajudar usuários a encontrarem objetos perdidos, por exemplo. O segundo conceito é o de "previsão", em que a inteligência artificial ajudaria com o que deve ser feito a seguir, como mostrar o próximo passo para preparar uma refeição. Há ainda o pilar de "manipulação de mãos e objetos", que seria capaz de entender o que um usuário está fazendo. O Facebook diz que ele poderia ser útil para ensinar a tocar um instrumento musical. O quarto pilar é chamado de "diarização audiovisual", que entenderia quem disse algo e quando isso aconteceu, e poderia resumir o assunto discutido em uma aula. O quinto pilar é o de "interação social", em que a inteligência artificial ajudaria o usuário a prestar mais atenção em um ponto específico, o que permitiria, por exemplo, ouvir melhor uma pessoa em um local barulhento. Para o Facebook, a criação de sistemas de inteligência artificial a partir de uma nova perspectiva pode "desbloquear uma nova era de experiências imersivas".