Pesquisadores da Microsoft estão usando o ChatGPT para instruir robôs e drones

mão-de-robô.jpg

O ChatGPT da OpenAI não é apenas bom em gerar respostas de texto coerentes para comandos de linguagem natural - ele também pode desempenhar um papel em interações humano-robô e usar o feedback do sensor para escrever código para ações do robô.

A Microsoft recentemente conduziu uma pesquisa para "ver se o ChatGPT consegue pensar além do texto e raciocinar sobre o mundo físico para ajudar em tarefas de robótica". O objetivo era ver se as pessoas podem usar o ChatGPT para instruir robôs sem aprender linguagens de programação ou entender sistemas robóticos.

Em profundidade: Esses especialistas estão correndo para proteger a inteligência artificial de hackers. O tempo está se esgotando

"O desafio chave aqui é ensinar o ChatGPT a resolver problemas considerando as leis da física, o contexto do ambiente operacional e como as ações físicas do robô podem mudar o estado do mundo", observa uma equipe da Pesquisa em Sistemas Autônomos e Robótica da Microsoft em um post de blog.

Os pesquisadores da Microsoft exploraram a capacidade do ChatGPT de gerar código, principalmente em Python, para cenários de robótica, como planejamento "zero-shot" e geração de código, após o ChatGPT ter acesso a dados de detecção de objeto e distância de objeto por meio de interfaces de aplicativo.

O ChatGPT pode produzir código porque foi treinado em grandes quantidades de código e texto escrito. O sistema mostrou ser capaz de resolver problemas de codificação e depurar programas, com a capacidade exclusiva de responder a diálogos e buscar esclarecimentos. Há também o Codex, modelo baseado no GPT-3 da OpenAI que sustenta o serviço de programação emparelhada do GitHub, conhecido como GitHub's Copilot, que completa o código automaticamente para desenvolvedores em várias linguagens de programação.

Também: O que é ChatGPT? Aqui está tudo o que você precisa saber

Levando em consideração essas capacidades de diálogo e esclarecimento, a Microsoft testou a capacidade do ChatGPT como uma interface baseada em linguagem entre um usuário não técnico e um drone. Como os pesquisadores observam em um artigo, embora o GPT-3, LaMDA e Codex tenham mostrado promessa em tarefas de planejamento de robótica e geração de código, o ChatGPT especificamente é "uma ferramenta potencialmente mais versátil para o domínio da robótica, pois incorpora as forças dos modelos de linguagem natural e geração de código juntamente com a flexibilidade do diálogo".

Os pesquisadores observam em seu post no blog: "ChatGPT fez perguntas de esclarecimento quando as instruções do usuário eram ambíguas e escreveu estruturas de código complexas para o drone, como um padrão de zigue-zague para inspecionar visualmente as prateleiras".

A Microsoft testou o ChatGPT para utilizar um braço robótico para mover blocos ao redor a fim de formar o logo da Microsoft. Os pesquisadores também deram ao ChatGPT a tarefa de escrever um algoritmo para um drone alcançar um ponto sem colidir com obstáculos. Além disso, testaram se o ChatGPT pode decidir para onde um robô deve ir com base no feedback dos sensores em tempo real.

Pesquisadores da Google Research e da Everyday Robots, empresa pertencente à Alphabet, também trabalharam em desafios semelhantes de robótica usando modelos de linguagem em grande escala chamados de PaLM ou Pathways Language Model, que ajudou um robô a processar prompts abertos e responder de maneira razoável.

Artigos Relacionados

Ver Mais >>