Um dos mais importantes cientistas de IA da Big Tech busca abandonar a abordagem atual para construir inteligência artificial em nível humano. Yann LeCun indica que o que precisamos não são grandes modelos de linguagem, mas sim "modelos do mundo". LeCun, cientista-chefe de IA de "pesquisa fundamental em IA" no Meta, deve deixar a empresa em breve, de acordo com diversos relatos de fontes confiáveis. LeCun, com 65 anos, é uma figura proeminente no mundo da ciência da IA e aparentemente tinha recursos ilimitados à sua disposição trabalhando como o principal cérebro de IA em uma das maiores empresas de tecnologia do mundo. Por que ele está deixando uma empresa que tem gasto generosamente, atraindo os especialistas em IA mais qualificados de outras empresas e, de acordo com uma publicação de julho do CEO Mark Zuckerberg, fazendo avanços internos tão surpreendentes que supostamente o desenvolvimento da "superinteligência está agora à vista"? Ele tem insinuado a resposta há muito tempo. Quando se trata de inteligência em nível humano, LeCun se tornou notório ultimamente por dizer que os LLMs, como os entendemos atualmente, são inúteis - não valem mais a pena serem perseguidos, não importa o quanto a Big Tech os escale. Ele disse em abril do ano passado que "um LLM é basicamente uma saída, uma distração, um beco sem saída". (O crítico de IA Gary Marcus criticou LeCun por defender "beligerantemente" os LLMs das críticas de Marcus e depois mudar de ideia
.) Uma análise da carreira de LeCun pelo Wall Street Journal publicada na sexta-feira aponta para outras possibilidades sobre as razões de sua saída à luz dessa crença. Neste verão, um jovem de 28 anos chamado Alexandr Wang - o co-criador da sensação baseada em LLM ChatGPT - tornou-se o chefe de IA no Meta, tornando um fanático por LLM, LeCun, seu chefe. E o Meta trouxe outro cientista-chefe relativamente jovem para trabalhar acima de LeCun este ano, Shengjia Zhao. O anúncio do Meta sobre o novo papel de Zhao exalta uma "inovação" de dimensionamento que ele aparentemente entregou. LeCun diz que perdeu a fé no dimensionamento. Se você está se perguntando como LeCun pode ser um cientista-chefe se Zhao também é um cientista-chefe, é porque a operação de IA do Meta parece ter um organograma excêntrico, dividido em vários grupos separados. Centenas de pessoas foram demitidas no mês passado, aparentemente em um esforço para endireitar tudo isso. O relatório do Financial Times sobre LeCun do início desta semana sugere que LeCun agora fundará uma startup focada em "modelos do mundo". Novamente, LeCun não tem hesitado em explicar por que ele acha que os modelos do mundo têm as respostas que a IA precisa. Ele fez um discurso detalhado sobre isso na Cúpula de Ação de IA em Paris em fevereiro, mas foi ofuscado pelo representante dos EUA, o vice-presidente J.D. Vance, que fez um discurso belicoso sobre como todos deveriam sair do caminho da América na IA. Por que Yann LeCun é fascinado por modelos do mundo? Como explicado em seu discurso - LeCun, que trabalhou nos óculos inteligentes Meta AI, mas não em grande medida no Llama LLM do Meta - é um grande defensor de wearables. Precisaremos interagir com wearables futuros como se fossem pessoas, ele pensa, e os LLMs simplesmente não entendem o mundo como as pessoas entendem. Com os LLMs, ele diz, "não podemos nem reproduzir a inteligência de um gato ou de um rato, muito menos a inteligência de um cachorro. Eles podem realizar feitos incríveis. Eles entendem o mundo físico. Qualquer gato doméstico pode planejar ações muito complexas. E eles têm modelos causais do mundo". LeCun fornece um experimento mental para ilustrar o que ele acha que pode impulsionar - se assim o quiser - um modelo do mundo, e é algo que ele acha que qualquer humano pode fazer facilmente, mas que um LLM simplesmente não pode: "Se eu disser 'imagine um cubo flutuando no ar na sua frente. Ok, agora gire este cubo em 90 graus em torno de um eixo vertical. Como ele se parece?' É muito fácil para você ter esse modelo mental de um cubo girando". Com muito pouco esforço, um LLM pode escrever um limerick obsceno sobre um cubo pairando e girando, com certeza, mas ele não pode realmente ajudá-lo a interagir com um. LeCun afirma que isso se deve a uma diferença entre dados de texto e dados derivados do processamento das muitas partes do mundo que não são texto. Enquanto os LLMs são treinados em uma quantidade de texto que levaria 450.000 anos para ler, LeCun diz, uma criança de quatro anos que está acordada há 16.000 horas processou, com os olhos ou tocando, 1,4 x 10^14 bytes de dados sensoriais sobre o mundo, o que ele diz ser mais do que um LLM. Estes, a propósito, são apenas as estimativas que LeCun dá em seu discurso, e deve-se notar que ele deu outras. A abstração a que os números apontam, no entanto, é que os LLMs são limitados de maneiras que LeCun acha que os modelos do mundo não seriam. Que modelo LeCun quer construir, e como ele vai construí-lo? LeCun já começou a trabalhar em modelos do mundo no Meta - incluindo a produção de um vídeo introdutório que implora que você imagine um cubo girando. O modelo dos sonhos de LeCun, conforme descrito em seu discurso na AI Action Summit, contém uma "estimativa do estado do mundo" atual, na forma de algum tipo de representação abstrata de, bem, tudo, ou pelo menos tudo o que é relevante no contexto atual, e em vez de previsão sequencial e tokenizada, ele "prevê o estado resultante do mundo que ocorrerá depois que você realizar essa sequência de ações". Os modelos do mundo permitirão que futuros cientistas da computação construam, ele diz, "sistemas que podem planejar ações - possivelmente hierarquicamente - de modo a cumprir um objetivo, e sistemas que podem raciocinar". LeCun também insiste que esses sistemas terão recursos de segurança mais robustos, porque as maneiras pelas quais os controlamos serão construídas neles, em vez de serem caixas pretas misteriosas que vomitam texto e que precisam ser refinadas por meio de ajustes finos. No que LeCun diz ser IA clássica - como o software usado em um mecanismo de busca - todos os problemas são redutíveis à otimização. Seu modelo do mundo, ele sugere, analisará o estado atual do mundo e buscará compatibilidade com algum estado diferente, encontrando soluções eficientes. "Você quer uma função de energia que meça a incompatibilidade e, dado um x, encontre um y que tenha baixa energia para esse x", diz LeCun em seu discurso. Novamente, estes são apenas relatos confiáveis de informações vazadas sobre os planos de LeCun, e ele nem confirmou que está fundando algo novo. Se tudo o que podemos juntar das declarações públicas de LeCun soa hesitante e um pouco confuso na fase atual, deveria. LeCun parece ter um projeto ambicioso em mente, e ele está pressionando por outra explosão de habilidades misteriosas semelhante ao ChatGPT. Poderia levar muito tempo - ou literalmente para sempre - sem mencionar bilhões de dólares de investidores, para que algo verdadeiramente notável se materialize. A Gizmodo entrou em contato com o Meta para obter comentários sobre como o trabalho de LeCun se encaixa na missão de IA da empresa e atualizará se recebermos uma resposta.
📝 Sobre este conteúdo
Esta matéria foi adaptada e reescrita pela equipe editorial do TudoAquiUSA
com base em reportagem publicada em
Gizmodo
. O texto foi modificado para melhor atender nosso público, mantendo a precisão
factual.
Veja o artigo original aqui.
0 Comentários
Entre para comentar
Use sua conta Google para participar da discussão.
Política de Privacidade
Carregando comentários...
Escolha seus interesses
Receba notificações personalizadas