Recentemente, a startup DeepSeek abalou o mundo da inteligência artificial com a introdução de seu modelo de pesos abertos, treinado com uma fração dos chips especializados que alimentam líderes do setor. Isso gerou uma grande agitação dentro da OpenAI, levando a questionamentos sobre os gastos excessivos com computação. Funcionários da OpenAI sugeriram que a DeepSeek pode ter ‘destilado inadequadamente’ os modelos da OpenAI para criar seu próprio modelo.
Em resposta, a OpenAI está se preparando para lançar um novo modelo, o o3-mini, antes do previsto. Este modelo promete alta velocidade, baixo custo e inteligência, visando superar a DeepSeek. Segundo Niko Felix, porta-voz da OpenAI, o trabalho no o3-mini começou antes da estreia da DeepSeek, com o objetivo de lançamento até o final de janeiro.
A chegada da DeepSeek motivou a equipe da OpenAI a buscar mais eficiência, especialmente enquanto a nova startup domina as discussões. A OpenAI, que começou como uma organização de pesquisa sem fins lucrativos, agora enfrenta desafios internos entre grupos de pesquisa e produto. Alguns funcionários defendem a criação de um produto de chat unificado que possa identificar quando uma pergunta exige raciocínio avançado, mas isso ainda não foi implementado.
Internamente, há uma percepção de que o chat, embora traga grande parte da receita da OpenAI, recebe menos atenção e recursos de computação em comparação ao modelo o1. Ex-funcionários, sob anonimato, afirmam que a liderança foca mais no o1 devido ao seu apelo, mas a base de código não foi construída para experimentação, limitando o progresso.
A DeepSeek, por outro lado, avançou utilizando aprendizado por reforço, uma técnica que a OpenAI ajudou a popularizar. Ex-funcionários da OpenAI dizem que a DeepSeek conseguiu dados melhores e uma estrutura mais limpa para seu modelo R1. O projeto Sputnik da OpenAI, que buscava integrar diferentes partes do código, não foi totalmente realizado, causando frustração entre os desenvolvedores.
Apesar das dificuldades enfrentadas pela OpenAI, o setor está dividido sobre o sucesso da DeepSeek. Enquanto alguns veem a possibilidade de reduzir a necessidade de chips, outros acreditam que a empresa com mais chips ainda prevalecerá. O projeto Stargate da OpenAI, que inclui novos data centers e supercomputadores, pode aliviar a escassez interna de recursos.
Microsoft amplia portfólio de energia renovável A Microsoft deu um passo significativo ao adicionar 389…
A plataforma de e-commerce Shopify retirou do ar a loja online de Kanye West após…
O Google tomou a decisão de remover eventos como o Mês da História Negra e…
Uma nova direção para o projeto IVAS O Exército dos Estados Unidos está prestes a…
O Founders Fund, fundo de investimentos fundado por Peter Thiel, está prestes a finalizar a…
Entenda o processo contra Elon Musk e DOGE Um grupo de trabalhadores federais está processando…
This website uses cookies.