Novo modelo de IA da DeepSeek causa impacto e questionamentos entre concorrentes dos EUA

DeepSeek e o impacto no Vale do Silício

A startup chinesa DeepSeek abalou o Vale do Silício com seu novo modelo de inteligência artificial de código aberto. Desenvolvido com capacidades de ponta e um orçamento aparentemente modesto, o modelo R1 da DeepSeek está provocando conversas sobre uma iminente transformação na indústria tecnológica.

Transição tecnológica e inovação

Para alguns, o avanço da DeepSeek sinaliza que os EUA perderam sua vantagem em IA. No entanto, especialistas, incluindo executivos de empresas que constroem modelos de IA de ponta, veem isso como um sinal de uma transição tecnológica diferente. Em vez de criar modelos cada vez maiores que exigem recursos computacionais exorbitantes, as empresas de IA estão agora focando no desenvolvimento de capacidades avançadas, como o raciocínio. Isso criou uma oportunidade para startups menores e inovadoras, como a DeepSeek, que não receberam bilhões de dólares em investimentos externos.

Paradigma de raciocínio “É uma mudança de paradigma em direção ao raciocínio, e isso será muito mais democratizado”, diz Ali Ghodsi, CEO da Databricks. Ele destaca que a inovação e a criação de maior eficiência, ao invés de apenas lançar recursos computacionais ilimitados, estimularão a próxima rodada de avanços tecnológicos. A revelação dos detalhes do modelo R1 pela DeepSeek levou empresas como a Meta a considerarem o uso das técnicas subjacentes para reduzir seus próprios gastos com IA.

Desenvolvimento acessível A tecnologia da DeepSeek foi desenvolvida por um laboratório de pesquisa relativamente pequeno na China, derivado de um dos fundos de hedge quantitativos mais bem-sucedidos do país. Um artigo de pesquisa afirma que o modelo de linguagem da DeepSeek-V3 custou apenas US$ 5,6 milhões para ser construído, uma fração do que seus concorrentes gastam em projetos semelhantes. A eficiência dos modelos da DeepSeek já gerou discussões sobre redução de custos em grandes empresas de tecnologia.

Um engenheiro da Meta afirmou que a gigante tecnológica provavelmente examinará as técnicas da DeepSeek para encontrar maneiras de reduzir suas despesas com IA.

Impacto na indústria A DeepSeek já está provocando debates sobre a pressão nos lucros das empresas focadas em IA de consumo. Apesar de algumas reservas sobre a dependência de modelos chineses para tarefas sensíveis, empresas como a Perplexity usam o modelo R1 da DeepSeek, garantindo que ele esteja hospedado de forma “completamente independente da China”.

Capacidade de raciocínio Os modelos DeepSeek R1 e R1-Zero demonstram raciocínio simulado semelhante aos sistemas mais avançados da OpenAI e do Google. Eles funcionam dividindo problemas em partes constituintes para abordá-los de forma mais eficaz, exigindo um treinamento adicional significativo para garantir que a IA alcance a resposta correta de maneira confiável.

Hardware e desenvolvimento Um dos tópicos mais discutidos sobre a DeepSeek é o hardware que pode ter sido usado, especialmente devido às restrições de exportação dos EUA à China. A DeepSeek indicou que tem acesso a um cluster de 10.000 chips Nvidia A100, que estavam sob restrições dos EUA. Independentemente dos métodos usados, a DeepSeek parece mostrar que uma abordagem mais aberta no desenvolvimento de IA está ganhando força.