Inteligência Artificial

Qwen 2.5-Max supera DeepSeek V3 em alguns benchmarks

Qwen 2.5-Max: A resposta da Alibaba ao DeepSeek

A Alibaba lançou sua mais nova aposta em modelos de larga escala, o Qwen 2.5-Max, desenvolvido com base no conceito de Mixture-of-Experts (MoE). Esse modelo foi pré-treinado com mais de 20 trilhões de tokens e refinado através de técnicas avançadas como Fine-Tuning Supervisionado (SFT) e Aprendizado por Reforço a partir de Feedback Humano (RLHF).

Desempenho superior em benchmarks

O Qwen 2.5-Max, quando comparado a outros modelos de inteligência artificial proeminentes, revelou resultados promissores em diversos benchmarks. Entre os testes utilizados estão o MMLU-Pro para resolução de problemas de nível universitário, LiveCodeBench para avaliação de habilidades em programação, LiveBench para capacidades gerais e Arena-Hard para comparação de preferências humanas.

De acordo com a Alibaba, “Qwen 2.5-Max supera o DeepSeek V3 em benchmarks como Arena-Hard, LiveBench, LiveCodeBench e GPQA-Diamond, além de apresentar resultados competitivos em outras avaliações, incluindo o MMLU-Pro.”

Modelo acessível para desenvolvedores

Para ampliar o acesso ao modelo, a Alibaba integrou o Qwen 2.5-Max à sua plataforma Qwen Chat, permitindo que os usuários interajam diretamente com o modelo em diversas capacidades. O API do Qwen 2.5-Max está disponível através da Alibaba Cloud, facilitando a integração para desenvolvedores interessados.

A compatibilidade com o ecossistema da OpenAI torna a integração direta para projetos existentes, reduzindo barreiras para quem deseja testar as aplicações com as capacidades do modelo.

Avanços e futuro da IA na Alibaba

A Alibaba demonstra um compromisso contínuo na expansão dos modelos de IA, visando não apenas melhorar o desempenho dos benchmarks, mas também aprimorar as habilidades de raciocínio e pensamento dos sistemas. Olhando para o futuro, a equipe da Alibaba planeja explorar novas fronteiras no aprendizado por reforço, com o objetivo de desenvolver modelos que possam superar a inteligência humana na resolução de problemas complexos.

As implicações para a indústria podem ser significativas, à medida que métodos de escalonamento melhoram e os modelos Qwen continuam a inovar, é provável que vejamos impactos em campos impulsionados por IA globalmente.

Rony Max

Especialista em IA, inovação e estratégia de negócios. Founder Abre.bio, Co-Founder Growby.ai. Transformando tecnologia em impacto real. 🚀

Recent Posts

Microsoft avança em suas ambições de IA com compra de 400 MW de energia solar

Microsoft amplia portfólio de energia renovável A Microsoft deu um passo significativo ao adicionar 389…

1 mês ago

Shopify remove loja online de Kanye com camisetas de suástica

A plataforma de e-commerce Shopify retirou do ar a loja online de Kanye West após…

1 mês ago

Google remove eventos culturais de seu calendário no ano passado

O Google tomou a decisão de remover eventos como o Mês da História Negra e…

1 mês ago

Anduril assume controle do programa militar de headset VR da Microsoft

Uma nova direção para o projeto IVAS O Exército dos Estados Unidos está prestes a…

1 mês ago

Founders Fund está prestes a fechar novo fundo de US$ 3 bilhões

O Founders Fund, fundo de investimentos fundado por Peter Thiel, está prestes a finalizar a…

1 mês ago

Trabalhadores federais processam Elon Musk e DOGE por acesso a dados

Entenda o processo contra Elon Musk e DOGE Um grupo de trabalhadores federais está processando…

1 mês ago

This website uses cookies.