A Alibaba lançou sua mais nova aposta em modelos de larga escala, o Qwen 2.5-Max, desenvolvido com base no conceito de Mixture-of-Experts (MoE). Esse modelo foi pré-treinado com mais de 20 trilhões de tokens e refinado através de técnicas avançadas como Fine-Tuning Supervisionado (SFT) e Aprendizado por Reforço a partir de Feedback Humano (RLHF).
O Qwen 2.5-Max, quando comparado a outros modelos de inteligência artificial proeminentes, revelou resultados promissores em diversos benchmarks. Entre os testes utilizados estão o MMLU-Pro para resolução de problemas de nível universitário, LiveCodeBench para avaliação de habilidades em programação, LiveBench para capacidades gerais e Arena-Hard para comparação de preferências humanas.
De acordo com a Alibaba, “Qwen 2.5-Max supera o DeepSeek V3 em benchmarks como Arena-Hard, LiveBench, LiveCodeBench e GPQA-Diamond, além de apresentar resultados competitivos em outras avaliações, incluindo o MMLU-Pro.”
Para ampliar o acesso ao modelo, a Alibaba integrou o Qwen 2.5-Max à sua plataforma Qwen Chat, permitindo que os usuários interajam diretamente com o modelo em diversas capacidades. O API do Qwen 2.5-Max está disponível através da Alibaba Cloud, facilitando a integração para desenvolvedores interessados.
A compatibilidade com o ecossistema da OpenAI torna a integração direta para projetos existentes, reduzindo barreiras para quem deseja testar as aplicações com as capacidades do modelo.
A Alibaba demonstra um compromisso contínuo na expansão dos modelos de IA, visando não apenas melhorar o desempenho dos benchmarks, mas também aprimorar as habilidades de raciocínio e pensamento dos sistemas. Olhando para o futuro, a equipe da Alibaba planeja explorar novas fronteiras no aprendizado por reforço, com o objetivo de desenvolver modelos que possam superar a inteligência humana na resolução de problemas complexos.
As implicações para a indústria podem ser significativas, à medida que métodos de escalonamento melhoram e os modelos Qwen continuam a inovar, é provável que vejamos impactos em campos impulsionados por IA globalmente.
Microsoft amplia portfólio de energia renovável A Microsoft deu um passo significativo ao adicionar 389…
A plataforma de e-commerce Shopify retirou do ar a loja online de Kanye West após…
O Google tomou a decisão de remover eventos como o Mês da História Negra e…
Uma nova direção para o projeto IVAS O Exército dos Estados Unidos está prestes a…
O Founders Fund, fundo de investimentos fundado por Peter Thiel, está prestes a finalizar a…
Entenda o processo contra Elon Musk e DOGE Um grupo de trabalhadores federais está processando…
This website uses cookies.