【财新网】开源大模型再迭代。6月7日,在开源社区上线了qwen2系列模型,包含5亿、15亿、70亿、570亿、720亿,五个参数版本的模型,其中qwen2-72b模型在多个测评榜单的成绩超过了meta 4月发布的llama3-70b模型,qwen2-57b则为阿里云第二款混合专家模型(moe),moe架构在相同算力资源下性能更强,被认为是大模型技术趋势。
阿里云提供的数据显示,在考察常识能力、逻辑推理、数学能力的多个测评榜单中,llama3-70b、法国大模型公司mistral ai旗下的mixtral-8x22b、阿里云2月发布的qwen1.5-110b此前位于第一梯队,榜单得分各有胜负,此次发布的qwen2-72b得分则全面领先上述三款模型。