【财新网】开源大模型的推手meta发新一代模型。北京时间4月19日凌晨,美国社交巨头meta(nasdaq: meta)宣布推出llama 3开源模型系列,将陆续登陆亚马逊aws、databricks、谷歌云、hugging face等大模型平台。meta称,还会在接下来数月的时间提供更强的长文本能力、多种尺寸、多语言的模型,目标是打造最好的基座模型。
具体来看,此次发布的包括80亿、700亿参数的两个预训练语言模型,根据meta的数据,在考察常识能力、学科知识、代码能力、数学能力的数据集榜单中,80亿参数的版本全面领先谷歌的轻量开源模型gemma 7b–it,和欧洲大模型公司mistral的开源模型mistral 7b instruct;700亿参数版本的整体得分小幅领先谷歌闭源模型gemini pro 1.5和anthropic的闭源模型claude 3 sonnect。