【财新网】
马斯克旗下xai发布大模型grok-1.5
3月29日,埃隆·马斯克创立的xai公司发布新的ai大模型grok-1.5。grok-1.5能处理的上下文长度从grok-1的8192 token提升到12.8万个token,与gpt-4一样能够处理更长、更复杂的提示词;在处理编程和数学相关任务方面,推理能力大幅提升,全面超越grok-1、claude 2等大模型,humaneval基准测试达到74.1%,超过gpt-4。另外,grok-1.5 采用分布式训练架构,基于jax、rust和kubernetes的训练框架,而不是用通用的python语言与pytorch框架。xai表示,将很快提供grok-1.5给早期测试人员,在未来几天内将推出几项新功能。