【财新网】“如果不具备泛用性,尽管模型比以前大一点、效果好一点,应用场景仍然是割裂的,这些中小模型和原来有什么区别?” 主攻预训练大模型的创始人、ceo张鹏近日接受财新专访时指出,他认为这一轮ai热潮建立在大模型的泛化能力上,业界普遍的认识是500一600亿参数是大模型智能涌现的门槛。
张鹏指出,尽管适用于单场景的模型需要参数量、成本相对较低,但一旦应用于新行业所有训练数据需要重新来过,泛化能力低。他认为,大模型参数降下来很容易,同时还能保持很强的能力,但一个中模型、小模型提升则很困难。“像之前cv(计算机视觉)那些模型只做人脸识别,给一个宠物照片就傻了,大模型可以往下降维,但小模型没法往上升维,”他说。