DoNews10月16日消息,据腾讯科技报道,零一万物今日正式发布了新的预训练模型 Yi-Lightning。在 Yi-Lightning的发布会上,李开复提到:“据我了解,目前“AI六小虎”在融资方面都有足够的资金支持,可以承担起预训练模型的运行成本。因此,只要这些公司能够吸引到足够的优秀人才,并有决心进行预训练模型的开发,资金和芯片资源都不会成为障碍。”
据了解, Yi-Lightning 与零一万物上半年发布的千亿参数模型 Yi-Large 相比,在性能更进一步的前提下,推理速度方面有着极大提升。
根据官方发布的评测数据显示,在 8xH100 算力基础下,以同样的任务规模进行测试,Yi-Lightning 的首包时间(从接收到任务请求到系统开始输出响应结果之间的时间)仅为 Yi-Large 的一半,最高生成速度也提升了近四成,实现了旗舰模型的性能升级。
在国际权威盲测榜单 LMSYS 上,Yi-Lightning 排名第六,暂时位列GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet之前。
根据李开复介绍,模型性能与推理速度的提升,一方面因为零一万物重视AI Infra能力的提升,2024年以来,中国大模型行业从狂奔进入到了“长跑阶段”,而大模型公司的核心竞争力模型+AI 基础设施+应用,缺一不可。
另外一方面,Yi-Lightning更新了模型架构,不再应用稠密模型架构,而是采用了 Mixture of Experts(MoE)混合专家模型架构,并在模型训练过程中做了新的尝试。
针对于行业长期热议的大模型公司并没有建立起真正的PMF问题,李开复进一步强调,核心在于基础模型能力需要真正强大及大模型成本还不足够低。
此外,李开复强调,要激活一个健康的生态系统,关键在于拥有顶级的模型,并且这些模型的价格要足够低,以促进应用的发展。如果模型太贵,可能会导致应用开发公司破产。