教授的团队仅用不到50美元(约港币HK$390)成功练习出一个名为“s1”的推理模型。这个模型在数学和编程才能测验中的体现,与OpenAI的o1和DeepSeek的R1等先进推理模型适当。这一成就让美国科技界惊叹,也显示出人工智能技能的竞赛越来越剧烈。
李飞飞团队的s1模型,采用了来自Google的推理模型Gemini 2.0 Flash Thinking Experimental的常识,并使用“蒸馏技能”改进其AI模型。蒸馏技能是一种模型紧缩办法,研究人员从一个大型、杂乱的模型(称为“教师模型”)中提取常识,再辅导一个较小、较简略的模型(即“学生模型”)进行学习。这样,学生模型能坚持较高功能,一起显着下降核算资源耗费。
从前DeepSeek团队曾发布其将OpenAI的练习本钱紧缩至本来的三十分之一,让许多人以为AI范畴的竞赛越发剧烈。然后李飞飞教授的团队在短短一个月内,便用不到50美元的本钱练习出了比美DeepSeek R1的AI推理模型,这无疑再次改写了本钱与功能之间的平衡。
李飞飞团队的成功标明,蒸馏技能的使用能改进与紧缩大型AI模型,还能在资源有限的环境下,坚持杰出的功能。这为未来在资源受限的环境中布置和运转大型AI模型供给了有用的解决方案。
李飞飞,这位被誉为“AI教母”的华裔科学家,在AI范畴的奉献不容忽视。她创建了全球最大的图画识别数据库——ImageNet,该数据库包含21,800个类别和超越1,400万张图画,对核算机视觉范畴的开展起到了及其重要的效果。现在,李飞飞是斯坦福大学的终身教授,也曾担任Google Cloud的首席科学家。
特别声明:以上内容(如有图片或视频亦包含在内)为自媒体渠道“网易号”用户上传并发布,本渠道仅供给信息存储服务。
上海地铁不明液体后续!相片曝光,猥琐男被扒是小领导老婆很美
参加医治医师回应“11岁男孩误吞100克金条两天后取出”:金条细长 金元素自身无直接损害
WCBA总决赛:四川女篮大胜东莞追到1-2 李梦24分王思雨破1300助攻
《编码物候》展览开幕 北京年代美术馆以科学艺术解读数字与生物交错的世界节律