时政·财经·军事 | 生活·家庭·娱乐 | 体坛·历史·科技 | 摄影·旅游·文化 | 移民·教育·就业 | 数码·健康·奇闻 | 社区·评论·问卷
留园网首页 · 新闻速递首页 · 【繁體閱讀】 【网友评论:14 条】 【 热评新闻排行 】 【 热门新闻排行 】 【 即刻热度新闻排行 】 【 72小时神评妙论 】   

超速追赶!李开复:中美大模型技术差距被拉近至6个月(图)

新闻来源: 腾讯深网 于2024-05-23 17:30:33  提示:新闻观点不代表本网立场



5 月 21 日上午,李开复创立零一万物宣布,零一万物最新千亿参数模型 Yi-Large 在在LMSYS盲测竞技场最新排名中总榜排名世界模型第 7,中国大模型中第一,已经超过 Llama-3-70B、Claude 3 Sonnet。此外,文分榜中,Yi-Large 是与 GPT4o 并列世界第一。

这是一周内久未谋面的李开复第二次面对媒体。中国大模型曾因刷榜乱象广受争议,已经丧失了部分公信力。LMSYS Org是一个针对大型语言模型(LLMs)的研究组织,其发布的大语言模型评估排行榜也被称为大模型匿名竞技场。

“最近我可以想象在你们眼中的各种发布一定是眼花缭乱,因为我刚才跟一位国外朋友聊天,他说他最近见了3个大模型公司负责人,都号称自己世界第二,但是我前几天也看到国内有一篇文章是说中国落后美国 10 年,这两套话似乎不可能都是对的,但是有可能都是错的。”李开复阐述。

李开复指出,零一万物用一年时间把过去几年的技术差距缩短到目前的6个月(在榜单上超过了6个月前更新的海外大模型),“6个月的差别我觉得不是很大,这是以一个不可思议的超级速度在追赶。”李开复解释。

事实也的确如此。“追上ChatGPT 3.5水平,我觉得今年内可能就能够实现,但对于ChatGPT-4或者ChatGPT-5,我认为可能需要3年左右的时间,应该不会低于两年。”在2023年年初王小川曾告诉《AI光年》。

对比中美大模型的差距,李开复表示美国的科学家在突破性科研和创造力上没有对手,但中国人的勤奋、聪明和努力是不能忽视,比做产品,中国公司不一定输给美国公司。而在追赶问题上,李开复提到了算力局限问题。

“我们是一个务实的AGI的信仰者,美国AGI信仰者疯狂堆GPU,不顾成本,因为他们的财务情况跟我们不一样,又有投资人愿意投资,或者公司愿意拨款。零一万物一直秉着我们不要用那么多GPU,我们的GPU就只有Google、Microsoft的5%。”李开复非常坦诚的说。

零一万物主张把一张GPU挤出更多的价值,此外是优化模型表现,涉及到数据配比,引入多模态等技术细节。

一方面中国大模型在技术上对GPT4的追赶如火如荼,而另外一方面,中国大模型的价格战也是风起云涌,战况焦灼。5月21日,阿里云宣布旗下大模型产品全线降价,而不久前刚官宣低价大模型的字节跳动,而下午百度立即宣布两款文心一言大模型免费。

谈及价格战,李开复表示:“我们的定价非常合理,而且我们也在花很大精力希望能够让它再降下来,我觉得一定程度上,整个行业每年降低10倍推理成本是可以期待的,而且也应该发生。今天可能处在一个比较低的点,但是我觉得如果说以后大约以一年降价10倍来看,这是一个好消息,因为今天的 API 模型调用还是一个非常低的比例,如果一年降低10倍,那众多的人都可以用上。”

“100 万个 token 花十几块还是花几块钱有很大差别吗?100 万的 token 对于很大、很难的应用,我们是必然之选。我们发布之后得到国内外非常高的评价,而且是可以横跨中国和外国的 API,都开放,我们有信心在全球范畴是一个表现很好、性价比也很合理的一个模型。”李开复阐述。

在李开复看来,大模型领域如果出现ofo式的疯狂降价是双输的打法,大模型公司不会这么不理智,因为技术是重要的。

			
网编:睿文

鲜花(3)

鸡蛋(2)
14 条
【手机扫描浏览分享】

扫一扫二维码[Scan QR Code]
进入内容页点击屏幕右上分享按钮
敬请注意:新闻内容来自网络,供网友多视角阅读参考,观点不代表本网立场!若有违规侵权,请联系我们。
新闻速递首页 | 近期热门新闻 | 近期热评新闻 | 72小时神评妙论 | 即刻热度新闻排行
科技频道】【宠物情缘
前期相关精彩新闻
新闻速递首页·向留园新闻区投稿·本地新闻·返回前页