查看原文
其他

对话李开复:中美大模型差距不断缩小,零一万物单一产品收入今年将达1亿元|钛媒体AGI

林志佳 钛媒体AGI
2024-09-05

钛媒体App获悉,5月13日上午,创新工场董事长兼CEO、零一万物CEO李开复博士,在北京发布全新零一万物千亿参数Yi-Large闭源模型,以及包括开源模型等产品矩阵,并披露公司今年To C单一产品收入达1亿元人民币。

演讲中,李开复表示,“一年前,中国大模型感觉太落后(于美国)了。但今天我们非常自豪的说,我们(零一万物)狂奔了一年,在模型方面至少赶上了美国最顶尖、一年前发布的(大模型)产品,当然以后还要继续努力。但是,我们对未来会需要有一个沉淀和展望,不能只是拼命狂奔。”

“我非常希望让全民都能够了解 AI 技术价值,”被问及杨植麟套现话题,李开复回应称,尽管不点评公司情况,但他创立零一万物的时候向投资人承诺,10年内不套现,而且他认为最好的套现方式是“赶快上市”,这是其未来两年努力的目标。

针对中国如何追赶美国大厂不断迭代新模型,李开复回应钛媒体App称,针对国外持续迭代,零一万物的新模型已训练一半,之后会朝着美国大模型继续进步。

“我们不能保证一定赶上它超过它,或者gap有多少,但是我们用适合我们的方法快速推进,既然我们不能用10万张GPU来训练,我们就会寻找别的方式,依然能做出非常好的效果。”李开复表示。

据悉,零一万物(01.AI)成立于2023年5月16日,致力于打造全新的 AI 2.0 平台与AI-first生产力应用的全球化公司,由创新工场董事长兼CEO李开复创立,并担任零一万物CEO。

2023年11月,零一万物发布首款研发的开源 AI 大模型系列“Yi”,包括60亿、340亿参数的Yi-6B、34B两个版本,性能超越;今年3月,零一万物公布基于全导航图的新型向量数据库,名为笛卡尔(Descartes)。

今年5月,零一万物推出首款免费一站式 AI 工作平台“万知”,不仅可以速读60万字《马斯克传》,做会议纪要、周报、写作助手,而且还可以解读财报、论文等各类文件,以及帮你手机一键生成PPT。同时,零一万物宣布李开复出任万知首席体验官。

融资层面,截至目前,零一万物已完成由阿里云领投的融资,估值已超过10亿美元,跻身独角兽行列。

距离“万知”发布仅隔了不到一周,今天,零一万物CEO李开复再度进行演讲,并且“破天荒”地在抖音开设新账号进行直播。

李开复演讲主要分为三部分:零一万物产品矩阵介绍;沉淀和TC-PMF(Technolog-Cost-Product-Market-Fit,技术成本X产品市场契合度)理论;以及最后采访问答。

首先,李开复公布零一万物整个产品矩阵,包括开源Yi-34B、Yi-9B、Yi-VL、Yi-6B、Yi-Spark API、Yi-Medium API、Yi-Vision API六个模型组成的开源系统,闭源包括Yi-Large API、Yi-XLarge APl、2C 生产力应用 “万知”以及更多Al-First应用。

零一万物称,在国际领先的底座模型之上,零一万物实现了从应用到生态的产品。李开复认为,这不是一个模式,不是一个产品,而是众多的矩阵。零一万物要让全世界的人都能用上这个模式,肯定要顾及到开源、闭源,To B、To C等各个领域。

性能基准层面,李开复以千亿参数规模的 Yi-Large为例。在第三方权威评测中,零一万物 Yi 模型在全球头部大模型的中英文双语 PK 上表现出色。最新出炉的斯坦福评测机构 AlpacaEval 2.0 经官方认证的模型排行榜上,Yi-Large 模型的英语能力主要指标 LC Win Rate(控制回复的长度) 排到了世界第二,仅次于 GPT-4 Turbo,Win Rate 更排到了世界第一,此前国内模型中仅有 Yi 和 Qwen 曾经登上此榜单的前 20。此外,零一万物将早先发布的Yi-34B、Yi-9B/6B 中小尺寸开源模型版本也升级为Yi-1.5 系列,每个版本达到同尺寸中 SOTA 性能最佳。

商业化层面,零一万物今天面向国内市场一次性发布了包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多款模型 API 接口,保证客户能够在不同场景下都能找到最佳性能、最具性价比的方案,Yi API Platform 英文站同步对全球开发者开放试用申请。

其中,Yi-Medium API 优势在于指令遵循能力,适用于常规场景下的聊天、对话、翻译等场景;如果需要超长内容文档相关应用,也可以选用 Yi-Medium-200K API,一次性解读20万字不在话下;Yi-Vision API 具备高性能图片理解、分析能力,可服务基于图片的聊天、分析等场景;Yi-Spark API 则聚焦轻量化极速响应,适用于轻量化数学分析、代码生成、文本聊天等场景。

李开复强调,零一万物的千亿参数模型在评测阶段已超越GPT-4。而且零一万物已经与GPT-4“并列全球第一”。

“我们也深深了解国外的大厂都在做产品更新,包括OpenAI可能不久之后也会有发布,所以我们也不会认为今天并列世界第一是最低的宗旨,它只是一个开始,之后随着国外模型进步,我们也会进步,希望能够在彼此互相敦促之下,让全世界的用户都能享用到最好的模型。”李开复称。

另外,对于C端应用,零一万物透露,接入自研向量数据库后,其C端应用在保证响应速率与准确性的前提下,成本大幅降至了原用第三方向量数据库时的18%。在端到端 FP8 训练的前提下,零一万物能够采用技术和工程手段得到与更高精度类型相媲美的训练结果,与此同时模型训练所需的显存占用、通讯带宽都极大降低。在背后,零一万物还与英伟达进行合作。

零一万物称,Yi-Large 训练环节的平均 MFU(模型算力利用率)已显著超越业内平均水平。多方面优化后,其千亿参数模型的训练成本同比降幅达一倍之多。

其次是大模型沉淀和“模基共建”等理论,以及零一万物的发展目标。

李开复表示,在大模型时代狂飙一年后,他认为PMF 这一概念已经不能完整定义以大模型为基础的 AI-First 创业,应当引入 Technology(技术)与 Cost(成本)组成四维概念——TC-PMF。

“做 Technology-Cost Product-Market-Fit(TC-PMF),技术成本 X 产品市场契合度,尤其推理成本下降是个‘移动目标’,这比传统 PMF 难上一百倍。” 李开复表示。

李开复提到,可以预见AI技术未来有几个趋势:持续Scaling Law(尺度规律),大模型能力快速增长,超过任何技术;同时大模型训练和推理成本持续大幅下降(GPT价格年内多次下调);另外,需要顶级模型推理能力,才能实践最佳AI-First应用,但有些应用会先爆发,同时要考虑推理成本和商业模式的平衡。因此,寻找TC-PMF难度远远大于PMF,是大模型行业集体的挑战和机运。

“我觉得一定是最终产品的胜出,要靠非技术一些优势达到口碑的传播,比如,抖音为什么能在这么强大的微信之下依然能够出来,那就是因为它在短暂的时间做了一个很棒的用户体验,做了一个非常好的短视频体验,而且专注它的用户体验,做出了这样一个大型的短视频市场机遇,但是今天我们一方面不能忘记PMF的重要性,而不是胡乱去烧钱。”李开复呼吁关注TC-PMF,拒绝Ofo式烧钱打法——ofo曾是中国最火爆的共享单车企业,但最终却因为烧钱太多、无法还债导致停摆,目前全国已看不到ofo单车了。

李开复谈到零一万物的未来发展方向有四点:全球化布局、模基共建、模应一体、Al-First。

其中,零一万物重点发力海外,聚焦生产力、社交赛道于海外应用展开探索,已有 4 款产品陆续上线。目前零一万物海外生产力应用总用户接近千万,营收今年预期过亿人民币,已实践出大模型 2C 产品的 TC-PMF——产品 ROI 为1,初步摆脱烧钱获客,海外已产生规模化收入;模基共建重点是发力自研 AI Infra,而模应一体就是模型、产品的体系化联动。

随着API、万知等应用共同构建起了零一万物的商业落地版图。李开复规划,零一万物将作为具有前瞻性的务实者一步步实现落地,并最终达到 TC-PMF,打造出 AI 2.0 时代的超级应用,实现让通用人工智能普惠各地,人人受益。

最后一部分是群访。接近一小时中,李开复主要回应 AI 大模型行业的发展趋势、泡沫化以及他个人在短视频上的一些布局等。

谈及推理芯片,李开复表示,“我认为国产训练芯片和推理芯片都要全力支持,但是两个的差别是比较大的,因为训练芯片还是有一定难度,主要还是CUDA;而推理芯片它的几个好处,一个是它本身比较简单,第二它没有CUDA这么强的依赖性,制造过程也不难,所以我们对国产推理芯片是看好的,我们也会在合适的时候去采用,我们在创新工场也一直在关注这方面的投资机会。”

对于独角兽的发展机会,李开复认为,OpenAI从独角兽做到超级独角兽,而零一万物有自己的特点,是可以走出一条适合自己的路。相对于追逐GPU,零一万物的模式可能会更务实一点。

“我们是务实的AGI的信仰者,所以我们一定要用最少的芯片最低的成本训练出我们能训练最好的模型,同时我们会不断的去摸索找这个TCM。国内初创公司相对硅谷公司的一个差异,我们能够仰望星空,但也能脚踏实地,我们会同时考虑非常复杂很难的题目,要预测技术都开始进步,然后我们能力所及产生什么样的模型,第二怎么把推理成本做到最低,让我们能点燃。第三是找到PMF需求,因为如果大家谈大模型的时候,往往会觉得说美国这方面论文写的最多、人才密度最高,这都是毋庸置疑的,但是同时你要考虑到,做一个伟大的大模型公司,它不只是底层,底层当然不能差,要能够在世界第一梯队,但是同样重要的是你应用是什么?怎么开发?怎么把这一批完全不同的人聚在一起,让我们模型的人现在也懂,应用的人也懂模型,两边一起协作,这些是我们在硅谷的公司一般没有看见的,所以这是我们独特的方法,我觉得也是一个机会。独角兽作为小公司的一个机会,有关AGI何时发生,我们当然相信AGI会发生,我们也希望我们能推进AGI的发生,我们会用几种途径去让我们有可能未来成为AGI的点燃者,比如说怎么有最好的用户,用最低的成本训练出超级棒的大模式,比如说未来有没有什么合作的空间,比如说跟芯片厂商或者云的更深度的合作,能够更用低廉的成本得到更多的算力,这些我们会继续的摸索,我们绝对不懈努力,也绝对不会放弃。当然,AGI是梦想,但是你用梦想去指点一个公司的执行,而你又没有这种财力去做一个超级大力出奇迹,其实就是徒劳无功的事情。”

李开复认为,如果一年降低10倍的推理成本,2年100倍,所以有100倍的推理成本下降,假如只要今天GPT 1/100的价钱来做推理成本,很多应用肯定是可以爆发的。

谈到国内大模型在 C 端的商业化,李开复回应钛媒体App称,当前零一万物主要以国外为主,海外用户已经有付费意愿。但对于国内来说,今天万知还没有收费计划,因为要考虑给用户带来的价值。”至于整个行业用户是否愿意对某些功能或产品付费,我们还在观察中,国外的是已经进入了一个roi为正的状态,也就是国外我们去买的流量是低于我们能够收到的订阅费用,所以没有比这个更好的。”

“已经有用户自己掏腰包买单,所以我们对此有相当大的信心可以做到(C端商业化)。”李开复称。

谈到个人抖音账号规划,李开复表示,此前一直没做视频号,如今做,主要是认为很有必要,一部分是因为有技术产品希望和大家分享,以及科普 AI 领域的重要性,“我也希望能够用我的抖音号来做一个非常实诚的分享,然后让大家了解怎么去把这个工具用好,别只看到会不会取代我们的工作”。

至于直播带货,李开复对此否认,他说不会去做直播带货,而是希望告诉大家怎么样给一个更相关、更有价值的 AI 领域的创业意见和方案。

李开复暗示,零一万物皆下来会做类似 AI 搜索类型的产品服务,更多聚焦于生产力的提升。至于其他方向,他认为,未来,AI 大模型需要看用户的粘性很强,传播力很强的赛道,然后去找别的商业模式去盈利,与移动互联网的商业化是类似的方法。

“所以移动互联网最终出了视频月费模式,我们在AI领域也要找到。移动互联网出了抖音,出了微信,出了滴滴、美团,因此在 AI 领域,我们要不断去探索哪些领域技术足够好,推理足够便宜,用户的需求足够强。再不就是付费,再用别的商业模式的挖掘,最终谁能最早推出胜出的一个关键。”李开复表示。

群访最后一个回应,是关于月之暗面CEO杨植麟套现数千万美元话题。

李开复表示,“我不点评别的公司情况,我不太了解,因为他们好像也有否认,但是我个人之所以做(零一万物)这件事情,这是我40多年的梦想,从我做博士论文的第一天,从我申请博士论文的前一年,我就说一既然就是我的梦想,今天有实现这个梦想的机会,这才是催化我们推动我的努力的主要的动力。至于变现,我还确实跟我的投资人一年前做了一个承诺,基本是一个自愿主动的承诺,就是我10年不套现。对于我的原创和团队,当然他们比我年轻,我觉得我们也会经过各种的手段,但是我觉得让他们能够合理的得到套现,但是更重要的是我觉得最好的套现方式是赶快上市,我觉得这个是我们未来两年会努力的目标。”

钛媒体App了解到,零一万物仍在规划下一轮融资,同时启动新的性能最强大模型Yi-XLarge MoE研发,从而推高下一代模型的性能和创新。

(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)


万水千山总是情,点个在看行不行
修改于
继续滑动看下一个
钛媒体AGI
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存