挂断电话后,朱宋纯并没有坐回办公桌前。
他走到巨大的落地窗边,脑海中预演完这场即将到来的风暴。
“slr……”
朱宋纯在心中默念着这个缩写。
作为一个在ai领域摸爬滚打三十年的老兵,他太清楚一项新技术从实验室走到产业链,中间隔着多少道鬼门关。
资源是有限的,时间是紧迫的。要想在镁国人的眼皮子底下完成“换道超车”,必须要有精密的战术编排,形成不可逆转的“飞轮效应”。
“第一步,必须是芯片。”
朱宋纯目光一凛。他当然知道“硬件彩票”理论——通常是硬件决定了哪种算法能活下来,而不是反过来。为一个新算法定制芯片是一场豪赌,赢了通吃,输了倾家荡产。
但在slr面前,这注定是一场值得押上身家性命的赌局。因为这可能是目前华国ai唯一一次掀翻桌子的机会。
“软件优化是有极限的。在gpu架构上跑逻辑推理,就象是在沙地上跑f1赛车。gpu的数千个cuda内核是为矩阵乘法这种‘大吞吐、低逻辑’的任务设计的。而slr的内核是‘gubel-box’,充满了条件判断和非线性变换。”
“如果不解决底层硬件的适配问题,slr永远只能是个‘慢吞吞’的数学玩具。”
“所以,必须由国家队进场。海思、寒武纪,必须在下一代芯片的ip核中,硬化‘gubel-box’算子,设计专用的lpu(逻辑处理单元)。”
专业计算卡相比通用卡的优势是巨大的。当年比特币挖矿,一开始大家也用显卡。但后来比特大陆搞出了专用asic芯片,能效比直接提升了百倍,瞬间把显卡扫出了挖矿市场。
“slr也是一样的道理。它对制程不敏感,不需要追求台积电的3n、5n极致工艺。哪怕是用国内成熟的14n甚至28n工艺,只要架构对了,去掉了gpu里那些为了图形喧染而存在的冗馀单元,专攻逻辑推理运算,其能效比也能吊打英伟达的4n h100。”
“这一步最慢,流片周期至少三个月,所以必须最先激活,作为‘矛尖’。”
……
“第二步,是生态的‘躯干’——编译器与中间表达(ir)。”
朱宋纯的思绪转向了软件层。
“光有芯片还不够,得让开发者用得爽。”
“英伟达的护城河不仅仅是硬件,更是cuda。那个庞大的算子库,让无数开发者产生了路径依赖。但cuda是为矩阵计算生的,在逻辑推理的新赛道上,它也是个瘸子。”
“我们要定义新的标准。可以让华威的dspore团队,开发一套专门针对slr的编译器后端。”
“虽然最终的编译器后端依赖于芯片的指令集,但中间层的框架设计现在就可以激活。我们要打造一套专门针对slr原生优化的软件栈,让开发者能象呼吸一样自然地迁移过来。”
……
“第三步,才是应用落地。”
“我们需要一个‘杀手级’的deo,来点燃资本的热情。”
“比如法律大模型,或者数学解题大模型。用极小的参数量,实现极高的准确率。”
想到这里,朱宋纯停顿了一下,并没有被狂热冲昏头脑。他很清楚,成本优势的创建不是一夜之间的事。。slr作为新生事物,初期的单位算力成本必然高昂,不可能一上来就比成熟的gpu更便宜。”
“但这局棋依然能活。”
“关键在于‘共生’。slr与ll结合,能产生‘一加一大于二’的化学反应。因此这个组合中的ll可以用小参数模型,成本会降低。用昂贵但精明的slr做逻辑引导,用廉价且量大的传统ll做知识填充。只要总体方案能对标同等智力的大参数模型,商业闭环就能跑通。我们不需要等八年,现在就能上牌桌。”
……
布局完进攻路线,朱宋纯的眉头微微皱起。
进攻容易,防守难。
大洋彼岸的对手,可是掌握着全球最顶尖算力和人才储备的超级霸主。一旦他们反应过来,全力跟进,华国这点先发优势能守得住吗?
“专利墙?当然要搞。但这只是防君子不防小人的手段。在国家利益面前,专利法往往就是废纸。”
“真正的防御,也许是‘人性’和‘商业规律’。”
他想到了两个词:【沉没成本】与【创新者的窘境】。
“英伟达、谷歌、微软,他们在gpu集群上砸了多少钱?几百亿,甚至上千亿美金。”
“他们的数据中心里,堆满了h100。他们的软件栈,全是基于transforr和cuda优化的。那些刚刚建好的超算中心,折旧期才刚刚开始。”
“现在,突然冒出来一个slr技术,告诉他们:‘嘿,你们的gpu架构过时了,未来的ai不需要那么多矩阵乘法了。’”
“他们会怎么做?”
朱宋纯仿佛看到了黄仁勋和皮查伊纠结的表情。
“他们绝不会立刻掉头。因为掉头意味着承认之前的几百亿投资打了水漂,意味着要革自己的命,意味着股价的崩盘。”
“就象当年的柯达,明明发明了数码相机,却为了保护胶卷业务而将其雪藏,最后被时代抛弃。”
“董事会和华尔街不会答应他们立刻转向。资本的惯性是巨大的。”
“所以,他们的第一反应,一定是‘抵制’或者‘魔改’。”
“他们很有可能会继续在纯transforr架构上修修补补,试图通过堆砌算力来掩盖架构的落后,利用先发优势和成熟的用户认知,继续一条路走到黑。”
历史上这样的例子彼彼皆是。想想九十年代的x86架构与dec alpha芯片之战。当时的alpha芯片在技术指标和运算速度上完全碾压英特尔,被誉为当时地球上最快的处理器。但结果呢?英特尔凭借与微软dows组成的‘tel联盟’,用庞大的软件兼容性和生态壁垒,活活耗死了技术上遥遥领先的alpha。在商业战场上,有时候‘好用’比‘先进’更重要,而‘大家都用’则比‘好用’更致命。
“当然,像谷歌这样的巨头可能会尝试跟进slr,毕竟他们最怕被看不见的敌人打死,也有足够的资金去‘赛马’。”
“但这就轮到专利墙发挥作用了。我们在lpu的‘分支预测逻辑’和‘非线性算子硬化’上已经布下了天罗地网。他们就算有先进位程,也绕不开这些架构设计的底层逻辑。一旦他们选择绕道,就只能采用次一级的方案,这样一来,我们的制程劣势就被抹平了。”
“再加之我们先发构建的软件生态……只要我们的生态足够繁荣,他们为了兼容性,最终只能捏着鼻子融入我们的体系。”
“这就是‘创新者的窘境’。他们越是拥有庞大的资产,就越是难以转身。”
“而这,就是我们的机会。”
“我们没有几万张h100的包袱,我们是一张白纸。我们可以毫无顾忌地拥抱新架构,从零开始建设lpu生态。”
“等到他们发现gpu实在撑不住,不得不转身的时候,我们的lpu生态已经成了气候,专利墙已经筑高,开发者习惯已经养成。”
“那时候,他们再想追,就只能看着我们的背影吃灰了。”
朱宋纯长舒了一口气,眼中的光芒愈发坚定。
这是一个完美的闭环。
从技术突破,到产业链布局,再到利用对手的商业弱点进行战略防御。