提起ai圈的“后起之秀”,iax绝对是绕不开的名字。很多人可能用过它的glow、海螺ai,也听过它和抖音旗下豆包的各种传闻,但对它到底是谁、背后团队有多牛、产品能干嘛,还有和豆包到底啥关系,一直云里雾里。今天就用最接地气的大白话,把这些问题拆解开讲透,保证不管你是ai小白还是普通用户,都能一看就懂。
一、先搞懂iax:ai圈的“实干派独角兽”,2021年才成立却冲得飞快
首先得明确一点,iax不是什么小作坊,而是正儿八经的ai巨头种子选手。用一句话总结:2021年底在上海成立的ai创业公司,专门搞“能听、能看、能说、能做”的多模态大模型,短短几年就做到了行业顶尖,还成功上市了。
1团队底子:400人精英战队,不搞花架子只拼技术
iax的团队规模不算特别大,大概400人左右,但“含金量”超高。和很多ai公司喜欢挖行业老人不同,它的人才主要靠校招自己培养,简单说就是“从一张白纸开始,培养最贴合自己技术路线的人”。
这里有个很有意思的点:团队没有kpi考核。咱们普通人上班都要面对业绩压力,但iax不一样,他们靠“单一目标拆解”驱动——比如今年要把视频生成模型做到全球前三,所有人就围绕这个目标分工干活,不用天天盯着kpi报表。这种模式虽然少见,但效果很明显:团队凝聚力强,技术迭代速度特别快,从成立到发布全球顶尖的大模型,只用了不到4年时间。
而且公司的定位很清晰:聚焦“多模态agi”。可能有人听不懂“多模态agi”,其实翻译过来就是“全能型人工智能”——不只是能处理文字,还能搞定语音、图片、视频,甚至能和物理世界互动,比如以后可能赋能机器人,让机器人能看懂环境、听懂指令、做出动作。这和很多只做文字聊天的ai公司,完全不在一个赛道上。
2融资与上市:资本追着投,2026年初成功登陆港交所
能在短短几年内快速崛起,离不开资本的支持。。要知道,ai行业烧钱特别厉害,能拿到这么多融资,说明资本对它的技术和前景极度认可。
更厉害的是,2026年1月9日,iax成功在港交所上市了。这意味着它成为了ai大模型赛道里的“上市公司一员”,有了更稳定的资金来源,后续研发和产品推广也能更有底气。对于一家成立才4年多的创业公司来说,这个成长速度堪称“火箭级”。
简单说,iax现在的状态就是:有顶尖技术团队、有充足资金、有明确的发展方向,而且已经靠上市站稳了脚跟,是ai圈名副其实的“独角兽”。
二、创始人闫俊杰:清华博士出身,商汤“老功臣”,带着技术理想创业
一家公司能走多远,创始人的格局和技术实力往往是关键。iax的创始人闫俊杰,就是典型的“技术大牛+创业实干家”,履历亮眼到让人佩服。
1学霸履历:从清华到中科院,一路深耕ai
闫俊杰是1989年生人,河南人,年纪不大但学术背景超硬核:清华大学自动化本科+中科院自动化所博士+清华大学计算机博士后。这一串头衔下来,就能看出他是“根正苗红”的ai领域科班出身,不是半路出家的“野路子”。
在学术上,他的成就也很突出:发表过100-200篇ai领域的顶会论文,googleschor(谷歌学术)上的引用量超过3万次。可能有人对这个数据没概念,简单说,顶会论文是ai行业的“学术天花板”,能发表一篇就很不容易,而他发表了上百篇,还被同行广泛引用,说明他的研究成果在行业内有很高的认可度。2019年,他还登上了福布斯中国30u30精英榜,算是行业内对他青年才俊身份的盖章认证。
2职场经历:商汤6年从实习生做到副总裁,攒下核心经验
闫俊杰不是刚毕业就创业的“愣头青”,而是有过多年大厂实战经验。他在商汤科技待了6年,从一个实习生一步步做到副总裁、研究院副院长、智慧城市事业群cto,堪称“逆袭典范”。
在商汤期间,他主导了深度学习工具链与算法体系的搭建——这相当于给商汤的ai技术搭好了“地基”,后续很多产品都是在这个基础上发展起来的。这段经历让他不仅懂技术,还懂团队管理、产品落地和商业化,为后来创立iax积累了关键经验。
3创业初心:押注多模态,要做“普惠大众”的ai
2021年,闫俊杰从商汤离职,创立了iax。他的创业初心很明确:坚信“agi(通用人工智能)一定会实现,并且一定会服务大众、普惠大众”。简单说,他不想让ai只停留在实验室里,或者只服务于少数大企业,而是想让普通人都能用得上、用得起ai。
他的技术路线也很坚定:坚持“单模型+全场景”,押注多模态融合是agi的终局。啥意思呢?就是不搞一堆零散的模型(比如一个模型处理文字、一个处理图片),而是打造一个“全能模型”,能同时搞定文本、语音、视频等多种数据,而且能适配不同场景(比如c端用户聊天、b端企业办公、内容创作等)。
从现在的发展来看,他的判断是对的。iax的多模态技术已经走在了行业前列,不管是语音模型还是视频生成模型,都有全球顶尖的表现,而这一切都离不开创始人最初的战略布局。
三、iax的核心产品:从聊天到视频,覆盖c端和b端,个个都是“实力派”
iax的产品矩阵很清晰,主要分三大类:底层的大模型技术底座、面向普通用户的c端应用、服务企业的tob解决方案。简单说,就是“自己搭好技术地基,然后做自己的产品,同时也把技术开放给别人用”,两条腿走路,既稳又快。
1底层技术底座:大模型是“核心引擎”,性能对标全球顶尖
如果把iax的产品比作一辆汽车,那大模型技术底座就是“发动机”,所有产品的功能都靠它支撑。目前它的核心技术底座主要有三类:
(1)系列大语言模型:开源全球第一,又快又便宜
这是iax的“王牌技术”,目前已经迭代到2版本。这款模型有多牛?
-综合成本不到openaigpt-5(high)的六分之一,输入每百万token只要21元人民币,输出只要84元。
可能有人听不懂“token”“开源”这些术语,咱们用大白话翻译:
-“token”就是ai处理文字的“基本单位”,简单理解为“字数”就行,百万token大概相当于75万字,也就是说,让ai处理75万字的输入,只要2块1,成本低到离谱;
-“开源”就是把模型的核心技术公开,让全世界的开发者都能免费使用、二次开发。这一点特别重要,相当于iax把自己的核心技术“分享出去”,既降低了行业的开发门槛,也能吸引更多人用它的技术,形成生态优势。
而且这款模型还得到了海外巨头的认可,比如ta(脸书母公司)在论文中提到,iax的研究是近期强化学习的突破代表,还采用了它提出的核心技术。在全球知名的ai模型调用平台openrouter上,2上线不到两天,调用量就冲进了全球前十,足以说明它的受欢迎程度。
(2)音频大模型:全球领先,语音生成、克隆都拿手
除了文字,iax的音频技术也是王牌。它的音频大模型在全球处于领先地位,能实现很多实用功能:
-情感语音生成:不只是简单的文字转语音,还能模仿开心、悲伤、愤怒等情绪,听起来和真人说话没差别;
-语音克隆:上传10秒音频,就能复刻别人的声线,不管是自媒体博主配音,还是普通人想让ai用自己的声音读文章,都能实现;
-音效合成:能生成各种场景的音效,比如下雨声、汽车声、游戏音效等,满足内容创作的需求。
这款音频模型是很多c端产品的核心支撑,比如后面要讲的glow、talkie,之所以能实现自然的语音交互,靠的就是它。
(3)视频生成大模型(abab-video系列):文生视频超逼真,半年产量破千万
这是iax近几年重点发力的方向,2024年发布后快速爆发。简单说,这个模型能实现“输入一段文字,自动生成视频”,而且效果特别逼真,没有那种生硬的“ai味”。
它的核心优势很明显:
-支持文生视频、图生视频,单段最长6秒,拼接起来就能做长视频;
-画面真实,物理效果自然,比如火焰、水流、人物动作都很流畅,不像有些ai生成的视频,看起来像ppt翻页;
-商用价值高,广告、短剧、动漫分镜都是核心场景,上线半年内,全球单日ai视频产量就破了千万条。
而这款视频模型,也支撑起了它的爆款产品——海螺ai。
如果说大模型是“发动机”,那c端应用就是“汽车成品”,直接面向普通用户。iax的c端产品个个有特色,而且都火过一阵子,咱们一个个说:
(1)glow:ai角色扮演聊天,早期爆款“意外走红”
glow是iax的第一款c端爆款,也是国内早期的ai角色扮演对话产品。它的核心玩法很简单:用户可以在里面创建各种角色,比如霸道总裁、温柔学姐、动漫人物,然后和这些ai角色聊天,ai会根据角色设定回应,互动感特别强。
有意思的是,glow的走红其实是“意外”。创始人闫俊杰最初做它的目的,是为了收集用户的对话数据,用来训练大模型——毕竟ai模型需要大量数据才能变得聪明。结果没想到,产品上线4个月,注册用户就爆发式增长,成了现象级产品,也让iax一下子在c端市场打响了名气。
现在的glow已经很成熟了,不仅角色种类更多,还支持语音聊天、自定义角色形象,很多用户用它来打发时间、情感陪伴,甚至练习外语,成了一款真正的“国民级ai聊天工具”。
如果说glow是“纯聊天”游戏”的结合体。它是一款多模态对话游戏,融合了文本、语音、图片,还加入了数值体系和抽卡玩法,有点像“ai版的二次元游戏”。
它的核心亮点是“互动性强”:用户可以和ai角色进行多轮对话,不仅能打字,还能发语音、图片,ai会根据这些信息回应,而且角色还有好感度、等级等数值,抽卡能解锁新角色、新语音,玩法比glow更丰富。。简单说,它成功打开了海外市场,让iax的c端产品走向了全球。
(3)海螺ai(haio):ai视频生成工具,普通人也能当“导演”
这是iax近几年的“王牌c端产品”,上线后快速成为全球第二大ai视频生成工具,把“写段文字→出大片”从概念变成了日常。它的核心优势就是“简单、逼真、能商用”,咱们用大白话说说它能干嘛:
-文生视频:输入一段文字,比如“航拍俯拍,穿汉服的女生在竹林舞剑,阳光透过竹叶形成光斑,电影感,4k”,就能自动生成6秒或10秒的高清视频,镜头语言自然,没有ppt感;
-图生视频:上传两张产品图,ai能自动补完360°旋转展示,比如义乌商家用它给商品做展示视频,直接投放到抖音橱窗,点击率提升了32;
-角色一致性:跨镜头能保持人脸、服装、道具不变,做系列短剧再也不怕“换演员”面容误差不到2;
而且它上手特别简单,5分钟就能学会:注册账号→按“镜头+主体+动作+环境+光影+风格”点击生成,2-5分钟就能出片,导出后用剪映加个字幕、bg,就能直接发布。2026年它还会更新,支持30秒长视频、虚拟试衣、4k超高清,功能会更强大。
(4)iaxagent:ai智能体平台,能帮你处理各种复杂任务
这是一款更偏向“实用工具”的产品,简单说就是“ai助手的升级版”。它能对接各种场景,提供个性化智能服务,比如:
-办公场景:帮你写ppt、整理会议纪要、调试代码,甚至能实现多代码文件的自动调试与修复;
-学习场景:帮你整理笔记、解答难题、生成学习计划;
-生活场景:帮你规划旅行路线、订酒店、写文案。
它有“高效”和“专业”双模式,轻量级对话用高效模式,复杂任务用专业模式,而且网页端和app限时免费,普通人也能体验到ai带来的便捷。
除了自己做c端产品,iax还把大模型技术开放给企业,提供api接口和定制化解决方案,服务了很多行业客户。
比如它给高济健康打造了智能患者管理系统,用ai帮医院整理患者信息、提醒患者吃药、解答常见健康问题,减轻了医护人员的负担;给企业提供模型训练、推理工具,让企业不用自己从头研发ai,就能快速实现智能化转型。
这种tob模式不仅能给iax带来稳定的收入,还能让它的技术在更多行业落地,积累更多场景数据,反过来优化大模型,形成“技术→落地→数据→优化技术”的良性循环。
四、关键澄清:iax和抖音豆包没有官方合作,是“竞合关系”
这是很多人最关心的问题:iax和抖音旗下的豆包到底啥关系?是不是有合作?答案很明确:没有官方合作,两者是独立的ai产品与技术主体,既有竞争,也有间接的行业交集。
咱们分两部分讲,先搞懂豆包的背景,再看两者的关系:
1豆包的真实背景:字节跳动自研,靠流量快速崛起
豆包是字节跳动(抖音母公司)自己研发的ai对话助手,2023年上线,和iax没有任何股权或技术上的关联。它的核心优势很明显:
-背靠字节跳动的技术实力:有自己的自研大模型,还有火山引擎的语音技术,不用依赖第三方;
-流量优势巨大:抖音有超7亿日活用户,豆包作为字节的“亲儿子”,能直接借助抖音的流量推广,2025年底日活就破了亿,成长速度特别快;
-产品定位:消费级ai助手,主打语音交互、情感陪伴、多模态娱乐,比如帮你聊天、写文案、生成图片、做视频字幕,功能很全面,而且完全免费。
从技术路线来看,豆包也做多模态交互,但它的优势在“场景丰富度”和“用户基数”,毕竟有字节的生态加持,能快速适配抖音、剪映等产品,用户使用起来更方便。。
2两者的“竞合关系”:竞争是主流,交集是间接的
虽然没有官方合作,但iax和豆包在ai赛道上有很多重叠,既是竞争对手,也有一些间接的行业交集:
(1)直接竞争:抢用户、抢场景
两者的竞争主要集中在c端市场,尤其是这些场景:
-ai聊天与陪伴:iax的glow、talkie和豆包的对话功能,都是面向普通用户的聊天产品,都主打自然交互、情感陪伴,用户群体有重叠;
-多模态内容生成:iax的海螺ai主打视频生成,豆包主打图片生成、文案生成、视频字幕,都在争夺内容创作者的用户时长;
-海外市场:talkie在海外的日活很高,而豆包也在拓展海外业务,两者在欧美市场有直接竞争。
而且它们的技术路线有重叠,都做文本、语音、视觉的多模态融合,只不过iax更侧重“开源+视频生成”全场景覆盖”,各有优势,但竞争很激烈。
(2)间接交集:生态层面的小互动
两者没有官方合作,但在行业生态里有一些间接交集,主要是通过第三方:
-硬件适配:有些智能音箱、智能车载设备,会同时适配多个大模型接口,可能既支持iax,也支持豆包,这是硬件厂商的“多模型兼容策略”,不是两者的官方合作;
-行业标准:都在参与ai行业的一些标准制定,比如多模态数据处理、ai安全等,可能会在行业会议、标准研讨中产生间接互动,但这不是商业合作。
简单总结:iax和豆包是“各玩各的,但又在同一个赛道竞争”,没有谁依赖谁,都是靠自己的技术和生态发展。网上流传的“豆包用了iax技术”“两者合作推出产品”等说法,都是没有官方依据的谣言,大家不用相信。
3核心差异对比:一张表看懂两者的不同
为了让大家更清晰,咱们用一张大白话表格,总结一下iax和豆包的核心差异:
对比维度iax豆包
所属公司上海稀宇极智(闫俊杰创立的创业公司)字节跳动(抖音母公司,互联网巨头)
核心技术自研系列开源大模型(全球前五)、音频全球领先、视频生成全球第二字节自研大模型+火山引擎语音技术
核心优势开源技术强、视频生成逼真、商用素材多流量大、用户基数广、功能免费、多端同步(手机+电脑)
主要用户内容创作者(短视频、短剧)、ai爱好者、企业客户普通用户(聊天、查资料)、职场人(办公、写文案)、学生(学习、作业)
合作关系无官方合作无官方合作
五、总结:iax是“技术驱动的实干派”,豆包是“流量驱动的全能派”
最后,咱们用最简单的话总结一下:
iax是一家技术驱动的ai创业公司,创始人是清华博士出身的技术大牛,核心优势在开源大模型、音频和视频生成,产品既服务普通人(聊天、做视频),也服务企业,走的是“技术过硬+商业化落地”的路线,靠上市和融资获得资金支持,在全球ai圈有很强的技术影响力。
豆包是流量驱动的互联网巨头产品,背靠字节跳动的流量和生态,核心优势在用户基数大、功能全面、完全免费,走的是“快速迭代+全场景覆盖”的路线,靠抖音的流量快速崛起,是普通用户最容易接触到的ai助手之一。
两者没有官方合作,是ai赛道上的竞争对手,各有优势,也各有侧重。如果你是内容创作者,想做短剧、产品视频,iax的海螺ai可能更适合你;如果你是普通用户,想找个免费的ai聊天、写文案、查资料,豆包可能更方便。