马年王炸,匿名屠榜;江湖传言“欢乐马”竟是阿里嫡系
大家好,我是企小脉。
事情发生得非常突然,就像你在大街上好好的,结果天上突然掉下了一匹“马”,把你给砸晕了。没错,就在这周一,一匹名为 “HappyHorse-1.0” 的模型匿名空降了全球最权威的AI盲测榜单。

最骚的操作是什么?
在榜单里,这位大爷把当下火得一塌糊涂的字节Seedance 2.0,以及快手可灵3.0给干翻了。不管是文生视频(无音频),还是图生视频(无音频),HappyHorse直接包揽双榜第一,拿下了号称“AI奥运会”的金牌。其Elo得分拉出了超过100分的巨大断层优势,这已经不是碾压了,这是暴打。
好家伙,看着这个名字“HappyHorse”,翻译过来就是“快乐马”。跟竞争对手那种“神秘力量”或“高深莫测”的风格完全不同,这位大爷极其质朴,就像是在跟你讲:“哥们儿,我这马挺快乐的,你要不也骑上来玩玩?”
这风格,简直就像老罗当年在发布会上调侃的那句:“我不是为了输赢,我就是认真。”不过这次,阿里这匹“快乐马”不仅认真,还特么把别人的头给锤爆了。
然而最神秘的是什么?发布那天,模型旁边只有四个字——“即将推出”。没有团队名字,没有任何大佬站台,甚至连官网都没有。搞得这两天江湖上猜什么的都有,有人说是雷军的手笔,有人说是王兴在搞跨界,还有人非要说这是马斯克从火星发回来的远程炸弹。
结果还没等大家嗨够两天,靴子落地了。4月10日,阿里ATH事业部——也就是那个刚成立不到一个月的新部门——大摇大摆地走出来说:
“别猜了,是我家的马。”
瞬间,阿里股价应声飘红,涨了将近3%。
你看,什么叫“闷声发大财”?什么叫“不鸣则已一鸣惊人”?阿里这波操作玩得,罗永浩看了都得挠挠头,想当年做手机的时候要是能学会这种“养马术”,也不至于欠下六个亿去直播带货还债啊。
今天我们这匹企小脉,就好好带大家扒一扒,这匹让全球AI圈坐不住的“欢乐马”,到底是什么来路?它凭啥能把人家视频生成界的大佬踩在地上反复摩擦?顺便,企小脉还为你准备了10个爆款标题,放在文末,拿走不谢。
一、匿名登顶,全网猜马:阿里这波“装孙子”玩得贼溜
说实话,国内科技圈搞AI视频生成,这几年字节和快手是公认的扛把子。字节的Seedance 2.0在盲测平台上那叫一个风光,就像一个开了挂的游戏玩家,稳稳地坐在第一名的宝座上,无人能撼动。

可谁能想到,就在4月8日凌晨,Artificial Analysis的Video Arena榜单上,一个代号为HappyHorse-1.0的视频生成模型突然空降榜首,直接把字节的王座踢翻了。
关键是这个模型还是个“匿名选手”——没有公司名称、没有团队信息、没有任何来历。模型名称旁边只有四个字:“即将推出”。这就像一个戴着口罩的神秘人在拳击擂台上一拳KO了拳王,然后转身就走,连名字都不报。
这下可好,整个AI圈炸锅了。科技博主们开始疯狂竞猜,有人说这是DeepSeek干的,有人说是OpenAI回马枪,还有人一本正经地分析说是“某个不知名的斯坦福博士搞的”。
但细心的网友很快发现了蛛丝马迹:4月8日当天,前阿里通义千问团队负责人林俊旸在X平台转发了一个由HappyHorse生成的样片,并配了一句 “happy horse is insanely happy” 。这口吻,怎么看怎么像是在暗示“这马是我家的”。
然而阿里方面呢?整整两天没吭声。既不否认,也不承认,就这么吊着全网的胃口。
企小脉不得不说,这波操作,简直是教科书级别的“饥饿营销升级版”。老罗当年搞锤子发布会时也爱玩悬念,但至少人家还会提前放几张海报。阿里倒好,直接让一匹“野马”闯入赛场撒欢两天,等全世界都在问“这到底是谁家的”之后,才悠悠然走出来认领。
这套路,我愿称之为 “先做马后放鞭” 。
二、硬核技术碾压,真不是靠吹出来的
好了,煽情完江湖传说,咱得聊点硬核的了。别误会,企小脉今天不是来搞技术分析的,我也没那功夫。但咱们可以把老罗那套“工匠精神”搬出来,看看这匹“快乐马”到底有多少斤两。
根据公开资料,HappyHorse-1.0作为全球首个原生支持音视频联合生成的视频大模型,仅参数就达到了150亿。什么概念呢?你就理解成这个AI大脑里,足足装了150亿个能独立处理数据的神经元。

更厉害的是它的架构设计。目前市面上绝大多数AI视频模型,要么完全舍弃音频(比如Kling、Runway),要么先出画面再独立配个音、做个口型对齐(比如Veo 3)。结果是什么呢?嘴型对不上、脚步声跟画面错位、环境音莫名其妙……你懂的,那种塑料感十足的廉价效果。
但HappyHorse不一样。它把文本、图像、视频帧和音频信号全部塞进同一个40层Transformer里,让模型在生成画面的同时就把声音也一并输出了。这样一来,口型同步、脚步声匹配、环境音嵌入,全部一次性完成,没有半点后期拼接的痕迹。
企小脉看到这里,忍不住联想到了罗永浩当年做手机时的理念——“在别人看不见的地方,我们也用心了”。阿里这匹“快乐马”,恰恰就是那个在“看不见的地方”真正较劲的选手。
除此之外,它还能原生支持包括普通话、粤语、日语在内的7种语言唇形同步,词错误率在同类模型中最低。速度方面同样亮眼:单张H100显卡生成一段5秒1080p视频,只需要38秒。
讲真,这种规格,如果让老罗来开发布会,他能给你讲出一个小时的单口相声来。
三、内部赛马+外部围猎,阿里的双保险有多狠?
说到这儿,可能有些朋友会问:“诶,阿里不是有通义万相吗?怎么又搞出一个‘欢乐马’来?内部打架呢?”
问得好。这正是阿里这盘棋最精妙的地方。
据36氪报道,在阿里最新的架构调整中,通义万相和HappyHorse的团队都被划入了ATH事业群,但隶属于两条不同的组织线:万相归通义大模型事业部,HappyHorse归AI创新事业部。前者做底层模型,后者靠近场景创新。
说白了,就是两条腿走路——一条腿搞基础研发,一条腿搞应用落地。这不是简单的“内部赛马”,这是阿里在多模态领域有意构建的双引擎结构。
而更令人意外的是,据阿里方面透露,近期还将上线另一款与HappyHorse不同的多模态模型。这表明阿里已经开始重新定义视频和多模态在自己AI战略里的核心位置。
你以为这就完了?阿里的棋盘才刚刚掀开一角。
就在HappyHorse屠榜的同时,阿里还成了生数科技B轮20亿融资的领投方。生数科技旗下的Vidu多模态大模型长期稳坐Artificial Analysis视频榜单前十。而在此之前,另一家AI视频生成领军企业爱诗科技的领投方也是阿里。
内有两匹“赛马”并行,外有两家“猛将”加持——
这不是锦上添花,这是赤裸裸的“双保险”布局。阿里在视频大模型这条赛道上,已经不是那个声量不高的陪跑者了,而是直接抢跑道的顶级选手。
四、为了“卡位”多模态,阿里不惜重金养马
聊到这儿,肯定有读者要问了:“企小脉,阿里为啥突然对视频模型这么上心?”
问得好。答案很直接——因为视频是下一轮多模态竞争的入口。

文本模型可以拼参数、拼推理、拼价格,但视频模型不一样。它同时考验时序一致性、物理运动、镜头调度、音画同步和推理效率,谁能在这里站住,谁才更有资格说自己真正掌握了多模态。
而且,阿里看中的也不只是视频生成本身,而是视频背后衍生出的可能性——视频理解、多模态Agent、新交互方式,甚至更远一点的世界模型叙事。
这让我想起老罗当年那句经典名言:“我不是为了输赢,我就是认真。”阿里在AI视频赛道上的布局,虽然不像老罗做手机那么“悲壮”,但那股“认真”的劲儿,还真有几分神似——要么不做,要做就做到世界第一。
五、这匹“马”引发的蝴蝶效应
说到这儿,其实企小脉最想感慨的,还不是技术有多牛、战略有多狠,而是这匹“马”引发的行业震动,实在是太有意思了。
首先,它让字节和快手坐不住了。Seedance 2.0霸榜几个月,结果被一匹“野马”一夜之间掀翻,这事换谁谁不慌?
其次,它让整个AI视频赛道的竞争逻辑被重新定义。当文生视频的“画质军备竞赛”达到一定瓶颈之后,下一步的战场正在从“画得好不好”转向“配得同步不同步”。HappyHorse用“音视频联合生成”这把钥匙,打开了一扇新的竞争大门。
最后,它对阿里自身的意义更为深远。在林俊旸等核心骨干离职、“阿里AI失去灵魂人物”的舆论甚嚣尘上之际,HappyHorse的登顶就像一记响亮的耳光,告诉所有人:一个技术平台的底蕴不在于某个“超级英雄”,而在于整个系统的深厚积累和人才梯队。
企小脉想借用老罗的一句话来收尾:“彪悍的人生不需要解释。”
HappyHorse的出现,也许只是阿里AI全面爆发的一个开始。这匹“欢乐马”,正在用自己的硬实力,向全世界宣告——
在AI视频这个赛道上,中国公司不光会抄作业,更能自己写教科书。
而这本教科书的第一页,就写着四个字:
我来,我见,我征服。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...













