H***yHorse-1.0久盼方至。
4月27日,阿里巴巴***生成模型H***yHorse 1.0开启灰测,目前已在H***yHorse***(***.h***yhorse.cn)和阿里云百炼平台开放,同步上线千问App体验。
前期,H***yHorse-1.0在权威评测平台Artificial Analysis登顶,将字节跳动的Seedance 2.0甩在身后,领先幅度甚至超过了Seedance对第五名产品的领先幅度。按照排行榜单来看,这是一种断层式的优势,让人想起AlphaGo首次击败李世石时的那种震撼。然而,正如围棋中的局部优势不等于全局胜利,技术榜单的领先也不等于商业市场的胜利。
图片来自AI生成
钛媒体App第一时间登陆***体验,***界面设置了两个核心功能,***生成和***编辑,支持用户上传图片作为***的参考画面,也可仅通过文字指令生成***,目前并没有出现和Seedance一样的排队情况。
输入prompt词后,5秒钟***等待数分钟即可生成,之后支持进一步***编辑和再次创作,对创作者比较友好。普通用户最多可两个***,高级会员可解锁更多并发任务,1080P、批量、优先生成***,以及去除水印等功能。
在体验过程中,我们分别用“超写实 4K,城市街头日常场景,行人自然行走,光影真实,无畸形肢体,画面流畅 60 帧”“双人对话场景,两人交替说话,肢体动作自然,人物轮廓稳定,不融合、不换人、无幽灵残影”“0 秒连续镜头,森林小路向前推进,场景元素稳定,物体不无故消失、不随机突变”等prompt词测试。
经过针对画面质量、逻辑一致性、运动合理性、细节还原、风格写实、复杂指令、极端场景的测试,H***yHorse-1.0整体效果尚可,属于第一梯队模型水平,其原生多模态架构***用音***联合生成方案,面向广告、电商、短剧、社媒创意等内容生产场景,提供从智能生成到编辑的一体化创作能力。
模型在画面质感与光影效果、运镜与转场流畅度以及人物真实感等方面表现优秀,尤其擅长大光圈、浅景深、强氛围感的中近景镜头表达,还具备音画同步能力。但是也难免出现了穿模、色彩跳变等常见问题,少部分***AI味明显。
H***yHorse的真实定位是什么?从目前的种种迹象来看,它更像是一个追赶者与搅局者的复合体。
就行业反响来看,H***yHorse-1.0提供了第一梯队、工业可用级的***生成模型选择,阿里肯定不会满足于目前的定位,H***yHorse 1.0更重要的意义是,用性价比和饱和式***投入,冲击“一超多强”的***模型格局。
追赶者的一面体现在模型的某些短板,这种差距在商业应用中可能被放大。一位AI***创作者表示,“音频同步不仅仅是技术问题,更是艺术问题。Seedance在处理人物对话时的情感表达、语气转换自然。H***yHorse虽然能同步,但有时候会显得机械。”
搅局者的一面则体现在市场策略上。Seedance2.0***生成价格为720P 1元/秒、1080P 2.48 元/秒。H***yHorse的***限时折扣价为720P 0.44元/秒、1080P 0.78元/秒。即便取消折扣,整体价格还是优于Seedance2.0。
而在企业级客户层面,通过阿里云调用H***yHorse API接口没有门槛限制,字节此前要求企业客户一次性预缴千万级费用。
这背后的商业意图简单直白,阿里云希望直接撬动火山引擎的企业客户市场。一位阿里云销售直言不讳,“很多客户现在都是苦于火山引擎的一家独大,一是生成要排队,二是涨价。但凡有一家能力跟他差不多的,价格也不是说特别过分,很多客户都是非常有兴趣的。”
在影视制作、广告创意、游戏开发等高端应用场景中,***生成模型已经广泛融入到生产流程。数据显示,2026年字节漫剧日Token消耗已突破7000万元,首次超过***短剧。
H***yHorse 1.0模型主要包括***生成和***编辑两大功能,其中***生成涵盖了主流的文生***、图生***以及多图参考生***的能力,***编辑支持用对***进行灵活的二次创作。模型支持15秒多镜头叙事、多画幅适配及1080P超分输出。
据悉,阿里云一线销售已经开始主动出击,挖掘火山引擎的AI***客户。团队已拉拢大批企业客户准备内测,其中不乏日消费数万乃至数十万级别的头部玩家。
对于企业客户而言,多一个供应商意味着更强的议价能力和更低的依赖风险,此前字节涨价、取消老用户折扣行为,已经引起广大用户的抱怨,也反映出字节在算力成本等方面的压力,最终转嫁到客户层面。
一位MCN机构负责人说:“以前我们主要用Seedance,现在至少有了对比的选项。哪怕H***yHorse在某些方面不如Seedance,它的存在本身就能让Seedance不敢随意涨价。”
展望未来一段时间,H***yHorse与Seedance的竞争将围绕三个维度展开。
一是技术迭代速度,H***模型能否快速补齐在复杂动作控制、音频情感表达等方面的短板,能否在保持专业级控制的同时,提升生成效率,技术迭代的速度将决定谁能占据下一轮竞争的制高点。返回搜狐,查看更多


