可灵AI基础模型重磅更新全球用户数已突破2200万

更新时间：2025-04-18 00:40:46 发布时间：2天前评论：0

内容摘要【TechWeb】4月15日消息，今日，快手可灵AI宣布基座模型再次升级，面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。与此同时，可灵2.0大师版正式发布，全新上线多模态视频编辑功能，在语义响应、动态质量、画面美学等方面显

【TechWeb】4月15日消息，今日，快手可灵AI宣布基座模型再次升级，面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。

与此同时，可灵2.0大师版正式发布，全新上线多模态视频编辑功能，在语义响应、动态质量、画面美学等方面显著提升生成效果。

官方披露的数据显示，自去年6月发布以来，可灵AI已累计完成超20次迭代，截至目前，全球用户规模突破2200万。

可灵2.0视频生成模型

据快手高级副总裁、社区科学线负责人盖坤介绍，可灵2.0视频生成模型在动态质量、语义响应、画面美学等维度，保持全球领先。

比如，在文生视频领域，可灵2.0对比谷歌Veo2的胜负比为205%，对比Sora的胜负比达367%，在文字相关性、画面质量、动态质量等维度上显著超越对手。

3月27日，全球知名AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单，快手可灵1.6pro（高品质模式）以1000分的Arena ELO基准测试评分登陆图生视频（Image to Video）赛道榜首。

盖坤披露的数据显示，截至目前，可灵AI全球用户规模已突破2200万，累计生成1.68亿个视频及3.44亿张图片素材。自去年6月上线至今的10个月时间里，可灵AI的月活用户数量增长25倍。

可图2.0图像生成模型

据快手副总裁、可灵AI负责人张迪介绍，在图像生成大模型领域，快手的可图2.0处于行业领先水平，拥有多项核心优势，诸如强大的复杂语义理解能力、电影级的画面质感、多条件的可控风格化生成等。

在团队内部的多项胜负率评测中，相较于Midjourney V7、FLUX1.1 [pro]以及Reve等行业领先的图像模型，均保持明显优势。

可图2.0文生图能力迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上，可图2.0可支持60多种风格化的效果转绘，模型出图创意和想象力实现大幅跃升。

同时，可图2.0也上线了实用的图像可控编辑功能——局部重绘和扩图，支持图片的增加、修改和修复。在图像的多模态可控生成中，可图2.0还上线了全新的风格转绘功能，只需要上传一张图片加上风格描述，就能一键切换图片的艺术风格，同时精准保留原图的语义内容。

可灵2.0大师版

在本次2.0模型的迭代中，可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language（MVL），让用户能够结合图像参考、视频片段等多模态信息，将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意，直接高效地传达给AI。

“大家应该很自然地会感受到文字在表达影像信息时，是不完备的。我们需要有新的方式，能让人真正精准地表达出心中所想。”盖坤指出，MVL由TXT（Pure Text，语义骨架）和MMW（Multi-modal-document as a Word，多模态描述子）组成，能从视频生成设定的基础方向以及精细控制这两个层面，精准实现AI创作者们的创意表达。

基于MVL这一全新交互方式，快手可灵AI发布了全新的可灵2.0大师版。张迪表示，可灵2.0大师版全面升级视频及图像创作可控生成与编辑能力，上线全新的多模态视频编辑功能，能灵活理解用户意图。

比如，可灵2.0大师版支持在一段视频的基础之上，通过输入图片或文字，对生成的视频内容实现元素的增加、删减、替换，帮助创作者们实现更加灵活的二次编辑和处理。

张迪披露，当前，图生视频约占到可灵AI视频创作量的85%，图片质量也对视频的生成效果产生重要作用。

面向B端商家提供API接入服务

据介绍，除了C端订阅用户，可灵AI也面向B端商家提供API接入等服务。

目前，可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。

盖坤披露，来自世界各地的超1.5万开发者，已将可灵的API应用于不同的行业场景中，累计生成的图像数量约1200万个，生成的视频素材超过4000万个。

举报收藏打赏 评论 0