资讯小灵通 >> 深度锐评>>

代,用户万模型可灵突破0时数已进入全系全球

代,用户万模型可灵突破0时数已进入全系全球 本章共7886字, 更新于: 2025-04-22 13:03:31

4月15日,可灵可灵AI在北京中关村国际创新中心举行“灵感成真”2.0模型发布会,全系全球宣布基座模型再次升级,模型面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。进入

截至目前,时代数已可灵AI全球用户规模突破2200万。用户来自世界各地的突破超1.5万开发者和企业客户,将可灵的可灵API应用于不同的行业场景中。

快手高级副总裁、全系全球社区科学线负责人盖坤表示,模型可灵希望让每个人都能用AI讲出好故事,进入实现更加精准的时代数已复杂创意表达。


 可灵AI全系模型进入2.0时代,用户定义人和AI交互的突破全新方式

4月15日,可灵大模型2.0版本及可图大模型2.0版本正式面向全球发布。可灵据悉,可灵2.0模型在动态质量、语义响应、画面美学等维度,保持全球领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。

盖坤介绍,两款模型在团队内部的多项胜负率评测中,均稳居业内第一。例如在文生视频领域,可灵2.0对比谷歌Veo2的胜负比为205%,对比Sora的胜负比达367%,在文字相关性、画面质量、动态质量等维度上显著超越对手。

自去年6月发布以来,可灵AI已累计完成超20次迭代。3月27日,全球知名AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模式)以1000分的Arena ELO基准测试评分登陆图生视频(Image to Video)赛道榜首。

作为全球首个用户可用的DiT视频生成模型,截至目前,可灵AI全球用户规模已突破2200万,累计生成1.68亿个视频及3.44亿张图片素材。自去年6月上线至今的10个月时间里,可灵AI的月活用户数量增长25倍。

可灵AI全系模型进入2.0时代,全球用户数已突破2200万

快手高级副总裁、社区科学线负责人盖坤(图片来源:快手)

盖坤认为,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性、以及用户复杂创意的精确传达上仍有“很多挑战”。也因此,要真正实现“用AI讲好每一个故事”的愿景,必须对基模型能力进行全方位提升,定义人和AI交互的“全新语言”。

一直以来,可灵AI致力于提升模型基础质量和模型效果,并引入更多创新功能,以满足用户的多样化需求。在本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,高效地传达给AI。

“大家应该很自然地会感受到文字在表达影像信息时,是不完备的。我们需要有新的方式,能让人真正精准地表达出心中所想。”盖坤指出,MVL由TXT(Pure Text,语义骨架)和MMW(Multi-modal-document as a Word,多模态描述子)组成,能从视频生成设定的基础方向以及精细控制这两个层面,实现AI创作者们的创意表达。

基于MVL理念,可灵AI正式推出多模态编辑功能。“从今天起,大家可以在可灵AI的平台上体验我们的多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式作为输入,生成符合自己想法的创意视频。”盖坤介绍,MMW(多模态描述子)将不只局限于图片和视频,也可以引入其它模态的信息,例如声音、运动轨迹等,让用户实现更加丰富的表达。

可灵AI全系模型进入2.0时代,全球用户数已突破2200万

“灵感成真”可灵AI2.0发布会现场(图片来源:快手)


 可灵2.0大师版正式发布,全新上线多模态视频编辑功能

基于MVL这一全新交互方式,发布会现场,快手副总裁、可灵AI负责人张迪发布了全新的可灵2.0大师版,在语义响应、动态质量、画面美学等方面显著提升生成效果。

“可灵2.0大师版不仅仅是一次简单的技术升级,更是一次全方位的体验跃升。”张迪介绍,可灵2.0大师版实现了技术、体验、美学的三重突破。

可灵AI全系模型进入2.0时代,全球用户数已突破2200万

快手副总裁、可灵AI负责人张迪(图片来源:快手)

据雷峰网(公众号:雷峰网)了解,可灵2.0大师版升级视频及图像创作可控生成与编辑能力,上线全新的多模态视频编辑功能,能灵活理解用户意图。支持在一段视频的基础之上,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者们实现更加灵活的二次编辑和处理。

 

可灵AI全系模型进入2.0时代,全球用户数已突破2200万

可灵2.0大师版操作界面(图片来源:快手)

张迪披露,当前,图生视频约占到可灵AI视频创作量的85%,图片质量也对视频的生成效果产生重要作用。

在图像生成大模型领域,快手的可图2.0处于行业领先水平,拥有多项核心优势,诸如强大的复杂语义理解能力、电影级的画面质感、多条件的可控风格化生成等。在团队内部的多项胜负率评测中,相较于Midjourney V7、FLUX1.1 [pro]以及Reve等行业领先的图像模型,均保持明显优势。

张迪介绍,可图2.0文生图能力迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图2.0可支持60多种风格化的效果转绘,模型出图创意和想象力实现提升。

同时,可图2.0也上线了实用的图像可控编辑功能——局部重绘和扩图,支持图片的增加、修改和修复。在图像的多模态可控生成中,可图2.0还上线了全新的风格转绘功能,只需要上传一张图片加上风格描述,就能一键切换图片的艺术风格,同时保留原图的语义内容。


AIGC技术迅猛发展,为全行业发展注入全新活力

除了C端订阅用户,可灵AI也面向B端商家提供API接入等服务。目前,可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。

盖坤披露,来自世界各地的超1.5万开发者,已将可灵的API应用于不同的行业场景中,累计生成的图像数量约1200万个,生成的视频素材超过4000万个。

如今,可灵正在成为AI时代视频创作的新基础设施。AIGC技术的迅猛发展,也正在重构包括广告营销、专业创作、影视、娱乐创意等在内的多个行业。

以二次元AI创作社区产品狸谱为例,其产品负责人一休介绍,可灵AI为狸谱带来了创新突破。其1.6版本在人物运动流畅度、镜头移动等方面展现出卓越性能,助力狸谱成功接入“动态LIVE”和“新春萌偶摇”两大功能。前者实现“图 - 影 - 音”快速创作,后者在春节期间引发60万用户转播。

未来,双方将基于狸谱的优质内容数据与可灵的算法能力,打造动画模型,推动AI成为内容引擎,并共同孵化优质创作者,构建更活跃的创作生态。

“可灵AI可全面融入剧集级创作流程”。可灵AI超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇在分享中介绍,AIGC相较于实拍和动画,不仅是效率的提升,更是试错空间的革命性释放。

从剧本创作到内容发行,异类Outliers团队完成了一次完整的影像工业化创作流程,覆盖从美学表达到镜头结构,再到复杂动作场景与细节的全面呈现。

“我们实践之后发现,可灵AI是一个能够稳定、大规模嵌入剧集创作流程的生成式协作大模型。”陈翔宇认为,在AI的辅助下,导演及编剧团队的大量内容创意也实现了更富有想象力的表达,“AIGC也许是下一代内容结构的雏形”。

可灵AI全系模型进入2.0时代,全球用户数已突破2200万

可灵AI超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇(图片来源:快手)

快手副总裁、可灵AI负责人张迪还在发布会现场正式发起“可灵AI NextGen 新影像创投计划”。

该计划将加大对于AIGC创作者的扶持力度,通过千万资金投入、全球宣发、IP打造和保障,以全资出品、联合出品和技术支持等灵活多样的合作方式,让AI好故事走向世界。同时,可灵AI面向全球创作者发出征集邀约,邀请用户共同打造全球首支用户共创AI创意短片,让创作者的灵感和创意登陆上海、香港、东京、巴黎、多伦多等世界多地广告大屏。

面向未来,盖坤表示,可灵AI将持续大力推动技术创新,用人与AI交互的全新语言,帮助用户实现复杂创意的精确表达,“我们的初心,是让每个人都能用AI讲出好的故事,我们也真切地希望这一天更快到来”。


本书首发来自资讯小灵通,第一时间看正版内容!

更多

编辑推荐榜

1英雄联盟织命与逆命(2025)皮肤上线!仅需49元可获取随机1款!
2新iPhone与旧款iPhone性价比谁更下选哪个 购哪个版本
3红旗HS5 50万辆纪念版正式上市 售价19.98万元起
4张靓颖被粉丝嫌没有停业 工做室回怼:借觉得是乌粉
5坚果食品质量安全风险防控研讨会圆满举办,助力行业迈向高质量发展
6吴彤帮贾玲聘请刘德华 借足写了一启疑给刘德华
7消息联播换背景战片头 央视消息联播新版片头图战背景图
831地广电有线治理“套娃”收费和操作复杂工作取得大进展
9煤矿块煤竞拍每吨降44元,不敢囤煤了吧?
10主场超燃音乐会开唱!海尔智家:全国19城为美好生活联动
资讯快递
人气热销 言情热销

长城润滑油:以“液体芯片”技术高质量助力 “中国智造” 国家发展和改革委员会主任郑栅洁日前表示,新质生产力正全面改造我们的生产方式,改变我们的生活方式。人工智能大模型百舸争流、异军突起,工业机器人的密度也显著提高,人形机器人加快走向应用,越来越多的产品装上

苹果腕表Series 4国止详细代价汇总 明面与机能掀秘 ­来日诰日凌晨,苹果正式停止秋季新品公布会,除三款新iPhone以中,苹果借公布了齐新的Apple Watch Series 4系列智妙腕表产品,国止代价3199元起,9月14日开启预卖,9月

姑苏金鸡湖音乐喷泉2023年开放时候+泊车天面+厕所地位 大年夜家等候的金鸡湖音乐喷泉正在本年的1月13日已开放了,但是喷泉详细开放的时候能够有的小水陪借是没有太浑楚,上里小编便去给大年夜家详细先容一下闭于音乐喷泉的相干疑息。1、开放时候每遇周5、周六战法定

长安汽车新车规划曝光 长安UNI 易车讯我们从相关渠道获得了长安汽车2024年的新车规划,其中长安UNI-Z将于3月底正式上市,深蓝G318则会在二季度与消费者见面,两款车型都将搭载新蓝鲸动力。同时我们还获悉,阿维塔15的增程车型也将

相遇阳朔,畅享健康森呼吸 海尔洗空气空调G系列全球首发—万维家电网 山峦如黛,水秀如画,阳朔不仅有着「甲天下」的绝美风景,更有着沁人心脾的健康好空气 …4月25日,海尔空调新品发布会在阳朔举办,现场海尔空调不仅携手中国天气对好空气进行了深度

集成灶行业“急刹车”,市场红利期已过? 【家电资讯-家电新闻 - 行业新闻,作者:编辑】 在经历了几年的狂奔后,集成灶行业来了个“急刹车”。2023年上半年,集成灶量额

加载更多

潜力大作 女生必读

1 多款颠覆性产品亮相美的生活电器2019新品发布会 作者:
33字
在消费升级的大环境下,家电行业所面临的不仅是产品的快速更迭、科技的不断突破,还有消费者审美趋势的改变。作为小家电行业的领导者,美的再次引领潮流,2019新品发布会上发布多款高科技新品,提出“科技、时尚

1 苹果iPhone XS/XR/XS Max对比 三款新机型哪个值得购 作者:
3339字
­2018年苹果的三款足机:iPhone XS、iPhone XR战iPhone XS Max终究与大年夜家见面了,一会女出了三款,没有考虑预算,没有晓得哪款足机更开适本身呢?­先去看

1 肖战工做室收文再次吸吁粉丝杜尽互撕治骂控评挨榜 作者:
96字
肖战工做室收文再次吸吁粉丝杜尽互撕治骂控评挨榜肖战工做室16日早再度收文,吸吁粉丝没有停止任何挨榜、控评及应援活动,杜尽互撕治骂,没有挑起群体对峙。此前,微专仄台公布告诉布告称,7月9日微专与肖战工做

1 海心周边漂流有哪些处所 作者:
3584字
到了气候酷热的时候,中出漂流便是最好玩耍好往背,那么正在海心周边有出有甚么漂流比较好玩的处所呢?上里小编便为大年夜家保举了海心周边的三处漂流好往背,快往玩耍吧!1、万泉河漂流天面:位于琼海市会山烟园电

1 吴彦祖发文谴责飞机上光脚踩座椅乘客:这不可取 作者:
6971字
3月31日#吴彦祖发文谴责飞机上光脚踩座椅乘客#登上热搜第一。3月29日,吴彦祖通过个人社交平台发出图文,怒斥了一位没有素质的乘客。只见照片上有一双涂了红色指甲油的光脚,没有穿鞋和袜子,直接踩在前排座

1 游仄易远晨播报:《吸血鬼 躲世血族2》改用真幻5开辟 《洛基》第两季预报 作者:
4字
各位玩家大年夜家好。来日诰日是2023年9月5日礼拜两。悲迎大年夜家支看来日诰日的游仄易远晨播报,我是co1dsleep。本日要闻有:《吸血鬼:躲世血族2》改用真幻5开辟;《霍格沃茨》重回英国真体周销

1 小米8屏幕指纹版建设如何样 硬件建设参数先容 作者:
6字
相疑小水陪们皆很等候小米8的上市,大年夜家也皆很猎奇那款小米8屏幕指纹版的建设如何样呢?去战小编一起看看小米8屏幕指纹版建设参数先容吧!小米8屏幕指纹版建设如何样小米8屏幕指纹版建设战卖价:小米8屏幕

1 霍启刚秀恩爱晒郭晶晶亲制苦面 庆1.6亿豪宅新房 作者:
831字
霍启刚正在交际仄台上晒出一组好食的照片,那是伉俪两人进住豪宅后第一次背大年夜众掀示他们的糊心,照片中是郭晶晶为庆贺燕徙而特天建制的细彩苦面。霍启刚连绝拍了好几张苦面照片,从照片中看,郭晶晶建制了好几种

1 汉阴新闻20250416 作者:
16753字

1 玩家祸音!《拆甲核心6》简朴Mod可大年夜幅降降游戏易度 作者:
565字
据IGN动静,远日一名Mod做者正在NexusMods上传了一款《拆甲核心6:境天天水》“简朴形式Mod”,以让游戏的机甲定义部分战游把玩簸弄法减倍宽松,减少游戏易度。那款Mod名为“EZ-Core”

系统发生错误

系统发生错误

您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

[ 错误信息 ]

页面发生异常错误,系统设置开启调试模式后,刷新本页查看具体错误!