可灵AI2.0重磅发布开启创作新“视”界

摘要：记者了解到，可灵AI是海淀企业北京快手科技有限公司（以下简称“快手”）推出的新一代AI创意生产力平台，基于快手自研的视频生成大模型可灵和文生图大模型可图，提供高质量视频及图像生成能力。数据显示，作为全球首个用户可用的DiT视频生成模型，自去年6月发布以来，可灵

4月15日，“灵感成真”2.0模型发布会在中关村国际创新中心举行，面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。

记者了解到，可灵AI是海淀企业北京快手科技有限公司（以下简称“快手”）推出的新一代AI创意生产力平台，基于快手自研的视频生成大模型可灵和文生图大模型可图，提供高质量视频及图像生成能力。数据显示，作为全球首个用户可用的DiT视频生成模型，自去年6月发布以来，可灵AI已累计完成超20次迭代。截至目前，可灵AI全球用户规模突破2200万。来自世界各地的超1.5万开发者和企业客户，累计生成1.68亿个视频及3.44亿张图片素材。“一直以来，可灵AI致力于提升模型基础质量，增强画质清晰度，并引入更多创新功能，以满足用户多样化需求。可灵希望让每个人都能用AI讲出好故事，实现更加精准的复杂创意表达。”快手高级副总裁、社区科学线负责人盖坤表示。

据介绍，本次升级发布的可灵2.0的全新交互理念让用户能够结合图像参考、视频片段等多模态信息，将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意，直接高效地传达给AI。值得一提的是，同步上线的可灵2.0大师版全面升级视频及图像创作可控生成与编辑能力，上线全新的多模态视频编辑功能，能灵活理解用户意图。支持在一段视频的基础之上，通过输入图片或文字，对生成的视频内容实现元素的增加、删减、替换，帮助创作者们实现更加灵活的二次编辑和处理。

与此同时，可图2.0模型也迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上，可图2.0可支持60多种风格化的效果转绘，模型出图创意和想象力实现大幅跃升。同时，可图2.0也上线了实用的图像可控编辑功能——局部重绘和扩图，支持图片的增加、修改和修复。在图像的多模态可控生成中，可图2.0还上线了全新的风格转绘功能，只需要上传一张图片加上风格描述，就能一键切换图片的艺术风格，同时精准保留原图的语义内容。

记者在发布会上获悉，AIGC技术迅猛发展，为全行业发展注入全新活力，目前，可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。以二次元AI创作社区产品狸谱为例，可灵AI为狸谱带来了创新突破，助力狸谱成功接入“动态LIVE”和“新春萌偶摇”两大功能。前者实现“图—影—音”快速创作，后者在春节期间引发60万用户转播。

活动现场，可灵AI还发起了“可灵AINextGen新影像创投计划”，该计划将加大对于AIGC创作者的扶持力度，通过千万资金投入、全球宣发、IP打造和保障，以全资出品、联合出品和技术支持等灵活多样的合作方式，让AI好故事走向世界。同时，可灵AI面向全球创作者发出征集邀约，邀请用户共同打造全球首支用户共创AI创意短片，让创作者的灵感和创意登陆上海、香港、东京、巴黎、多伦多等世界多地广告大屏。

随着可灵2.0视频生成模型和可图2.0图像生成模型的发布，可灵AI团队已投入了下一代大模型产品的研发，面向未来，盖坤表示，“可灵AI将持续大力推动技术创新，用人与AI交互的全新语言，帮助用户实现复杂创意的精确表达。我们的初心，是让每个人都能用AI讲出好的故事，我们也真切地希望这一天更快到来。”

记者王萌

来源：海淀融媒

标签： aigc 模型模态创作风格化

本文地址：https://news.43u.com.cn/a/1249265.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!