摘要:记者了解到,可灵AI是海淀企业北京快手科技有限公司(以下简称“快手”)推出的新一代AI创意生产力平台,基于快手自研的视频生成大模型可灵和文生图大模型可图,提供高质量视频及图像生成能力。数据显示,作为全球首个用户可用的DiT视频生成模型,自去年6月发布以来,可灵
4月15日,“灵感成真”2.0模型发布会在中关村国际创新中心举行,面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。
记者了解到,可灵AI是海淀企业北京快手科技有限公司(以下简称“快手”)推出的新一代AI创意生产力平台,基于快手自研的视频生成大模型可灵和文生图大模型可图,提供高质量视频及图像生成能力。数据显示,作为全球首个用户可用的DiT视频生成模型,自去年6月发布以来,可灵AI已累计完成超20次迭代。截至目前,可灵AI全球用户规模突破2200万。来自世界各地的超1.5万开发者和企业客户,累计生成1.68亿个视频及3.44亿张图片素材。“一直以来,可灵AI致力于提升模型基础质量,增强画质清晰度,并引入更多创新功能,以满足用户多样化需求。可灵希望让每个人都能用AI讲出好故事,实现更加精准的复杂创意表达。”快手高级副总裁、社区科学线负责人盖坤表示。
据介绍,本次升级发布的可灵2.0的全新交互理念让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,直接高效地传达给AI。值得一提的是,同步上线的可灵2.0大师版全面升级视频及图像创作可控生成与编辑能力,上线全新的多模态视频编辑功能,能灵活理解用户意图。支持在一段视频的基础之上,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者们实现更加灵活的二次编辑和处理。
与此同时,可图2.0模型也迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图2.0可支持60多种风格化的效果转绘,模型出图创意和想象力实现大幅跃升。同时,可图2.0也上线了实用的图像可控编辑功能——局部重绘和扩图,支持图片的增加、修改和修复。在图像的多模态可控生成中,可图2.0还上线了全新的风格转绘功能,只需要上传一张图片加上风格描述,就能一键切换图片的艺术风格,同时精准保留原图的语义内容。
记者在发布会上获悉,AIGC技术迅猛发展,为全行业发展注入全新活力,目前,可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。以二次元AI创作社区产品狸谱为例,可灵AI为狸谱带来了创新突破,助力狸谱成功接入“动态LIVE”和“新春萌偶摇”两大功能。前者实现“图—影—音”快速创作,后者在春节期间引发60万用户转播。
活动现场,可灵AI还发起了“可灵AINextGen新影像创投计划”,该计划将加大对于AIGC创作者的扶持力度,通过千万资金投入、全球宣发、IP打造和保障,以全资出品、联合出品和技术支持等灵活多样的合作方式,让AI好故事走向世界。同时,可灵AI面向全球创作者发出征集邀约,邀请用户共同打造全球首支用户共创AI创意短片,让创作者的灵感和创意登陆上海、香港、东京、巴黎、多伦多等世界多地广告大屏。
随着可灵2.0视频生成模型和可图2.0图像生成模型的发布,可灵AI团队已投入了下一代大模型产品的研发,面向未来,盖坤表示,“可灵AI将持续大力推动技术创新,用人与AI交互的全新语言,帮助用户实现复杂创意的精确表达。我们的初心,是让每个人都能用AI讲出好的故事,我们也真切地希望这一天更快到来。”
记者 王萌
来源:海淀融媒