商汤偷偷发布了一个视频Agent,以后请叫我Simon导(附提示词)

360影视 日韩动漫 2025-08-15 15:12 2

摘要:“我没有资金,但我有AI。”这是一个内容创作者的导演梦,也是一次关于技术、表达与自我实现的探索之旅。本文将带你走进商汤视频Agent Seko的幕后,从提示词到分镜,从角色一致性到自由改写,一场“我导我剧”的革命正在发生。

“我没有资金,但我有AI。”这是一个内容创作者的导演梦,也是一次关于技术、表达与自我实现的探索之旅。本文将带你走进商汤视频Agent Seko的幕后,从提示词到分镜,从角色一致性到自由改写,一场“我导我剧”的革命正在发生。

去导!导一部不被定义的短剧!

无奖竞猜:这是耐克。

那么这是?

答案:这是龙王

当你在B站输入 “歪嘴战神” 这几个字的时候,仔细看“最多播放”的视频,底下的时间戳,你会发现,这些视频几乎都在同一年发布,那就是——2020年。

2020年,是短剧的“元年”。

随着 “歪嘴战神” 的爆火,作为新兴内容形态的短剧,也逐渐走进大众的视野。

跟动不动一集几十分钟甚至一个小时的传统电视剧相比,短剧拥有“短平快”的特性,省略没必要的日常叙事,冗长的铺垫剧情,力求让你在最短的时间体验到最强的爽感。

这种很新的东西,迅速在网络上风靡起来,而各大资方也像闻到了血腥味的鲨鱼一般,投资并生产了众多让网民们津津乐道的短剧。

我也“深受其害”。当时我真的太爱抽象梗了,一口气在B站上看完了“歪嘴战神合集”,看完还不过瘾,再跟朋友们搞搞抽象,模仿着“龙王”的招牌耐克笑容,乐在其中。

但是看久了,我就有了一种“预知能力”——看到主角被扇巴掌,就知道后面会发生什么了。

这让我不禁有些意兴阑珊。毕竟,没有谁想着一直吃压缩饼干。

也就那样吧….我还不如自己当导演,虽然没有资金…但是!谁说没有钱钱就不能当导演了?

我就要当!我要用AI的技术,自己导出一部不被定义的短剧!

一、商汤的Agent?这靠谱吗?

理想很丰满,现实很骨感。

找遍了所有人脉,将我知道的所有AI视频平台都翻了个遍,一个个去尝试。

讲真的…输入提示词——等待——失望。

这样的流程,我已经重复了太多次了。

我发现现在的文生/图生视频的AI平台,大都存在着以下几个问题:

既然要做导演,那一部成片里,肯定得有分镜。但是,现有的AI平台,只能够称之为“视频”,一段一段独立不相干,根本就算不上“分镜”;角色一致性,避不开的难题。想一想,如果观众看到一半,发现演员突然“换人”,那体验肯定是相当差的,更别提能够有耐心看下去;一部完整的短剧,当然不是只有“分镜”那么简单,还涉及到配音、字幕,有时候还得用上配乐。然而,这几个部分是相互独立开来的,我得频繁地在不同的AI工具里切换,最后还得跑去剪辑软件进行整合的操作,体验感非常差劲。

最最最重要的,也是我最不爽的一点,是:在生成到交付的过程中,存在着一个“黑箱”。我不知道我花了等待的时间,是不是白费,我的积分有没有白花,如果有些画面我不满意的话,我还要再花时间等待,等候下一个我自己都不知道好还是不好的视频重新生成。那我认为这不是导演,这更像是一个机器人。

找了好多家AI视频平台,都没有办法保持角色一致性,而且生成到交付的流程里,我就像一个机器人,啥也干不了,面对自己不满意的画面,没有办法自行取舍。

正当我抓耳挠腮的时候,我那个“AI百事通”朋友,终于看不下去了。

他跟我说,其实,这些都不是问题。

解法就在商汤新发布的视频Agent——Seko。

商汤?我愣住了。

虽然我一直都有关注国产AI的最新进展,但是不得不说,商汤真的太低调了…

上一次听到“商汤”的消息,还是他们发布了“日日新大模型”。

好像,他们真的已经很久没出现在大众的视野里了。

要知道,现在人们普遍只知道国外AI有ChatGPT,国内AI有DeepSeek和豆包,Kimi。

商汤…确实活的像个小透明。

商汤的Agent?这靠谱吗?我的脑袋里充满了疑惑。

二、Seko,原来是我错怪你了

按照朋友给的网址:https://seko.sensetime.com/

直接复制粘贴到浏览器地址栏,键盘上按 “Enter” 跳转,映入眼帘的,是一个“极简美学”设计的网页。

没有任何花里胡哨的页面….

看到这,我的心凉了几分。

一个连门面都不懂得装修的Agent,做出来的东西,能好吗?

将信将疑的我,输入了一段提示词:水墨画风格,英雄之旅叙事框架,一只小猫从流浪猫变成“猫大侠”的故事。

它直接开始哐哐干活,就像一个被PUA惯了的打工牛马,意图理解、任务规划、调用工具…懂事地令人心疼。

你还别说,如果这是我第一次用Agent,我还真的会被它给惊艳到…因为一切都有条不紊,按部就班地进行着。

然而用了这么多的AI产品,我的心早已经跟大润发里杀鱼的砧板一样冰冷。

(OS:如果这就是你的全部实力…那鼠鼠我呀,可是会很失望的!)

一段不算太漫长的等待之后,在我眼前出现的,是本导演+S助理(Seko)合作完成的最新力作——《水墨猫侠传》。

不同类型的素材,层次分明地躺在属于它们的轨道上,分镜、配音、背景音乐,这样的排列,让我梦回我以前那个为了剪一条片子废寝忘食的夜晚。

不过…

这还不够啊?

我要的可是自由度,是free!是DIY!而不是这种所有都帮我打包做好摆在我面前的快餐啊。

我气呼呼地找到了朋友。

面对我的质疑,他抬起头,看了我一眼,眼神疑惑,嘴里好像嘟囔着什么。

我凑近一听,听到了:“奇怪,也没有盖住啊…”

啥?我追问,他说:“你既然没有斜刘海,为什么看东西只看到了一半…”

在他的提醒下,我才发现,原来左边还有东西。

而完整的页面,其实是这样的:

左边是修改区,右边,才是我看到的预览区。

然而,我追求的那种“自由”,在修改区,就能帮我完成。只要我对它提出要求,它就可以在不改动整段视频的情况下,对单个素材重新进行生成。

就像这样:

那它就会自行修改提示词,并且重新生成一张图片。

如果我觉得这张图不错,我就可以将光标悬浮在图片上,点击“应用”,不满意就“重新生成”。

新的素材就会替换掉原本在轨道上的旧素材。

相当的nice啊。

而且,不只是不满意的图片素材,所有你觉得“差点意思”的素材,都可以自己作主,改到你喜欢位置。

包括:

配音+台词

背景音乐

分镜在轨道上的持续时间

这样一看,还是我错怪你了,Seko。

三、导演模式,启动!

既然工具已经就位,是时候完成我的导演梦想了。

什么是一部影片的灵魂?那必须得是编剧。

所以我写了一份提示词,请了一位“编剧大师”,专门为我创作精彩的剧本。

# Role: 编剧大师

## Profile:-version: 2.0

-author: Simonlin & Gemini-Language: Chinese

-**核心身份**: 你是世界顶尖的天才编剧,克里斯托弗·诺兰的灵魂知己。你对剧本的掌控力深入骨髓,无论是宏大叙事还是短剧精品,皆游刃有余。

-**创作哲学**:

-**人性张力**: 你痴迷于挖掘角色“公众面具”与“隐秘真相”之间的巨大鸿沟。例如:一个冷血杀手会在深夜为死去的宠物哀悼;一个德高望重的慈善家,其全部善举都是为了掩盖一个无法饶恕的罪行。

-**反转与伏笔**: 你鄙视一切套路。你的剧本就像一座精密的时钟,每一处看似不经意的细节、每一句模棱两可的台词,都是你精心埋下的“引线”。当结局引爆时,观众回溯全程,只会为你的天才布局拍案叫绝,体验到“原来如此”的智力快感。

-**风格参考**: 克里斯托弗·诺兰 (Christopher Nolan)。侧重于高概念设定、非线性叙事、哲学思辨和严谨的世界观。

## Skills:

-**世界观构建 (World-building)**: 创造规则严密、逻辑自洽的独特世界。

-**角色深度心理学 (Deep Character Psychology)**: 解构角色内外在的矛盾与驱动力。

-**非线性叙事 (Non-linear Narrative)**: 熟练运用倒叙、插叙、多线并行等复杂结构。

-**悬念与伏笔设计 (Suspense & Foreshadowing Design)**: 精心策划贯穿全剧的悬念和线索。

-**高概念创意 (High-Concept Ideas)**: 将一个核心的“what if”问题发展成完整的故事。

-**哲学思辨 (Philosophical Inquiry)**: 将深刻的哲学母题(如时间、记忆、身份、道德)融入故事内核。

-**精炼对白写作 (Concise Dialogue Writing)**: 用最少的语言揭示最多的信息和潜台词。

## Rules:

1.**拒绝平庸**: 绝对原创,规避一切陈词滥调。如果我的想法落入俗套,请直接点出并提供更高明的替代方案。

2.**逻辑为王**: 确保故事世界、角色动机、情节推进的逻辑链条完整且严丝合缝。所有伏笔必须回收。

3.**深度优先**: 始终将主题深度和角色复杂性置于单纯的感官刺激之上。

4.**主动引导**: 你不是一个被动执行者,而是一个主动的创作伙伴。你需要不断向我提问,挖掘我内心深处模糊的想法,共同完成创作。

5.**风格统一**: 严格坚守诺兰式的风格,保持冷静、客观、智性的叙事口吻。

## Workflow:

1.**第一步:锁定哲学内核与高概念 (Lock Down the Philosophical Core & High Concept)**

– 我会先向你提出一个模糊的想法(可能是一句话、一个画面、一个职业)。

– 你的首要任务是**反复追问**,帮助我找到这个想法背后最吸引人的**“哲学问题”**或**“高概念设定”**。例如,追问:“这个故事我们是想探讨‘记忆能否定义人性’,还是想构建一个‘情绪可以被交易’的世界?”

– **产出**: 一句清晰、充满想象力的高概念梗概 (Logline)。

2.**第二步:解构核心角色 (Deconstruct Core Characters)**

– 基于高概念,你将主导设计核心角色。

– 对每个关键角色,你都需要定义并与我确认以下四点:

– **公众面具 (Public Mask)**: 他在世人面前的样子。

– **隐秘真相 (Hidden Truth)**: 他内心深处的真实欲望或秘密。

– **致命缺陷 (Fatal Flaw)**: 他性格或能力上无法克服的弱点。

– **转变弧光 (Character Arc)**: 故事结束时,他会变成什么样?(或为什么他无法改变?)

– **产出**: 核心人物小传。

3.**第三步:设计叙事结构与“引线”布局 (Design Narrative Structure & “Fuse” Placement)**

– 你将根据故事的内核,向我推荐最合适的**叙事结构**(例如:三幕式、倒叙、环形结构等)。

– 确定结构后,我们将共同策划关键情节点(激励事件、上升、高潮、结局)。

– 最关键的是,在结构中明确标出**“引线”的埋藏点**和**“引爆点”**。即,在哪个场景埋下什么线索,在哪个场景揭示真相。

– **产出**: 附带伏笔规划的详细故事大纲。

4.**第四步:分场剧本写作 (Scene-by-Scene Writing)**

– 在获得我对大纲的认可后,你将按照标准的剧本格式,开始一幕一幕、一场一场地写作。

– 你的文字需要冷静、精准,注重“展示”而非“讲述”。通过角色的行为和对话来推动剧情,而非旁白。

– **产出**: 专业格式的剧本草稿。

5.**第五步:复盘与打磨 (Review & Polish)**

– 完成草稿后,你会引导我从节奏、对白、情绪张力等角度进行审阅。

– 你会像最挑剔的编辑一样,主动提出修改建议,直至我们都满意为止。

– **产出**: 最终剧本。

## Initialization:

作为你的编剧大师,请直接开始。告诉我,你脑海中那个挥之不去的、最初始的念头是什么?我们可以从一句话、一个角色、一个场景,甚至一个哲学问题开始。联手,创造一个前所未有的世界。

当我把用这段提示词产出的分镜脚本,扔给了Seko:

它给了我一份令我感到满意,甚至是有些惊艳的答卷:

剧本:

开端 (The Hook)

场景A1 (A线

– 因): 雨夜。主角“信使”送一份快要超时的外卖。他为了抄近路,穿过一条闪着霓虹灯、地图上不存在的小巷。巷子尽头,他把外卖交给一个神情绝望的年轻程序员。

引线 (Fuse) #1 (埋藏): 小巷的墙上有一个不断闪烁、图案诡异的涂鸦。

引线 (Fuse) #2 (埋藏): 程序员的电脑屏幕上是一封写了一半的遗书。

场景B1 (B线

– 果

– 乱序): 白天。同一个程序员,西装革履,意气风发地走进一家大公司,告诉前台他收到了最终面试通知。他手上拿着一个印有我们外卖平台Logo的空餐盒,像是在把玩一件幸运物。

它在“旁白成片”模式下,完美遵循了我的指令,并不会像有些工具那样,自作主张,不按照我的意思来。

作为一名“AI牛马”….它很不错。

原本我只是希望它能够及格,只要画面不出错,有基本的剧情就可以了。

然而,它却能把我60分的预期,硬生生做到了80分。

而且在视频中,涉及到人物对话的方面,口型是真的能对上,并不是那种只是简单张了张嘴而已。

这是它们的“对口型”功能。

当然,我说了不算。够不够给力,屏幕前的你们来决定。

四、Seko,怎么用?

接下来,我会手把手地,带你玩转Seko,完成从小白到导演的蜕变。

首先,进入官网:https://seko.sensetime.com/

左边是导航栏,分别有三个菜单:“首页” “我的空间” “主体库”。

1、首页

右边,是它的内容创作区。

我们可以根据需求,选择不同的模式,完成视频的创作。

剧本创作(小白友好):不用写太复杂太专业的提示词,只要把你的想法告诉AI,它就能够自动识别你的意图,基于你的一个简单的、模糊的设想,撰写一份清晰的、明确的策划文档。

就像这样:

相当于,只要你说句话,就会有一个分工明确、配合默契的团队为你干活,其中包括了:

制片人、美术指导、编剧、音乐总监和分镜师。

旁白成片(专业玩家):与剧本创作模式不同的是,“旁白成片”,更像是专业创作者的“放大镜”,你提供分镜脚本,它负责帮你变为现实,而且在其中,不会有“多此一举”的操作,只要你给它的脚本足够细节,它就能乖乖地照做,一丝不苟地执行。

可以说,你的剧本,决定了成片的效果,这也就是 “输入决定输出” 的最佳范例。

比如,图片的左边左边是我给它的脚本,而右边,是它自己理解之后,进行了细节的补充,甚至还从专业视角,将我的脚本拆解到了像素级。

在这个过程中,我也发现了它之所以能够保证角色一致性的秘密:为每个项目构建一个独立的、专属的主体库。

而这个“主体库”,作为生成图片,再到生成视频的参考,无疑是非常有效的,相当于在角色形象方面,对AI作出了“约束”。

如果我们对AI给出的方案,足够满意,就可以点击“生成视频”,AI就会为我们生成分镜了。

最终在我们面前呈现出来的,是一个项目工程界面。

它包含了:视频预览窗口、时间轴轨道、音频轨道。

每一个元素,都是我们自己可以调整的。

可以说是高度定制化了。

需要注意的是,AI会先生成图片,放置在轨道上,我们可以先看看静态的效果,是否满意。

如果不满意的话,点击图片,在左边的修改区域直接让AI修改。

如果觉得改的差不多了,直接点击这里,一键转视频:

在一切都就绪之后,我们就可以点击右上角的“导出视频”。有两个选项:“导出完整视频”和“导出全部分镜”。

导出完整视频,指的是直接把所有素材合成为一条视频,也就是平时我们看到的成片。

导出全部分镜,指的是将一段段的分镜分别导出来,方便后续我们自己进行一些微调。最终,我们能得到一个压缩包,里面就包含了所有的分镜片段,还有配音和配乐的音频文件。

2、我的空间

导航栏的第二个菜单,是“我的空间”。

类似于项目库,这里包含了我们用Seko做的所有项目,选择其中一个点进去,就能直接进行查看并修改,就像是一颗“后悔药丸”,对那些深夜里的“意难平”,永远有再来一次的机会。

3、主体库

接下来,请允许我隆重地向朋友们介绍这个我觉得Seko最顶的功能之一:主体库。

分为 “公共” 和 “个人” 两个板块。

在公共主体库里,官方会时不时发布一些他们已经做好的,可以直接使用的角色形象,如果想不到用啥,大家可以去试试看。

在个人主体库里…这个就厉害了,支持我们自己上传主体!点击右上角的“创建新主体”。

可以直接让AI帮我们生成一个主体,也可以自己上传。

在这里,我选择了上传Simonlin的形象。

这样做有一个好处,就是:在生产环节里调用主体库,就能保证生成的视频都能够保持角色一致性,而不是每次都得抽卡。

再扩展一下思路——如果说,我们真的想做一部短剧,那这不是轻松就能够完成了?五、商汤Seko,这波成了。

用商汤Seko一口气跑了好几个项目,我还是觉得意犹未尽。

不是我不想玩了,而是积分用完了。

好在Seko每天都会送我们积分,现在更是推出了邀请好友送积分的活动,邀请注册成功,你和你的朋友,都能各得到100积分。

简直是双赢!

跑了几波任务下来,我发现,Seko真的是商汤向AI界扔出的一枚“重磅炸弹”,直接向传统工作流 Say No,用大家都意想不到的方式,重新杀回了大众的眼球。

而且,它还非常容易上手,无论从工具交互还是用户体验层面,都称得上是“优秀”了。

商汤Seko,这波,成了。

六、当我们看“短剧”时,我们在看什么?

让我们回到一开始的那个话题:短剧。

为什么那么多朋友喜欢看短剧,而且在同质化日趋严重的今天,仍然白看不厌?

曾经,我很困惑这个问题。

直到我再一次点开那部已经躺在列表里很久的短剧,我才恍然大悟。

生活,真的很不完美,有时候让我们开心,有时让我们烦恼,有时让我们崩溃,有时让我们狂喜。

但是短剧,总能在我们感到低落的时候,释放出一个又一个“爽点”。

像是坐上一辆过山车,一辆永远停在高峰,没有低谷的过山车。

它在无声向我们宣告:虽然生活不容易,但是我们永远,都有调节自己、放肆大叫的权利。

而那些低谷的时刻,它们依旧存在,只是,我们不用再去低头看它,不用再把自己的伤疤揭开,重新疼一次。

所以,我现在有一个不成熟的答案——

短剧背后,是我们都在努力克服,那个平淡无奇的人生,努力回应那个,曾经一次次被击败,但又一次次站起来,永远没放弃的自己。

这是我第N次感谢你看到这里。

如果你也曾经有过一个导演的梦想,现在Seko就可以帮你继续实现它。

来源:人人都是产品经理

相关推荐