实测对比!扣子空间播客功能完爆 NotebookLM,覆盖场景更大

360影视 动漫周边 2025-05-29 15:44 3

摘要:多模态始终是大模型领域,想象空间最大的应用概念,从 Sora 的文生视频,再到 Google 的 NotebookLM 生成播客,功能越来越有趣,对日常生活、工作的渗透度也越来越强。

本播客由扣子空间(coze.cn)一键生成

作者 | 红羽

多模态始终是大模型领域,想象空间最大的应用概念,从 Sora 的文生视频,再到 Google 的 NotebookLM 生成播客,功能越来越有趣,对日常生活、工作的渗透度也越来越强。

尤其是文本生成语音赛道,一些头部公司已经募集了上亿美金。有媒体称,音视频生成是当下最受资本青睐的三大子领域之一。公开数据显示,预计到 2027 年,全球文本到语音市场的价值将超过 100 亿美元。

但小编作为一个播客爱好者,此前很少关注类似的 AI 应用,核心问题在于:玩具太多,“狠活儿”太少———这些工具往往只能满足猎奇心理,很难在产品层面做到精益求精,不是找不到喜欢的声线,就是找不到喜欢的内容。

类似的成见,持续到今年 5 月才被打破。5 月 28 日,扣子空间上线了文生播客这个功能,出于对字节跳动这家公司本身的关注,笔者进行了试用,体验非常不错。这篇文章也使用了扣子空间的播客生成功能,并将音频内容放在文章顶部,你可以准备好耳机,试听一下。

不知道你的感受如何?在不知晓内情的情况下,恐怕很难有人意识到这是 AI 生成的。

对比以往音视频生成类 AI 应用,我认为其核心变化在于:

AI 甚至没说普通话,也不是标准播音腔,而是很精准的“播客风”;

双主播之间,有很真实的对话、交互感,不是简单的念脚本;

易用性好,学习成本极低,播客聊的话题可以自己来定,听众从被动地收听到可以用 AI 自主创作想要的播客内容。

扣子空间似乎想明白了一个问题:一个好的内容,通常需要内容生产者有比较好的边界感。方言感太重,听众就听不懂;播音腔太重,听众就听不下去。这个中间值很模糊,但扣子空间却精准拿捏了中间的尺度,最终达到以假乱真的听觉效果。

端午假期马上到了,考虑到笔者堪忧的旅行攻略制作能力,干脆打算用扣子空间来把自己安排的“明明白白”,顺便看看这个 AI 的能力边界到底在哪里,整体体验如何?

一场“懒”到极致的旅行攻略制作

能制作旅行攻略的 AI 太多了,但这项工作的难度在于:能否精确解读和遵循一些比较感性的 Prompt。从场景来看,计划出游是个相对轻松的场景,用户很难这时去研究“提示词工程”,AI 的理解能力就成了保障交付的关键。

我给扣子空间的 Prompt,遵循了老板“既又还”的标准逻辑:“帮我规划端午节应该去哪玩,既要避免拥堵、又要有意思、还要有节日文化。”

在插件方面我添加了高德地图、飞常准、墨迹天气、图像工具,模式直接选自动。扣子空间的执行步骤是调用 Agent 去网络上检索相关资料的同时,转写代码完成对不同旅行地点的信息收集和比对。

出乎我意料的是,扣子空间在写攻略的同时,直接完成了配图——所有图片都是真实图片,来自互联网,而非 AI 生成,充分贯彻了“无图无真相”的互联网社区价值观,避免了过往 AI 生成旅行攻略,看了等于白看的问题。

扣子空间的答案如下:

对美食推荐和景点特色的总结非常实用,我一度怀疑扣子空间偷偷分析过我的朋友圈,不然它怎么知道我的旅行,除了看热闹就是吃呢?

不过只是做了版攻略,阅读理解的成本还是有点高,不够生动,分享给我的旅行搭子时,也不够方便。因此我让扣子空间将该攻略做成了网站,要求:“基于该攻略,生成一个网站。网站要美观,交互性要好,看着不能太无聊。”

于是扣子空间开始老老实实地写代码。需要注意的是,这是个“Serverless 式”的服务,也就是说,我并不关注服务器环境的配置,也不关注插件和模型版本,以及该网站是否要占用哪些公有云资源,从头到尾,除非部分插件需要 API 授权,否则我发出的命令只关乎需求本身。这一点我认为扣子空间对底层复杂度做了非常好的屏蔽。

网站生成的效果如下,我忍不住将整个网站的截图全部黏贴上来,分享给你————说实在的,看到这个网站后,我认为程序员接网站开发私活这件事儿,可能彻底成为历史了。AI 开发网站,不但效率高百倍,且功能性和美观度都远超预期。鼠标移动到这个网页的一行字、每一幅图片,都会触发一定的动态效果,所以整体浏览体验很棒。

考虑到甲方的需求通常不会这么简单,我让扣子空间将该网站的语音导览功能也一并实现:“针对每一个景点,添加语音导览功能模块。”

如果不希望单独占用完整时间来阅读网站内容,也可以用播客的形式,对整个网站进行总结、介绍、对话。扣子空间的播客功能最强大的地方,在于其可适配的场景非常多,完全不限于上传 word 生成播客的僵化形式,接近于随时随地,在任何主流场景下,提供播客服务。实际上,如果是旅游时遇到不了解的景点,可以随时随地让扣子空间生成介绍播客,直接免去租景区讲解器的 30 元。

另外有兴趣的朋友,可以对比下 NotebookLM ,我认为扣子空间生成的播客,更符合中文播客的听感,个性化更强。同时 NotebookLM 播客功能的闭环是 AI 笔记,只服务个人学习场景。扣子空间覆盖的场景更大,适用性更好。无论是工作还是娱乐,同一时间打开一个 AI 工具就能搞定 80% 的问题,还是去收藏夹检索七八个 AI 工具解决一个问题,有本质区别。

AI 兜底的假期保障计划

从“场景适应性”这一维度延伸来看,打工人节假日被迫加班,是广泛存在的现象,但很少有产品关注并解决这个问题,那么扣子空间能提供帮助吗?

我干脆搜一下端午假期可能出现的热点,提前安排工作,以免被一个电话打乱假期。

追热点的第一项任务是找选题。扣子空间检索出来的话题包括热门旅游趋势、各地活动、热门商机,共有 22 个话题。每个话题都有数据支撑,引用真实的媒体报道,还有每个选题的讨论量。

其中,我选择做“2025 端午节数字文创”这个热点话题,想要了解同类报道情况,在扣子空间输入:“围绕以上话题,调查过往的报道角度和节日历史”,回答如下:

它能从科技、文化传承、消费与市场等多个角度综合分析,也抓住了故宫文创端午数字产品等全国各地的端午热点。

为增强选题内容的直观性与丰富度,我迅速开展图片筛选工作,给到的指令是:“根据上面的主题和意境,找到 3 张适合端午节的真实照片,例如包粽子、赛龙舟等,要求图文并茂。”

凭借高效的检索能力,仅 1 分钟就精准定位到三张契合端午节主题的真实照片。这些照片均具备鲜明的端午元素,画面构图优美、色彩协调,兼具艺术性与趣味性,能够与文字内容形成良好呼应,为读者提供更全面、生动的端午主题体验。

我需要对选题研究生成 PPT 分享给团队,完成度也相当不错:“请将以上内容,生成选题研究 PPT。”

可以预见的是,这份 PPT 将给到初级设计人员,以及一众 AI 生成 PPT 垂类工具极大的压力。对于初级设计人员而言,扣子空间生成的 PPT 无论从色调、图片还是排版上,都已经达到了相当精美的程度,非商务场景完全够用了,而且胜在效率高。

过往 AI 总是被诟病:可以生成,但难以调整,对于今天的扣子空间,也不再是问题。我提出“每页字数太多了,请删减文字”的修改意见,扣子空间可以非常精准的将内容简化,且完成度极高。

至于其他 AI 生成 PPT 的垂类工具,压力主要来自场景和产品。

场景足够广、产品足够强,是当下 AI 应用抢占市场的不二原则。但是垂类工具天然场景狭窄,客户获取困难。此外由于 GenAI 应用需要相当强大的研发团队做支撑,所以产品能力也难以保证。笔者试用过一些市面常见的 AI 生成 PPT 工具,体验一言难尽:AI 会将 PPT 标题误会为正文,PPT 正文误会为标题,导致一份不到 300 字的 PPT 大纲,最后可能会生成一个长达七八十页的 PPT,极其难以修改。

这些问题在扣子空间的 PPT 生成功能上,反倒被解决的很好。

此外,扣子空间在生成文字内容方面的功能对用户也很友好,例如我在扣子空间上输入:“围绕以上 PPT 生成文章大纲,要求内容创新、有趣。”

仅耗时 3 分钟,便成功生成了一份结构完备的文章大纲,涵盖引言、端午节数字文创消费市场现状、端午节文旅消费市场现状、市场潜力与发展趋势、市场挑战与应对策略以及结论这六大板块。

在阐述端午节数字文创消费市场现状时,文中精准列举了传统民俗商品销售额同比大幅增长的详实数据,部分商品销售额同比激增达 300%。同时,还以苏州绣娘精心制作的粽子香囊、五芳斋推出的“五杀粽子礼盒”等热销产品为例,生动展现了市场的繁荣景象。

不难发现,扣子空间所输出的内容不仅丰富多元、独具新意,而且数据真实可靠,极具参考价值

考虑到新媒体传播追求“一鱼多吃”,或者你的团队干脆就在维护一个播客账号,它同样也能根据文章大纲生成播客:

如果不考虑招募全职主播运营一档播客栏目,对于大部分团队而言,这个品质足够了。

值得一提的是,扣子空间对 MCP 协议的支持也很好,现在已经上线的插件实用性都很强。一方面是字节跳动通过自己的生态合作,为扣子空间集成更多插件铺平道路;另一方面,开发者实际上也可以通过自定义扩展,添加自己的插件,并将插件编排成工作流——简而言之,扣子空间是个看上去简单,但对于开发者来说,“可玩性”也足够强的平台。

此外,笔者还了解到在产品设计上,扣子空间当前至少有 90+ 已经成熟的应用场景。这意味着,我们对扣子空间的体验仍处于「初级探索阶段」,而大众所期待的「AI 红利」,其实才刚刚拉开序幕 —— 更多基于场景深耕的惊喜功能,正待解锁。

今日好文推荐

传字节跳动内部开始禁用Cursor了

模型下载量12亿,核心团队却几近瓦解:算力分配不均、利润压垮创新?

印度国家级大模型上线两天仅 300 余次下载,投资人直呼“尴尬”:韩国大学生模型都有20万!

Java 三十周年重磅发声:James Gosling 怒斥 AI 是“一场骗局”,是科技高管“疯狂压榨”程序员的新工具

来源:InfoQ

相关推荐