摘要:1985年,Windows 1.0的诞生,带来了革命性的图形界面。用户可以直观地点击、拖拽,释放了人与计算机交互的自由度。而这个历史性的转变,让计算机真正走入千家万户。
1981年,IBM推出个人计算机,用户需要通过DOS系统,输入繁复的命令与计算机对话。那是计算机的“命令行时代”。
1985年,Windows 1.0的诞生,带来了革命性的图形界面。用户可以直观地点击、拖拽,释放了人与计算机交互的自由度。而这个历史性的转变,让计算机真正走入千家万户。
如今,这段历史再一次重演了。从 2023 年到 2024 年,AI 生产力工具正在经历相似的革命。
2023年,ChatGPT横空出世,用户与AI对话的方式,强化了AI的“类人感”,让人与AI在交谈中相互启发、无限延展,也让chatbot的范式快速在市面上铺开,一时之间,几乎所有AI应用都在沿用这一模式。但多轮次的线性的对话,未必适合创作场景。一些创作类产品,例如OpenAI的Canvas引入了文档编辑面板,WPS AI、AiPPT则是保留了传统的文档形式,似乎又回到了互联网产品的旧范式之中。
直到11月12日,百度文库与百度网盘推出的"自由画布"给出了一个AI生产力工具的新解答。在这个全新的交互范式中,用户可以通过“一拖一圈”将多格式、全模态的文件自由组织,而画布本身则化身为理解全局的智能助手,与用户共同进行创作。这种突破性的交互方式,让AI从单纯的对话者转变为真正的共创者。
如果说,ChatGPT以对话方式让用户输入prompt,一如DOS时代用户输入命令;那么,画布式交互则像是AI时代的Windows,用户可以自由拖拽、框选内容,让创作回归直观与自然。
从用户反馈来看,自由画布首日就获得了20万用户预约的热度,也从侧面印证了市场对这种创新解决方案的渴望。
以史为镜,当AI工具从“命令行”进化到“图形界面”,或许真正的AI原生应用时代才刚刚开始。
AI生产力工具的破局:工具孤岛、流程断裂与学习门槛
当我们满怀期待地打开各类AI生产力工具,现实却总是不尽如人意:用AI制作视频需要经过多道处理,并像抽盲盒一样反复尝试,用AI写作也需要不断调试,采用不同的AI写不同类型的内容,最火爆的业务还得是 AI教学,这也折射出当前的AI工具依然是一种“高门槛生产力”。
鼓吹技术已经让人们逐渐麻木,如何在产品层面,让更多的用户用上、提升效率才是关键。
摆在用户面前的,首先是AI创作工具的孤岛。如今的市场上充斥着大量功能单一的垂类应用,用户不得不在多个工具间来回切换,能做PPT的工具往往无法进行文字优化,专注文本处理的又难以处理图片,就连AI消除都可以单独形成一个产品。
从人的创作过程来看,原本从素材收集、内容生产到成果输出,是一个连续完整的链条。但工具孤岛之下,创作流程断裂,用户无形中需要投入大量时间学习和适应。
你以为是AI在为你打工,但现实却是你得先明确、拆分自己的需求,并主动挑选适合的AI工具,多次调试再完成输出,可能比自己做还累。
实际上,用户需要AI参与创作的需求很简单,一个能够贯通全流程的智能工作空间:能搜索资料,能摘取素材,能整理素材和思路,能创作修改,能适配各类应用场景。和自动驾驶一样,在所有人类作业环节,最理想的状态都是端到端,让AI直接把活干了。
为了满足用户的需求,具体到产品形态上,首先是要做出一款All in One的产品,解决工具细碎的问题,像人一样先持续收集信息,再整体性地思考、创作。
All in One不是简单的功能堆砌,而是对人类认知方式的深度模拟和对现代工作需求的必然回应,是AI工具演进的内在逻辑和发展方向。
一方面,人类的思维方式本就是多模态的,我们在思考时自然地融合了语言、图像、声音等多种信息形式。All in One模式自然就贴近了人脑的整体认知模式。
另一方面,这也解决了现代工作场景往往需要多种能力协同。工具切换带来的时间和注意力成本不容忽视,而上下文的连续性对工作效率至关重要。
而自由画布,正好是All in One的绝佳形态。
从chatbot到画布,AI的All in One进化
像人一样持续收集信息,再进行整体创作,在All in One的模式下,无论是chatbot的交互方式,还是文档式的AI润色、续写,显然都不够用了。前者,意味着AI与人的交流仍然是线性的多轮次的沟通;后者则仍然还是将AI变成word里的一个功能插件。
那么,究竟什么样的AI功能/产品才能够解放用户生产力?
百度文库给出的答案是“自由”。
这个“自由”,不仅仅是界面形态的创新,对技术能力的全面包含,也是对创作本质的思考。
首先是技术层面的自由——多模态理解的突破。
在画布中,文本、图片、视频等多种格式内容可以自由导入,AI系统能自动理解不同模态内容间的关联,实现了对传统单一格式限制的突破。让AI获取像人一样的全模态信息。
比如在研究报告撰写场景中,用户可以同时导入PDF文献、网页、会议记录和相关图片,AI会自动分析这些异构数据之间的逻辑关系,帮助用户快速构建知识网络。
其次,则是在产品层面,自由画布满足了交互层面的自由。
不同于传统文档的线性排版,采用类似思维导图的自由布局方式,用户可以在对素材进行自由批注、圈选,任意选择素材的重点和使用方式,同时可以并行处理多个创作任务,同时展开多个思维分支,生成多种类型的作品。
以小红书博主的创作流程为例,他们可以在画布中同时准备多篇内容,将灵感、素材、文案并列展示,随时调整组合,突破了传统对话式交互的单线程限制。
最终,在技术和交互自由之上,才能实现思维自由。
类似思维导图的重要性,正是让人的思维从文档的线性输出,转向网状思维,支持发散式创意探索。画布的形式也是一样的,突破了文档的线性思维,也不受限于chatbot的线性思维,让创作回归人类思维本质,创作流程不再受限于固定的创作步骤,随时调整、重组内容结构,实现真正的灵活创作。
我们可以想象一个创意工作者的桌面:他可以随手将网络上的创意素材拖拽到画布中,AI助手会即时理解内容并提供创作建议,多个创意方向可以同时孵化。
这种多维度的“自由”正是画布范式区别于其他AI工具的核心优势。
它不只是解决了工具层面的效率问题,更重要的是符合了创作的思维方式,将创作从线性的轨道上解放出来,回归到更自然的网状模式。
结尾
媒介技术学者麦克卢汉曾提到过,媒介本身具备着影响文化和社会的能力。文字时代通过书写,培养了人类的“视觉线性思维”和个人化阅读习惯;印刷时代则通过标准化文本,加速知识传播,强化了理性主义和个人主义;电子时代,又通过“地球村”打破了线性叙事,实现即时交互和多感官参与。
同样地,chatbot也好,画布也好,作为创作和信息的载体,也在影响着人们思维的方式。
在chatbot中,AI是与你对话的个体,通过接收、理解用户发出的信息进行生成,而在画布的形态下,AI成了与用户共享视角的存在,这才是画布这一形态带来的价值。
当然,从目前已推出的自由画布功能来看,想要释放这一模式的潜力,还有很多空间。例如,目前,画布主要可以只能创作出长文、图片体裁的作品,创作的自由度还可以继续扩展;另一方面,自由画布也面临着,如何既兼容各式各样的功能,又保持简洁、避免繁琐复杂。
不过,无论如何,自由画布的出现,让AI从对话者转变为共创者,从线性突破到多维,都是一次新鲜的尝试。
随着95后、00后成为创作主力,谁能满足这一代人对自由创作的渴望,谁就能在下一代生产力工具的竞争中占得先机。画布模式的出现,或许会对AI原生应用带来更多的可能性。
来源:硅星人一点号