OpenAI 连续 12 天 AI 发布会汇总

摘要：o1 完整版本：这个版本在多个方面实现了突破性进展，包括更智能、更快的响应速度、多模态输入能力（能够处理图像和文本信息），以及在指令遵循方面的表现更好。o1 在重大错误率上降低了约 34%，思考速度提升了约 50%。o1 模型现在能够同时处理图像和文本进行推理

随着凌晨第十二天的 o3 模型的发布，OpenAI 连续 12 天的 AI 发布会结束了。下面回顾下这十二天都发布了些啥。

在 OpenAI 的第一天发布会上，主要发布了两个重要的更新：o1 的完整版本和 ChatGPT Pro 订阅服务。

1、o1 完整版本：这个版本在多个方面实现了突破性进展，包括更智能、更快的响应速度、多模态输入能力（能够处理图像和文本信息），以及在指令遵循方面的表现更好。o1 在重大错误率上降低了约 34%，思考速度提升了约 50%。o1 模型现在能够同时处理图像和文本进行推理，这为视觉相关的应用开辟了广阔的应用前景。

2、ChatGPT Pro：这是一个高级订阅服务，每月收费 200 美元，提供了无限访问 OpenAI 最先进的模型 o1，以及 o1-mini、GPT-4 o 和 Advanced Voice 等功能。特别引人注目的是 o1 Pro 模式，这是 o1 的一个高阶版本，利用更强大的计算资源，深度分析问题并为最复杂的问题提供更优解答。

用户价值：

提升效率和准确性：o1 的升级版为用户提供了更快、更准确的服务，尤其在复杂问题的处理上，减少了错误率，提高了思考速度。

多模态能力：多模态输入的支持使得 o1 能够处理更多样化的任务，如图像分析和图文结合的创作等。

专业级服务：ChatGPT Pro 为高需求用户提供了更强大的功能和更稳定的服务，适合在数学、编程等领域需要极致性能的用户。

o1 完整版本需要 Plus 用户才能体验，ChatGPT Pro 对个人来说太贵了，况且那些高级推理能力一般人也用不上。

重点介绍了「强化微调（Reinforcement Fine-Tuning）」技术。

强化微调技术：这项技术允许用户在极少的训练数据基础上，创建特定领域的专家模型。通过强化学习的理念，这一技术使得模型具备更自主的推理能力，并在各项指标上显著提升。强化微调能力可以让小体量模型「从高中水平跃升至专家水平」，预计将在 2025 年春季开放给用户。

用户价值：

定制化 AI 应用：强化微调技术使得企业或科研单位能够根据特定需求，快速训练出专家级别的 AI 模型，提升了定制化 AI 应用的可能性和效率。

OpenAI 发布了备受期待的 Sora 视频产品。

Sora 视频产品：Sora 支持生成 1080p 高清视频，并提供多种视频编辑智能功能，如替换元素、最佳帧隔离等，减少了视频创作的门槛。Sora 提供了文本转视频、图像转视频和视频转视频功能，并配备了精美的分镜工具，让用户精准指导视频创作。

用户价值：

视频创作民主化：Sora 的发布极大地降低了视频创作的技术门槛，使得普通用户也能创作出专业级别的视频内容。

创意表达工具：Sora 为创意人员提供了强大的工具，帮助他们更好地表达自己的想法和创意，推动了内容创作的创新。

最近看了檀东东的一个海螺和 Sora 对比评测视频，感觉 Sora 有点拉胯，对不起那么贵的价格。

OpenAI 为 Canvas 推出了三项重大更新，这些更新使得 Canvas 更加强大，为用户提供了全新的使用体验。

1、Canvas 全面开放与主模型集成：OpenAI 将 Canvas 面向所有用户开放，并直接将其整合到主模型中，免去了额外的加载步骤。用户可以直接从首页的输入框跳转到 Canvas，进行文档编辑和创作。

2、Python 代码实时执行能力：Canvas 集成了一个 Web Assembly 的 Python 模拟器，允许用户直接在 Canvas 中运行 Python 代码，并实时查看文本或图形输出。这个环境不仅能够实时运行与反馈代码，还能智能报错提醒和提供代码建议，极大地提高了编程效率。

3、Canvas 与自定义 GPT 的深度整合：新创建的自定义 GPT 将默认启用 Canvas 功能，而现有自定义 GPT 可以通过简单设置启用这项功能。这标志着 OpenAI 在构建 AI 应用生态系统上迈出了关键一步，有望催生出一个比传统应用商店更具创新活力的 AI 应用市场。

用户价值：

提高效率：Canvas 的更新使得文档编辑、代码编写和团队协作更加高效，尤其是实时代码执行和错误反馈功能，为程序员提供了即时的编程辅助。

增强协作：通过集成评论系统和版本对比功能，Canvas 优化了团队协作体验，使得团队成员的互动更加自然和高效。

扩展应用场景：Canvas 与自定义 GPT 的整合为开发者提供了更灵活的创作空间，降低了 AI 应用开发的门槛，加速了专业领域 AI 解决方案的落地。

这个功能还比较良心，向全部用户开放。

OpenAI 宣布了 ChatGPT 与苹果 iOS、iPadOS 和 macOS 系统的集成，允许用户在操作系统中直接访问 ChatGPT 的功能。

ChatGPT 集成到苹果系统：用户可以通过唤醒 Siri 来直接使用 ChatGPT 的功能。

用户价值：

便捷访问：集成到苹果系统中，使得用户可以更自然、更便捷地在更多场景中使用 ChatGPT。

提升体验：通过 Siri 的集成，ChatGPT 的交互变得更加直观和易于访问，提升了用户体验。

OpenAI 宣布了高级语音模式的重大升级，其中最引人注目的是视频聊天功能的加入。

1、视频聊天功能：用户可以通过智能手机摄像头与 ChatGPT 进行视频聊天，ChatGPT 能够理解用户的连续性动作以及记住相关信息，为用户提供实时的指导和帮助。

2、屏幕共享：用户可以将自己的屏幕分享给 ChatGPT，ChatGPT 能识别设备屏幕显示的物体和内容，并据此为用户提供相应的帮助和解答。

用户价值：

多模态交互：视频聊天和屏幕共享功能的加入，使得 ChatGPT 能够提供更加自然、直观的交流方式，增强了用户体验。

实时指导：通过视频聊天，ChatGPT 可以实时指导用户解决具体问题，如冲泡咖啡等，为用户提供了实际的帮助。

提高沟通效率：屏幕共享功能使得 ChatGPT 可以更直接地参与到用户的工作中，帮助用户解决技术问题，提高沟通和工作效率。

OpenAI 推出了名为「Projects」的新功能，这是一个旨在提高用户工作效率和项目管理能力的工具。

1、Projects 功能：Projects 允许用户上传文件、设置自定义指令，并在一个 Project 中组织所有对话。这个功能类似于 GPT，但主要的区别在于它能够将所有相关的对话和文件整合在一起，方便用户管理和跟踪项目进展。

2、文件上传与自定义指令：用户可以上传各种格式的文件，如 TXT、PDF、Word 文档、PPT 幻灯片和 Excel 电子表格等，ChatGPT 会阅读文件内容后回复用户。同时，用户可以为特定项目设置自定义指令，使 AI 更好地理解和执行项目相关的任务。

3、对话组织与管理：Projects 功能还允许用户将现有会话加入到 Project 中，使得项目管理更加集中和高效。

用户价值：

提高项目管理效率：通过整合文件和对话，Projects 功能帮助用户更有效地管理和跟踪项目进展。

增强协作能力：Projects 功能支持团队协作，使得团队成员可以共享文件和讨论，提高团队协作的效率。

定制化工作流程：用户可以根据自己的工作流程设置自定义指令，使 AI 更好地适应特定的工作需求。

这个功能应该值得充一个 Plus 。

OpenAI 宣布了 ChatGPT 搜索功能的三大更新，这些更新旨在提升用户体验和搜索功能的实用性。

1、搜索性能提升：OpenAI 提升了搜索性能，特别是在移动端，使得搜索更快、更便捷。

2、地图体验加入：搜索功能中加入了地图体验，用户可以更加直观地获取地理位置相关信息。

3、全球免费开放：搜索功能现在向全球所有登录用户免费开放，用户可以通过语音对话获取实时网络信息。

用户价值：

提升搜索效率：性能的提升和地图体验的加入，使得用户能够更快地找到所需信息。

实时信息获取：通过语音对话获取实时网络信息，提高了信息获取的便捷性和实时性。

全球用户覆盖：全球免费开放使得更多用户能够享受到 ChatGPT 的搜索服务。

不过 AI 搜索在国内是标配了。

在第九天的发布会上，OpenAI 主要针对开发者群体，推出了多个 API 相关更新，特别是 o1 API 的正式版本。

1、o1 API 正式版本：这个版本不仅速度更快、成本更低，还加入了视觉识别、函数调用等新功能，使得开发者能够更轻松地构建各类应用。

2、计算资源节省：o1 API 正式版本比之前的版本节省了 60% 的计算资源，这意味着开发者可以用更低的成本获得更好的性能。

3、WebRTC 支持：OpenAI 通过引入 WebRTC 支持，极大简化了实时语音应用的开发流程，现在开发者只需要 12 行代码就能构建基础的语音交互功能。

4、价格下调：相关服务的价格大幅下调，其中 GPT-4o 的音频处理费用降低了 60%，使得更多开发者有机会尝试语音应用开发。

用户价值：

降低开发成本：o1 API 的正式版本和价格下调，使得开发者能够以更低的成本构建和部署 AI 应用。

提升开发效率：新功能的加入和 WebRTC 的支持，简化了开发流程，提高了开发效率。

增强应用性能：节省计算资源和提升性能，使得应用能够提供更好的用户体验。

OpenAI 宣布了通过电话和 WhatsApp 使用 ChatGPT 的新功能。这意味着用户可以通过最基础的电话功能或 WhatsApp 与最先进的 AI 进行对话，号码是 1-800-CHAT-GPT，或者是 1-800-242-8478。支持智能手机，老人机和座机等设备。极大地降低了使用门槛。

电话接入：美国用户可以拨打 1-800-CHAT-GPT（即 1-800-242-8478），通过语音与 ChatGPT 对话。每月可免费通话 15 分钟。

WhatsApp 集成：全球用户可以在 WhatsApp 上添加上述号码为联系人，与 ChatGPT 进行文本交流。这是 OpenAI 首次将 ChatGPT 集成到 WhatsApp 平台，且该服务完全免费。

简单易用：不需要注册账号，不需要记住密码，只需要像打电话一样简单操作。

跨设备支持：从最新款的 iPhone 到老式的翻盖机，都能直接和 AI 对话。

多语言支持：ChatGPT 能够提供多语言服务，如教用户用西班牙语交流。

用不上。

OpenAI 宣布了 ChatGPT 与 Mac 应用的深度集成，特别在编程和写作方面进行了更新。现在，用户可以通过简单的复制粘贴操作，与 Warp、Xcode 等应用协同工作，无需详细交流即可执行任务。此外，ChatGPT 还支持在语音模式下与 Notion、Apple Notes 等应用协同工作。这些新功能已在 Mac 最新版 ChatGPT 应用中推出，而 Windows 用户还需等待。

桌面应用全新升级：ChatGPT 桌面应用支持与多种应用程序协同工作，包括开发工具和文档编辑工具。通过 ChatGPT 分析 Git 提交数据并生成可视化图表。

实时演示与 Warp 终端、Xcode IDE 的智能协作：展示了 ChatGPT 如何与开发环境无缝协作，为编程任务提供实时支持。在 Xcode 中实现代码自动补全和功能添加。

对 Notion、Apple Notes、Quip 等写作工具的支持：这些功能现已在 Mac 桌面应用上线，Windows 用户需等待。

高级语音交互模式：通过语音模式与 ChatGPT 交谈，提供了更加自然和高效的体验。

搜索辅助功能：确保输出信息的准确性，结合搜索功能来优化写作内容。

Mac 一直没升级，用不上。

今天凌晨的发布会上，OpenAI 发布了 o3 模型及其精简版 o3-mini。这标志着 OpenAI 在 AI 模型开发上的又一大步，o3 模型在性能上比前代模型有显著提升，而 o3-mini 则提供了一个更轻便的选择，以适应不同的使用场景和需求。

为什么从 o1 直接到了 o3，是因为跟英国电信服务提供商 O2 可能存在版权或商标冲突，就直接用了 o3。

目前不知道 o3 什么时候放出，但可以在下面地址进行申请：