摘要:Canvas全量开放,ChatGPT进一步升级为生产力工具 北京时间12月11日凌晨,OpenAI在Day4直播中发布最新功能Canvas并面向所有用户推送。Canvas直接内置在ChatGPT中,提供了一个单独的窗口,主要用于编程、写作任务,会提供意见、审核
一、【浙商计算机】OpenAI Day4
Canvas全量开放,ChatGPT进一步升级为生产力工具 北京时间12月11日凌晨,OpenAI在Day4直播中发布最新功能Canvas并面向所有用户推送。Canvas直接内置在ChatGPT中,提供了一个单独的窗口,主要用于编程、写作任务,会提供意见、审核和执行具体的功能并提供更细致的服务,同时Canvas也支持表情符号。
【Canvas用例】 1、用户可以在ChatGPT中使用Canvas获取写作反馈,将文本选择在Canvas中打开时,会出现“获取建议”和“帮助我写作”等提示,直播演示中,使用者要求AI从物理老师的角度对文本发表了评论。用户可以接受、拒绝或对留下的评论提供反馈,并通过添加或删除实时更新文档。 2、编程功能下,目前Canvas可理解 Python。新的“运行”按钮可让用户在Canvas窗口中启动 Python 代码,并通过控制台窗口实时查看结果。ChatGPT 可提供上下文,并提供针对运行代码时可能发生的错误的故障排除辅助。用户还可以选择“修复错误”让ChatGPT 完成相关。 3、代码转换:用户可通过Canvas将Python代码转换为JavaScript、TypeScript、Java、C++或PHP等,同时尽量保持原有的逻辑结构不变,轻松实现跨语言、平台开发。
我们认为,Canvas可视为内置Agent来指导ChatGPT进行更好的内容生成和修改,在优化用户体验的同时,有望进一步提升用户在文本编辑、代码编写等领域的效率提升,建议关注:
AI+智能体:焦点科技、科大讯飞、金山办公、彩讯股份、泛微网络、迈富时等。
AI+编程:普元信息、金现代、科大国创、新炬网络等。
二、【广发证券】OPENAI新品发布追踪系列(一):OPENAI积极探索商业化 SORA正式上线 从创作工具向生产力工具转变
核心观点:
事件:OpenAI 正在进行为期12 天的直播活动。2024 年12 月4 日晚,OpenAI CEO Sam Altman 在X 宣布从第二天太平洋时间上午10 点开始,将进行为期12 天的OpenAl 活动。每个工作日都会进行直播,发布或演示一些产品和圣诞惊喜。
Day1:发布o1 完整版模型,相较于o1-preview 更为智能,在高难度数学题解答、编程能力和复杂科学问题分析等领域表现优异;推出200 美元/月的ChatGPT Pro 订阅,包括无限制访问o1、o1-mini、GPT-4o 等高阶模型,并提供对o1 pro 的支持。
Day3:视频生成工具Sora 正式上线,提供了全新的交互界面、多种视频编辑模式以及故事板工具,使得用户能够以更低的成本和更高的效率创作视频内容。在定价方面,Sora 已包含在ChatGPT Plus 和Pro 订阅中,用户无需额外付费。生成不同长度、质量的视频会消耗不同数量的credit,Plus 用户每月1000 credits,Pro 用户每月则有10000 credits。此外,明年初将推出针对中小型企业等不同类型用户的灵活定价方案。OpenAI 积极探索商业化。收入成本矛盾下,OpenAI 面临盈利压力,积极探索高端订阅服务推动商业化,本次推出的高达200 美金每月的Pro 订阅同样反映了公司对商业化的积极探索。同时,为应对盈利压力,OpenAI未来可能拓展广告业务。Sora 的正式上线推动视频生成从创作工具向高效生产力工具转变。Sora Turbo 带来了更为精准和多样化的功能更新,如故事板工具、Remix 和Recut 等编辑功能,通过模型改进与算法优化,推理过程变得更加高效,减少了每次生成视频所需的计算资源。这一创新不仅提升了生成速度和效果,也使得创作者能够以更低的成本、更高的效率进行创作,推动了视频生成技术的普及和应用。这标志着视频生成技术的一个重要转折点,从创作工具向高效生产力工具转变。
投资建议。AI 应用端,建议关注:第四范式、商汤、星环科技、金山办公、福昕软件、泛微网络、万兴科技、美图公司、合合信息、同花顺、佳发教育;AI 算力端,建议关注:寒武纪、紫光股份、浪潮信息、中科曙光、神州数码。
风险提示。应用软件市场竞争加剧;AIGC 商业落地的不确定性;AIGC 产业链价值分配的不确定性。
三、【海通证券】OPENAI直播跟踪(二):SORATURBO面世并投入商用 最高支持1080P20S视频
Sora Turbo 面世,最高支持1080p 20s 视频。12 月9 日(直播第三天),OpenAI正式发布Sora Turbo 并投入商用。Sora Turbo 相比OpenAI 在2 月推出的Sora,速度大幅提升。通过Sora Turbo 用户可以生成最高1080p 分辨率的视频,时长最长为20 秒,支持宽屏、竖屏和方形的纵横比。用户可以上传自己的素材进行扩展、混合或重新编排,或者完全通过文本生成新的视频内容。
此外,OpenAI 开发了新的界面,使得用户可以更轻松地通过文本、图片和视频来提示Sora。OpenAI 的分镜工具还允许用户精确指定每一帧的输入内容。定价方面,Sora Turbo 将免费提供给ChatGPT Plus 和 ChatGPT Pro 用户,月租20美元的Plus 用户,每月最多可以生成50 个优先视频,最高支持720p、5 秒的视频;月付费200 美元的 ChatGPT Pro 订阅者每月最多可生成500 个优先视频,普通视频无限量生成,可以同时生成5 个视频,最高支持1080p、20 秒的视频,此外还提供下载无水印版视频的附加功能。
Sora Turbo 功能强大,使得视频生成功能更加实用。Sora 拥有强大的视频生成功能,包括:(1)Remix(混合):使得用户能够替换、移除或重新设计视频中的元素;(2)Re-cut(重新编辑):该功能能让用户找到并且选中最佳帧,向任一方向延伸;(3)Storyboard(分镜板):它相当于按时间轴的方式,把一段故事切成了多个不同的故事卡(视频帧)。用户只需要设计和调整每张故事卡(视频帧),Sora 会自动把它们补成一段流畅的故事;
(4)Loop(循环):通过这个功能,Sora 可以修剪并创建无缝的重复视频,Sora 会在开头和结尾中添加大量帧,来将它们连接起来;
(5)Blend(混合):通过这个功能,可以把两个完全不同的视频,融合为一个无缝剪辑;(6)Style presets(风格预设):该功能让用户充分发挥想象力,创建想要的风格,以官方示例为例,原始视频是两头猛犸象在雪地里走路的场景,用户可以将这一视频转换为纸工艺品风,即两个纸板做的“猛犸象”在纸做的“雪地”中行走。
Sora 基于DALL〃E 和GPT 模型的经验教训,定位为通往AGI 的重要里程碑。
Sora 基于DALL〃E 和GPT 模型的经验教训,旨在为人们提供扩展的讲故事和创意表达工具。Sora 是一种扩散模型,通过从看似静态噪声的视频开始,逐步去除噪声生成视频。在为模型提供多个帧的前瞻性信息后,OpenAI 解决了一个具有挑战性的问题:即在主题暂时离开视野时,确保它保持一致性。与GPT模型类似,Sora 采用了变换器架构,解锁了卓越的扩展性性能。
Sora 采用了DALL〃E 3 的重标注技术,该技术通过为视觉训练数据生成高度描述性的标注,使模型能够更加忠实地跟随用户的文本指令生成视频。除了可以通过文本指令生成视频外,Sora 还能够从现有的静态图像生成视频,准确地动画化图像内容并关注细节。Sora 还可以对现有视频进行扩展或填补缺失的帧。Sora 为理解和模拟现实世界的模型奠定了基础,OpenAI 相信这一能力将成为实现人工通用智能(AGI)的重要里程碑。
我们认为,Sora Turbo 能够生产1080p、20s 的视频,使得AI 生成的视频至少从清晰度和时长上开始能够贴合实际的需求,而且Sora Turbo 还拥有强大的特色功能,使得其视频生成功能更加实用,其生成的视频应用场景进一步拓宽、加深,总的来说,Sora Turbo 的发布代表AI 视频模型的技术水平和商业化进入到了新时期,未来发展速度有望持续提升。建议关注:万兴科技、虹软科技、新国都、当虹科技、同花顺、新致软件、金山办公、福昕软件、泛微网络、致远互联、三六零、合合信息、商汤科技、科大讯飞、迈富时、汉得信息、鼎捷软件、赛意信息、中国软件国际、海康威视、大华股份。
风险提示:AI 技术发展不及预期,AI 应用落地不及预期。
免责声明:
1.本号内容在于分享信息和供本号相关人员随时查阅,除原创文章外其它内容不代表本号观点或立场;分享的信息仅供参考,不构成投资及交易建议,如使用请自行核实,据此操作,风险自担。
2.本号分享的信息如有侵权,请及时私信联系,本号将及时处理!
来源:花明