摘要:2024年12月4日,纽约时报Youtube频道发布Sam Altman DealBook峰会专访,主要围绕Sam Altman对OpenAI过去2年发展、未来方向、AI技术发展趋势看法展开。Altman预测,AGI可能比预期更早到来,将在2025年带来令人震
2024年12月4日,纽约时报Youtube频道发布Sam Altman DealBook峰会专访,主要围绕Sam Altman对OpenAI过去2年发展、未来方向、AI技术发展趋势看法展开。Altman预测,AGI可能比预期更早到来,将在2025年带来令人震惊的AI系统,AI Agent是未来发展重要方向。
2024年12月5日,OpenAI正式开启Shipmas产品发布季,将连续12个工作日发布新产品与功能更新。首日,OpenAI推出两个重磅更新,o1模型满血正式版、ChatGPT Pro订阅计划。o1模型处理复杂问题错误率大幅降低,同时在数学、编程、科学问题上展现出色表现,特别是在多模态识别上重大突破,实用性大幅提升。ChatGPT Pro订阅计划,定价200美金/月,提供更强大o1 Pro模式,确保在处理难题时获得更多算力,实现更高稳定性与一致性。
2024年12月6日,OpenAI推出强化微调技术,允许用户根据特定需求定制o1 mini模型,预计将在2025年Q1正式发布。这项技术将使科学家、开发者、研究人员能利用自有数据定制o1推理模型,即使只有少量训练数据,提高模型在特定任务与领域准确性,预示AI模型性能提升关键手段。
2024年12月9日,OpenAI延迟10个月,正式推出AI视频生成模型Sora,与预期Sora 2.0级别大版本升级不同,此次发布更注重形成端到端可交付产品。Sora在产品设计上有所进步,物理理解等问题仍有待提高,Plus用户每月有50次生成配额,Pro用户享受无限慢速模式与500次快速通道。
本期智能前线,选择Sam Altman专访纪要、OpenAI 12弹发布季系列前3弹介绍与分析,瓜哥AI新知、腾讯科技发布,六合商业研选精校,分享给大家,Enjoy!
正文:
全文16,625字
预计阅读33分钟
纽约时报专访Sam Altman:如果时光倒流,我会要OpenAI股份,马斯克的xAI是强大的对手
时间:2024年12月6日
字数:10,480
Sam Altman接受纽约时报DealBook峰会专访,2024年12月4日公开发表于New York Times Events Youtube频道,主要围绕Sam Altman对OpenAI过去2年发展、未来方向、AI技术发展趋势的看法展开。
内容导读
ChatGPT成功并非完全预料之中:OpenAI内部一直相信大型语言模型潜力,ChatGPT的爆火程度与时机仍存在偶然性。GPT-3发布相对较早,杀手级应用是开发者在playground中的交互式使用,ChatGPT正是基于此改进而来,使其更容易上手,并广泛流行。
AGI临近与影响:Altman认为AGI可能比大多数人预期的更早到来,带来的经济变革将是渐进式开始,迅速加剧;预计在2025年,将出现令人震惊的AI系统,认为AI Agent是未来发展重要方向。
AI发展三大关键要素与Scaling Law:Altman指出AI发展三大关键要素是算力、数据、算法,它们之间可以相互权衡。算力竞争最为显著,算法突破性进展才能带来指数级收益提升,坚信AI Scaling Law将继续有效,没有墙。
与微软合作关系与算力获取:Altman承认与微软合作中存在挑战,整体上认为合作关系积极;表示OpenAI需要确保获得足够算力,并不一定需要自行建造全部数据中心,可以借助云服务商的力量。
对AI安全性回应与担忧:Altman承认存在对OpenAI不够重视安全的批评,认为安全是持续迭代与协商的过程,强调迭代式部署的重要性;认为极度危险的超级智能,离我们比较远,需要在技术与政策层面共同努力应
对竞争对手看法:Altman认为xAI,将成为强大竞争对手,对他们快速建设数据中心的能力表示尊重;认为AI技术最终会商品化,并非坏事。
OpenAI发展模式转变:OpenAI最初是非盈利组织,发展需要巨额资金,逐渐转向盈利模式,非营利组织初衷与部分工作仍在继续,解释了OpenAI组织结构调整的复杂性与挑战。
个人持股问题与对未来展望:Altman解释自己未持有OpenAI股份原因,强调自己对工作的热爱与满足感胜过金钱;认为AI将改变世界,人类根本需求与情感不会因此改变,他期待孩子降生,认为这比AGI更重要。
对版权与创作者权益看法:Altman认为需要新的协议来规范AI训练数据的使用,支持创作者获得报酬的机制,认为《纽约时报》诉讼立场是错误。
访谈全文
主持人安德鲁:非常感谢你,感谢你来到这里。
Sam是OpenAI联合创始人、CEO,这是我们时代影响力最大的公司之一。
仅在过去的几年里,ChatGPT发布以来,Sam与他的团队已经将AI带入主流,从根本上改变我们工作、沟通、创新方式、我们对未来将会是什么样的思考。
OpenAI现在价值约1,570亿美元,不仅引发一场军备竞赛,真正重新定义技术的可能性,随着他向AGI迈进,我们被迫要认真思考关于未来工作、权力平衡、伦理考量、许多其他议题的重大问题,我们将与Sam深入探讨所有这些问题。
感谢这位处于这一切中心的人物,很高兴见到你。
2年前,几乎就在这个星期,你们发布ChatGPT。我认为,可以说,当你按下按钮的那一刻,一切都乱套了。
感觉是这样,它改变了全球对话,改变了融资重点,转移了资源的流动,其他科技公司也改变他们做事方式,已经出现诉讼、各种反应。
我非常好奇,能否请你带我们回到2年前,几乎是同一天或同一周,分享当时按下按钮时预期的结果。
Sam Altman:我们一直都知道,会有一些时刻,无论出于什么原因,世界都会从不理解到理解。突然之间,这项技术是有效的这一点会变得清晰明了。
在内部,那时对我们说,语言模型会不断扩展,会做所有这些有用的事,这似乎非常明显。
为什么它在ChatGPT发布时发生,我有一些理论,为什么它在当时发生,而不是在我们之前发布GPT-3与API时发生,或者为什么它直到几个月后GPT-4发布才发生,这是一个有趣的问题。
当它真正流行起来时,似乎有一些偶然的因素。我们通过API与GPT-3观察到,GPT-3有点早期,它并不适用于很多事。
某种意义上说,它的杀手级用例之一,是开发者在playground游乐场中使用它,在那里他们可以在实现API之前快速测试想法。他们喜欢与模型对话,他们会坐在那里,与GPT-3进行关于任何事的对话,这是人们主要使用它的方式。
我们说,如果这就是人们想要的,我们可以让它更易使用。你不需要注册开发者帐户、执行所有其他操作,我们可以对其进行调整,以擅长对话。我们说,让我们把它做成一个产品。
现在,我们一直在计划用GPT-4来发布它。我们在2022年8月完成GPT-4,我们将其保留了一段时间。
你是否预料到这一切都会发生?
再说一次,某个时刻,我们认为世界上会有一件大事发生。
我们知道它会恰好在ChatGPT发布时发生吗?不是。
主持人安德鲁:现在,2年后,我们所有人都在问的下一个大问题是,我甚至不敢相信我们只是在2年后才问这个问题,你刚写到这个问题,你说我们有可能在接下来几千天内拥有超级智能。
2年前,你这么认为吗?当你提到几千天时,我可以对这意味着什么进行各种计算。
Sam Altman:存在很大不确定性,对超级智能的定义也不同。
2年前,我们认为我们正处于一条非常陡峭的曲线之上。我们创建OpenAI,是我们认为这是可能的,可能不会太遥远。进展顺利,我们希望它会进展顺利。
就像,我们相信深度学习是人类令人难以置信的新发现。我们认为它可以达到这个目标,我们有责任让它达到这个目标,让它进展顺利,广泛分享益处,我们认为我们可以做到这一点,我们仍然相信我们可以做到这一点,但这并不确定。仍有工程方面的工作要做,但我认为这是可能的,我认为这并非遥远的未来。
我预计在2025年,我们将拥有这样的系统,即使是对当前进展持怀疑态度的人也会说,我没想到会这样,这会改变什么?
我认为,AI Agent是每个人都在谈论的事,我认为这是有充分理由的。这个想法是,你可以给AI系统相当复杂的任务,就像你交给非常聪明人的任务一样,需要一段时间才能完成,使用一堆工具来创造一些有价值的东西,这就是我2025年期待的那种事,这是一件大事。
我们谈论这件事就像,这件事将会发生,但这是真的。如果它像我们希望的那样有效,它真的可以改变很多东西。
主持人安德鲁:我们应该怎么想?过去几周里,有很多标题新闻谈论到AI的Scaling Law正在放缓。你发布这条,我不知道是含糊其辞,还是非常直接,你发布一条推文,上面写着,没有墙。
Sam Altman:看还有什么比这更不含糊的方法,这完全是一次试图不含糊其辞的尝试,说,这将会继续下去,希望这至少能暂时解决这个问题。
我一直对人们多么喜欢推测有墙吗,缩放会继续下去吗,感到震惊,而不是仅查看进展曲线,然后说,也许我不应该与这样的指数增长作对。
无论如何,我们还有很多很棒的新东西,我们正在为假期做一些有趣的事。我们从明天开始,进行12天OpenAI活动。我们将每天发布一些东西或进行演示,持续接下来的12个工作日。在不透露太多关于明天事情情况下,是持续的进步。
主持人安德鲁:给我们一点提示,如果它明天就要开始的话。
Sam Altman:我不想剧透,等待的时间并不长。
主持人安德鲁:我不擅长等待,我想知道。
关于AI的一个重大问题是,这与缩放问题有关,就是需要多少数据、需要什么,才能继续缩放。有多少是关于纯粹的处理能力,因此是资本,与数据相比,你从哪里获得数据,这个合成数据、数字数据的想法,我们将在此基础上重新创建数据?
在这个阶段,需要什么才能扩展?当人们甚至谈论一些限制因素时,我认为其中包含一些关于哪个部分将获得这个的问题。
Sam Altman:还有其他要素,三个关键要素是算力、数据、算法,有时你可以权衡它们。
比如,如果有更好的数据,可以减少算力使用;或者,如果有更多算力,可以用它来生成合成数据,获得更多数据。
一段时间以来,我们在算力方面,获得令人难以置信的容易收益。最近,我们在算法方面取得很多进展。你需要同时推动三个要素的发展,在不同时间,对其中一个或另一个要素的投入,可能会有不同的回报,我倾向于将这三个要素都考虑在内。
主持人安德鲁:对你来说,我猜想算力是最大的因素?如果没有算力,其他一切都不重要。
Sam Altman:某种意义上,算法的进步才是最重要的,最大的因素。也许你可以将计算机规模扩大一倍,也许随时间推移,通过大量资金投入,可以将计算机规模扩大10倍。但偶尔,算法会带来1,000倍收益,Transformer就是很好的近期例子。这种情况很少见,一旦发生,就是最大收益。
主持人安德鲁:现在感觉像是在进行一场算力军备竞赛,一场为算力筹集资金的军备竞赛,一场建造与获取更多算力的军备竞赛。你与微软有合作关系,你现在依赖他们。
Sam Altman:我认为所有这些方面,都在进行竞争。
算力竞争,是最有趣、最引人注目、数字最大的那一个,它得到最多关注,非常重要,我不想轻视它。
肯定也有大量的努力,投入到谁能想出最好的算法、谁能获得新的数据源上,我认为这三个方面都在竞争。
主持人安德鲁:你与微软有合作关系,有时它被描述为,以最好的方式说,一种科技上的兄弟情。我刚读到Alex Heath文章,他写道,微软与OpenAI正在逐渐疏远。
Sam Altman:我认为我们没有疏远,我不会假装没有不一致或挑战,有一些。总的说,我认为这对两家公司,都是非常积极的事,很高兴能够一起做更多、更多的事。
主持人安德鲁:长远看,你认为你需要拥有自己算力,而不是依赖其他人吗?
Sam Altman:我认为我们需要确保,获得足够我们想要、可以依赖的算力。也可能有一些原因,我们有一些关于我们想构建东西的非常疯狂想法,这些想法,是高风险、高回报的。
我们不需要OpenAI,变得非常擅长建造像大型数据中心那样的计算机。
其中一件事,也许这是我成长方式的结果,我作为那一代初创公司创始人之一长大,当时情况是,那段时间之前,每个人都必须自己建造硬件,你们有这些大型数据中心。
突然之间,AWS改变局面,我一直都是这么想的。
我很乐意我们说,我们将不得不自己建造东西,或者随时间推移,垂直整合会变得更重要。
但专注研究与产品,做我们正在做的事,真的很好。
主持人安德鲁:我之所以这样问,是这会造成一种朋友、敌人、亦敌亦友的局面,我想,你有你的产品。
我昨天用它来检查了一些事,效果如何?很好。很高兴听到这个消息,我们稍后会请Sundar来,你们正在做的搜索产品非常吸引人。
Sam Altman:它真的很酷。我不得不说,这是我们推出我最喜欢的产品,谢谢你说这些。这是我很久以来,推出我最喜欢的产品。我经常使用它,非常满意,它彻底改变了我使用互联网的方式。
主持人安德鲁:我之所以这样说,是你们关系是这样:微软在Copilot中使用你的产品,苹果也在使用你的产品,你们自己销售自己原生产品。
某些时候,利益是否不再一致?我这么说,是包括《纽约时报》在内一些报道暗示,对于你们获得多少算力与访问权限,OpenAI员工应该使用的某些微软产品,他们可能不想使用的要求方面,存在一些不满,我只是想了解所有这些。
Sam Altman:在不同时间,肯定存在真正的算力紧缺。同样,我们产品规模已经扩大。
2年前,我们几乎没有业务,现在我们每周有超过3亿活跃用户,我们用户每天向ChatGPT发送超过10亿条消息。
我们拥有非常庞大的开发者业务,我认为大约有130万美国开发者,全世界还有更多。
我们需要大量算力,比我们预测的还要多。
这在商业史上,是不同寻常的快速扩张,这方面存在压力,我没有听说有人使用微软服务而感到沮丧。
我们拥有庞大的平台业务,我们拥有庞大的第一方业务,许多其他公司都在管理这两件事。
我们擅长一些事,微软擅长一些事。再说一次,并非没有压力,总的说,我认为我们目标是相当一致。
主持人安德鲁:听起来有点紧张,但在AGI方面,你总是说,你与他们交易的一部分是,如果你真的实现AGI,交易可能会被取消,听起来你好像快成功了。
Sam Altman:我们说过,我们目标是将AGI视为沿途一个里程碑。我们给自己留下一些灵活性,我们不知道会发生什么。
我猜想,我们将比世界上大多数人想象的更早实现AGI,它的重要性会小得多。
我们与其他人表达的许多安全担忧,并没有在AGI出现的那一刻到来,就像AGI可以被构建出来。
世界还是按照同样的方式运行,经济发展得更快,事情发展得更快。但随后,从我们所说的AGI,到我们所说的超级智能,会有一段持续不断的延续。
主持人安德鲁:那时我们才应该担心,我记得你甚至在过去几年里,你在华盛顿与其他地方告诉我们,应该感到紧张。
Sam Altman:确实如此。
首先,即使在AGI到来之时,我认为仍然有一些值得担忧的事。
我预计经济的颠覆性变化,会比人们想象的持续更久一些,社会存在着巨大惯性,强度也会比人们想象的更剧烈。
最初几年可能变化不大,经济可能发生剧烈的变化。
我不相信无业的说法,我认为我们总会找到事可做。
每一次重大的技术革命,都会带来大量职位更替,我敢打赌,这次的变革速度将前所未有。
我认为在相对较短时期内,我们需要担心类似这样的问题。极其危险的事,我认为,离我们还比较远。
主持人安德鲁:你相信政府或其他人,能够想出办法避免这种情况吗?
Sam Altman:我相信研究人员能够想出办法避免这种情况,我认为有一系列技术难题,世界上最聪明的人,将会致力解决这些难题。
我天生比较乐观,我假设他们能够解决这些问题。我们正在非常努力工作,其他人也在非常努力工作。
我认为摆在我们面前的任务还有很多,我同时认为我们拥有这项神奇,并非魔法,而是这项令人难以置信的科学成就深度学习,它可以帮助我们解决非常棘手的问题,我认为我们会把这件事做好。
围绕AGI的社会问题,不仅是几年后就能完成大量工作,创造巨大经济价值的那种AGI,而是真正的超级智能,那种不仅比你聪明、比我聪明,甚至比我们所有人加起来都聪明的系统,拥有令人难以置信的能力。
即使我们能够在技术上确保它的安全,我假设我们会做到这一点,我们必须对我们政府抱有一定的信心。
这将需要一些相关的政策措施,需要在一定程度上进行全球协调,我认为这种情况将会出现,这似乎是一个挑战。
主持人安德鲁:这就是安全问题。
我们都读过相关新闻标题,你也多次出现在新闻标题中。
在过去1~2年里,有许多人,包括OpenAI内部一些人,他们要么离职,要么公开发表意见,或者采取其他行动,他们说,这些人对安全不够重视,你必须回答信任问题。
请说明一下,以便我们理解。当人们说对安全关注不够时,你认为是什么情况?具体是什么问题?应该做的事没有做到?
Sam Altman:我会指出我们过往记录,我会说,我们谈到过我们推出一款伟大的产品。这是一项非常新兴的技术,发展速度非常快。
一开始,我们不知道如何很好对其进行对齐。现在,它普遍被社会认为是安全可靠的。安全,这始终是由许多利益相关者协商达成的协议,也许很难准确定义它意味着什么。
主持人安德鲁:对儿童版GPT,安全意味着什么。我这么问,是当我们听到一些离开OpenAI,公开发表言论的人,他们在X/推特说,这些人不重视安全。
这是关于安全资源的问题吗?是关于处理能力的问题吗?是关于你们关注度的问题吗?
Sam Altman:有人认为ChatGPT不够安全,它允许它不应该做的事,或者没有做它应该做的事,有些人会在这方面施压。
有些人会说,ChatGPT比我们想象的要安全一点。下一个系统的计划是什么?我们要如何处理这个问题?还有一些人会说,发布这样的系统本身就不安全,OpenAI加速全球竞争,这让我们用来处理安全问题的时间更少。
我们相信,这是有主观意见的立场,这种迭代部署的想法非常重要,我们必须将这些系统投放到世界中,社会与技术必须共同发展。
你必须从风险较低时开始,你必须了解人们将如何使用它,它在哪些方面不起作用,哪些方面有效。
还有一些人会说,这样做有一些好处,不值得付出相应代价。
主持人安德鲁:让我问一个不同的问题,也许它可以追溯到处理能力的问题。
我打算提到,马斯克正在建造他自己的处理设施,是巨大的处理能力实验室,为xAI提供动力。
我问你是否需要你自己处理能力的原因之一是,似乎每个人都在获取自己处理能力。
我们之前刚与肯谈论马斯克,马斯克在这些年中与你们关系相当独特,他既是创始人,也是现在正在起诉OpenAI的人,你认为xAI在多大程度上是你们竞争对手。
我们总是谈论谷歌,也谈论Anthropic,在某种程度上谈论微软。
我不知道你认为亚马逊处于什么地位,我们今天下午会与贝佐斯谈。
你是怎么看待这个问题的,他们是竞争对手吗,你认为他们是你们最大的竞争对手之一吗?看起来他们发展得非常迅速。
Sam Altman:我认为他们将成为非常强大的竞争对手。
主持人安德鲁:你预料到这一点吗?他们在做什么?他们做了什么,他们是如何能够如此快速组建一家公司,我不是说它与你们正在做的事可以相比,它已经非常接近,发展速度非常快,这是什么原因?
Sam Altman:目前处于前沿的许多模型都非常接近,我非常尊重他们建造数据中心的速度。
主持人安德鲁:你担心所有这些都会因此商品化吗?我不是说任何人都能做到,这看起来就像,你们优势是什么,你们劣势是什么?
Sam Altman:我认为这项技术本身,如果你相信深度学习就像某种物理定律,我们发现一项重要新的科学成果,这部分工作将会由很多人来完成,每个人都有自己对AI的比喻。
Sundar Pichai一会儿会来这里,他把它比作电力;许多其他人把它比作工业革命,有些人称为文艺复兴。
我喜欢的一个比喻是晶体管,这是一项科学发现,一些公司首先发现这项发现,它改变了我们社会,扩展得非常好。
当人们谈论规模定律时,我认为最好的比喻是摩尔定律,这个概念被世界各地许多公司使用。
如果你看这个房间里所有带有晶体管的东西,我们不会把它们看作晶体管设备,我们不会认为谷歌是家晶体管公司,如果没有晶体管,他们就不会存在。
我认为AI也将发生这种情况,将会有令人震惊的强大模型,广泛可用,并用于一切事物。未来的人们会无法想象,他们使用的设备、产品、服务不是真正智能的。
他们不会都自称是AI公司或AI产品,某种意义上说,AI本身,也就是它推理引擎的本质,将会商品化,这很好。
科学应该传播到整个社会,这就是为什么我们专注构建像ChatGPT这样的东西。
主持人安德鲁:另一个问题,也跟马斯克有关,就是你们公司现在正转向盈利模式,现在是公益性质的。
如果大家看过新闻报道,马斯克正在就此事、其他许多事起诉你们。我只想从非常私人角度问你,抛开案件优劣不谈,作为与他共事多年、共同创立OpenAI的人,你今天对这一切有什么感受?
Sam Altman:令人极其难过,我从小就视马斯克为超级英雄。
我认为马斯克所做的一切,对世界都非常不可思议。我现在对他感觉有所不同,我仍然很高兴他存在。
这不仅是,我是认真的,不仅是我认为他的公司很棒我这么认为,而是他在一个大多数人没有抱有远大抱负的时候,他激励包括我在内很多人更有野心思考。
我很感激,这词好像不太贴切,我更愿意说是感谢,我对这一点持积极态度。
我们一起创立OpenAI,在某个时候,他完全失去对OpenAI信心,决定走自己的路,这也没什么问题。
我认为马斯克是一位建设者,大家都知道的一点是,他非常在乎成为领头人。我认为他是一个,如果他不是,就会在市场、技术或其他领域竞争,而不是诉诸法律诉讼。
不管申诉中陈述的内容是什么,我认为他只是一个竞争对手,我们做得很好,看到这种情况让人很难过。
主持人安德鲁:我必须问你这个问题,《华尔街日报》上有一篇文章,你、贝佐斯、其他一些他的主要竞争对手都在其中。文章推测,像你这样的人担心他的影响力,不仅是他在科技领域势力,包括他现在与当选总统密切关系。
Sam Altman:我不担心,我对此深信不疑,我可能最终会错,我非常相信马斯克会做正确的事,美国人如果利用马斯克所拥有的这种政治权力,来伤害竞争对手,让自己企业获益,那将是极度不美国的行为。
我认为人们不会容忍这种行为,我认为马斯克不会这么做,这会严重违背我认为他非常珍视的价值观,我不担心。
主持人安德鲁:马斯克提出一个指控是,他认为OpenAI现在规模太大,没有竞争,你们试图通过阻止潜在资助者同时资助你们与例如xAI或其他公司来阻止竞争发生,这是不正确的。
Sam Altman:这是一个非常标准的做法,我们所说的是,如果你投资我们,想投资我们的任何竞争对手,完全没问题,我们会停止你的信息知情权。
你仍然可以这样做,但这对我们规模的公司说是一个非常标准的条款。
我们不会再告诉你,我们研究路线图,每个人都觉得这很合理。
同样,这就像,你想投资他们?去投资吧。
主持人安德鲁:让我问你一个关于公司本身的不同问题。
你们最初是以非盈利组织身份启动,最初是一个研究机构。现在,我认为有一种观点认为,它必须转变为某种盈利导向的公司,它必须这样做吗?
Sam Altman:首先,我想谈谈我们一开始就以非营利组织身份启动的原因,我认为这也能说明问题的答案。
我们开始时,我们根本不知道我们会成为一家产品公司,我们不知道我们需要的资金会如此之巨大。
如果我们知道这些事,我们会选择不同组织结构。很难夸大其词,时间不算很久远,很难夸大2016年的情况有多么不同,那是在我们拥有产生语言模型的研究成果之前的几年,那是在我们发布第一个产品之前的4年半,那是在我们发布ChatGPT之前的6年半。
我们只知道我们想做一些AI研究,我们认为AGI与超级智能,最终将成为对世界非常重要的事,我们想做一些对世界有益的事。
当时,我们正在撰写论文、开发新的强化学习算法、创建新的理论、研究如何玩电子游戏、制造机械手,当时并不清楚是否会有产品或收入来源,也不清楚我们是否需要收入来源,似乎我们不需要大量资金。
在GPT-1与其他一些工作的发布之后,我们意识到我们需要扩大规模。
与此同时,马斯克决定停止资助我们这个非营利组织,我们发现很难找到替代资金来源。这种情况让我们意识到,我们需要找到一种方法,来产生有限利润。
我们致力继续许多我们认为作为非营利组织是有益的举措,因此我们成立一家利润有限的子公司,这种模式运作了一段时间,某些方面,目前仍然运作良好。
其他方面,鉴于我们在下一阶段所需的资金量,它正在对非营利组织控制的组织理论框架造成压力,我们一直在探索可能的改变。
目前还没有做出任何决定,弄清楚这件事非常复杂。
董事会正在努力解决这个问题,无论采用哪种配置,非营利组织都不会消失。
例如,董事会考虑过一种方案是,由非营利组织拥有大量股份的PBC公共利益公司,想办法利用这笔财富来实现非营利组织的目的,还有其他的想法。
主持人安德鲁:我一直很好奇的一件事是,你从未在公司中持有股份。
我认为你比我更在意这个问题,我很惊讶。你的工资是7.6万美元,我看过,我相信你说的,就是这样。
如果公司真的出现这样时刻,人们期望你会得到一些股权,媒体对此有很多报道。
Sam Altman:关于这个问题,也有一些投资者的压力,我没有获得股权这件事很奇怪。
主持人安德鲁:你想要吗?
Sam Altman:不,我不想。如果我能回到过去,我会拿一点,只是为了不必再回答这个问题。无论我多少次尝试向人们解释,我拥有世界上最有趣、最酷的工作,这就是我的退休生活,是我梦想中度过时间的方式,在我拥有相当不错的职业生涯之后。
人们可以从事艺术项目,而不为此获得报酬,没有人觉得奇怪,或者其他什么,这只是……没有传达出来,我希望我当时拿了一些。
我不认为我会因此工作更努力或更不努力,我认为我会与投资者或其他人的目标更加一致,这肯定更有利于融资。有很多投资者没有投资,因为我没有持有股权。
主持人安德鲁:他们说,真的,这很有趣。他们不会投资,你没股权。
Sam Altman:这个问题出现过几次。
主持人安德鲁:如果OpenAI现在估值1,570亿美元,如果这种情况发生,你认为一个合适的数字是多少,我认为你应该更多考虑这个问题。
我必须再问几个快速的问题,其中一个,需要完全公开,我们应该说明一下。
Sam Altman:在你继续之前,我能就这一点再多说一句?我知道时间紧迫,我会很快的。就像,这是我儿时的梦想工作。不是每天,不是每天都这样。
我宁愿不,一直撞得头破血流。能够从事AGI研究,能够与世界上最聪明的研究人员一起工作,参与这场疯狂的冒险,这正是我一直想做的,这真的是我儿时的梦想。
除了所有这些古怪的事之外,我认为至少应该可以理解,这对我说比任何额外的金钱都更有价值。
主持人安德鲁:让我问你这个问题,如果我不提它,我就失职了。
碰巧《纽约时报》正在就使用内容进行训练,对OpenAI与微软提起诉讼。
这个房间里,有很多内容创作者与其他人士靠创作内容为生,我只是很好奇,我知道你不能谈论诉讼本身,对在这个房间里写过书、写过文章、拍过电影等,信息已被用于训练的人,无论是在开放网络、封闭网络,还是YouTube上,我们应该有什么样感受?
Sam Altman:我认为我们需要一个新的协议、标准或任何你想要称呼它的东西,来规范创作者如何获得回报。
我非常相信学习的权利,或者任何你想要称呼它的权利。
如果一个AI阅读一些东西,一本物理教科书可以学习物理学;它可以用这些知识做其他事,就像人类一样。我认为版权法与合理使用法的这些部分,需要继续适用。
我认为我们正在开始探索,其他人也在探索一些额外的东西,我一直以来特别热衷研究如何实施微支付。
例如,如果你用安德鲁·罗斯·索尔金的风格创作了一个故事,你应该可以选择允许使用你的姓名、肖像与风格,因此获得报酬,还有许多其他想法。
我认为关于合理使用的讨论,处于错误的层面,我们非常相信学习权利方法的必要性。但我真正认同的部分是,需要找到新的经济模式,让创作者拥有新的收入来源。
关于《纽约时报》,我不相信作为客人,出现在别人家里却行为粗鲁。
我要说的是,我认为《纽约时报》站在历史的错误一边。
主持人安德鲁:在很多方面都是如此,我们可以讨论与辩论这个问题。
我认为,我们会在法庭上这样做,期待见到你。
我最后想问你的问题,几乎与技术无关,也许有关,就是你个人生活中2025年将发生一件非常令人兴奋的事,你将拥有自己孩子。
对于所有父母与准父母,他们都在思考AI将如何影响我们生活,甚至我们作为人的意义是什么,如果机器真的能够做我们真正做不到的事。
我们应该做什么,我们应该如何思考它,它对我们自身尊严的影响是什么。
当你有了孩子,你正在思考,并与孩子交谈时,你认为你会告诉他们关于我们即将进入的这个新世界什么?
Sam Altman:没有什么能比得上,我相信拥有孩子会更加强烈,即使是像真正准备好要孩子一样。
至少对我说,没有什么比这更能使AGI显得无关紧要的。
我对AGI的兴奋程度,我认为已经相当高,对拥有孩子的兴奋程度要高得多,它让我从另一个角度看待什么才是真正重要的。
我认为这是一个对一般现象的具体视角,就是我们长期以来,一直在开发令人难以置信的新技术。
每次发生这种情况时,人们都会进行这些对话,这意味着什么?工业革命来临,机器夺走我们所有工作,这意味着什么?电脑革命来临,电脑取代许多现有工作,这意味着什么?
答案是,至少就人类意义而言,没有太大影响,经济会增长,人们从事的工作类型会发生变化。
人们会更关心他们孩子,比他们关心AGI、或任何其他技术所能带来的任何东西都要多得多。
深刻的人性驱动力如此强大,已经存在很长时间,进化漂移非常缓慢。
我认为某种意义上,我的孩子将在一个与众不同的世界中长大,某种程度上,它将完全相同。
主持人安德鲁:非常感谢你们的谈话,谢谢。
OpenAI系列狂欢第一弹:满血版o1模型来了,还有Pro版会员200美元/月
时间:2024年12月6日
字数:1,692
北京时间12月6日凌晨2点,OpenAI正式开启 Shipmas产品发布季,明显是受到圣诞日历Christmas Calendar传统启发的12天连发活动。
就像小朋友每天打开圣诞日历上一个小格子期待惊喜一样,OpenAI要给全球科技圈每个工作日都送上一份圣诞礼物。
今天发布会上,Sam Altman亲自承认,公司将在工作日陆续发布新产品与功能更新。
开门红就放大招,OpenAI带来两个重磅更新:o1模型满血正式版、与堪称顶配版的ChatGPT Pro订阅计划。
简直是给这两天疯狂发布新品的谷歌,贴脸送圣诞惊喜。
满血o1模型:完全态不一样
发布会开始,Sam Altman先提到新版o1在处理复杂问题时的重大错误率降低34%,能根据题目难易程度调节处理时间,困难的题可能做几分钟,简单题目仅需几秒,使得用户等待时间下降超过50%。
Sam Altman紧接着给出它的表现数据,o1在国际数学奥林匹克预选赛题目AIME 2024中拿到83%正确率,把GPT-4o的13%甩得连尾灯都看不见,比起o1-preview的56.7%也提升将近一半。
编程能力测试CodeForces方面,o1展现出强劲实力,从GPT-4o的11%,跃升到o1的89%。算得上从入门级,直接涨到架构师水平,同样比o1-preview提升一半。
在处理博士级科学问题GPQA Diamond时,o1超越人类专家表现,达到78%准确率,人类专家水平为69.7%。比较奇怪的是,这一项上,o1表现似乎不如o1-preview。
更重要的更新是:o1现在支持多模态识别。
发布会现场,o1负责人直接手绘在太空中收集太阳能,以供太空数据中心使用的一套系统草图让o1识别。
太空中没法水冷,散热需要靠一张巨大的散热片。研究员让o1计算,如果要给的数据中心供给1 GW电,它需要多大散热片,才能保证GPU阵列正常运作。
o1完全准确识别与理解图片内容,经过超过3屏的精密分析与计算,给出正确答案,需要242万平方米的一块巨大散热片才够。
回答这个问题,仅用o1 10s时间。
可以预见,多模态支持技能一解锁,o1实用性暴增。医生可以用它分析医学影像,工程师能让它帮忙看图纸,设计师能让它提供创意建议。
另一道现场测试题更为复杂:OpenAI研究员要求o1找到一种符合六个标准的特定蛋白质。
这个问题的挑战在于,需要模型回忆相当专业的化学领域知识,对于任何给定的标准,可能会有数十种蛋白质符合该标准。
模型必须全面考虑所有候选者,检查它们是否符合所有标准。
这一问题需要大量思考与排查的问题,o1花了63s做对。
安全性测试中,o1拿下84分的高分,比GPT-4o的22分有质的飞跃。OpenAI在让AI既聪明、又懂规矩这事上,没少下功夫。
o1新模型,今日起将面向 ChatGPT Plus 与团队用户开放,企业与教育用户从下周开始可使用。
ChatGPT Pro:200美金/月,买个稳定发挥
o1升级是意料之中,月收费200美元的ChatGPT Pro,真的让人倒吸一口凉气。之前一直传闻提到OpenAI会推出200美元收费套餐,这个价格过高,业内很多人不相信。
看数据,它是目前AI模型界旗舰。
这个套餐里,OpenAI 提供最强的o1 pro mode。Sam Altman自己解释,这个模式会让o1处理非常难的题目时,获得更多算力与能量。
听起来似乎才是o1真正完全体,不卡算力情况下的o1。
一般测试中,o1 pro 模式,在国际数学奥林匹克预选赛题目AIME 2024中,正确率达到86,超过o1版本78。
编程中,它与o1相当,在处理博士级科学问题GPQA Diamond时,有5%左右的优势。
这点性能提升,似乎不值得大家每个月多花180美元升级成Pro版本。
为了展示o1 pro mode强大,OpenAI专门设计一套极其严格的四次测试评估:模型需要连续四次,都答对同一个问题才算通过。
这种严苛条件下,o1 Pro模式,依然保持相当高可靠性:竞赛数学中达到80%,编程测试中达到74.9%,科学问题中达到74.2%,远超普通版o1。
说明o1 pro,能提供更佳稳定性与一致性,这对需要AI协助完成重要工作的专业人士,无疑是重要保障。
ChatGPT Pro版,客户能享受到完整GPT-4o访问权限,无限使用,不用排队。
未来可期:更多惊喜在路上
这只是12天发布计划的首日,OpenAI这波圣诞营销节奏掌握的不错,第一天放出业内预测会在12天发布的最重要的产品之一满血版o1。
这力度,肯定能勾起大家对接下来11天更新的好奇心。
有一点是肯定:2024年AI圈,注定要在这个寒冬里进入搏杀状态。
谷歌可能会发Gemini 2,Anthrophic据说会有新模型将在圣诞前上线。
对整个AI圈,今天仅是开始。
直播最后,OpenAI研究员讲了个圣诞冷笑话:圣诞老人试图让他大型语言模型解决一个数学问题,他非常努力提示它,就是不行。
他最终是怎么解决的,用的是reindeer enforcement learning驯鹿加力学习。
笑点是,这几个词连在一起读出来就是reinforcement强化学习。
烂谐音梗,让Sam都无语。
OpenAI系列狂欢第二弹:强化微调惊艳了不在现场的Sam Altman
时间:2024年12月7日
字数:1,173
12月7日消息,OpenAI第二日发布会上,将焦点完全放在企业领域。企业用户现在可以利用强化微调Reinforcement Fine-Tuning技术,根据各自特定需求定制o1 mini模型。
OpenAI直播活动参与者说法,科学家、开发者、研究人员,现在能利用自己数据定制强大的o1推理模型,甚至几十个例子就可以,不再局限仅使用公开数据。
通过强化学习技术,各领域专家可以在o1模型基础上开发出专业的模型,将显著提高各自领域专业能力。
OpenAI联合创始人、CEO Sam Altman在X发帖表示:今天我们宣布推出强化微调功能,这使得在特定领域创建专家级模型变得非常容易,即使只有很少的训练数据也能到。强化微调的alpha项目现已启动,正式版会在2025年Q1发布。
Sam Altman随后表示:它的效果简直太棒了,它成了我2024年最大惊喜之一,真期待看到大家会创造出什么成果。
什么是强化微调
OpenAI官方博客提供信息,强化微调是一种先进的模型定制技术,允许开发者通过使用数十到数千个高质量的任务来定制模型,根据提供的参考答案来评估模型响应。
这种技术通过加强模型在类似问题上推理能力,提高模型在特定任务与领域上准确性。
强化微调是一种利用强化学习原理,进一步优化与定制预训练模型的方法,使其在特定任务上表现更佳。
ChatGPT对此解释:在AI中,强化微调指的是一种结合强化学习RL技术与监督式微调的训练方法。
它通常用于提升AI模型性能,特别是在期望行为涉及复杂决策或与人类偏好一致的场景中。
本质上,强化微调允许AI结合来自大规模预训练的通用知识,与由强化学习信息的任务特定优化,产生既能干、又与期望目标一致的模型。
强化微调的作用
AI领域,强化微调技术正成为提升模型性能的关键手段。这项技术通过利用大型模型对特定数据进行训练,使得模型能更深入理解与处理复杂领域的问题,尤其是在需要大量数据与专家知识的研究中。
OpenAI的o1模型与GPT-4o,能够分析上传的数据,它们在未经微调情况下,无法达到在特定数据上微调后的模型版本所具有的深度理解。
现在,o1模型首次能对复杂数据进行推理,大大增强实用性。
用户需要准备一个数据集与一个评分系统,以评估模型在训练与验证数据集上表现。
通过结合o1模型、微调技术与特定数据,用户可以创建性能超越原始o1模型的新版本o1 mini。这一过程中,OpenAI将承担所有技术工作,用户仅需提供数据支持。
OpenAI强化微调研究计划
OpenAI表示,强化微调技术目前处于研究预览阶段,计划在2025年全面推出。
OpenAI当前诚邀研究机构、大学、企业参与强化微调研究计划Reinforcement Fine-Tuning Research Program。
预计在法律、保险、医疗保健、金融与工程等领域有积极结果,该模型在结果具有客观正确答案(大多数专家都会同意)的任务中表现出色。
OpenAI强化微调研究计划包括以下内容:
API访问权限:作为研究计划一部分,参与者将获得OpenAI强化微调API的alpha版本访问权限,以便在专业领域任务中测试这项技术。
反馈与改进:OpenAI将征求用户反馈,以便在API公开发布之前对其进行改进。
数据集合作:OpenAI希望与愿意共享数据集的组织合作,利用这些数据进一步优化模型性能。
OpenAI系列狂欢第三弹:Sora来了,自带剪辑工具,145块就能玩
时间:2024年12月10日
字数:3,088
延迟10个月后,OpenAI在北京时间12月10日凌晨正式推出Sora。
与大家期待中Sora 2.0级别的大版本升级不同,一致性、1分钟视频输出,没有。
正如OpenAI产品经理所言,这次发布更注重形成端到端的可交付产品。
对基础模型升级,Sora团队只提到用很大功夫让Sora能更快、更便宜生成,这一更快、更便宜的新版Sora被称为Sora Turbo。
OpenAI官网产品更新页里,丝毫没提及模型改进,只有对产品介绍。
官方发布内容效果,整体与过往Sora的演示水平相差不大。
17分钟发布会看完,感受是Sora在产品设计上,向专业影视软件靠近一些。模型的原地踏步,让它很难成为用户所期待的大餐。
总体梳理发布会提供的关键信息:ChatGPT会员可直接使用Sora Turbo,Plus用户每月50次生成配额,Pro用户享无限慢速模式与500次快速通道;新版除了基础文生视频,加入故事板编辑工具、场景混合功能、循环视频制作,支持多种分辨率与最长20秒视频输出,用户能保存预设风格、一键分享作品到社区。
向着AI生成的FinalCut迈进
Sora核心界面相当简洁明了:它将整个系统分为三大核心区域,探索区Explore、个人库Library、创作系统Creation System。
探索区作为Sora社区中心,采用信息流形式展示用户分享的作品。用户可以直接在流式页面中预览播放视频,点击后进入详情页,查看完整内容。
这是很常规的产品设计,比较特别的是,Sora在每个作品详情页底部,都会展示完整的创作方法,包括具体的文本提示词、使用的参考图片,创作工具的详细设置。
Sora开发者,在直播中评价,这一功能帮助用户最大限度获取灵感。
个人库是用户创作管理中心,提供网格与列表两种视图模式。用户可以创建多级文件夹对作品进行分类整理,也可以将重要作品添加到收藏夹中快速访问。系统设置专门的上传区域,用于存储用户的参考图片与视频素材。
创作系统是Sora核心,整个创作系统包含三层工具体系,基础合成器、故事板、高级编辑功能。
基础合成器,提供最直接的创作入口,支持三种模式,通过文字描述生成视频,或将静态图片转换为动态视频,或者直接用视频生成视频。
用户可以在横向、方形、竖向三种画面比例中选择,分辨率最高支持1080P,视频长度可在5~20秒范围内调节。系统支持同时生成多个不同版本,最多四个,方便用户对比选择。
OpenAI内置多种视觉风格模板,如定格动画与气球世界等,方便用户快速实现特定的视觉效果。
,时长00:56
故事板是此次发布中最具创新性的功能,也是Sora最具野心的尝试。它为用户提供类似专业视频编辑软件的时间轴界面。
用户可以在时间轴上添加多个场景卡片,每个卡片都可以包含详细场景描述或上传的参考图片。用户可以将多个提示词串联起来,系统会自动处理场景之间过渡效果。
通过调整场景卡片之间的间隔,用户可以控制场景转换效果。系统会自动理解上传图片的场景内容,生成符合逻辑的动作描述,用户可以手动修改描述来精确控制场景发展。
如果对生成不满意,可以在故事版中用Recut,只保留其中一部分生成,让Sora重新生成另外部分。
,时长00:23
高级编辑功能方面,Sora提供三个专业工具,Remix、Blend、Loop。
Remix功能,支持对已有视频进行创意改编,用户可以通过1~8级的强度调节,来控制改编程度,还可以选择温和、适中、强烈的预设选项。
系统能保留用户指定的原视频元素,同时对其他内容进行创造性改变。
,时长00:40
Blend功能,允许将两个不同的视频场景融合,借由此创造介于梦境与现实间的奇异画面。用户可以调节融合比例与方式,选择需要保留的关键元素,系统会自动处理场景间过渡效果。
花与冰晶的Blend
Loop功能,专门用于创建无缝循环的视频片段,支持用户自定义循环的起始点,提供少帧、多帧两种处理模式,分别适用相似度高与差异较大的片段。
视频处理流程上,Sora采用分级处理机制。360P预览版本生成速度很快,通常只需20秒左右;1080P完整版本,需2~3分钟处理时间。系统支持后台处理,允许用户同时提交多个任务,提供实时处理进度反馈。
为辅助创作过程,Sora提供一系列辅助功能。系统会根据用户输入提供提示词优化建议,允许保存与复用常用的参数组合,比如设置成各种预设风格。
协作方面,用户可以将作品直接分享到探索区;复制他人作品的创作参数,添加标签与描述,参与作品评论与反馈。
请务必阅读免责声明与风险提示
来源:六合商业研选一点号