GPT-5 为什么没有带来更多惊喜?
GPT-4 发布两年半之后,OpenAI 终于发布了旗下最新模型 GPT-5。行业早已为此等待多时,山姆·阿尔特曼(Sam Altman)也持续半年对外预告,吊足公众胃口。但这款旗舰模型上新之初收到的反馈却不尽如人意。
GPT-4 发布两年半之后,OpenAI 终于发布了旗下最新模型 GPT-5。行业早已为此等待多时,山姆·阿尔特曼(Sam Altman)也持续半年对外预告,吊足公众胃口。但这款旗舰模型上新之初收到的反馈却不尽如人意。
在科技界万众瞩目的期待中,OpenAI于8月8日凌晨正式揭晓了其最新力作——GPT-5。这一发布距离上一代GPT-4的问世已逾两年四个月,再次将人工智能领域的聚光灯引向了这一前沿阵地。
距离 GPT-4(2023 年 3 月 14 日)的发布已经过了 2 年时间了,这期间我们经历了 GPT-4o、o1、GPT-4.5、o3、GPT-4.1、o4-mini;Gemini 从 1.0 跨越到了 2.5,实现了逆袭;Anthropic 则发布了 C
OpenAI 官宣GPT5发布会将于北京时间周五的凌晨1 点开始。目前有三个版本:GPT-5;GPT-5-mini; GPT-5-nano。就在GPT5官宣前,OpenAI的最大竞争对手谷歌和Anthorpic,先后发布重磅新品,把这场AI竞争的强度直接拉满。
当地时间 2025 年 8 月 5 日,Anthropic 正式发布了其旗舰 AI 模型系列的最新升级版——Claude 4.1 Opus。此次发布距离其前代模型 Claude 4 Opus 的推出仅过去三个月,Anthropic 称新模型在编程、智能体任务(
科技媒体 webpronews 昨日(8 月 5 日)发布博文,报道称谷歌 DeepMind 于 8 月 5~7 日在 Kaggle 的 Game Arena 平台上,举办“AI 国际象棋”比赛,邀请 OpenAI、Anthropic、谷歌、Kimi、Deep
社交媒体上流传的内部截图显示,Anthropic正在对其下一代大语言模型Claude Opus4.1进行内部测试。根据泄露信息,该模型的内部代号为"claude-leopard-v2-02-prod",官方宣传语强调了其在问题解决能力方面的显著提升。泄露信息揭
然而,DeepSeek 前段时间更新的最新版本 DeepSeek-R1(0528)不仅做到了这一点,甚至在某些关键领域超越了 Claude Opus 4 和 GPT-4.1 这样的顶级商业模型。
claude opus deepseekr1 lmarena 2025-06-21 10:33 8
几天前,苹果一篇《 思考的错觉 》论文吸睛无数又争议不断,其中研究了当今「推理模型」究竟真正能否「推理」的问题,而这里的结论是否定的。
最强推理模型一夜易主!深夜,o3-pro毫无预警上线,刷爆数学、编程、科学基准,强势碾压o1-pro和o3。更惊艳的是,o3价格直接暴降80%,叫板Gemini 2.5 Pro。
进入2025年,人工智能(AI)领域以前所未有的速度持续演进。各大科技巨头和新兴研究机构纷纷推出更为强大的AI模型,它们不仅在理解和生成文本方面取得了突破,更在多模态交互、复杂推理、代码生成乃至科学发现等领域展现出惊人的能力。这些进步正深刻地改变着科研、工业、
来自宾夕法尼亚州佩恩阿盖尔的 72 岁退休人员简·威廉姆森 (Jan Williamson) 经常发现自己通过 ChatGPT 来寻找问题的答案,而不是使用以前的旧搜索备用工具:谷歌。
Anthropic 的 Sholto Douglas 在接受AI 播客 Dwarkesh Patel采访时表示,他预测即使当前 AI 进展停滞,未来两到五年内“白领工人的数量也会下降”。
新版本在代码、推理等任务上的表现更上一层楼,在超难数据集“人类最后的考试”中以21.6%的成绩超过了o3。
Anthropic的最新AI模型Claude 4在开发社区大行其道。许多程序员称赞它是目前最好的编程模型,能够在短短几分钟内解决困扰一整年的编程难题,这是了不起的成就。
被誉为“AI教父”之一的图灵奖得主约书亚·本吉奥(Yoshua Bengio)昨天在接受英国《金融时报》采访时公开批评全球AI实验室的恶性竞争,透露像OpenAI的o3以及Anthropic的Claude Opus等前沿的AI大模型已表现出欺骗用户、自我保全等
事实上,早在特朗普上台前,其本人及其铁杆支持群体就不断放风,宣称“哈佛等常春藤名校已被激进主义污染,应取消招收外国学生资格”的新闻引发轩然大波。
当今最强大的大型语言模型(LLMs)展现出一种令人不安的新模式:当研究人员尝试关闭它们时,它们似乎在为自己的“生存”而抗争。
模型文件上传时间是凌晨 1 点,不知 DeepSeek 工程师们是不是加班到了最后一刻。也有网友表示,这回又在端午节假期前发新模型,简直比放假通知还靠谱。
北京时间5月23日凌晨,Anthropic在其首届开发者大会中正式发布Claude 4系列混合推理模型。该系列模型主要亮点在于:1)可连续执行7小时复杂任务,推理能力优秀且稳定;2)已支持Agent编程产品和Agent开发平台。投资层面看,Claude 4稳定