DeepSeek内部数据库泄露;ChatGPT仿DeepSeek升级推理交互;Claude全球服务宕机 | 极客头条

360影视 2025-01-31 12:11 2

摘要:前阿里高管张斯成评论 DeepSeek 热议,呼吁理性对待开源项目DeepSeek 内部数据库因配置问题暂时可被访问ChatGPT 优化推理功能展示,与 DeepSeek 采用类似交互设计Claude 全球服务突发中断,Anthropic 紧急启动故障排查阿里

「极客头条」—— 技术人员的新闻圈!

CSDN 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。

整理 | 箭蛙

出品 | CSDN(ID:CSDNnews)

一分钟速览新闻点!

前阿里高管张斯成评论 DeepSeek 热议,呼吁理性对待开源项目

DeepSeek 内部数据库因配置问题暂时可被访问

ChatGPT 优化推理功能展示,与 DeepSeek 采用类似交互设计

Claude 全球服务突发中断,Anthropic 紧急启动故障排查

阿里宣布 Qwen2.5-Max 旗舰模型 API 定价

吴恩达:DeepSeek 崛起凸显 AI 领域四大趋势

谷歌发布 Gemini 2.0 Flash 模型,Imagen 3 图像生成技术同步升级

OpenAI 新轮融资估值或达 3400 亿美元,软银拟投资最高 250 亿美元

扎克伯格公布 Llama 4 研发进展,将主打原生多模态和代理能力

DeepSeek R1 70B 登陆 Cerebras 平台,推理速度较 GPU 提升 57 倍

OpenAI 为欧洲多国用户推出新功能,包括视频共享和自定义指令更新

Waymo 在亚特兰大启动完全无人驾驶测试,年内将与 Uber 合作推出服务

微软将 DeepSeek R1 模型引入 Azure AI 和 GitHub 平台

PyTorch 2.6 发布:加入 Python 3.13 支持并停用 Conda 发布

国内要闻

前阿里高管张斯成评论 DeepSeek 热议,呼吁理性对待开源项目

前阿里钉钉事业部副总裁张斯成在社交媒体发文,就近期 DeepSeek 相关热议分享看法,指出网传“黄教主给股东的信”和“梁文峰的公开信”均为杜撰。他认为 DeepSeek 在技术层面确有创新,主要聚焦于提升算力效率和算法有效性,但关于 PTX 调用是否规避 CUDA 限制仍存在专业争议。

张斯成指出,目前事态发展面临挑战:一方面是外媒对其训练成本的质疑,另一方面是将其过度解读为中美科技竞争。他呼吁给予这一国内优秀开源项目更多包容和发展空间。

他同时强调,尽管 DeepSeek 带来突破,但算力仍是行业刚需,只是市场对高端算力稀缺性的焦虑有所缓解。他建议 DeepSeek 加强危机公关管理,避免陷入不必要的争议。

DeepSeek 内部数据库因配置问题暂时可被访问

外媒 TechCrunch 报道,云计算公司 Wiz 的安全研究人员发现并报告了 DeepSeek 一个数据库的配置问题。该数据库包含用户聊天记录和 API 密钥等信息。Wiz 团队表示,这是由数据库访问权限的默认配置导致,在收到通知后,DeepSeek 已及时调整了相关配置。目前尚无法确认该配置持续了多长时间,以及是否有其他访问情况。

阿里宣布 Qwen2.5-Max 旗舰模型 API 定价

阿里云通义千问今日宣布其新一代模型 Qwen2.5-Max 的 API 定价:输入令牌价格为每百万/ token 1.6 美元,输出令牌价格为每百万/ token 6.4 美元。

此前,Qwen2.5-Max 模型凭借其在大规模 MoE(混合专家)模型领域的研究成果,在 Arena Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等多个基准测试中展现出优异性能。目前,用户可以通过通义千问官方网站的在线对话服务、API 接口以及 Hugging Face 演示平台等多个渠道使用该模型。

国际要闻

吴恩达:DeepSeek 崛起凸显 AI 领域四大趋势

AI 领域知名学者吴恩达近日发表观点,认为 DeepSeek 的爆发性增长揭示了当前 AI 发展的四个重要趋势:

首先,中国在生成式 AI 领域正快速追赶美国。他指出,过去两年中美差距显著缩小,包括 Qwen、Kimi、InternVL 和 DeepSeek 等中国模型在多个领域展现出强劲实力,部分领域甚至已现领先迹象。

其次,开源权重模型正推动基础模型层“平民化”。以 DeepSeek-R1 为例,其每百万 token 定价仅为 OpenAI 的 1/30,大幅降低了开发和使用成本,为应用开发者创造了新机遇。

第三,算法创新正成为 AI 发展的重要路径。受限于硬件条件,DeepSeek 团队通过算法优化,仅用不到 600 万美元的算力成本就完成了模型训练,展示了规模扩张并非进步的唯一途径。

最后,开源模式对 AI 供应链具有重要意义。吴恩达表示,如果美国持续限制开源发展,中国可能在 AI 供应链中占据更重要地位。

Claude 全球服务突发中断,Anthropic 紧急启动故障排查

AI 公司 Anthropic 今日发布服务异常通告,其旗下产品 Claude 的全球服务出现大规模中断。故障表现为用户登录 claude.ai 时遭遇 502 网关错误,出现身份认证失效提示。监测数据显示,中断期间 API 调用失败率峰值达 82%,控制台仪表盘数据延迟超过 15 分钟。

OpenAI 新轮融资估值或达 3400 亿美元,软银拟投资最高 250 亿美元

财联社报道,软银正主导 OpenAI 新一轮融资,计划投资 150 亿至 250 亿美元。此轮融资总规模预计达 400 亿美元,将使 OpenAI 估值升至最高 3400 亿美元,较去年 10 月 1570 亿美元的估值翻倍。

部分资金将用于支持 OpenAI 履行在"星际之门"项目中约 200 亿美元的出资承诺,该项目初期投资额为 1000 亿美元,由 OpenAI、软银各投 190 亿美元,甲骨文和阿布扎比 AI 公司 MGX 投资 70 亿美元。剩余资金将用于支持 OpenAI 业务运营。

谷歌发布 Gemini 2.0 Flash 模型,Imagen 3 图像生成技术同步升级

谷歌今日宣布在 Gemini 应用中推出 Gemini 2.0 Flash 模型,声称是“为了 Agent 时代设计的最新型号”。该模型在多项关键基准测试中展现出更快的响应速度和更强的综合性能,适用于头脑风暴、学术辅助和文本创作等日常场景。官方数据显示,2.0 Flash 的单次推理延迟较前代模型降低 43%,在逻辑推理类任务中的准确率提升 19%。

Gemini Advanced 用户将继续享有 1M token 上下文窗口支持,可处理长达 1,500 页的文档上传,并拥有深度研究(Deep Research)和专属技能包(Gems)等功能的优先使用权。同步升级的还有图像生成模块——最新版 Imagen 3 在细节丰富度和纹理表现力上达到新高度,能更精准理解用户指令完成创意可视化。

目前 2.0 Flash 已通过 Gemini 网页端和移动端向全球用户开放。为保障用户体验连续性,Gemini 1.5 Flash 和 1.5 Pro 版本将在未来数周内继续保留现有对话功能。

ChatGPT 优化推理功能展示,与 DeepSeek 采用类似交互设计

ChatGPT 近期悄然进行了界面更新,新增了一个灯泡图标功能,用户点击后可切换“Use more intelligence”(使用更多智能)和“Think”(思考)两种模式。这一设计使其推理思考功能更加直观可见,与近期广受关注的 DeepSeek 采用了相似的交互方式。

此次更新似乎正在进行灰度测试,不同用户收到的更新内容略有差异。例如,部分 Mac 版本用户发现模型选择按钮除了原有的顶部位置外,现在在输入栏也能进行切换,提供了更便捷的操作方式。

扎克伯格公布 Llama 4 研发进展,将主打原生多模态和代理能力

Meta CEO 马克·扎克伯格在 Facebook 上透露,作为下一代开源 AI 模型,Llama 4 的研发正在稳步推进。其中,Llama 4 Mini 已完成预训练阶段,推理模型和更大规模的模型也展现出良好成果。

与此前 Llama 3 着重于让开源模型追赶封闭模型的目标不同,Llama 4 的定位是成为行业领导者。扎克伯格表示,Llama 4 将是一个原生的多模态“全能模型”,具备智能体能力(agentic capabilities),有望解锁更多新的应用场景。相关详细计划将在未来几个月内陆续公布。

对于 2025 年的 AI 发展,扎克伯格预测将出现重要突破:AI 智能体(agent)有望达到中级工程师水平,具备编程和解决问题的能力。他认为,这将成为历史上最重要的技术创新之一,率先实现这一目标的公司将在 AI 研究和行业格局中占据领先优势。

DeepSeek R1 70B 登陆 Cerebras 平台,推理速度较 GPU 提升 57 倍

AI 芯片公司 Cerebras 今日宣布,DeepSeek R1 70B 模型已在其平台上线。该版本结合了完整版 R1 的推理能力和 Llama 70B 的规模优势,在通用和推理基准测试中的表现超越了 GPT-4o 和 o1-mini,被认为是目前性能最强的 Llama 70B 变体。

在 Cerebras 平台上,R1 70B 的推理速度达到每秒 1,500 个 token,比 GPU 解决方案快 57 倍。例如,在代码生成任务中,Cerebras 平台仅需 1.5 秒即可完成,而 o1 mini 则需要 22 秒。

OpenAI 为欧洲多国用户推出新功能,包括视频共享和自定义指令更新

OpenAI 今日宣布,面向欧盟、挪威、冰岛、列支敦士登和瑞士的用户推出多项新功能。ChatGPT 移动应用的高级语音功能(Advanced Voice)现已支持视频和屏幕共享功能,这项功能此前于 2024 年 12 月首次在其他地区推出。

同时,OpenAI 还在这些地区的 chatgpt.com 网站和 Windows 桌面应用上推出了更新版的自定义指令功能。该功能于 1 月 18 日首次发布,通过全新的用户界面,允许用户自定义 ChatGPT 的回应方式,包括设定其性格特征、对话风格以及遵循的规则等。

这两项功能的欧洲区域推出,标志着 OpenAI 继续扩大其全球服务范围,为更多地区的用户提供完整的 ChatGPT 体验。

Waymo 在亚特兰大启动完全无人驾驶测试,年内将与 Uber 合作推出服务

Waymo 今日宣布在亚特兰大开启完全无人驾驶模式测试,目前仅面向其员工开放。该公司表示,这一进展建立在其在旧金山、凤凰城、洛杉矶和奥斯汀等城市累计超过 3300 万英里自动驾驶经验的基础之上。

Waymo 计划于今年晚些时候通过与 Uber 的独家合作,在亚特兰大向公众推出商业化无人驾驶出租车服务。此外,该公司还将目标瞄准迈阿密市场。目前在奥斯汀的服务仍处于候补名单阶段。

程序员专区

微软将 DeepSeek R1 模型引入 Azure AI 和 GitHub 平台

微软宣布在其 Azure AI 和 GitHub 平台上正式提供 DeepSeek R1 模型服务。开发者现可通过 Azure 一键部署方案快速集成该模型,免去复杂的基础设施搭建过程。微软表示已对模型进行安全测试并集成内容安全过滤功能。

值得注意的是,微软计划推出 R1 的精简版本,使其能够在 Copilot Plus PC 上本地运行。开发者可通过 Azure 账号直接调用 API,或在 GitHub 平台获取更多开发资源和集成指南。

此前,微软曾向所有 Copilot 用户免费提供 OpenAI 的 o1 推理模型。

PyTorch 2.6 发布:加入 Python 3.13 支持并停用 Conda 发布

PyTorch 团队近日发布 2.6 版本,带来多项重要更新:torch.compile 现已支持 Python 3.13,新增性能控制参数 torch.compiler.set_stance,以及多个 AOTInductor 改进。此外,该版本还为 X86 CPU 添加了 FP16 支持。

来源:CSDN

相关推荐