抢先DeepSeek R2,阿里通义正式发布国内首个通用推理模型
已经流传了一个月的时间;特别是最近一周内,坊间对Qwen 3的猜测不断在“憋个大的”与“最终难产”之间反复横跳。
通用 r2 deepseek 推理模型 deepseekr2 2025-04-30 14:40 8
已经流传了一个月的时间;特别是最近一周内,坊间对Qwen 3的猜测不断在“憋个大的”与“最终难产”之间反复横跳。
通用 r2 deepseek 推理模型 deepseekr2 2025-04-30 14:40 8
杭州一家中厂的算法从业者告诉「电厂」:“近几个月网上不少DeepSeek R2的泄露信息,有人说R2要在5月份发。Qwen 3(这个时间发布)肯定是想抢个先机。”
通用 r2 deepseek 推理模型 deepseekr2 2025-04-29 22:05 8
2024年4月26日,中国电信粤港澳大湾区(韶关)算力集群正式上线全球首个商用智算昇腾超节点CloudMatrix 384。这一节点采用全光互联架构,配置包括12×47U计算柜+4×47U总线设备柜,搭载192颗鲲鹏920 CPU、384颗昇腾910C芯片、3
r2 deepseek 910c 附股 deepseekr2 2025-04-28 21:57 8
4月27日,全球最大AI开源社区Hugging Face CEO发推暗示DeepSeek R2即将发布。不少网友在评论区也纷纷猜测R2可能很快上线。而在今日凌晨,关于R2的泄露信息也在X平台上遭到病毒式传播。不过,目前尚无法确认这些信息的真实性,而从信息源头来
开源 ceo r2 deepseek deepseekr2 2025-04-27 16:54 7
周末,Meta深夜突袭发布Llama 4系列,号称“原生多模态+千万级上下文窗口”,并首次披露单卡H100可运行的轻量化版本。此前OpenAI则宣布O3和O4-mini模型即将在几周内上线,同时确认GPT-5因技术整合和算力部署问题推迟数月。
r2 llama deepseek deepseekr2 关 2025-04-06 15:02 7
DeepSeek新论文来了!在清华研究者共同发布的研究中,他们发现了奖励模型推理时Scaling的全新方法。
推理 清华 r2 deepseek deepseekr2 2025-04-05 10:13 10
腾讯在X平台上推出了Hunyuan-TurboS,这是一款被称为首款超大型Hybrid-Transformer-Mamba MoE模型的AI产品。它通过结合Mamba的长序列处理能力与Transformer的上下文理解能力,成功解决了传统模型在长文本处理中的瓶
模型 r2 deepseek pika deepseekr2 2025-03-12 00:48 11