mamba

KAIST团队:如何让AI模型更高效?

想象一下,如果你的手机能够在处理复杂任务时既快速又节能,那该多好?韩国科学技术院(KAIST)的研究团队刚刚在2025年3月的《机器学习研究汇刊》上发表了一项令人兴奋的研究成果,他们开发出了一种让人工智能模型变得更高效的全新方法。这项研究的第一作者是宋佑民(W

模型 mamba token kaist kaist团队 2025-06-11 17:28  4

Mamba 架构实现推理性能超 Gemma3-27B!推理模型开始迈入「无注意力」时代

推理大模型中的注意力机制可以去掉吗?这是当下最具挑战性的开放问题之一。过去半年,伴随长思维链的爆火,模型在复杂推理任务中普遍需要生成成千上万的 tokens 才能产出高质量解答。然而,这也与 Transformer 架构天然矛盾:随着生成长度的增长,Atten

推理 架构 推理模型 mamba mamba架构 2025-06-07 12:58  5

腾讯混元T1正式版发布:推理速度翻倍、成本直降,AI赛道掀价格战

当用户还在感叹“AI生成速度不够快”“长文本处理总丢上下文”时,腾讯混元大模型团队在3月21日深夜投下一枚“技术炸弹”——混元T1正式版。这款号称“秒回消息、打字快到飞起、超长文本轻松拿捏”的深度思考模型,以全新架构和“腰斩级”价格,直击行业痛点,或将改写国产

推理 t1 腾讯 价格战 mamba 2025-03-22 16:50  11

反派科比的 Mamba Mentality

奔四老JR 最早是KG球迷 KG 2004年打成那样都没冲出西部 一直耿耿于怀 从2003-2010年都觉得Kobe是反派时间变幻 虽然Kobe阻止火箭冲出西部 2010年完成对我凯的复仇 但这个反派又强又韧 强悍又迷人 主角的强大是由反派衬托起来的 这段时间

反派 mamba mambamentality 2025-01-28 09:59  16