摘要:在新版本的测评中,DeepSeek-R1-0528在数学、编程以及通用逻辑等领域均取得了卓越的成绩,不仅在国内模型中独占鳌头,而且在整体表现上已经逼近了国际顶尖模型,如o3和Gemini-2.5-Pro。
获悉,5月29日晚间,DeepSeek公司宣布,其R1模型已顺利完成一次重要的版本迭代,新版本被命名为DeepSeek-R1-0528。
提升思维深度与推理能力
在新版本的测评中,DeepSeek-R1-0528在数学、编程以及通用逻辑等领域均取得了卓越的成绩,不仅在国内模型中独占鳌头,而且在整体表现上已经逼近了国际顶尖模型,如o3和Gemini-2.5-Pro。
除了推理能力的提升外,新版DeepSeek R1还在其他方面进行了优化。针对“幻觉”问题,新版模型进行了针对性改进,与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了约45%~50%,从而能够为用户提供更加准确和可靠的结果。
DeepSeek-R1-0528依旧基于2024年12月推出的DeepSeek V3 Base模型构建,但在后训练阶段加大了算力的投入,从而显著增强了模型的思维深度和推理能力。这一成就标志着DeepSeek在人工智能领域的技术实力又向前迈进了一大步。
加速行业生态发展
不得不说,今年以来大模型应用持续爆发。自2023年年初,ChatGPT引爆大模型技术后,国内外掀起“百模大战”。如今,经过两年多技术演练后,“百模大战”全面升级为“百家争艳”。
市场方面,据悉,Qwen3 则是阿里巴巴(BABA.US)通义千问团队的最新一代大型语言模型系列,涵盖稠密模型和混合专家(MoE)模型,在推理、指令遵循、智能体能力和多语言支持方面有显著提升。
值得一提,北京市经济和信息化局近日印发《北京市人工智能赋能新型工业化行动方案(2025年)》,其中提出,加强模型应用金融服务。用好市级人工智能、机器人、先进制造与智能装备等相关基金,培育优质制造业企业、大模型及智能体创新企业。
微美全息持续探索AI与大模型领域
资料显示,微美全息(WIMI.US)作为AI领域的重要创新者,近年来通过多维度布局加速推进AI与大模型技术的探索,战略覆盖技术研发、开源生态、算力基础设施及行业应用落地等多个层面。对此,市场普遍看好微美全息在AI赛道中的竞争优势,特别是其持续在AI业务方面取得亮眼成绩。
事实上,微美全息构建了覆盖云端与边缘端的「全息云」平台,开放模型代码和算力接口,支持开发者调用DeepSeek等通用大模型进行二次开发,加速商业化验证。同时,其自研的多模态AI系统整合文本、图像、视频等数据,提升跨模态理解能力,应用于视频生成、智能终端等场景。
可以说,微美全息前瞻布局AI技术,通过产业创新、科技创新和场景创新“融合”,聚焦人工智能与大模型产业集中发力、深耕细作,坚持技术攻关、软硬协同、应用牵引、生态培育的工程化路径,打造出具有特色的产业生态,未来其也将在垂直行业布局上进一步优化,针对汽车、金融、教育等垂直领域,进行更多产业实践。
结尾
业内人士指出,2025年AI则聚焦商业化场景,并且今年AI智能体在垂直行业领域渗透加速,大模型正从‘辅助工具’跃升至‘核心生产力’。”展望未来,各企业需积极助力人工智能产业发展,“加快新质生产力革新,推动新技术、新产品、新工艺应用推广、迭代升级,促进更多企业乘“云”而上、借“AI”发展。
来源:每日科技新动向