这个浙江科技公司多厉害?老板被总理邀请当天放出震撼巨弹

360影视 2025-01-22 15:57 3

摘要:1月20日下午,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。

据《新闻联播》报道:1月20日下午,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。

有细心者发现,最近被称为世界最厉害人工智能大模型之一的DeepSeek的85后老板梁文锋,也被总理邀请之列,并第四个发言。

2024年年底,DeepSeek-V3横空出世,代表着我们国产AI大模型的崛起。

DeepSeek-V3的发布不仅标志着国产AI技术的重大进步,也在全球AI界引起了广泛关注和赞誉。

这款由中国浙江的AI大模型制造商DeepSeek推出的新版本,在国际舞台上展现了强大的竞争力和创新能力。

前GoogleSearch成员Deedy表示:DeepSeek-V3将成为全球最强的开源大模型。

而OpenAI的创始成员Andrej Karpathy也对此表示了赞同,强调了高效资源利用的重要性。

Meta的AI科学家田渊栋也认为:DeepSeek-V3在多个方面都展现出了惊人的创新。

此外,据专业人士检测,它在MATH500、AIME2024和Codeforces三个维度更是遥遥领先,数学和编程能力极强,远超过GPT-4 和 Claude 3.5 Sonnet 这两大世界领先的闭源模型。即使在某些语言理解和软件工程任务中稍有逊色,但也是TOP2尖子选手。

令人惊讶的是,DeepSeek-V3在性能比肩GPT-4o的同时,研发成本却远低于后者。

作为参数量高达671B的大模型,在预训练阶段,DeepSeek-V3仅使用2048块GPU训练了2个月,且只花费557.6万美元,成本仅为GPT的1/20。

Deepseek作为一款全世界开源的人工智能大模型,还与美国公司的拼命烧钱堆算力的全闭源模型形成强烈反差。

而这家不起眼的浙江小科技公司,既没有西方风险投资,更没攀附洋资本,只凭着国货当自强的狠劲,员工也都是国内大学毕业,扎根于浙江大学良好的科创土壤,集中中国人的智慧,把核心技术牢牢攥在手心。

它一经亮相,狠狠扇了那些想通过禁售美国GPU拖慢中国人工智能发展,以及国内那帮崇洋媚外者一巴掌。

这个85后DeepSeek创始人梁文锋在一次专访中说:中国的AI不可能永远跟随,需要有人站到技术的前沿。

这是国家为本土科创力量站台,直接打破了“唯洋为大”的迷信。并给各行各业树了标杆:我们不能仰人鼻息,埋头苦干照样能出成绩。

这个新闻,也会让美国的一帮打压中国的政客们真的睡着好觉了,他们震惊之余,可能也在反思,和中国打科技战,以往的技术封锁、资本垄断咋不灵了?禁售美国GPU对中国到底有多大用?会不会帮助中国GPU的突破?

1月20日,DeepSeek又放了巨型震撼弹,R1开源大模型,媲美OpenAI-o1,超越Claude 3.5。

DeepSeek表示,DeepSeek-R1在数学、代码、自然语言推理等任务上的性能比肩GPTo1正式版,且该模型的API服务定价为每百万tokens输入 1元(缓存命中)、每百万tokens 输出16元,远低于o1的55元、438元。

加利福尼亚大学伯克利分校教授Alex Dimakis表示,跟他交流过的多数AI研究人员都对DeepSeek-R1的性能感到有些震惊,DeepSeek似乎是奔赴OpenAI最初使命的“最佳人选”,其他公司需要迎头赶上。

英伟达高级研究科学家Jim Fan则说:“我们生活在这样一个时代,一家非美国公司正在让OpenAI的初衷得以延续,即做真正开放、为所有人赋能的前沿研究。DeepSeek-R1可能是第一个展示了RL(强化学习)飞轮可发挥作用且能带来持续增长的OSS(开源软件)项目。”

DeepSeek-R1带来的巨大震撼,不仅展示了中国在AI领域的崭新力量,也为全球AI发展提供了更多可能性,标志着中国开源AI的进一步崛起。

这就是中国力量!

这就是浙江力量!

声明:部分内容和图片来自网络,侵删。

最后,这期关于这期话题,大家还有哪些不一样的看法?欢迎评论区留言分享。

来源:中国男孩教育

相关推荐