年终盘点|2024年大模型,科技大厂抓住弯道超车机会引领奇点时刻

摘要:自2023年,ChatGPT掀起了AI大模型热潮,人们对于通用大模型的发展前景、应用场景充满想象。根据瑞银发布的一份研究报告显示,ChatGPT在2023年1月份月活跃用户估计已达1亿。

自2023年,ChatGPT掀起了AI大模型热潮,人们对于通用大模型的发展前景、应用场景充满想象。根据瑞银发布的一份研究报告显示,ChatGPT在2023年1月份月活跃用户估计已达1亿。

如今,2024年,大模型市场更加热闹非凡,一方面,各大厂商纷纷将目光投向具体应用场景,推动行业定制化的大模型加速落地,这些模型正逐步渗透到多个关键行业中,为解决专业领域的复杂问题提供了方法。

另一方面,关于大模型未来发展路径的讨论持续升温,围绕商业化落地、大模型与小模型的选择、应用的方向等成为业界关注的重点话题。

AI应用竞争成兵家必争

当前,AI 技术在多元方向持续突破,视频生成、世界模型、具身智能和空间智能等技术推动了人类对 AGI 的探索。

比如,OpenAI o1 无疑是今年受瞩目的模型之一,在它身上体现了推理能力的大幅提升,以 o1 为代表的新 Scaling Law,促使大模型追求更高的推理能力。

ChatGPT的爆火也让市场看到了AI大模型的机会,这股风也刮到了全球市场,各家互联网、科技大厂纷纷推动自身AI大模型的建设和发布。因而,岁末将至,对2024年大模型市场的关键进展进行总结。

盘点炙热的科技大厂

谷歌:

为应对OpenAI此前推出的众多新产品,获悉,谷歌(GOOG.US)周三推出下一代重要人工智能模型Gemini 2.0 Flash,可以原生生成图像和音频,同时支持文本生成。

2.0 Flash还可以使用第三方应用程序和服务,使其能够访问谷歌搜索、执行代码等功能,新版本将通过Gemini API和谷歌的AI开发平台提供。然而,音频和图像生成功能仅对“早期接入合作伙伴”开放,并计划在明年1月全面推出。

未来几个月内,谷歌表示将推出2.0 Flash的不同版本,用于Android Studio、Chrome DevTools、Firebase、Gemini Code Assist等产品。

Meta:

进入AI时代,Meta(Meta.US )AI自然也在大力推动AI的进展。自2023年Meta AI就取得了多项好成绩,并被公认为开源AI之王,今年,Meta依然持续在发力,相继发布了3.1模型与Llama 3.2模型。

此外,据扎克伯格透露,目前Meta AI每月拥有超过5亿活跃用户,1.85亿周活跃用户,直追ChatGPT的2.5亿。但Meta并没有止步于此,据称Llama 4已经进入开发阶段,公司正在一个比100,000台H100更大的集群上训练Llama 4模型,预计将在2025年年初发布,达到业内先进水平。

英伟达:

据了解,英伟达(NVDA.US)在GPU技术大会(GTC)上,英伟达发布了全新旗舰AI芯片Blackwell GPU,被称为是英伟达史上最成功的产品。英伟达称,Blackwell拥有6项革命性技术,可支持多达10万亿参数的模型进行AI训练和实时大语言模型(LLM)推理。

微软:

据外媒12月6日最新报道,OpenAI正在与微软(MSFT.US)磋商放弃AGI条款,以释放投资潜力。此外,微软AI主管Mustafa Suleyman预测,未来几年AI模型将呈现大小模型“齐头并进”的趋势。

大模型的规模化竞赛仍将持续,并融入更多模态的数据。另一方面,利用大模型训练小模型的技术将兴起,高效的小模型将在特定场景中发挥巨大作用。

特斯拉:

2023年,特斯拉(TSLA.US)马斯克旗下的xAI推出了Grok系列模型,为了让其后来居上,一向激进的马斯克大手笔屯了10万张英伟达GPU卡建立AI集群,并在年底融了一轮60亿美元的资金,用于继续购买英伟达显卡以扩大其集群。

此外,xAI已经正式官宣Grok全球免费,但有使用限制,免费用户每2小时可以询问最多10个问题,每天最多可分析3张图片和生成4张图片。

百度:

据悉,百度(BIDU.US)在AI大模型的投入和应用研发上有先天优势。”行业观察人士分析称,“另一方面,百度是较早确立AI发展方向的互联网大厂之一,也做了很多此方面的研究,在技术储备上更厚实一些。”

此外,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上表示,在当今的大模型生态下,开源对全球技术及生态的贡献毋庸置疑,因此百度将倾向于大模型业务快速商业化。 

阿里巴巴:

据称,阿里巴巴(BABA.US)推出同通义千问大模型,这是阿里巴巴大模型研究的阶段性成果。通义千问更大的意义在于提供了AI大模型商业应用的一个方向,面向AI时代,如果每家企业拥有具备行业能力的专属大模型,将为AI大模型带来巨大的市场增量。

通义千问主要用于赋能阿里巴巴内部各产品,如钉钉、淘宝、天猫精灵等。比如,钉钉接入通义千问测试后,可以自动生成工作方案,也可以在会议纪要后自动生成总结和待办事项,还能拍功能草图并自动生成小程序。

微美全息:

资料显示,微美全息(WIMI.US)不断开发“人工智能、量子技术、脑机接口等前沿领域创新成果不断涌现”,在AI领域率先卡位,不断提升自身大模型的版本和能力,并深化开展“人工智能+”实际行动。

目前,微美全息发布大模型,同时并发布大模型在教育、办公、直播、数字员工等行业的应用成果,使得“AI大模型+”场景,覆盖“技术”“产业”两端。未来,微美全息将继续支持团队在大模型领域的探索和研究,为不同产业场景构建AI大模型应用。

字节跳动:

行业风向标的新动作,引发国内大模型厂商的追赶。据悉,互联网巨头字节跳动近来投入的动作明显加快,收编大模型创业公司的核心人才,推出一系列AI产品,业务重心转向AI应用。

总结

毫无疑问,AI大模型市场正处在一个充满机遇和挑战的时代,2024年以后大模型的机会在企业级市场,大模型要走产业化、垂直化,深度定制的方向。新技术的发展从来都不是一帆风顺,AI大模型亦是如此,期待随着技术的不断进步,大模型能够在更多场景中得到应用,为社会发展注入新的活力。同时,也希望各方能够携手合作,确保大模型技术的健康发展。

来源:每日科技新动向

相关推荐