从Transformer(2017)到DeepSeek-R1(2025)
本文详细回顾了大型语言模型从2017年Transformer架构的出现到2025年DeepSeek-R1的发展历程,涵盖了BERT、GPT系列、多模态模型、推理模型等关键进展,展示了LLMs在规模、性能、成本和多模态能力上的巨大进步,以及对AI领域和社会的深远
模型 gpt llm transformer bert 2025-03-29 07:08 1
本文详细回顾了大型语言模型从2017年Transformer架构的出现到2025年DeepSeek-R1的发展历程,涵盖了BERT、GPT系列、多模态模型、推理模型等关键进展,展示了LLMs在规模、性能、成本和多模态能力上的巨大进步,以及对AI领域和社会的深远
模型 gpt llm transformer bert 2025-03-29 07:08 1
比如大模型的数学不好,知名测试就是让大模型比较9.8 和 9.11哪个数大,大概半年之前,大部分大模型都会告诉你是9.8大。现在基本都正确了,其实还要归功于 RAG 技术,RAG 技术的原理和 MCP 实际上有异曲同工之妙,都像是个外挂程序,只不过 RAG 挂
一年之后,AI正式成为众多互联网科技企业竞技的新阵地,一切从零开始。日前,以阿里、腾讯为首的中国互联网巨头在公布最新年度业绩报时,都有一个共同点,也是市场翘首以盼的核心点:重金投入AI领域。
晶泰控股有限公司(以下简称“晶泰科技”)于3月28日发布了2024年全年业绩报告。这也是晶泰科技作为第一家根据18C章程在港上市的特专科技公司、上市后发布的首份年报。
SWEET-RL(Step-WisE Evaluation from Training-time information,基于训练时信息的逐步评估)是多轮大型语言模型(LLM)代理强化学习领域的重要技术进展。该算法相较于现有最先进的方法,成功率提升了6%,使L
这些推理步骤将过程分解为更小的、结构化的推理,所以更粗白的讲,这类模型与其是学习“回答什么”不如是学习“如何”回答。
前者是老问题,知乎用四季度接近1亿元的调整后净利润给出了答案。通过对业务效率的提高,知乎的毛利率同比提升3.8个百分点,达到了62.9%,即便和以高毛利著称的腾讯、拼多多相比也毫不逊色。这一数字,更是高于大多数国内的内容平台同行。
要了解LLM agent是什么,首先来探索LLM的基本能力。传统上,LLM不过是一个接一个地进行下一个token预测。
以下是如何在Raspberry Pi上运行大型语言模型(LLM)的方法。本文的目标是找出在Raspberry Pi上运行LLM是否是ChatGPT和GitHub Copilot等工具的合理替代方案。
人工智能(AI)近年来取得了令人瞩目的进展,尤其是大语言模型(LLM,Large Language Model)的崛起,使其成为科技竞赛的核心领域。然而,对于外行而言,理解AI的发展往往伴随着误解与夸大。本文将从外行的视角分析大语言模型的本质、应用前景、技术瓶
为了解决这一问题,我们提出了LinkAlign,这是一种新颖的框架,可以通过系统地解决模式链接问题将现有基线模型有效适应于真实世界环境。我们的框架包括三个关键步骤:针对挑战1的多轮语义增强检索和无关信息隔离,以及针对挑战2的模式提取增强。我们在SPIDER和B
在软件开发等领域,AI将打响取代人类第一枪!美国调查报道显示,AI将影响全球近40%的就业机会,70%的职业技能将发生改变。而一旦发生经济危机,AI就业革命或将在全美各行业引爆!
中国农历新年结束没多久,马斯克就给中国的特斯拉车主送上一份大礼——2月26日,在毫无征兆的情况下特斯拉向中国区购买了FSD的HW4.0车主开启了功能推送。
继几个月前发布首个 Gemini 2.0 AI 模型后,Google 又推出了全新升级。该公司称新的 Gemini 2.5 Pro Experimental 是其"最智能"的模型,具有超大的上下文窗口、多模态能力和推理能力。Google 展示了一系列基准测试,
gemini llm google experimental 2025-03-27 16:53 1
根据 ChatGPT 创建者 OpenAI 最近发布的一项研究显示,为防止 AI 模型发生撒谎或作弊的行为而设置的一些惩罚机制,并不能真正阻止它的不当行为——反而只会迫使它学会如何更好地隐蔽自己的欺骗手段。
来自华东师大和东华大学的研究团队发表了“A Survey on the Optimization of Large Language Model-based Agents(大模型智能体的优化方法综述)”,首次从系统化视角对LLM智能体优化策略进行了全面梳理与分
LLM Agent 正在变得越来越普及,似乎逐渐取代了我们熟悉的“常规”对话型 LLM。这些令人惊叹的能力并非轻易实现,而是需要许多组件协同工作。
2025年3月19日,《欧洲心脏杂志》(EHJ;IF=37.6)发表了一篇关于人工智能(AI)在心血管疾病人群健康管理中应用的最新综述,探讨了AI技术在提升心血管健康方面的最新进展、应用案例以及面临的挑战和机遇。
Brex前端改造拥抱“第一性原理”,优化React性能,采用Relay替换Apollo,解决React Hooks隐藏的GraphQL schema问题。通过预加载、数据共址等策略,实现代码的局部推理,提升代码可理解性,使网站对代码 LLM 更加友好,并利用
AI与企业软件开发和应用关系的日益紧密,使得AI和软件供应链已经融为一体。AI成为软件供应链的重要组成部分。