【专家特稿】提升生成式AI的价值：研发与应用相统一迫在眉睫

摘要：近年来，生成式人工智能的发展如火如荼，从通用大模型、行业大模型，到智能体、智能机器人。大模型和智能体的方式都有研发和应用之意，前者研发的理论性多些，后者更倾向应用研发，都力图尽快进入应用。但发展过程难免存在认知和操作上的一些矛盾。将AI研发与应用统一起来，旨在

近年来，生成式人工智能的发展如火如荼，从通用大模型、行业大模型，到智能体、智能机器人。大模型和智能体的方式都有研发和应用之意，前者研发的理论性多些，后者更倾向应用研发，都力图尽快进入应用。但发展过程难免存在认知和操作上的一些矛盾。将AI研发与应用统一起来，旨在提升人工智能水平、促进人工智能产业发展。

01 生成式AI在研发与应用过程的矛盾

‌‌AI发展无疑会带来巨大潜力和广阔的应用前景。对AI大模型、行业模型、智能体、机器人的研发，是科学、技术，还是工程，有不同的说法，也引发研发和应用上的若干分歧。

大模型研发扩张与应用减缓的矛盾

大模型的出现颠覆了人们的认知，在惊叹其大突破的同时，不少公司将大模型研发作为投资热点，抢占制高点，但起初对大模型规律并不清晰，研发中面对庞大的算力、规模数据和算法的要求，200多家公司从事大模型研发有可能造成重复建设、资源浪费。虽然通用大模型在营销、办公、客服、人力资源、基础作业等领域也开始一些应用，但对AI已有成果的应用有所减缓。而且通用大模型更适合to-c，面向产业转化较少，而投资、科技、企业、社会、媒体都将眼光盯在模型的功效上。以至有人呼吁不要卷模型，要卷应用。没有应用，大模型将一文不值。事实上，也不能让人们的注意力长期停留在对大模型的争论和焦虑中，要让搞科技的人关注AI深入研发，让更多企业集中在AI已有成果的应用，在发挥各自作用中推进人工智能的探索和发展。

通用大模型与行业大模型的差异

AI大模型研发从全面探索转向规模试点和特定领域的智能生成，需要根据不同领域的需求定制AI解决方案。通用大模型、行业大模型，都是生成式AI的崭新探索，前者倾向广泛领域和理论研发，后者多是特定领域的应用研发。由于研发通用大模型数据需求量大，算力损耗多，很难较快地应用落地，于是不少公司转向行业、产业和企业的垂直模型研发，这是探索和实践中的选择。围绕大模型的深入研发和已有成果的尽快应用，在争论中逐渐形成两种较为明显的态度：一种是追求技术，主张走通用大模型之路，提高“更大更强的AI能力”；一种是将AI成果尽快用到市场，要多发展行业模型，走产业之路，认为将“足够的AI能力”投入快速变现到商业场景，用市场庞大而独特的数据构筑壁垒。两者都有道理，但易走极端，应该倡导两者相互理解吸收，把力量集中在符合我国实际的研发和应用上，推进“人工智能+”的落地和发展。

开源模式与闭源模式的张力

大模型的开源和闭源是研发企业选择的不同模式。开源是开放源代码，允许任何人获得并修改软件的源代码，通过更大范围的开发者、研究者和爱好者的合作，拓宽技术创新边界，为人工智能发展注入活力。闭源是将软件源代码仅由软件编写者或系统开发商掌握，通过核心技术和商业模式的保护，使企业从技术成果中获得经济回报，在涉及敏感信息和高安全要求领域，闭源形式尤为重要‌。两种模式反映技术进步与社会价值、经济效益与安全保障之间的平衡探索。开源和闭源之争实际是对这种平衡的不同选择和追求。选择开源的企业希望通过全球合作推动技术创新和应用发展；选择闭源的企业以保护其技术和商业利益为主。例如，Open AI 发布的o1模型，在交互过程中默认隐藏了思维链，也可能不想让其他开发者和用户看到模型思考过程。开源和闭源彼此的张力，体现在商业模式和技术选择上，反映不同企业对未来发展的战略考虑。

黑石集团董事长苏世民认为，企业更有利于研发大模型，从数据积累、算力投入、研发本身的技术和工程性质，似乎企业比大学研发更有优势，更易突破[5]。而且通用大模型研发还可给行业模型、智能体以及各行各业赋能，应用中各行业丰富的场景、海量的数据、优势的资源投入，又在强化通用大模型研发，使科技研发和应用相辅相成，达到统一。

02 如何将AI研发与应用统一起来

AI的研发和应用是逻辑发展的统一，出现上述现象有着特殊背景和原因，需在深入发展中化解。

发展链路将研发与应用统一起来

大模型出现以来，生成式人工智能逐渐形成“大模型—行业模型—智能体—机器人”的发展链路。各环节都有相对独立性，按照技术逻辑，它们排列有序地发展。

一要重点发展几家通用大模型，提高我国AI技术竞争力。对通用大模型尚无统一的定义，多数人理解的大模型，包括大语言模型和多模态大模型。通用大模型在技术和理论上展现出强大能力，可为各个领域赋能并带来机遇，是重塑人类社会的重要因素。通用大模型不仅需要的参数规模大，算力规模大，而且在遇到数据瓶颈、算力瓶颈的情况下，走到无尽的前沿，不知道还要多长时间、还需多大投入，才能有新的突破。月之暗面的CEO杨植麟认为解，Open AI o1模型就是在天然数据不够用时，用较好的基础模型强化学习，创造出很多非天然数据，提高了数据质量和计算效率，进而产生出更深入的思考和推理，实际上他们创新出一种新的范式。

深入研发通用大模型，需要不断挑战，奔向通用人工智能的目标。因此，搞大模型研发的企业不必过多。由于美国对我采取AI技术限制，我国必须要有一些具备世界竞争力的通用大模型。人工智能专家吴军认为，“现在全世界大模型成规模的没几家，美国大概5-10家，欧洲基本上就法国一家，若每个国家建一个大模型不可能，这很烧钱，我国应重点扶植不超过10家。”目前，我国的baichuan3、智谱glm-4、腾讯混元、通义千问2.1、文心一言4.0、华为盘古、月之暗面的Kimi、抖音的豆包、阿里通义千问Qwen2、可灵AI等大模型走在前列，除上述大模型做得好的公司，我国互联网大厂、相关大型企业拥有规模数据，有实力解决算力问题，也符合大模型研发的条件。

大模型具备通识和泛化能力，由于应用中存在数据隐私和算法偏见、数学和逻辑推理能力不足等问题，通用大模型很难满足具体行业的特定需求、专业性能和经济效率，缺少细分度更高的产品，在公有云提供服务中会造成企业私有数据、敏感数据安全性的担忧，使用中还需通过传统的磨合流程来实现产品与市场的契合，将通用大模型融入核心业务流程的案例不多，而行业大模型更有利于发展专业能力和精准赋能。但也有专家认为，现在的产品很大程度由模型能力决定，要把产品和模型更紧密地结合起来去思考。比如产品上想做一个功能，背后需要对应模型能力的支撑。还有互联网大厂的企业家强调大模型赋能智能体，其实践意义更大，应用前景广阔。

二要大力发展行业模型和业务模型，发挥我国产业齐全和技术应用的优势。行业模型“利用通用大模型技术，针对特定数据和任务进行训练或优化，形成具备专用知识与能力的模型及应用。国际上更多用垂直模型来表示，我国还有垂类模型、领域模型、专属模型等称谓。” 行业模型本质上是解决方案。从用户在乎产品而非技术的实际出发，尽快把技术转化成产品，才有利解决问题。行业大模型提供的不仅是产品和工具，还有定制服务与支持，需要客户参与共建。

一方面，企业为提升竞争力和智能化转型，满足市场需求，想将数据转化为核心驱动，主动寻找最佳模型；另一方面，AI技术公司也在选择对人工智能提升发展质量有需求的特定行业、企业、产业开展合作。研发方和需求方结合，共同深耕 “人工智能+行业\产业\企业”，利用行业专业数据或私有数据、特色应用场景等独特资源，对模型定制调整和优化，会较快地进入应用，针对性地解决问题，产生价值。行业模型和智能体是相互关联和互补的技术，共同推动AI技术的产业化。

三要把智能体和机器人作为智能发展的重点，培植和壮大智能产业。智能体是具有智能的实体。以云为基础，以AI为核心，构建一个立体感知、全域协同、精准判断、持续进化、开放的智能系统。智能体包括智能行为的物理实体和虚拟存在，比如物理形态的机器人和虚拟形态的数字人。

智能体远超近年国内使用的Siri、小爱同学、天猫精灵等智能助手。智能体可以帮助我们处理更加复杂的任务。在大模型技术加持下，智能体将具有自主性、感知性和行动能力，在复杂环境中自主决策、学习进化，更接近人类智能本质。随着新型芯片技术的涌现，将会出现无人汽车、无人机、机器人等颠覆性的智能体，将实现更高层次的智能化。这种应用驱动的AI研发，目的使智能体成为人类广泛使用的商品，并根据使用环境和用处，按需求定制形状、大小及功能不同的智能体。

机器人是智能体中重要的一种，跟传统机器人相比，具身智能机器人有泛化性优势。传统工业机器人可解决固定搬运、固定点位的焊接、喷涂等相对固定的方式的问题，但在工序复杂的总装过程，工业机器人还不如人工安装。大模型赋能的智能机器人就可应对此类问题。工业用智能机器人会快于家用机器人落地应用，约在3到7年可批量生产。家用机器人因任务复杂程度高，任务完成的满意程度不同，需要5到10年才可量产。

上述智能方式都需技术研发，都有很高应用价值，共同构成人工智能发展格局。研发为应用打基础，应用是研发的目的，宏观上体现了研发与应用的统一。

‌扬长避短将AI研发和应用统一起来

AI发展有研发、应用等环节，但并非每个企业都要按顺序将各环节做一遍。在全球化、数智化、市场化条件下，要扬长避短才能在AI的发展中相互成就和发展。目前，在人工智能各环节，美国处于研发领先地位并带动着应用。美国去工业化后，其产业结构以金融和服务业为主，通用大模型的应用，主要覆盖金融、财务、审计、研发、法律、医疗等领域。我国产业齐全、制造业发达，更适合AI快速应用于产业、行业和社会。加之我国具有互联网应用、数字技术应用的经验，在通用大模型研发带动下，已在金融、服务、文教、医疗、创作等通用模型易应用的领域广泛落地。

现在除加大几家通用大模型研发力度外，要发挥我国技术应用优势，重点加强AI行业大模型、业务模型、智能体、机器人等不同方式的应用研究。使少数骨干公司的大模型研发成为赋能各项AI应用的“蓄水池”，使AI各种方式的应用直接服务于具体产业，使它们既承接通用大模型的技术赋能，又能结合行业、企业和社会应用的场景和需要，向着智能产业、智能应用的方向发展，并将丰富的应用场景等资源和问题反哺大模型、行业模型的研发，形成通用大模型与AI应用“相辅相成、相互促进”的良性循环。

运用灵活方式将研发与应用统一起来

2023年中期，我国200多家公司相对集中在通用大模型的研发上，在全球研发大模型的数量最多。随着AI技术逻辑的演进，不断深化对大模型的认识，无论从能力、需求、成本、市场等方面看，不需要更多公司都挤在大模型研发的独木桥。当初一些研发大模型的公司，转变到AI应用研究或AI应用的方向。一种方式是，原先做大模型的公司改做行业大模型，它们积累了扎实的知识基础和丰富的交互体验，知道如何承接大模型的技术赋能，从而做好行业模型。另一种方式是，基于一些通用大模型的开源模式，开展行业大模型研发，能对模型结构、参数等按需调整，更好地适配个性化应用需要。“市场上诸多金融、法律、教育、传媒、文旅等行业模型，大多是在Llama、SD、GLM、Baichuan等国内外主流开源大模型基础上构建的。”两种方式都不用过大的算力和数据，省去很多训练时间和成本，又能放心地利用私有数据提升应用效果，减少数据安全疑虑，很好地将AI技术研发转化到应用研究上来。

还有一种方式，就是开发比行业模型更灵活的领域模型或业务模型，它适合国内市场极度丰富的业务场景，能促成生成式人工智能商业化。领域模型更适合超大规模的AI应用市场和多种服务模式。中国信息通信研究院公布的数据显示，2023年我国人工智能产业应用进程持续推进，核心产业规模达到5784亿元。不少属于行业大模型和领域模型以及AI工具的应用。有家公司2023年做AI视频面试，比上年翻了一倍以上。现在校招面试成本很贵，他们用AI视频取代微信私域营销，面试打分客观，还会追问应试者，场景很多，达到降本增效的目的。义乌一个女老板应用前沿的AI视频，化身语言达人，熟练切换多国外语，介绍自家生意，打造了全新的应用场景。诸如此类的AI研发和应用，都值得推广。

03 提升人工智能发展质量和价值的建议

我国人工智能的研发势头正旺，智能产业前景乐观，AI应用将会蓬勃发展。从目前的探索和实践看，尚需夯实AI的基础建设，致力于技术创新，拓宽商用渠道，统筹处理AI的研发、产业化和应用的关系。

营造良好的政策和服务环境

我国已就AI的标准、能力、伦理、创新、治理等方面，出台了相关政策和法律，以确保技术发展符合社会的价值观和伦理标准，形成拥抱AI发展的社会环境，政府部门、行业协会和市场监管方面，对刚起步的生成式AI的研发和应用，应多包容，多服务，逐渐引导规范，使其走上健康的智能发展路子。

AI技术产业化要为产业的智能化开路

网络运营商、软硬件设备终端提供商、互联网企业，是大模型应用的先行者。它们数字化程度高、数据积累丰富、技术接受能力强，会成为大模型落地较早的行业。这些行业的大模型应用场景广泛，覆盖了营销、客服、内容生成等诸多环节，目前已有丰富和成熟的经验，它们的带动示范和提供的大模型服务、工具、产品，正在传导到制造等产业，促进企业从数字化向智能化转型升级。随着各种智能方式和载体逐渐成熟落地，企业会在改造、提升传统产业的同时，向着产业智能化快速发展。

打造坚实的AI技术底座

加大算力中心建设力度，促进算力统筹协同，随着国产算力性能和易用性的提升，将会获得AI公司和应用企业的青睐；要有效地积聚高质量的数据，扩大数据交易，发挥数据的资源和要素作用；以创新精神研发智能产业的不同载体，避免同质化，体现技术、产业和应用的特点和优势，创造与众不同的产品和服务，提升价值，积极推广。

*本文刊载于《通信世界》

总第956期 2024年11月25日第22期

END