摘要:“大模型堪称强悍,但仍存在成本、可解释性、精度乃至幻觉等问题。行业大模型固然算力要求较低,但对精度、鲁棒性和攻击防御要求更高,很多问题还有待研究。”在2024开放原子开发者大会暨首届开源技术学术大会上,中国科学院外籍院士樊文飞针对当前AI大模型发展的挑战分享了
“大模型堪称强悍,但仍存在成本、可解释性、精度乃至幻觉等问题。行业大模型固然算力要求较低,但对精度、鲁棒性和攻击防御要求更高,很多问题还有待研究。”在2024开放原子开发者大会暨首届开源技术学术大会上,中国科学院外籍院士樊文飞针对当前AI大模型发展的挑战分享了自己的实践与思考:将逻辑推理与机器学习相结合,并在训练阶段加强数据质量。
这场主题为“一切为了开发者”的大会,汇集了开源技术领域众多专家、学者和从业者,通过1场开幕式和18场分论坛,共同探讨了开源技术在当前AI时代最新进展、实践经验与创新成果、面临的挑战以及未来发展。
樊文飞院士的报告聚焦于AI与数据,事实上生成式AI已经影响到软件应用开发的方方面面,本次大会覆盖了操作系统、数据库、编程语言、开源大模型、前端及低代码等领域,相关前沿议题表明,开源不仅是当前软件科技创新的主流,而且正在对大模型开发及应用涉及的各技术领域创新产生深远的影响。
开源操作系统:数字化转型与智能生活两手抓
操作系统是基础软件领域创新绕不开的话题,而随着数字化转型的加速,开源操作系统在构建现代IT架构中扮演着越来越重要的角色。作为由开放原子开源基金会孵化及运营的重量级操作系统开源项目,开源鸿蒙(OpenHarmony)聚焦于搭建一个智能终端设备操作系统的框架和平台,促进万物互联产业的繁荣发展,而开源鸿蒙的影响不仅仅是智能生活。
在本次大会上,开源鸿蒙5.0 Release版本正式发布,社区代表深入介绍了该版本在系统完备度、分布式创新、开发者体验及系统稳定性方面的显著提升,还展示了如何赋能产业创新升级和数字化转型。
开源鸿蒙5.0 Release版本首先可支持各类超级应用的开发,分布式软总线再升级,设备连接效率和稳定性持续提升;其次多任务处理更高效,设备间的数据共享更加安全便捷;此外提供更友好的开发环境,加速应用开发进程。开源鸿蒙项目在开放原子开源基金会平台之上持续面向社区开放共建,超过120款芯片完成适配,超过900款软硬件产品通过兼容性测评。
根据本次大会上发布的一批开源应用案例,开源鸿蒙在电力、水利水运、养老、智慧城市、交通、油气和工业制造等行业已有广泛的应用,展示了开源操作系统技术成为推动行业变革新引擎的巨大潜力。如在新疆某水库的一个视频AI监控项目,夜间复杂场景下整体识别率达到了95.45%,强于传统摄像头。这些案例,对开发者和IT从业人员提升技术选型和解决方案设计能力,将开源技术应用于实际业务场景,也带来了很高的实用价值。
另一个操作系统同样为AI而变。在openEuler技术分论坛,嘉宾们探讨了openEuler在云原生、嵌入式、AI等领域的最新成果,如何通过开源社区推动操作系统的创新,以及openEuler如何帮助企业和开发者构建一个更加安全、高效的数字基础设施。
openEuler技术委员会委员任慰透露,他正在牵头推进openEuler Embeded引入智能驾驶基础软件的具体规划和实现,面向智能驾驶领域,涉及异构多核SoC、舱驾融合等,后续还有面向车路云一体化、智能驾驶加车云融合等规划。
此外,openEuler还披露了具身机器人、人形机器人以及openEuler for Space的星辰大海。对于利用openEuler开源技术构建未来数字世界的开发者,这无疑带来了更有趣的想象空间。
开源数据库崛起:变革企业级应用开发
数据库是核心IT基础设施之一,AI的融入为数据库领域带来了革命性的变化。本次大会在开源数据库技术最新发展方面的探讨,覆盖了数据库技术的智能化、自动化管理、以及如何通过技术创新优化数据库性能,以适应AI系统对数据处理和分析的复杂需求。
华中科技大学并行数据存储实验室周元辉博士讲述了云上键值存储时延优化及RAG系统优化探索的进展,根据云块存储的契约和时延性能的关系,提出了一种契约感知的设计优化的时延方案,并讨论了RAG技术在自动评估输出质量方面的挑战和解决方案。这也是该实验室已和TiDB在AI及云存储领域合作的成果,方案目前在不同的EBS存储栈上,甚至在不同的云服务商的块存储设备上,都表现出了优异的时延优化效果。
作为由开放原子开源基金会孵化和运营的企业级分布式HTAP开源数据库,OpenTenBase社区同样关注优化,认为无论Oracle、MySQL还是PostgreSQL,优化都必不可少,因为SQL是应用程序中最常见的语言。
OpenTenBase社区的开源共建企业正在通过开源和商业双驱动提升产品能力,促进OpenTenBase在企业级应用开发场景的应用,帮助开发者解决数据管理和分析中的挑战。他们表示,未来一到两年内将扎根底层技术,如底层语法、底层引擎的改造,持续打磨Oracle兼容、迁移工具等,促进技术架构进化到更合理且能支持长期演进的状态。此外,社区也正在密切关注和探讨与大模型等AI技术的集成、AI对SQL分析的影响等。
目前,开源数据库普遍遇到了Append Update MVCC框架下数据膨胀、索引检索效果下降,多进程架构对系统并发处理能力的影响以及源数据管理导致的内存浪费,Double Cache资源使用等问题。对此,OpenTenBase社区认为,从长远发展考虑,维护自己的分支并不明智,未来将会错过社区新特性带来的红利。
此外,KaiwuDB在AIoT场景下的技术实践、TuGraph在GraphRAG上的探索和实践等话题,也受到了与会者的热切关注。
开源大模型:驱动AI领域的创新与协作
开源大模型落地实践分论坛的嘉宾们围绕开源大模型实际落地的需求,在技术突破、模型压缩、模型性能优化、高效推理等方面进行了深入探讨,分享了各自的最新研究成果和实践经验,主要包括多模态安全目标检索与生成技术的研究与应用、多模态情感语义理解大模型及其应用、大模型推理服务、开源的面向通用任务的声音预训练模型XIAOMI DASHENG、“紫东太初”多模态大模型的进化之路和腾讯开源大型模型MOE及其关键技术与应用等。
北京智源人工智能研究院在大模型和数据方面的工作,包括构建高质量数据集的方法论、系统方法,以及不同系列模型的开发,为与会者展示了数据对模型性能的重要性,并给出了建立高质量数据集和标签体系的建议。北京智源人工智能研究院的刘广表示,在智源,构建数据集后,团队会通过小模型进行验证,评估数据集的质量和有效性。这一过程不仅可以发现数据中的问题,还能为后续的模型训练提供反馈。此外,智源团队还通过设计统一的输入格式和处理流程,使得图像、文本和音频等多种模态数据能够有效结合,提高模型的综合性能,以整合不同模态数据,应对多模态大模型的需要。
随着大模型的发展,数据量和模型规模的增大导致了算力需求增加、推理成本高昂以及用户体验下降等问题。为了应对这些挑战,阿里云智能集团技术专家马腾提出了基于KVCache的解决方案,该方案通过缓存机制减少算力开销,提高吞吐量,并在过载场景下保持较好的用户体验。
阿里云与清华大学已经联合发起了一个称为mooncake的开源项目,通过构建一个高效的分布式KVCache缓存池,以GPUdirect、RDMA等高性能IO技术实现多节点间数据高速传输,并与任意推理框架兼容,从而解决大模型推理中面临的性能瓶颈。
构建开源基础设施:为数字世界打造坚实的技术基石
开源的发展离不开健康的社区生态,例如开源鸿蒙社区已汇聚8000多名贡献者和70多家单位持续共建,项目代码量累计超过1.2亿行;而OpenTenBase社区已拥有19家企业加入社区委员会,通过开放原子校源行活动,发展了40余位OpenTenBase的校园大使。一套完整的、运行良好的开源基础设施,能够更好地支撑开源生态的良性发展。
因国内开源软件起步较晚,且普遍对开源技术的重视远超社区建设,企业开源团队和社区运营人员对开源基础设施的认知尚未一致,故而开源基础设施建设分论坛首先回答了什么是开源基础设施、开源基础设施为什么重要的问题,然后探讨了开源基础设施建设进展,包括代码托管平台、SBOM物料清单等,以及这些工具如何为开发者和IT从业人员提供更高效、安全的软件开发和维护环境。
专家认为,完整的开源基础设施,包括代码托管平台、制品托管平台、云基础设施平台等狭义基础设施,也包括更广义的基础设施,如SBOM清单、CVE漏洞、代码扫描工具、社区、开源协议等。
而开放原子开源基金会提供了包括开源协作平台AtomGit等开源基础设施,值得注意的是,AtomGit正在联合国内主要托管平台共同打造全面的开源数据中心,致力于在多平台间迁移项目、交流思想、共享成果。此举加速了技术创新与应用的步伐,为各行各业带来了更加高效、智能的解决方案。
专家们认为,随着AI和开源的发展,开源基础设施将逐步成为数字世界不可或缺的底座。
2024开放原子开发者大会暨首届开源技术学术大会,不仅展示了开源技术在AI大模型、操作系统、数据库等关键领域的最新进展与创新成果,也深刻揭示了开源作为推动数字化转型与行业变革的重要力量。通过汇聚全球智慧,共同探讨开源技术的未来趋势与挑战,本次大会为构建更加开放、协作、创新的数字世界奠定了坚实基础。未来,开放原子开源基金会将持续为项目、产业和广大开发者提供优质服务,不断强化技术创新、生态构建和产业发展,促进开发者创新成长,推动开源产业生态繁荣。
来源:CSDN