鸿海研究院推出具有推理能力的繁体中文大语言模型

360影视 欧美动漫 2025-03-11 17:10 2

摘要:鸿海研究院(Hon Hai Research Institute)宣布推出首个繁体中文大语言模型(LLM),在短短四周内完成更高效、更低成本的模型训练方法。

(全球TMT2025年3月11日讯)鸿海研究院(Hon Hai Research Institute)宣布推出首个繁体中文大语言模型(LLM),在短短四周内完成更高效、更低成本的模型训练方法。

该研究所由鸿海科技集团(富士康)支持,它表示,LLM--代号为FoxBrain--未来将开放源代码并公开共享。它最初是为集团内部系统的应用而设计的,涵盖数据分析、决策支持、文档协作、数学、推理和问题解决以及代码生成等功能。FoxBrain不仅具有强大的理解和推理能力,还针对中国台湾用户的语言风格进行了优化,在数学和逻辑推理测试中表现出色。

FoxBrain的训练过程由120颗英伟达H100 GPU驱动,采用英伟达Quantum-2 InfiniBand网络进行扩展,仅用约四周时间就完成了。FoxBrain基于Meta Llama 3.1架构,拥有70B参数。FoxBrain在数学方面比基本的Meta Llama 3.1模型有了全面的改进。

来源:全球TMT

相关推荐