摘要:鸿海研究院(Hon Hai Research Institute)宣布推出首个繁体中文大语言模型(LLM),在短短四周内完成更高效、更低成本的模型训练方法。
(全球TMT2025年3月11日讯)鸿海研究院(Hon Hai Research Institute)宣布推出首个繁体中文大语言模型(LLM),在短短四周内完成更高效、更低成本的模型训练方法。
该研究所由鸿海科技集团(富士康)支持,它表示,LLM--代号为FoxBrain--未来将开放源代码并公开共享。它最初是为集团内部系统的应用而设计的,涵盖数据分析、决策支持、文档协作、数学、推理和问题解决以及代码生成等功能。FoxBrain不仅具有强大的理解和推理能力,还针对中国台湾用户的语言风格进行了优化,在数学和逻辑推理测试中表现出色。
FoxBrain的训练过程由120颗英伟达H100 GPU驱动,采用英伟达Quantum-2 InfiniBand网络进行扩展,仅用约四周时间就完成了。FoxBrain基于Meta Llama 3.1架构,拥有70B参数。FoxBrain在数学方面比基本的Meta Llama 3.1模型有了全面的改进。
来源:全球TMT