mtp

周黎辉讲师-MTP管理才能和领导力发展专家

周黎辉老师拥有23年大型企业中高层管理实战和企业管理顾问经验,曾任职台湾顶新集团、中通文博等知名集团企业,跨域制造业、服务外包及管理顾问等业务领域,具有丰富的一线业务经验和推动企业发展的实战管理经验。

领导力 mtp 黎辉 2025-01-08 09:58  9

国产大模型DeepSeek-V3一夜火爆全球,671B的MoE

今天,一个国产大模型火遍了世界。打开 X,满眼都是讨论 DeepSeek-V3 的推文,而其中最热门的之一是这个参数量高达 671B 的大型语言模型的预训练过程竟然只用了 266.4 万 H800 GPU Hours,再加上上下文扩展与后训练的训练,总共也只有

模型 moe mtp 2024-12-28 09:46  12