摘要:大家好,我是Ai学习的老章DeepSeek突然在huggingface上放出了0324版V3大模型的权重https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/模型文件被切分成163个,合计688GB大小目前已知
大家好,我是Ai学习的老章
DeepSeek突然在huggingface上放出了0324版V3大模型的权重
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/
模型文件被切分成163个,合计688GB大小
目前已知信息不多,官方推特账号还未发布最新消息
我对比了DeepSeek 3月前发布的V3,没看出太大区别
README 也只留下 license: mit,非常低调
国外已经有大佬在512GB M3 Ultra 上玩上了4-bit量化版,速度很快
来源:小顾科技观察