budget

16张H100训26分钟,超越o1-preview!李飞飞等用1K样本

大模型推理性能的提升,真的只能靠堆数据、加算力吗?李飞飞等用仅1000个样本微调模型,并提出预算强制(Budget forcing)技术,成功让推理能力随测试计算量增加而提升。他们的s1-32B模型在多个基准测试中超越闭源模型OpenAI o1-preview

h100 token budget 2025-02-08 18:29  8

fish是“鱼”,wife是“妻子”,那fishwife是什么意思?

英语中,词汇的组合含义常常出人意料。当熟悉的 “fish(鱼)” 与 “wife(妻子)” 组合成 “fishwife”,若仅从字面理解,很容易产生误解。今天,就让我们一同走进这个有趣的词汇世界,探寻 “fishwife” 背后真实且独特的含义,揭开它神秘的面

budget ex fishwife 2025-02-07 10:45  9