摘要:100多年前,Erlang解决了第一个问题:多少电话线,才能让人随时拨通?他给出了答案:用一个参数E,衡量整个系统的“负载”,也就是到达率乘以服务时间。用一个简单的公式,就能算出呼叫被拒绝的概率。这套东西今天还在用,银行客服、医院挂号。
排队,看起来像小事,其实是系统失衡的明证。资源有限,人却不等人。
100多年前,Erlang解决了第一个问题:多少电话线,才能让人随时拨通?他给出了答案:用一个参数E,衡量整个系统的“负载”,也就是到达率乘以服务时间。用一个简单的公式,就能算出呼叫被拒绝的概率。这套东西今天还在用,银行客服、医院挂号。
这就是排队论的出发点。问题的本质不是排,而是“等资源”。
资源越紧张,排队就越长。机场安检、火车调度、医院分诊,其实就是一个接一个的排队网络。用户关心的是“响应时间”,能不能快点轮到我;运营者关心的是“利用率”,人有没有白雇、机器有没有闲着。
性能建模(Performance Modeling)就是干这个的。看起来像排队,其实是在追踪资源的“流动性”和“竞争性”。
早期系统简单,模型也简单。单个服务中心、一条队伍、一种规则,叫M/M/1系统,都是指数分布。
但人不是指数分布。人会变、会犹豫、会放弃,会看到前面排太久就走人。人也不是一个个来的,是一群一群、一波一波来的。人还会分优先级,会看情况调整策略。这些东西,传统的排队论根本兜不住。
到了多资源的系统,情况更复杂。比如机场安检,资源是篮筐、是X光机、是工作人员。用户不是按顺序排完就走,中间还要“分流”“合流”“同步”。经典模型无法处理这些并发结构,只能换一套语言。
于是计算机科学家发明了“过程代数”(Process Algebra)。它不再用一条线排队,而是用一种“编程语言”描述系统的多个部分怎么协作。像编程序一样写模型,再用软件一键生成马尔科夫链,求解。
这套新模型的杀手锏是:可以精确控制每一个资源的行为,把资源当作“第一公民”建模,不只是用户的附庸。
英法比意的工程师们开始用这套工具优化现实问题。从比利时运河调度,到法国3G网络布点,再到意大利公交车内传感器的数据传输性能,都能建模、求解、改进。
甚至连细胞里的蛋白质循环,也开始用这套方法分析。蛋白质是资源,反应是任务,细胞是系统。过程代数变种 Bio-PEPA,用来建模细胞周期,能看出正常振荡与突变失调的差别。
一套理论,横跨工厂、铁路、网络、生物。但它还有一个对手,最近特别红:AI大模型。
ChatGPT不是魔法,是资源叠出来的怪物。训练一个模型,要几百张GPU卡跑一个月,耗电量上千吨碳排放,远超一部手机运行十年。推理一次,能耗是Google搜索的100倍。
最离谱的是,这一切都被当成“正常”,甚至是“进步”。
因为模型之间比的不是资源效率,而是“榜单表现”——谁的准确率高,谁能多答对几个选择题。至于用了多少电、烧了多少钱,不在考核项里。
能效不管,资源就无限堆。数据爆炸,参数膨胀,从老鼠脑,到猴脑,再到人脑,模型越大越有“统治力”。
但总有人没那么多资源,比如DeepSeek。它是被迫节省的,结果反而做得更好。在相同任务上,它比GPT便宜得多,跑得更快,而且答得还更准。
关键在哪?不是魔法,是调度。更好的并行结构,更少的浪费,更紧凑的架构。资源用得更聪明。
所以,该回头看看最早的启示了。Erlang那套一百年前的公式,提醒我们:资源不是免费的,排队不是例外,是规则。
越是拥挤的未来,越要懂得怎样让资源动起来。系统不是靠堆出来的,是靠“算”出来的。
大模型不是终点,而是一次倒退。性能建模,才是该重新回归的方向。
来源:老胡科学一点号