32B方案成本已做到万元级!零售业加速部署大模型,智能体 AI生鲜识别率先成熟|行业动态

360影视 动漫周边 2025-05-12 16:47 1

摘要:“当货架上的电子价签在闪烁的时候,您可能不知道它也正在经历一场毫米级的、非常高难度的算力革命,可能正在打价格战。”刚刚落下帷幕的2025中国零售业博览会上,中国连锁经营协会副秘书长杨雯表示。

财联社5月12日讯(记者 付静)“当货架上的电子价签在闪烁的时候,您可能不知道它也正在经历一场毫米级的、非常高难度的算力革命,可能正在打价格战。”刚刚落下帷幕的2025中国零售业博览会上,中国连锁经营协会副秘书长杨雯表示。

财联社记者观察到,此次博览会多家A股公司亮相,集中展示了零售行业全产业链上的前沿技术、创新设施设备、特色商品及智慧零售解决方案,DeepSeek、智能体也“跨界”成为从业者口中的关键词。据悉,全球零售业正经历转型变革,技术侧,头部零售企业正探索基于行业数据和知识的智能体和AI模型,零售硬件方案商则向智能服务商升级,底层的算力层也已形成完整解决方案。

零售业多场景加速AI化

财联社记者在博览会上注意到,众多零售行业头部企业正加速数字化步伐,如天虹股份(002419.SZ)旗下灵智数科于去年9月发布首个零售行业大模型百灵鸟AI大模型;绝味食品(603517.SH)推出了AI点餐智能体“绝味小火鸭”;百果园则利用AI辅助私域营销内容生成。

工控方案商深圳市吉方工控有限公司副总经理李晓涛向财联社记者介绍,在零售场景,8B大模型可进行人流预测、商品检验、导购;14B大模型可实现简单的报表分析;32B大模型可进行图谱指引、数据预警;70B大模型则可扮演大区经理的角色。

财联社记者获悉,在大模型的应用场景方面,目前物品识别在业内已较为成熟。博览会现场,石基信息(002153.SZ)子公司海石商用展示的POS产品方案支持物品识别算法,可对生鲜商品进行精准识别和称重。

“CPU和GPU的性能在零售场景中已经开始出现冗余,单纯的算账和支付并不需要太高的性能,但AI场景开始显现出来,最早被提出并解决的问题就是生鲜识别。现在大家在很多超市里看到,在秤上无需人工选择商品,只需将黄瓜放上去,系统就能自动识别为黄瓜,这就是AI在该行业中最成熟的应用。”海石商用副总经理李昊旻称。

李昊旻向记者介绍,海石商用希望在生鲜识别之后实现散装商品的称重识别,最终将其推广到标准品的识别上。“前两步我们已经基本完成,无论是生鲜还是零食食品,现在已经在行业内得到广泛应用。”此外,该企业还在着手进行AI+超市收银通道识别、购物车遗留商品监控等方案的研发。

他进一步表示,当前零售业最需要解决的是自助防损问题。“据我们统计,大约有2%-3%的商品,顾客本想扫描,但由于未对准或其他原因,未能成功完成扫描动作。顾客并非有意偷盗或拿走商品,但由于扫描动作不够准确,会给超市造成损失。”

基于此,海石商用自研防损算法,此外在现有算力摄像头基础上增加了TOF传感器,可更精准地判断收银动作是否正确完成,约80%的无意异常将被识别到。

32B模型方案成本已做到万元级

值得关注的是,由于零售为“成本依赖型”行业,即便零售行业多场景均在加速AI化,当前零售场景中硬件设备老旧的情况依然较常见。“零售业从业者可能会用几年甚至十年前的设备,很难直接替换成能够满足AI需求的设备,这是我们面临的一个很大的困难。”李昊旻表示。

对此李晓涛认为,如果前端设备的性能不够,势必就要更新换代;如果性能够,用户依然不愿意投入费用进行更新,就需要有更具性价比的方案。

李晓涛称,未来与大模型互补的智能体将是行业更需要且更有用的工具。“智能体最大的优势就是成本。在不借助显卡的情况下,7B、8B的模型能够直接运行;14B的方案加上显卡基本上可以做到万元级别。我们内部评估,如果可以做到万元级别,而且可以服务20个人的公司,用户就会愿意(购买方案)。”

“我们和合作伙伴在32B模型上投入较多。许多合作伙伴在综合考量部署成本和应用场景后,认为32B模型在成本、效率和精准度之间取得了良好的平衡,因而在行业应用中具有较高的合理性。”博览会期间,英特尔方面这样告诉财联社记者。

英特尔方面介绍,以DeepSeek为例,在32B模型的数据处理中,在商超或边缘计算场景中部署一台服务器前端可支持24路并发,若考虑冗余前端支持设备数甚至可达到36-48台。“一台设备就能够控制如此多的终端,并且整机成本控制在4万-5万元之间,这是一个极具性价比的方案。”

据了解,底层算力层面,目前针对不同算力需求也形成了完整解决方案。

英特尔方面向财联社记者介绍,一块CPU硬件将支撑中小门店几乎所有IT信息化所需的算力需求。具体来看其方案包括:端侧基于酷睿Ultra处理器的方案可提供智能导购、缺货提醒、商品推荐及广告等功能;边端设备基于酷睿Ultra处理器和锐炫独立显卡,为陈列合规检测、人流动线分析等门店管理工作提供数据处理支持,且能与边缘服务器进行数据交互。据悉,边缘服务器可由至强处理器和锐炫独立显卡支持,用于运营业务逻辑较复杂的ERP代码生成、企业内部管理、大型门店监控、高并发客群分析等场景下的大模型业务。

“对于极端场景,需要运行如671B的更大规模模型,英特尔也提供至强CPU搭配Gaudi加速器的方案。”英特尔方面称。

财联社记者从英特尔方面最新获悉,Intel 18A制程节点已进入风险试产阶段,将于年内正式量产,英特尔亚利桑那州的Fab 52工厂已完成Intel 18A流片;2027年,英特尔则将Intel 14A风险试产作为目标。

谈及在智能体方面的进展,李晓涛告诉记者,基于酷睿Ultra系列,吉方工控的智能体硬件已实现小批量生产。

另外英特尔方面预计,下半年Panther Lake客户端处理器推出后,搭载Panther Lake的POS机除了承担传统POS机功能,也可进行店铺摄像头数据分析及更高算力需求的后台应用,如运行大模型实现数字导购助手。

来源:财联社

相关推荐