摘要:经过多年数字化浸染后,企业端沉淀下来的大量数据,正等待进一步盘活和价值重塑。AI下场,另一种高效“解题思路”随之出现,并为相关链条上的创业公司带来巨大机遇。
作者:苏打
出品:明亮公司
经过多年数字化浸染后,企业端沉淀下来的大量数据,正等待进一步盘活和价值重塑。AI下场,另一种高效“解题思路”随之出现,并为相关链条上的创业公司带来巨大机遇。
在今年的中关村论坛年会上,枫清科技与中化信息、吉林大学宣布成立“人工智能赋能新材料联合实验室”。联合实验室将重点建设垂直领域推理大模型、开发新材料领域高质量数据集、构建智能工具平台,并推进跨学科人才培养。枫清科技将利用自身平台与大模型能力,助力材料研发全流程智能化,加速新材料的研发进程。
近日,「明亮公司」与枫清科技创始人兼CEO高雪峰就数据智能化的应用、枫清独有的技术产品能力、围绕链主企业全产业链开发的商业模式以及AI+新材料领域的前景等问题进行深度探讨,以期呈现生长于AI高速推进环境中的创业公司如何把握机遇实现跃迁。
天眼查APP显示,枫清科技(Fabarta)成立于2021年,定位“知识引擎与大模型双轮驱动的新一代智能体平台”,并希望通过新一代智能体平台,帮助企业在复杂场景中实现精准、可解释、安全的智能化升级和决策智能。
2022年与2023年,枫清科技分别完成数亿元天使轮融资及Pre- A轮融资。其中天使轮由蓝驰创投领投,将门创投、加盛巢生资本跟投;Pre- A轮融资中,由朗玛峰创投领投,蓝驰创投与将门创投作为老股东均超额追投。
以下为明亮公司与高雪峰的对话(有删节)
Q:明亮公司
A:高雪峰 枫清科技创始人兼CEO
行业智能体核心是规划,而不是变大参数
Q:能否整体介绍一下枫清的主要产品特质,以及伴随行业对AI应用的热情变高,近期是否有迭代以及新思考?
A:产品特色方面,首先,我们的知识引擎支持多模态数据,可以将企业海量的多模态数据转化为大模型可以理解的知识;
其次,我们的知识引擎不仅能够把数据、图片或文本向量化,让AI能够读取向量并作分析或内容生产,亦能将向量以及结构化数据之间的关系记忆和存储下来。
第三,能够实现智能数据编织。我们可以把企业积累的丰富数据,智能化编织到多模态知识引擎中——只要跟业务方把Schema(描述数据结构的模式)定义出来,剩下的事情就完全可以用AI完成,大量节省了数据标注等人工环节。
随着客户的体量越来越大,我们已经把很多企业级能力,比如安全、数据权限管控以及多租户管理等能力,都叠加到了产品之中,真正形成了一个企业级的知识管理与智能体应用平台。未来,伴随AI的不断发展,我们的产品体系也会跟随技术发展趋势以及客户需求来进行更新。
Q:应用层面,你们在解决幻觉、可解释性差、推理能力弱、数据安全这些痛点方面有哪些优势,目前处于同行业中什么水平?
A:这些问题均为大模型以概率为核心的技术基底自带的弊端,一个核心解决方法是把概率与符号逻辑推理技术进行深度融合。
因此,我们所有产品的出发点都围绕着如何将符号逻辑推理能力融入到产品中。我们为此构建了支持图、向量和文本等多模态数据存储和记忆知识引擎。我们的知识引擎从底层帮助企业将本地数据进行结构化组织,使其既包含图结构,又包含文本嵌入(embedding)的向量化数据。在此基础上,我们再去进行各种AI能力的建设,便能从底层弥补上述这些问题。
比如,针对解释性差和推理能力弱,我们可以把企业本地积累多年的数据和知识变成结构化的知识图谱,叠加数据的向量化,通过模型体外精准推理的方式进行优化;幻觉方面,我们会将大模型生成的内容放入本地知识引擎中进行二次校验,这样就能及时纠正和调整不精准或者不符合本地数据与知识的问题并进行修正。
就行业智能体而言,最重要的是怎么做规划和执行,其中的核心是规划,这就要求它必须有一个懂这个行业的大脑,而不是单纯地把模型参数变大。比如,在和一些企业进行HSE等领域合作中,如果我们自己的大模型都不懂本地安全操作的各种流程和规范,就无法识别不同工厂传上来的视频内容,更无法通过智能体编排调度去规划每一步操作。所以,智能体的大脑一定要依托本地的知识沉淀和本地数据来微调。
数据安全是另一个story。很多企业的不同部门之间会进行数据安全隔离,但如果把这些数据全部扔给一个大模型去做微调,调完可能很容易把原数据勾出来。而对已经转化到本地的多模态知识引擎中的知识,我们可以通过核心数据库级别的数据权限管控能力,解决各部门对于原数据的访问权问题。这就是为什么我们在解决实际行业问题时,必须要以数据为主中心,而不能沿用单纯的model centric(模型为中心)的方式。
Q:枫清更擅长深耕哪些行业?目前积累的技术能力以及经验是否可以实现跨行业复用?
A:基于以数据为中心的原则,企业或者行业的本地数据就非常重要。我们获取数据大致有以下路径,一是来自大行业,比如化工、农业、先进制造、半导体制造等。在一个大行业中,单独一家科技公司是无法获取全面行业数据的,所以我们选择与行业链主企业一起合作,形成了许多技术与行业的联合优势。
另外有一些行业相对更通用,我们可以直接深入其中去做各种AI加场景化的赋能。比如跨境电商/跨境贸易,我们可以将其中一个环节150元左右的成本直接降至几元钱,真正实现无人化。我们研发的新一代AI智能报关系统,结合多智能体协同处理技术,打造业了内首个真正具备“理解-执行-纠错”能力的智能体产品。可以实现单证填报提速20 倍、核验效率提升 10倍,并且支持7×24小时无间断作业,旺季产能最高提升 300%。同时,系统还内置可 AI 风险哨兵,可实时比对港务与申报数据,自动生成修正方案,即使新人也能轻松应对复杂案例。独创“任务找人”模式打破传统流程,从报关指令、单证录入、智能核验到异常修正与申报暂存,构建全流程自动闭环,管理者仅需聚焦关键决策。
在大行业中,我们自研了智能体平台,并已经与客户一起找到很多高价值场景开始尝试,比如与中国中化旗下中化信息一起,探索化工和农业的很多细分领域。近期,我们与一家著名通信领域链主企业将会启动项目落地和签约,另一家即将签约的头部半导体链主企业客户,也将同我们一起推动AI能力的融合。
同时,我们也会继续寻找更有价值的场景,比如化工新材料科研领域等。但整体而言,我们希望把行业智能体平台以及多模态知识引擎,真正与行业场景与数据深度融合,所以目前并没有规划太多行业。
大行业层面,不同行业是无法直接进行跨行业落地的。但我们的核心产品,包括多模态知识引擎、知识智能构建,以及行业智能体平台,包括围绕知识引擎的大模型蒸馏技术等,都是跨行业通用的。这也是为什么我们既能服务化工和农业,也可以服务金融保险,还能服务先进制造业。我们还有“AI+跨境”的SaaS产品,基于既有的积累,只需两三个月就能做出一个行业场景的智能化SaaS产品。
新材料潜力巨大,是各国「必争之地」
Q:你们如何定义“高价值场景”?
A:首先是有价值,其次是实现的成本可控,这是两个最核心的问题。
怎么评估有价值?我们有几个标准,第一,相应的场景是不是能够被频繁地使用且具备粘性。很多公司做了一个DeepSeek一体机聊天机器人,但就让大家没事去聊聊天,一段时间后可能就没人用了,这就不是一个高价值的场景。
其次,真正起到降本或是提效的目标。在我看来,提效就是降本,降本就是另一种方式的效率提升。比如之前提到的HSE领域,我们可以通过对不同工厂的多模态数据、实时视频流以及已积累的企业安全操作规程数据,智能探测出哪些操作在对应的工厂里是有相应风险的,哪些高风险持续发生就有可能导致非常严重的爆炸等等。这个在以前可能会需要布置很多人进行24小时视频监控,而且这些人要能读懂相应的安全操作规程,然后一个一个进行核对确认。这种就是存在隐形降本的和提升效率需求的场景。
同时,我们也基于不同的行业做了结构化数据和多模态数据融合的企业智能数据分析。不同行业的企业都有自己的数仓指标,非常复杂,我们把企业能够想到的数据全部扔到知识引擎当中去做关联,就可以进行指标类数据的智能归因分析,从而提升数据分析团队的效率。
第三,高价值场景也是真正长期价值非常高的场景,比如新材料领域是各个国家必争之地,未来能带来的价值是非常巨大的。我们和中化信息,吉林大学联合实验室在做的AI+新材料项目,把AI跟传统的仿真计算等进行深度融合,希望利用人工智能技术加速新材料等领域的研发进程。
但归根结底,还是要评估场景中可实现的程度。如果有一种技术和一个场景,我们觉得价值都非常大,但需要两三年非常重的投入才能实现一个简单的原型验证,这种我觉得也很难被称为当下的高价值的场景。
Q:上述提及的新材料项目,目前有哪些新进展?你们对此有何预期?
A:新材料是我们在不断研究和突破的一个领域,其潜在价值非常大,因为新材料是各个国家的必争之地。这也是我们将其定义为高价值场景的主要原因之一。
4月份,我们联合中化信息和吉林大学成立了AI+新材料的联合实验室,受到了北京市的高度重视,后续将结合本地沉淀的化工新材料领域数据实现化工领域行业模型。未来我们也会持续迭代这样的一些模型。我们的团队在这个领域里面都有相应的沉淀,预计七八月份就能推出很多成果,例如化工行业新材料合成模型,类似AI+仿真计算的产品也会随后推出。
我们希望把这样一个联合实验室做成更开放的生态。截至目前已经有很多化工材料公司找到我们,希望加入到实验室。同时我们还希望能够引入像矿物晶体等新材料,它们与化工类新材料的表征结构分子完全不同,但在AI融入产业的逻辑和理论上是类似的。
还有一个是生物制药领域,也可以进行类似的AI+生物制药探索。未来我们会演进成科学计算的联合实验室,把生物制药、新材料等都纳入进来,如此一来,实验室沉淀的组件及技术等便可以实现跨行业互动。
Q:DeepSeek的出现对你们而言带来哪些积极的影响?
A:首先是AI的平权化。以前大家想使用这种推理模型,基本上只能用云上的API或者是跟大模型厂商合作私有化部署,几乎很难将其变成行业的推理模型,而且成本也非常高。
而DeepSeek可以让每一个链主企业都拥有一个满血版本的推理模型,开放的蒸馏技术可以让我们把一个基模型的推理能力结合行业数据,在一个小参数的模型上,体现出非常优秀的既懂行业又懂推理的模型,同时也推动我们构建起自身完整的产品矩阵。
其次,DeepSeek出圈后,所有人都开始关注AI,并推动了其他大模型的不断迭代,给当下整个AI生态注入了非常多的活力。这让很多企业都意识到不接触AI就会被行业所淘汰,并让他们非常愿意投入和付费。
做大「AI+产业」,与链主企业站在一起
Q:在去年收入的基础上,今年你们规划的收入目标是否有调整?
A:去年是我们真正商业化的第一年,当年就实现了数千万的订单体量,大部分客户都是去年底开始跟我们开展合作的。
随着链主企业客户越来越多,今年我们整体订单量肯定会出现规模化的提升,我们预期今年的既定目标将会比去年翻一番。预计今年的总订单数量肯定会超过既定目标。至于最终能够实现多少的收入,主要取决于我们自己是否愿意在更多行业跟链主进行更深度的投入。
此外,我们希望同时起量AI SaaS的产品。预计全年大约有20%的收入来自跨境SaaS的产品服务,为我们明年构建起非常好的订阅制收入基础,而且现在只是早期阶段,未来肯定会出现指数级的增长。只要产品是在市场上是受欢迎的,我们会配合KA客户每年的预算进行投入,构建相应的收入基础。
Q:商业化路径上,我们选择攻坚链主企业的逻辑是什么?
A:首先,人工智能作为新一代工业革命的关键技术,只有与行业场景深度融合,才能真正释放高质量发展的新动能。行业场景know how的积累,行业核心的痛点,以及行业号召力和上下游产业链的数据积累,几乎都掌握在链主企业手中,而这些又都是在AI+产业中非常重要的一部分。所以我们要做大AI+产业,深入这行业,与链主企业站在一起是行之有效的方式。
其次,我们的团队核心成员具备IBM和阿里的融合背景,在to B领域里面有近20年的积累,深知如何做出一个标准化、具备企业级能力的产品,而不是单纯做个应用。我们也一直在帮助客户以超过他们想象的速度迭代其产品,所以链主企业与我们的合作都非常顺利。
当下我们的综合规模可能不如上市公司,但客户愿意选择我们进行更紧密的深入合作,这也能在一定程度上证明我们的团队基因、产品的能力以及正在做的事,是能够真正解决实际行业和产业痛点的。而且我们和一些大厂也都是非常好的战略合作伙伴,市场定位上也是能够补充并充分合作的。
Q:目前链主企业在收入中的占比怎样?
A:去年大约有60%的收入来自链主企业,今年至少会占到70-80%。但明年,来自链主企业的收入占比可能会明显下降,我们希望降至50%左右,因为链主以外的行业场景SaaS收入会逐渐起量。但这是软件领域良性收入结构构件的一个表现。
简单来讲,我们定义的链主企业并非单独一个企业,而是其背后涉及的长产业链条,比如中化有一个场景,日化品的材料生产、原配料等的规则标准,我们会结合多模态的知识引擎产生一些相应的智能化应用,与中化一起把这些应用销售给全产业链的生产商。而且他们的出海业务也正好可以匹配我们的跨境SaaS服务能力,可以实现双向赋能。
与单独的企业相比,我们更希望在产业链上赚更多钱,所以不会拓展太快,也不会大量铺不同的链主企业。因为一定要更深入下去才对得起之前的投入,回报也会更多。
高价值场景对应的收入,更具战略价值
Q:目前研发投入占比怎样?
A:海外很多高价值的科技公司研发投入都非常大。我们作为一个以AI+科技为核心的公司,大比例投入也会放在研发上,当下约为80%。
我觉得未来一段时间的研发投入也不会低于60%,甚至会更高,这也是该行业的一个特质。
比起收入规模与研发投入的比例关系,就是市研率,我更关注研发投入的增速要低于整体的营收增速,这是衡量运营财务数据指标时考虑的一个核心问题。
Q:在判断营收来源时,哪些板块的收入更具战略价值?
A:整体而言,我们会重点关注跟链主企业合作,找到高价值场景,然后将标准化的产品推向整个行业,既要服务好链主企业,也要服务好大行业中的中小企业。所以只要符合这样的潜在标准,这部分的营收就是高价值的。但如果我只是给客户做了一个项目、解决了一个问题,但不能实现行业复制,即便能产生收入,也不符合高价值收入的逻辑。
Q:近几年营收的增长处于什么水平?预计何时能实现盈亏平衡?
A:去年我们全年实现了数千万的收入,每年营收增速超过200%,今年也会继续保持这个速度,预计将会达到300%,我们对此非常乐观。
以当下的研发投入和运营成本计算,我们希望能够在明年实现业务层面的盈亏平衡。但是如果出现一些新机遇,比如我们希望在AI+新材料领域进行非常深入的研究,也可能会加大投入。
Q:融资和IPO方面,公司有哪些规划和目标?
A:融资方面,尽管目前只是Pre- A阶段,但我们仍旧希望在以业务为重心的前提下,有持续的资金注入。整体而言,我们会更加欢迎能够实现资源协同的投资机构,包括区域性资源和产业资源。
IPO方面,我们的路径会比较多样,包括单独上市、与其他上市公司进行深度合作等。相信时间应该不会太久,如果能实现盈亏平衡,业务模式得到验证,我们将会很快推进IPO的相关事项。
在全球对标Palantir,在中国成为融合「IBM+微软」优秀能力的科技型企业
Q:全球范围内,枫清是否有对标的公司作为阶段性目标?
A:在美国比较清晰,我们对标的是Palantir,希望能够推动企业数据与AI的深度融合;在中国,我们更希望成为我们所在领域的“微软”和“IBM”的结合体,只做“微软”或者只做“IBM”都可能会水土不服。
一方面,微软to B和to C的核心产品层面均有非常好的积累,产品力很强。另一方面,我曾在IBM工作十几年,深知IBM在理解用户需求和服务企业级客户方面的经验非常独到。我们想成为一家结合IBM Consulting 经验加上微软优秀的产品基因的公司,来服务好我们本土的企业级客户。
Q:当年选择创业,是否因为看到行业中有一些尚未解决的问题,团队希望躬身入局?目前是否已经阶段性实现了目标?
A:IBM任职期间,我作为IBM 认知计算解决方案研究院负责人,做了很多前沿研究,也接触到许多全球500强企业和非常多中国各行业的客户。
我清楚地看到,中国的数字化进程非常快,大部分企业在数字化上面做了非常多投入。但到2021年左右,很多企业虽然都实现了数字化,沉淀下来的数据却不知道用来干什么,最多用来做一些报表和展示,数据的价值密度非常低。那个时候我们就认为,未来数据智能化市场一定非常大,而且这个市场刚刚兴起,只有链主企业在开始关注,这是我们决定创业的契机。
实际上,2021年左右,我们在阿里任职时,就已经开始使用生成式人工智能技术,那个时候这些AI能力只是我们在跟客户谈数智化升级过程中的一个体现。
所以决定创业后,我们看重的并非大模型市场,而是企业的智能化市场。大模型非常优秀也非常值得关注,但行业一定还需要其他技术一起,来完成和实现企业的数智化进程。在IBM时,我们有一个全球的项目叫Intelligent Workflow,就是如何把企业的工作流变得更智能化,这个也是当下我们正在专注的事情。
我相信路还很长,我们已经实现了一些阶段性的胜利,但未来还要继续努力与我们的企业客户一起创造更多高价值场景,服务全产业链上的各种企业。
Q:业内一直有观点认为,中国软件业的商业化不太乐观。你觉得AI加入后,是否能为行业带来一些新机遇?
A:中国的数字化的进程在不同行业和企业中,发展非常不均衡,有些企业采用的是标准ERP软件,有些企业则会通过各种方式自建。另一方面,工作流的种类和厂商层出不穷,标准极不统一,导致构建生态软件时需要做非常多的定制化,涉及到很多API的对接、各种数据的梳理对接转换等等。
面对中国标准化软件的挑战,AI+产业这波浪潮是真正可以颠覆原本整个软件生态的规模和协同方式的,比如摒弃API,完全通过智能化的MCP协议完成对软件数据和能力的操作。而且企业沉淀的数据也可以汇总到企业独立的知识引擎中,实现知识的综合运用。
未来将会是一个完全智能化交互的时代,中国的智能化市场也一定会涌现出非常多标准化的企业软件,去改变原有的游戏规则。
来源:明亮公司主编