摘要:Business Research Insights的报告显示,2023年全球图数据库规模约6亿美元,预计2032年将达到21.6亿,2023年至2032年复合增长率预计为18.2%。国内也有调研显示,95%企业认为图数据库是重要的数据管理工具,超65%的厂商
随着企业数据增加,寻找有效方法管理复杂、相互关联的数据也日益重要。比起传统的关系型数据库,图数据库更擅长于此。
Business Research Insights的报告显示,2023年全球图数据库规模约6亿美元,预计2032年将达到21.6亿,2023年至2032年复合增长率预计为18.2%。国内也有调研显示,95%企业认为图数据库是重要的数据管理工具,超65%的厂商认为业务上图数据库优于其他选择,目前应用场景主要集中在金融风控、欺诈检测等。
不过,由于目前市场教育仍需提升、图数据库的生态系统和行业应用场景有待完善拓宽等,整体而言,图数据库使用仍处于早期阶段。
作为图数据库市场玩家之一的嬴图成立于2019年,已入选Gartner® 2022《图数据库管理系统市场指南》全球代表厂商,以及登上DataTech 50 2024 / ESG FinTech100全球奖项名单,其在全球图数据库行业地位可见一斑。嬴图也于去年发布Powerhouse,标志产品架构的彻底革新,为复杂数据计算、分析和存储提供快速强大的动力支持。
嬴图的成绩单熠熠闪耀。嬴图创始人兼CEO孙宇熙向雷峰网回顾嬴图的成长历程,感慨完成产品“不可能三角”的闭环并不容易。从0到1,嬴图如何在图数据库市场中打出自己的名声?已经是第四次创业的孙宇熙,这些年对数据库市场又有何观察?
嬴图创始人兼CEO孙宇熙
数据库的市场教育是踩坑踩过来的
做好图数据库这个目标,起源于孙宇熙在2016年的一次创业尝试。
当时他从EMC离开,结束了自己九年的大厂工作生涯后,用两三年做了名为全历史(Allhistory)的文化产品。这个网站的内核是知识图谱,对内容关联性的要求很强。然而,团队在市场调研后发现,当时很多图数据库都算力不足,数据库穿透能力很差,耗费大量资源。
孙宇熙没能找到满意的图数据库。2019年,他亲自下场,成立了嬴图。
不同于传统的关系型数据库,图数据库具有更高的灵活性,支持高维建模和动态建模;能进行更高效的复杂查询与计算、多表关联查询,能实现动态、海量、复杂模型的实时计算与分析;并且是白盒化、可解释的。尤其在查询逻辑上,图数据架构在关联查询时,效率会显著高于关系型数据库;随着查询深度增加,时耗差异会指数级增加。
然而,当时以传统数据库为默认选项的市场,对图数据库的接受如何?
孙宇熙指出,过去几年的数据库市场混乱,极大考验用户的判断能力。一个悖论是:用户要知道产品好坏就要使用产品,但使用产品前往往需要先采购——有些POC只是走一轮过场,让用户在判断产品真实效力时仍举步维艰。而且,图数据库应能做关联分析,但可能是汉字使用习惯导致,有中国IT从业者会习惯性认为数据“库”就是只存不算。
举例来说,把全国工商数据导在图数据库里,若想知道某公司的对外投资网络里有多少股份在百分之几以上的被投公司,只存不算的数据库无法进行递归式穿透,需要把数据导到Apache Spark或Apache Hadoop再写一套程序,之后把结果导到Excel里传回或做成报表,再找一套可视化工具实现。本该实时完成的事变成大规模批处理,要横跨几个部门、花几天,甚至几周才能实现。
很多头部金融机构和银行都走过“采购只存不算的图数据库”的弯路,可以说,数据库的市场教育是大家踩坑踩过来的。尤其早期,涉及到认知层面的碰撞都会很激烈——当时有的客户并不重视实时性的意义,嬴图的产品创新在他们眼中就一文不值,“当你不觉得越快越强是一件好事时,就会陷入螺旋式内卷”。
嬴图图数据库产品2大核心,分别是底层的实时图数据库与上层的高可视化平台。底层的分布式、可扩展、可弹性的高性能原生图数据库,能承载万亿级点边的超大规模数据集,通过超融合统一图计算架构,提供达到实时级别的微秒、毫秒级查询和分析。
市场教育需要时间,是一种集体意识。所幸,对实时性的重视一传十、十传百,孙宇熙在这六年里已感受到头部和中部客户的认知在发生变化。
嬴图图数据库的存储引擎、计算引擎,甚至查询语言都是自研。新的查询语言是否会给用户带来学习压力?2024年4月,国际标准化组织(ISO)和国际电工委员会(IEC)发布了图查询语言(GQL)国际标准的第一个正式版本,嬴图9月就在其最新的Powerhouse版本中提供GQL支持。在孙宇熙看来,标准出现后对技术人员而言就不存在学习成本了,需要考虑的只是在SQL和GQL之间做抉择。
到今天,孙宇熙都相信,图数据库是一种终极数据库。现在市场上同类玩家不多,他这么理解:任何东西有足够的门槛,做的人就一定很少。
产品从1做到99 要五到十年
创业初期做市场调研时,孙宇熙发现,国内市场内有三百多种不同类型的数据库,但具体落地质量参差不齐。早期他经常被投资人问到一个问题:你这个产品是基于哪篇论文的?
“有基于一篇论文可以做出的产品吗?一个产品通常要基于上百或上千篇论文吧”,孙宇熙答到。
他指出,光是计算引擎就可能要建立在一两百篇论文的基础上,而图数据库还包含存储引擎、图查询语言编译器或优化器、数据库管理组件等,还涉及到大量可视化问题,这些都建基于浩如烟海的文献。在一篇论文基础上做出的产品,只能说是“PPT创业”。
产品做出来还只是第一步,距离真正工业化道阻且长。以金融业为例,他们对产品效率、系统稳定性和精准性要求很高,要把产品从0到1再做到99甚至120分,才有可能被采纳。而产品从0到1可能只需花费一年,但1到99就可能要花五到十年时间。“很多东西做到最后都是工程,一个重研究轻工程的公司是极其危险的”。
孙宇熙向雷峰网表示,“功能的完善”、“稳定性”、“效率”这三个重要维度,是数据库级别产品的“不可能三角”——这个三角没有四五年,基本不可能达到闭环。巨大的时间成本对寸光阴寸金的创业公司而言,也是莫大考验。嬴图在相当长一段时间里,做产品研发都依靠自己的资金储备。
嬴图成立于2019年,到现在已迈入第七个年头。头两年公司还在做产品的闭环,第一年大量时间进行内部试验,实现高效的计算引擎;第二年把计算引擎的功能补全,让它跟存储引擎结合,实现端到端闭环。真正商业化落地是在第三年。
2021年开始,产品进行不断迭代,一直到公司成立后的第四第五年,这个“不可能三角”才逐步闭环并增强。这时孙宇熙回顾两年前产品,发现它就是“能用,但不完善”,“挺痛苦的,意味着那不是一个标准化的解决方案”。与国内众多厂商不同,嬴图并不满足于只提供定制化的解决方案。以全球金融风险管理领域为例,2021 年,嬴图为某银行定制的流动性风险管理图中台系统,一经推出就斩获国际唯一的 “流动性风险管理成就奖”,还被 IBM 研究院收录为案例。但孙宇熙深知,定制化虽能解一时之需,却难以推动行业的长远发展。所以,打破定制化局限,创造更具价值的创新样本,通过金融+科技手段,才是将金融风险管理迈向更普适、高效的后手棋。
在这两年,嬴图数据库在持续的场景拓展过程中,研发团队紧密围绕实际反馈,对产品性能进行全方位、深层次的优化,针对不同场景下的特殊需求,从硬件配置到软件算法,从底层系统到交互展示逐一精雕细琢,其系统通用性能够无缝适配各类环境与用户需求。孙宇熙指出,可拓展性也是产品的一大重要性能。现在市场上大量产品没有可拓展性,只能服务中小玩家——如果面对大玩家的海量数据,有拓展性的情况下还要稳定,且葆有良好的性能,这几乎又是一个“不可能三角”。
不过,即便见过很多场景,国内数据库公司仍面临较普遍的发展痛点,即甲方基本把乙方当“外包团队”使用。孙宇熙说道,中国许多甲方高度依赖乙方,要乙方帮忙寻找需求、设计产品,但知识产权理论上都归给甲方。这种合作模式会导致乙方永远在给别人高度定制开发,所做的内容没有延续性。
他也感受到,很多时候头部金融机构更能明白自己的需求,也因此,嬴图很多早期的客户是头部金融机构,在双方合作中打磨产品。
嬴图的又一挑战是身处后疫情时代,客户没钱,资本市场干涸,劣币驱逐良币,价格战愈演愈烈。在孙宇熙看来,这是一件三败俱伤的事情:有企业用十万去做本该用一百万完成的工程,打败竞对拿下单子,但这大概率会是个烂尾工程;客户会因过多烂尾工程而对整个行业产生失望,投入更少,导致行业间争抢更加激烈,由此陷入恶性循环。
要走过辛苦的时期,嬴图很注重开源节流。比如孙宇熙很早就留意到了,公有云并不便宜。于是他们在团队规模还在十人上下时,便决定自己搭建私有云,这已经够几十人开发测试应用,即便加上电费、存储硬盘和监控网络等成本,一年下来也只相当于用公有云两个月的成本,且能保障数据安全。
嬴图推出的一系列相关专著 。
第四次创业 情绪内核稳定是重要招人标准
前段时间,孙宇熙参加了清华一个人工智能和大数据专委会,与老师和毕业校友相聚。大家都在聊出海,嬴图现在也得谈论出海的问题。
嬴图的出海计划里,跟云厂商合作是一个重要方向。孙宇熙指出,今年年初,嬴图已发布了嬴图Cloud2.1版本,并已在海外上线。因嬴图客户大多是大型企业,海外的云厂商可以整套组件都部署到客户那端,其API、SDK都能直接调用,云上的解决方案如图数据库等可以迁移。
国内图数据库市场玩家中也不乏蚂蚁、华为等大厂的身影,但孙宇熙对嬴图在竞争中的优势依然颇有信心。他观察到,目前“old money”头部金融机构依然是数据库的重要客户,但有时互联网的产品放到监管严格、合规流程要求多的金融机构里,容易水土不服;且有时大厂内部复杂的阵营倾向与立场分歧,也会极大影响产品研发。
这也是他在过往的职业生涯中所感受到的。
孙宇熙在清华计算机系学EDA,做CPU芯片设计。毕业后,比起做硬件底层,他更喜欢做网络、操作系统,在雅虎美国、微软亚太研发集团就职过研发或研发管理相关岗位,并曾任EMC亚太研发集团CTO和中国研究院院长。
谈起微软,孙宇熙印象深刻的是“建设性批评”的企业文化。它确实存在积极的一面,但硬币的另一面也会表现为不同部门甚至同部门内的微妙博弈或隐形抗衡。
也因为此,嬴图从创立之日起就崇尚TEAL文化,强调组织的自主性、完整性和进化性。团队的员工情绪(内核)都非常稳定——这是嬴图招聘时着重考虑的一点,再次才是写代码、调试测试的功夫等,“情绪稳定代表心智的成熟和把控自己情绪的能力,这并不容易,有的需要后天极大魄力才能学会”。
嬴图为员工举办的研学沙龙分享活动,特别邀请了国际知名绩效科学领域的Ken West 博士。其分享内容聚焦于如何通过改变潜意识、提升自我意识以及激发正能量。
嬴图是孙宇熙的第四次创业。他从1999年硕士毕业到现在工作的近25年中,有十五年时间基本都在创业。小公司从融资到退出或跟大公司合并的过程,他已经历过三次,可以说是一个创业爱好者。
在孙宇熙看来,自己能承受普通人难以承受的压力,甚至不觉得那是压力。对于过往他并没有太多惋惜,“典型的创业者会选择忘记遗憾”,但在很多个有所突破的时刻,他都感到成就满满——
面对图数据库所需的高计算力,嬴图很早就意识到,需要解决的核心问题是对超级节点极其高效地穿透。现在,嬴图有个名为“超级节点穿透”的核心专利,是全世界首个探索超级节点排序技术的专利,也仅此一个。
当时团队尝试了几周都没能把这串代码跑通。有次孙宇熙在一个国际航班起飞前都还在尝试。起飞关电脑后,他左思右想睡不着,半梦半醒间有了灵感,打开电脑写了一个多小时,终于把这串代码跑通。
那是在2019年下半年,他已记不清自己当时是找乘务员要了杯酒,还是原地振臂高呼了两声,但无比确切的是当时真的超级兴奋。
在2025年的开始,孙宇熙对未来充满信心。他相信,随着市场对图数据库有更好认知,而嬴图又能为客户创造降本增效的产品和解决方案,再次伟大的机会也在眼前。
来源:雷峰网