百家中国数据库企业仅3家千人规模,如今一家要上市

2022年8月8日09:10:16百家中国数据库企业仅3家千人规模,如今一家要上市已关闭评论


    中国占到全球数据库技术人员的1/5,即2万人左右,平均到中国116家企业,平均每家不足175人,其中有3个国产数据库达到千人以上规模,分别是阿里、华为和达梦。如今达梦已提交IPO。
    文|周路平 赵艳秋
    编|王飞飞
    6月底,在一场国产数据库小型会议上,信通院人士公布了数据库研究报告的部分内容,其中有几个有意思的数据:
    全球数据库企业目前有363家,以中美为主,总计占全球71%,其中美国145家,中国116家。全球数据库领域的技术人员超过10万人,平均每家员工数量不到300人。中国占到全球技术人员的1/5,也就是2万人左右,平均每家不足175人,其中有3家国产数据库企业达到1000人到2000人的规模,也有一些企业员工数不到5人。相比之下,美国数据库企业甲骨文,有数万人。
    由于信通院未公布中国3家千人以上数据库企业的名字,这也引发了业内的好奇。而数智前线通过业内人士了解到,阿里和华为规模都超过了千人,第三家是谁存在争议。
    数智前线根据达梦的招股书以及之前的资料发现,武汉达梦数据库的规模在2021年突破了千人。这家企业是第一批国产数据库的代表,被誉为国产数据库“四朵金花”之一。
    目前,四朵金花里的其他三家都还没有资本方面的动作,而人大金仓在太极股份旗下,也没有明确的上市计划。如果达梦成功上市,将成为国产数据库的第一股。
    不过,尽管顶着第一股的光环,但达梦是否能撑得起此前券商给出的500亿元估值,以及达梦数据库的内核是否真的完全自主可控,依然存在一些争议。
    01
    500亿市值,值不值?
    先看一下估值的争议,此前有券商认为达梦市值有望突破500亿元人民币,而这一判断的主要逻辑非常简单,2021年达梦的净利润为4.38亿元,如果按照100倍左右的PE(市盈率,PE=公司市值/公司净利润)计算,市值就能到500亿元左右。
    100倍的PE值是怎么得出来的?券商参考的是国产工业软件第一股中望软件,以及替代了Office的金山软件,他们作为国产替代的代表软件公司,有一定的参考价值。而后两家公司的PE都在100倍左右。其中,国产CAD第一股的中望软件,去年的净利润1.82亿元,如今的市值为169亿元,PE值为108。
    所以,市场认为,达梦也应该有百倍的PE。而且相比于工业软件和办公软件,数据库在这几年得到的支持明显更大。不过,影响这个算法的另一因素是净利润,达梦在上市前夕,业绩大幅攀升。
    从2019到2021年,达梦的业绩增长非常迅猛,分别实现营业收入3.01亿元、4.5亿元、7.43亿元,同期净利润则分别为8374.6万元、1.44亿元、4.38亿元,同比增速分别为71%、204%。尤其是2021年,净利润率超过了50%。
    但作为四朵金花之一的人大金仓 ,其2021年的营收为3.4亿元,而净利润也只有3129万元。为何差距这么大?
    首先,达梦营收增长受到了大环境的影响。其客户主要集中能源、金融、政府领域。这几个领域又是价值较高、自主创新的领域。
    比如今年年初,银保监会印发指导意见,强调“对业务经营发展有重大影响的关键平台、关键组件以及关键信息基础设施要形成自主研发能力,降低外部依赖”,自主创新的基础软硬件在IT外采中占比要求有望提高至15%-25%。
    而达梦的股东背景也给了它非常大的便利,达梦在2008年引入中国软件作为其大股东。
    不过,政企的项目往往存在比较长的账期。2021年,达梦的营收增速为65%,但其应收款增速达到了125%。也就是说,业绩确实在高速增长,但换来的是一堆应收款。
    国产替代的需求带来了营收高增长,而净利润的飙升,则受到了两个非业务因素的影响:一个是税收优惠,光2021年税收返还及优惠政策所涉及的金额就达到了1.12亿元,占营业收入比重为15.08%。
    另一个是政府补助。数据库作为国家大力支持的“核高基”项目,支持力度较高。而达梦在2021年计入当期损益的政府补助金额为1.31亿元,占同期净利的29.95%。
    这两项都不具备持续性。所以说,100倍的PE值以目前的市场情绪是可以达到的,但达梦的净利润能否一直保持就很难说了,以目前如此高的净利润来计算估值,并不是非常合理。
    参见上市的芯片企业,芯片的热度一定程度上要高于数据库,前两年上市的芯片公司,PE值有的高达200~300倍,有芯片资深人士曾告诉数智前线,PE值在60倍左右是合理的。但如今,很多芯片公司的PE值已回归30倍左右。
    02
    到底是不是完全自主可控?
    数据库作为卡脖子的技术之一,其底层能否自主可控一直是外界最为关心的话题。
    当达梦提交IPO后,业内有一个讨论是,达梦数据库是不是完全自主知识产权的。也就是说,达梦的代码是自己写的,还是借鉴了某个开源数据库?
    这样的质疑背后有一定的原因,中国的数据库大部分是基于开源技术开发的,自己研发的少之又少。而开源是否为自主知识产权,国家还没有一个明确的定义。特别是以海外主导的开源技术和社区,最近几年出现过一些问题,让基于开源的产品,面临一定风险。
    信通院最近给出了一组数字,美国开源和商业数据库的占比为48%和52%,在我国是16.6%和83.4%。具体到数量,美国开源数据库为107个,商用数据库产品116个,比较均衡;但中国开源数据库为146,商用数据库仅为29个。
    信通院称,国内外的商业和开源数据库的数量和种类差异比较显著,这也意味着我国数据库技术上整体还存在一定的差距。
    值得关注的是,达梦从始自终都强调自己的数据库产品,源代码是自主开发,而不是像绝大多数国产数据库一样,基于开源开发。当时包括人大金仓在内的国产数据库,底层都是基于开源的PostgreSQL。
    而在最新的达梦招股书中也明确写道:历经20年的发展,达梦已掌握数据管理与数据分析领域的核心前沿技术,达梦拥有全部源代码,具有完全自主知识产权,自主原创率达99.9%。
    “达梦在近30年的技术积累基础上,投入上千人力,投资过亿,开发源代码数千万行才形成了今天的产品,每行代码都是我们自己的研发队伍写出来的。”2010年,冯裕才就对采访他的媒体说。
    不过,公众号“飞总聊IT”提到,在某个大牛云集的地方,大家讨论过达梦数据库,一个说法是它们数据库是基于某个很早期的PostgreSQL版本魔改的。也有留言称,不是PostgreSQL版本,而是MySQL。
    但达梦高级副总裁付铨曾告诉我们,达梦在一些大项目中之所以能够获得订单,最根本的一条是自己掌握核心技术。
    他解释说,达梦做了这么多年的兼容甲骨文数据库,甲骨文的功能非常多,是百万级别的。“代码是自己的,你才能够做很多的修改和调整。用开源数据库,它的架构都已经定了,你没有把它吃透的话,遇到问题是搞不定的。”他说,达梦因为代码都是自己写的,能够很快解决问题。
    早在2013年4月,达梦数据库获得由中国信息安全测评中心颁发的《信息技术产品自主原创测评证书》,成为国内第一家获得“信息技术产品自主原创测评证书”的数据库安全产品。
    付铨也提到开源做数据库的问题,他当时说达梦没有考虑基于开源研发数据库,原因是目前他们觉得知识产权的保护上可能做得不是太够。很多技术一旦开源了,要遵循开源的协议,你要去用它的开源的东西,同时,你修改的东西也应该要公开。所以,虽然注意到开源发展很快,但达梦还没有考虑这一块。
    “首先,对开源引领的技术方向要认真的研究;其次,对开源代码要采取谨慎的态度。在别人的地上盖房子种庄稼,当人家把地收回去时,房子庄稼就都不存在了。”冯裕才做过这样的表述。他甚至把开源免费看成是上瘾的鸦片,终有一天要为此付出沉重的代价。
    具体到达梦的核心技术,要做到兼容甲骨文,一个关键是要具备甲骨文类似的共享存储集群。这也是甲骨文拿下中国通信和金融市场的一个核心技术。付铨说,达梦在2013年左右开始做这个类似的共享存储集群,是在达梦6.0版,但这个版本的架构有一些问题,最后试验评估下是走不通的,由此,达梦重新设计了体系架构,做了7.0,而真正到达梦8.0才做成了共享存储系统,到2021年才算是产品化,“这个东西是很难的”。
    付铨称,两三年甚至更早的时候,达梦随一些国内合作伙伴出海,产品用到了东南亚的泰国,也到了南美、非洲的,甚至还有俄罗斯。“这两年要少一点,这跟疫情也有关系。”
    而在业内人士看来,如果有知识产权问题,大概率是不太敢出海的。
    飞总也称,“目前网上说达梦是PostgreSQ改的,并且能够展示出来比较信服的证据,我还是真的没看到。这让我想起了另外一家说自己也是全自研,但是很多证据都揭示是基于PostgreSQ改的公司,两个一对比,目前来说,我也很难说达梦不是自研。”
    03
    国产数据库是熬出来的
    国产数据库“四朵金花”里,人大金仓成立的时间最早,在1999年由人大教授王珊牵头成立,她也是国内数据库学科奠基人萨师煊的弟子。达梦正式成立的时间是2000年,创办人冯裕才当时是华中科技大学的教授。而南大通用是南开大学的背景,神舟通用则是中国航天和浙江大学支持的项目。
    不难发现,最早一批成立的数据库公司多与大学或者科研院所有关,都是学者教授在将科研攻关成果转化为市场产品。但这些从高校或者科研院所孵化出的项目,在早期并没有太大成功,背后有自身技术的不足,当然也有市场不够支持的因素。
    冯裕才曾回忆,他为了推广数据库,去拜访过近千家国内企业,感兴趣者寥寥。背后主要是国产数据库与海外的产品差距太大,国内的数据库市场基本由三座大山压住了:IBM、甲骨文和微软。
    不过,令人欣慰的是,付铨回忆,从2013年左右开始,市场开始推动国产数据库。大家越来越深刻地意识到自主可控的重要性,国内企业开始尝试把更多机会和订单给到国产技术和产品。
    早在2008年,由于国家电网与甲骨文在采购价格、后期服务费上没有谈拢, 时任国家电网的总工提出,要了解国产数据库,达梦有机会进入国家电网测试, 并在没有抱太大希望的情况下,达梦逐步进入国家电网调度系统。到目前,国家电网调度领域所有数据基本都国产化了。这也是达梦最大的客户之一。
    2013年斯诺登事件后,达梦开始进入民航领域,并在民航订票系统的数据库落地过程中,使用了柔性替代方案,即达梦数据库与海外数据库并行一段时间,再切换到达梦数据库上。这个方法也是当年各领域国产企业替代海外产品的做法。此后,达梦进入中国人寿、中国移动等项目中。
    达梦的最大特色是与美国甲骨文兼容,这个兼容性的开发,是一个长期的过程,达梦到现在已经做了十四五年。去年6月,达梦称与甲骨文兼容的程度,笼统的说可能到了95%以上。这也是达梦获得很多大型企业订单的原因。曾有一位客户反馈,用达梦替代甲骨文后,他们上层的应用都不用改写,这是企业最为看重的地方。
    在经历了中兴华为事件之后,国产化在数据库等关键领域被更加重视,支持力度前所未有。比如2020年被认为是启动金融试点的元年,国内头部的银行、保险、证券、期货、支付金融机构开启了一定比例的自主产品采购。
    不过,金融系统由于对业务稳定性要求高,此前一直是国产数据库最难替换的行业。所以,诸如银行的交易系统大多用的依然是甲骨文的方案,国产数据库更多在一些非核心系统上使用。
    根据国际数据公司(IDC)的统计,截至2019年,在传统部署的关系型数据库市场,甲骨文的甲骨文数据库在中国占有的市场份额为34.7%:在金融、电信等高端专业领域,甲骨文数据库占有的市场份额高达98%。
    但即便在金融行业,国产数据库与并非没有进展。2019年,湖北银行成了达梦数据库在银行领域的第一个客户。而蚂蚁集团的OceanBase和腾讯的TDSQL都拿下了数个银行核心数据库的订单。
    一位资深数据库人士对数智前线说:“三年之内,中国城商行的国产替换完全有可能。”
    如今,国产数据库从之前的荒草丛生,现在已是百花齐放。
    除了传统数据库厂商(人大金仓、达梦、神舟通用、南大通用等),也有大厂的“云数据库”(阿里云、腾讯云等),还有新兴数据库,比如PingCAP的通用数据库TiDB,涛思数据的时序数据库TDengine、欧若数网的图数据库Nebula Graph。此外还有巨杉、中兴、浪潮、易鲸捷等的数据库产品,都登上了国内外流行度榜单。
    在市场方面,2021年,中国数据库市场是47亿美元,占全球的5.2%。而从IT支出来说,中国占全球的15%,数据库这个领域的市场增长有较大空间。
    多方面因素之下,国产数据库,也许很快就要熬出头了