【CSDN 编者按】工业软件,又被称之为是现代工业体系的“大脑”。近年来,在政府、企业、从业者等各方的齐心协力之下,中国工业软件市场规模不断壮大,逐渐成为“制造大国”。然而,站在全球的角度来看,相较一些高端核心技术,国内起步较晚的工业软件在设计型软件、工业互联网平台、大数据处理的开源软件等维度仍有一定差距。本文,来自涛思数据创始人陶建辉将带来他关于缩小差距与创新突破的独特见解。
根据智研咨询数据,2020年全球工业软件市场规模是4358亿美元,这一年中国工业软件市场规模是286亿美元,仅占全球规模的6%。近十年间,中国连续保持世界第一制造大国地位,制造业的快速发展也极大带动了国内工业软件市场。一些数据显示,在2012-2020年间国内工业软件市场规模复合增速达到了12%,超过世界增速7个点。虽然发展速度在加快,但不可否认的是,从世界角度来看,中国的工业软件不论是从规模亦或是技术来看,都还差了一大截。
到底是什么限制了中国工业软件的发展?为什么说工业软件必须要发展起来?未来它的机会在哪里?想要加速冲刺,还有哪些捷径可走?在打造和优化时序数据库TDengine的这些年里,我对工业软件做了一些思考,现将一些想法与大家分享。
中国工业软件:难、难、难
普遍意义上,工业软件指的是专用于或主要用于工业领域,以提高工业企业研发、制造、生产管理水平和工业装备性能为目的的软件。其门类复杂,包含ERP、CRM一类的企业管理软件,CAD、CAE、EDA一类的工业设计软件,生产调度和过程控制软件(即对自动化设备等进行监控、数据采集并保证其安全运行的工控软件),以及运用了工业云、大数据、AI等技术的部分IT基础软件。
与应用软件的全球风靡相反,中国工业软件每一步都走得非常艰难,甚至成为在改革开放后唯一一个与国外同行不断拉大差距的技术领域。受到国际竞争环境的影响,一提到需要突破的重点技术,国内大部分人想到的就是芯片、光刻机、操作系统等,普通大众对工业软件的接触并不广泛,也导致大家对其发展了解有限。
众所周知,中国基础软件无论是操作系统,还是数据库领域,虽然已经有数百家国产替代品,但市场仍然是被Windows、Linux、MySQL、Oracle等产品垄断。那么在工业领域呢?应该更为惨烈,PTC、Autodesk、达索、西门子等国外CAD研发设计类软件垄断了国内90%的市场,DCS、PLC、SCADA等工控软件垄断了国内70%的市场,高端占95%以上。
在整个软件行业中,工业软件虽然占比不高,但却是工业与制造业发展的核心基础,工业软件的安全性好坏决定着工业项目能否正常运行。随着数字化进程的加快,现代工业已经离不开信息化,几乎所有的设备、系统都是基于工业软件,工业软件的广泛应用让生产效率和质量都得到了极大提升。以大家熟悉的鸟巢建造为例,想要让钢材在保持稳定的同时排列美观,没有工业软件的支撑这项工作将很难完成。如果工业软件出现问题,工业项目可能会面临瘫痪的局面,后果不堪设想。
中国软件发展整体起步较晚,尤其工业软件,以CAD、EDA一类的设计软件为例,虽然在整个工业生产中扮演着至关重要的角色,但由于技术实现难度较大、投入成本较高、开发周期较长,自身的总产值却并不高,这种行业特点不仅让创业者望而却步,连投资人都难以招架,在一定程度上也限制了其发展。
在中国加入WTO之后,国外的先进技术和产品开始迅速涌入国内,技术的差距是真实存在的,中国工业软件的发展需要时间,但机遇不等人,这时工业、制造业要发展就只能先借助国外工业软件的力量,这也变相促成了当下国外工业软件垄断国内市场的格局。
我们再看一下国内风头正劲的一些较为基础的工业软件。随着物联网技术的成熟和发展,中国的各个巨头也推出了工业互联网平台,包括海尔、三一、用友、华为等,值得骄傲。但基于这些平台我们开发的只是应用部分。就拿个人熟悉的工业大数据处理而言,几乎无一例外,用的都是Hadoop生态的软件拼凑而成,无论是消息队列、缓存、还是持久化存储、流式计算等,采用的都是Kafka、Redis、HBase、MongoDB、Cassandra、Spark、Storm等欧美开源软件。
这些工业软件的核心模块并不难,原理算法都很清楚,但由于欧美厂商已经持续研发了十年甚至更长时间,各种接口、各种场景都能处理,积累了很高的生态门槛,一个新的软件很难马上将其替代。比如实时监控领域OSISoft的PI,架构相当陈旧,而且其水平扩展能力、分析能力都相当有限,涛思数据研发的TDengine在时序数据的处理上已远超越了它,但还是无法一下将其替代,因为PI的生态已经很好,能处理数百种工业协议,其与很多工业应用软件已经集成。
中国是制造大国,打造工业软件是制造行业向智能制造转型的关键一步。如果这些软件在未来不可用,可以预见,中国的这些工业互联网平台可能面临非常严峻的风险,这对中国经济的打击将是毁灭性的。如果不想未来仍然被时时掣肘,中国软件就应该全力以赴打造自身的技术,从借鉴历史经验和把握未来发展趋势两方面出发,我认为开源、集成化和云化或将是中国工业软件突围的三大方向。
商业模式的创新:开源
要颠覆现有的技术,有两种方式,一是依靠颠覆式的技术,二是依靠创新的商业模式。从历史角度来看,商业模式的创新成就了大家都熟悉的Linux、Android、MySQL等软件,而这几个软件的模式创新就在于采取了开源的策略。
以Linux为例,Linus Torvards还是一名在校大学生时,在Intel 386上跑起了Linux这个类UNIX的系统,当时的Sun Solaris、IBM AIX、HP-UX都没有把它当作竞争对手,认为只是玩具而已。但由于开源免费,Linux吸引了很多开发者的喜爱和关注,很多开发者自动加入进来,开发各种模块和驱动,在大家的努力下,Linux开始慢慢流行起来,逐渐进入主流市场。到现在,Linux在公有云服务器领域已经占据90%以上的市场份额。
回看工业软件,目前还没有一款具有市场垄断地位的开源软件。在我所熟悉的实时数据库领域,排名第一的OSISoft PI没有开源,GE的iHistorian、Honeywell的PHD(The Process History Database)也没有开源。国产的庚顿、麦杰、朗坤等等都没有开源。那么,开源这种新的商业模式引入工业领域,一定会有颠覆式的效果。
这也是TDengine选择开源的原因,从2019年7月TDengine宣布核心代码开源,2020年8月又宣布集群开源。如图1所示,目前GitHub上Star数量已经超过18.7K,全球每天新上线的实例数超过200,这是传统的实时数据库软件远远无法匹敌的。尽管TDengine目前还无法对PI、iHistorian、PHD这类软件构成威胁,但按照现在的发展趋势来看,TDengine取代它们是5年内会发生的大概率事件。
图1 TDengine在GitHub的页面
中国在工业软件上是较为落后的,开源可以成为颠覆传统工业软件的重要武器。虽然产品推出时,会有各种不足,还无法完全代替他们。但因为开源免费,一定能吸引很多用户来尝试它,而且也能吸引贡献者参与进来。以TDengine为例,在开源之初,就吸引到了40多位贡献者,贡献了国产操作系统中标麒麟、银河麒麟、凝思、统信UOS等的适配;验证了国产CPU龙芯、鲲鹏、申威、飞腾、海光等的适配;还贡献了C#连接器,这些在闭源软件上是不可能发生的。
此外,开源还能让市场规模和用户需求相辅相成,开源能进一步满足用户多样化、个性化的需求,在吸引用户广泛使用的同时,无形中帮助软件扩大了市场规模。开源开放一定是生态建设的重要法门,只有系统的开放性问题得到解决,才能吸引到更多的第三方开发人员,在这之上提供良好的二次开发工具,以二次开发满足用户的个性化需求,从而获得更多用户的关注,而且这也能在一定程度上帮助软件公司避免了大量开发资源的消耗。
在开源力量的影响下,发展5年,TDengine的用户实例已经近14万了,同时也吸引了很多工业企业客户。以西门子与和利时为例,西门子将TDengine应用于SIMICAS® OEM设备远程运维套件中,他们所使用的Flink+Kafka+PostgreSQL+Redis的架构存在部署繁琐、应用复杂的挑战,在接入TDengine后,直接移除了Flink、Kafka和Redis,系统架构大大简化。和利时则是在InfluxDB、OpenTSDB、HolliTSDB和TDengine四款数据库中选择了TDengine,用于工控领域边缘侧的数据处理。
开源更重要的一点是,它建立起了开发者社区,让更多开发者具有参与感、成就感和信任感,给产品做出更好的传播。由于开源免费,用户对产品的瑕疵也是能容忍的,而且会通过社区积极的反馈,加速产品的迭代,帮助产品团队更好的打磨产品。以TDengine为例,开源的三年时间里,反馈的问题已经超过9000个,这是任何一家闭源软件公司都难以做到的。反馈的问题数目越多,用户社区就越活跃,产品质量也更可靠。要知道,几大流行的开源软件的问题数都已超过一万。
在中国,我认为做开源软件的条件已经成熟,这主要有两大原因:
①由于高等教育的飞速发展,特别是移动互联网的发展,中国已经有近2000万开发者,中国的人口红利也已经由农民工红利演变为工程师红利。这支庞大的开发者队伍呼唤新的开发工具、新的技术,可以说,基础软件和工业软件有了用户基础。
②中国是制造大国,有各种工业应用场景,而且数据量惊人,是各种新技术、新产品最好的试验场。而由于全球科技竞争的原因,越来越多的中国企业更倾向于选择国产软件。
20年前,这两个条件是不存在的,但现在条件已经很成熟,可以说当下就是中国开源工业软件的春天。
开源成功的关键:全球化
成功的开源软件一般都是用户量巨大的基础软件,比如数据库、操作系统等等。因为软件开源,绝大部分用户都不会付费,付费的比例只有5%不到,因此想要获得发展,用户基数需要大。这个角度看,开源的基础软件有点类似于互联网ToC的服务,中国软件市场确实不小,但仍然只占全球市场的10%不到。
因此即使国内有充分竞争的市场,如果只针对国内市场做开源软件,由于规模不够,仍然难以做出一家真正的独角兽企业,永远只会是小小的软件开发作坊。从这一点来说,中国开源的工业软件如果要成功,产品团队需要有国际视野。从产品设计的那一天起,就需要考虑并拥抱全球市场,特别是欧美发达国家市场,要有敢于与世界一流的工业软件公司在产品上一较高下的决心,而不是仅仅去占领具备自主可控、国产化优势的国内市场。
工业开源软件不仅要在产品的设计、开发上考虑国际化,而且在全球开发者社区的推广上,也需要拥抱全球流行的方式,而不是构建“中国特色”的方式。也就是说,做开源软件的团队本身,思路和胸怀就必须是开源且全球化的。
只有真正拥抱开源、相信全球协同的力量,才能吸引来自世界各地的开发者加入进来,中国才可能诞生伟大的工业软件公司。
开源不仅能解决中国工业软件的“卡脖子”问题,更是中国软件走向全球的捷径。同时,开源也是打破不被信任的最好方式。
举个例子,ClickHouse是俄罗斯团队开发的一款数据产品,分析能力超强,在中国、美国以及世界各地都有很多忠实用户,大家不会由于它是来自俄罗斯的开源产品就不用它。TDengine在最初开源时,没有在任何英文媒体或自媒体做过推广和宣传,但来自美国的用户数就已经接近1000,数量仅次于当时在中国北京的用户数,这就是最好的证明。
软件开源之后,你不用担心地域的限制、意识形态、文化的差异,你唯一要担心的就是你的产品不足够好,技不如人,没有持续长久的投入。拥抱开源,相信协同的力量,相信开发者社区的力量,有所为,有所不为,在工业软件领域,一定能诞生出源自中国而又行销全球的产品。
技术创新:无缝集成和云原生
顾名思义,无缝集成(Seamless Integration)就是指实现各类软件的互联互通,其实就是围绕产品打造活跃、庞大的生态,有了生态,才能有“百花齐放”的应用,进而形成良性循环发展。我在上文中就有提到,对于架构陈旧、能力有限的PI,在性能上远超它的TDengine依然无法立刻把它取代,原因就是它的生态做得已经比较完善,集成了非常多的工业应用软件。
近年来,TDengine在发展自身技术的同时,也在紧抓生态建设,与第三方工具的连接能极大提升用户的使用体验。目前无需一行代码,TDengine就可以与Kafka、Telegraf、Grafana、Google Data Studio、EMQ X、Prometheus、StatsD和collectd等众多第三方工具集成。
但如PI一般的数据监控软件,有着时间沉淀的先行优势,在短时间内,TDengine无论如何努力,在生态上仍然是差对方一截。本着打铁还需自身硬的道理,从帮助用户降低运维成本的角度出发,TDengine开始打造缓存、流计算和数据订阅功能一体化的创新技术,在最近刚刚推出的TDengine 3.0版本中,这些功能又有了进一步的提升。
以个人的观点来看,无缝集成和极简本就是一体的,这两个产品创新点都是为了让用户在使用上更加便捷,以此提升用户的使用体验。这放在其他工业软件的发展上同样适用。
此外,随着云技术的不断发展,云原生也成为市场竞争力的一个衡量标准。云原生服务的核心就是要充分利用云平台的计算、存储和网络资源可以弹性伸缩的优势,按用户实际用量付费,大幅降低运营维护成本。而且它还提供了快速开发原型、研发、测试以及部署新的应用的能力,可以大大缩短新的应用从设计开发到进入市场的时间。
以时序数据库领域为例,大多数数据库只是“云就绪”(Cloud-Ready),而非云原生(Cloud-Native)。当你要购买某些数据库供应商提供的云服务时,比如TimescaleDB,即使没有运行任何查询,你仍然不得不为计算资源付费,如果你的数据规模增长了,你还需要决定是否购买更多资源。这种云解决方案,其实只是数据库服务提供商在转售云平台,并不能成为自身的核心竞争力。
只有成为真正云原生的软件,才能充分利用云平台提供的优势。从这一点出发,我在TDengine 3.0版本中重点推动了云原生,现在的TDengine已经成为一款真正的云原生时序数据库,它具备云原生数据库的几大特点:水平扩展性(Scalability)、弹性(Elasticity)、韧性(Resiliency)、可观测性(Observability)以及运维自动化(Automation)。它能支持10亿个时间线、100个以上节点,整个集群的启动速度可以控制在一分钟以内,完全解决时序数据业内的High Cardinality的问题。
同样,对于国内的工业软件来说,想要快速从国外流行产品的攻势中突围出来,云原生必定是一个非常正确的技术发展方向。
工业软件发展的助推剂:政策
中国有个优势是,工业市场和需求非常庞大,这是一片孕育工业软件的沃土。但想要让“种子”发芽,还需要政策的东风。
过去一些年里,重硬轻软的思维严重影响着工业软件的发展,软件作为资产很难评估,因此软件往往是依附在硬件上一起卖的。相当大比例的项目,软件都不单独招标,就更不用提底层的工业软件了。应用软件大家还能感受、看到,但底层的工业软件就毫无感知了,因此很难有好的市场价格。工业软件具有单独招标的需求。
此外,中国国内市场看起来足够大,仅是内循环都是足以支撑一些基础软件公司。但仔细分析会发现,国内工业软件的采购方主要是大型国企、政府、军工等单位,但它们项目招标的条件严格,对中小企业要求较高,因此他们很难满足各种资质的要求。
想要让新创的基础性软件公司生存并做强,就需要政府从政策、法规等方面,给予新创的非体制内企业大力支持。
另外一方面,全球软件的付费模式也在发生改变,大家已经越来越习惯按照服务付费,而不是永久性的License。在中国,很多单位都还是完全购买永久License的方式,不采用服务按年付费方式,更不采用购买云服务的方式。这也会极大阻碍中国软件行业的发展。
好在,进入2020年以来,底层软件的研发屡次被政策提及,随着顶层政策层面持续加强规划和扶持,中国工业软件的发展正在起步。我相信,如果从开源、云原生、无缝集成等方面发力,中国工业软件的发展一定大有希望。
作者介绍:陶建辉,涛思数据创始人。1986年考入中国科大,1994年到美国印第安纳大学攻读天体物理博士,曾在美国芝加哥Motorola 、3Com等公司从事2.5G 、3G 、Wi-Fi等无线互联网研发工作,在高可靠分布式系统、即时通信、消息队列等方面,是顶尖的技术专家。
☞iPhone 14/Pro卫星紧急求救上线;非法采集用户位置,谷歌赔偿3.9亿美元;Node.js 19.1.0发布|极客头条 ☞ 纠错老板马斯克后,Twitter 工程师遭解雇! ☞风平浪静的双十一,有哪些值得关注的技术?