开源国际化不是技术人创业的万能药|开谈

2022 年 8 月 26 日 CSDN

作者 | 辛晓亮        责编 | 唐小引
出品 | CSDN(ID:CSDNnews)

月 25 日,星爵创业的向量数据库公司 Zilliz 宣布完成 B+ 轮 6000 万美元融资,成功将其融资规模进⼀步扩⼤⾄ 1.13 亿美元,这已经是星爵创业的第 5 年,能在当前环境下还能取得这样的成绩实属不易。

开源创业是近两年特别火的创业模式,基础软件也是备受关注,但是致力 AI 向量数据库这个赛道仍是非常少见的,成功走向国际化的产品就少之又少,尽管在数据库领域深耕二十年,星爵依然直言创业前期就遇到了“拿着锤子找钉子”的困境。

近日,CSDN 高端对话栏目《开谈》邀请到 CSDN 创始人&董事长、极客帮创投合伙人蒋涛独家对话 Zilliz 创始人星爵。我们得以近距离了解星爵在开源上的思考,听听他是怎么看待国内外开源,以及技术人创业和开源国际化一路走来的思考与趟坑经验。

以下为对话实录(CSDN 做了不改变原意的编辑,点击下方视频,可畅享完整对话


创业之初的困难:“拿着锤子找钉子”不是个好选择


蒋涛:星爵,先和大家简单介绍一下,你创业的背景是什么,为什么选择了 AI 向量数据库这个新兴的赛道,是因为你在数据库领域这么多年的背景吗?

星爵:我们做的是一个面向 AI 的新型数据库,属于基础软件的赛道,我自己从 2002 年开始一直在做数据库方面的研究,之后又在 Oracle 工作多年,负责云数据库产品的研发,现在团队里的很多成员也都是数据库领域的老兵。

我们发现在 AI 到来的时代,企业处理数据的类型发生了根本变化。数据类型从传统的基于数值、数据表等数据格式的结构化数据,变成了 AI 时代的图片、视频、自然语言、用户行为,甚至生物领域分子结构等等海量的非结构化数据,这些非结构化数据成为 AI 领域里数据处理的重要对象。

数据对象的变化使得数据处理方式也发生了改变,传统结构化数据的处理方法,关系型数据库的理论,在非结构化数据领域就不那么高效,也起不到应有的作用。基于此,我们看到了这样一个新兴的机会,准备打造一个服务 AI 应用的新型数据库,叫做向量数据库系统。基于向量数据的分析,挖掘后面非结构化复用的含义。

过去几年我们也看到以向量数据库为代表的新型 AI 数据库,在 AI 应用处理的场景之下,发挥着越来越重要的作用。所以,未来十至二十年,随着 AI 应用的进一步落地和发展,现代数据库能起到越来越重要的作用,去帮助各行各业更好地处理 AI 数据。

蒋涛:你从 2017 年开始创业,回顾一下从创业之初到现在,创业的方向发生过变化吗,背后的原因是什么?

星爵:其实在创业最开始时有过一次调整。2017 年时,我们对产品理念、形态还不是特别清楚,手上只有技术,考虑要为 AI 服务,我们就做了一个用 GPU 加速各种数据处理的引擎。通过使用 GPU 里高效并行的算法去加速各种结构化数据和非结构化数据。

有了这个技术之后,我们就拿着技术找场景,就是常所说的“拿着锤子找钉子”。然而找了很久后发现,光有一个好技术、好算法,想要落地变成产品还是非常难。大概经历了一年半的时间,通过大量的用户访谈和交互,我们发现用户其实在处理这种 AI 数据时,已经用 GPU 异构的硬件来做加工,同时也发现,他们有向量图片搜索、视频分析加速的需求。

根据市场的反馈,我们确立了这样一个机会,坚定了把向量数据库做成一个产品的决心,大概从 2018 年开始,我们坚定了公司和产品发展路径,聚焦于新一代的面向 AI 的向量数据库的研发。迄今为止,也取得了一定的成果。



融资并不是最大的困难,开源帮助我们打开了市场的大门


蒋涛:听起来都要经历这么一个过程,就是技术找到市场真正的需求点。那么你是怎么拿到第一笔融资的,一般企业从 0 到 1 都是有难度的,你是怎么实现这个突破的,又是怎么组建第一个团队的?这中间都遇到了什么困难?

星爵:蒋总这个问题特别好,因为创业最不缺的就是困难和挑战,我觉得估计给我三天三夜的时间都聊不完。任何一个阶段,当你解决了一个特别困难的挑战时,就会安慰自己以后就是一马平川了,但实际情况则是问题越来越多,困难挑战也是越来越大。我认为从创业到 IPO,挑战和困难会贯穿公司整个生命周期。

说到第一笔融资,我们可能和其他公司不太一样,创业之初并没有找投资,前期主要靠我个人的积蓄作为启动资金,在公司完成了初步的探索和技术原型之后,才决定去接触投资人。

这个过程也比较顺利,主要是在朋友的介绍下认识了第一位投资人,这位投资人之前在 Google 有多年工作经验,同时也在长期研究基础软件的赛道,很快就对未来数据库系统等基础软件的变化达成了默契。我们直接拿出代码编译测试,整个尽调(Due Diligence)过程比较简单粗暴,也只聊了一次就敲定了投资的意向。在接下来的两周内就完成了融资,所以我们第一次的融资过程还是比较顺利的,运气也很好。

公司天使轮的时候,团队一共只有四个人,其中一位是我本科的同学,我回国后说服了他加入我们,然后又从社会面招聘了两位年轻有为的工程师,组建了第一个天使小团队。

蒋涛:你提到了在 2018 年的时候确定了公司发展的方向,也取得了一些成果,那有没有具体的瞬间就是你确信自己创业做对了,市场上有哪些标志或者反馈?

星爵:我们从 2018 年开始做向量数据库的产品,到了 2019 年把产品开源出来,开源半年之后,就在全球积累了超过 100 家的企业级客户。这个时期,我们还是比较兴奋的,终于把技术变成有用的产品,给我们的“锤子找到了一个特别好使力的钉子”。回过头看,当时应该来说我们已经找到了所谓的 PMF(Product Market Fit,产品市场匹配度)。

蒋涛:所以你认为开源的策略帮你打开了市场吗?

星爵:对,开源不仅帮我们打开了市场,更多的是给我们的技术找到了一个很好的支点,可以让更多的企业能够迅速地使用上我们的技术,并且基于技术和产品不断提供反馈,再让我们更好更快地去迭代。



开源国际化不是技术人创业的万能药


蒋涛:开源帮助你们打开了市场,最近几年在国内开源创业的模式也是备受关注,出现了一批新型的开源公司,你们平常有交流吗,怎么看待国内这些开源公司的发展?你认为对于技术创业尤其是基础软件赛道创业者来说,开源是个比较好的模式吗?

星爵:我觉得首先来说,大家都处在一个比较好的时代。我们之所以能够做开源,能够利用开源进行商业化,其实是因为我们中国工程师的发展能够撑起开源软件的这种研发需要。同时,中国的经济与资本的发展,尤其是风险投资行业的发展,也使得我们能够去向基础软件这样的赛道去探索开源。

所以对我们而言,是出生在了一个比较幸运的时代,但挑战也很大。从第一天开始,我们就要面对全球化的竞争,因为在开源的世界里,国界意识是非常淡薄的,或者可以说开源是无国界的。那么不管你的技术、产品,甚至说商业化的成功,都需要放在国际化、有着更高要求的环境里去对比和竞争,这是很多开源兄弟厂商都面临的一个挑战。

对于国内开源公司的发展,我非常乐观。从本质上来说,在过去二十多年的发展过程中,中国的工程师文化和能力有了全球范围的外溢,这个外溢的效应在未来会越来越明显。所以我觉得在未来的十至二十年里,中国会有一批开源软件的公司能够从国内出发,走向全世界。

回到开源创业,我想尽管我们依靠开源获得了非常多的机会,但其实开源并不见得是一个万能药,还是要根据不同的项目,不同的团队特征,找到一条真正适合自己的路径。

比如美国有很多基础软件、SaaS 的公司,没有采用开源的方式也取得了成功。最近美国成长最快的一批 SaaS 公司里就有一大半是闭源的,时至今日,在云时代,开源与闭源做软件,都能找到很好的成长路径。

对于我个人来说,有一个小技巧可以帮助大家判断项目是否有必要开源。

越是底层的软件,意味着服务的需求越通用,可以比较容易地打造一款小而精的通用产品去找到通用的需求。这时开源就是更好的选择,可以帮助你快速获取用户更广泛的需求,进而把产品进一步地做精做好。同时,因为需求比较普遍,你的产品更容易传播和复制,这也是能在开源社区取得早期成功的先决条件。所以,越底层的软件越容易被开源接受,也越容易在开源赛道取得成功。

但这并不意味着做一款上层的应用型软件就不适合开源,最终还是要根据自己团队的特点、项目的不同阶段,进入市场的战略以及最终要采取的商业模型去做综合判断。

蒋涛:非常好的判断方法,那你认为国内现在哪些开源项目是有潜力发展起来的,会是像你们现在正在做的新兴领域的前沿技术吗,还是过去一些传统领域的项目?你们已经成功地走出国门,你认为国内的开源公司和项目应该如何参与全球竞争,更好地拓展国际化市场?

星爵:我觉得无论是传统领域,还是新兴的领域,关键词都在于创新,尤其是在开源赛道。

开源的一个重要思想就是不要重复造轮子。从另一维度去解释的话,就是我们提倡创新。只要这个技术、产品在通过一种之前无人做过的方式去解决问题,我认为都值得去推广,值得去通过开源的方式运营发布。无论它是在既有问题上做的微观创新、带来效率提升,亦或是在一个全新领域里去拓展一些我们之前完全不曾做过的,创造一些全新领域和机会,我认为这都是创新。

如果说开源一个项目想获得成功的话,关键决定因素还是项目创新的高度,或者说项目创新的可持续性,以及创新的稀缺性和原创性。

另外,其实整个国际化探索上,我们还是处于初级阶段。我觉得想要更好地拓展全球化市场,首先要调整好心态,在企业组织架构和产品设计上,都需要根据海外市场去重新调整。

首先,我认为国际化不是个体,而是在实践过程中无数个本地化的合体。无论是北美市场,还是欧洲市场,语言沟通方式、对产品形态的需求、对团队成员的构成都是完全不一样的。

从我们的经验来说,全球化的第一步,就是找到自己认为最核心的市场,在这之中,用本地化的方式做精做好做透。本地化顾名思义就是把自己想象成当地的本地公司,不要把自己当成一个国际化公司,也不要想象成是外来公司,你就是本地原生的公司。公司从内部组织架构、文化、产品形态,到外部用户关系、客户关系、生态合作伙伴的关系,都要重新打造。比较关键的一点是,要能招到足够多本地的人才,然后用本地的方式,才能把本地的生意做起来。

同时,对于一家科技公司,如果在做本土化的过程中,能够获得当地的合作伙伴,不管是生态的合作伙伴,还是资金与投资的合作伙伴,这对它的早期成果都是相当重要的,这也是我们今后要重点发展的方向。



中国不缺软件生态土壤,我们需要有更多的耐心 


蒋涛:你提到国外非常多基础软件公司、SaaS 公司无论是开源还是闭源的都有很多取得了不错的成果,是因为有天然的适合软件生长的“土壤”吗,你认为存在这个差异吗,毕竟一个公司的产品技术尤其是基础技术,是需要一个好的生态做支撑的。

星爵:这点我非常赞同,任何一个软件真正想要生根发芽,长成参天大树,都需要广泛的生态支持。

我认为国内完全不缺生态的土壤,我们可能需要有更多的耐心,需要更多的公司去慢慢施肥浇水耕耘。因为无论是微软、Oracle 还是 Salesforce 等企业,都是短则十至二十年,长则花了三十至四十年的时间,去构建整个上下游生态。

回顾国内软件发展历程,加起来可能也就三十年左右的时间,所以我们要走的路依然很长。在这个过程中,我们要去注重生态的建设,比如国内有一批企业已经基于开源项目去做服务和生态,对于这样的行为我们要无私地扶持。做生态的企业一定要比我们先挣到钱,才能为未来更强大的生态奠定基础。



基金会的经历可以加速项目商业化吗?


蒋涛:开源还是离不开懂生态的运营人才,你在国际开源社区也是很有影响力的,你是怎么参与到 Linux 基金会的,能讲讲你在基金会的经历吗?

星爵:首先介绍一下,我们基金会的全称是 Linux Foundation AI&DATA 基金会(简称 LF AI&DATA 基金会),它是 Linux Foundation 下面的一个子基金会,专注于开源 AI 和模型能力方面的创新,同时也包含了开源的数据分析和数据科学领域的创新。这个子基金会从 2018 年开始发起成立,到 2019 年正式成型,经过几年的发展,在全球也有了三十多家企业级的会员,二十多个开源项目。

我最早接触基金会是想为 Milvus 项目寻找一个合适的基金会做托管,在市场上寻找了一圈,我们发现自己的项目既是一个基础软件的数据库产品,同时又是一个面向 AI 场景的创新技术。这时看到 Linux Foundation AI&DATA 非常符合 Milvus。通过和基金会董事多次交流,发现基金会的理念与我们产品的未来方向是契合的,于是就将项目捐赠给了基金会做孵化,2021 年上半年正式毕业成为这个子基金会的顶级项目。

蒋涛:对你来说,加入 LF AI&DATA 基金会得到的帮助和成长是什么?你认为加入基金会和企业做商业化会有冲突吗?基金会怎么看这个事情?

爵:主要有两个方面,首先开源项目的治理,最开始在制定开源项目的章程、议事规则、管理方法等方面,都是遵循基金会的最佳实践和指导去执行的。

其次,基金会里有许多开源的 AI 项目,在过去的几年时间里,我们和这些项目建立了一些合作,使得自己的 Milvus 不仅仅作为一个创新的数据库项目,更多的是能够整合到整个开源生态中去,成为企业 AI 生产环境项目部署链条里不可缺少的一环。基金会在这些方面发挥了很好的连接作用。

关于基金会和企业商业化,我觉得本质上没有太多的冲突。现在无论是传统的 Apache 基金会,还是 Linux 基金会下的 CNCF,它们对开源项目的商业化都是秉承着中立甚至是鼓励的态度。像基金会里很多优秀的项目,他们的核心团队出来成立公司,把项目商业化,基金会对这些事情也是支持和鼓励的。



中国工程师聪明勤奋,但美国工程师成长更快


蒋涛:我们回到你最初招聘工程师的话题,你认为中国和美国年轻工程师的相同点和不同点有哪些,各自的优缺点都是什么?最后,如果要给年轻的工程师们分享你个人在技术成长方面的一些建议,你准备说什么?

星爵:我觉得国内外年轻的开发工程师,在勤奋程度和基础知识扎实的程度上都相差不大。但是美国的年轻工程师,尤其是工作了 2-3 年甚至 5-6 年后的工程师,他们的进步要比中国的工程师更快。

具体来说,他们会有更多、更高的项目要求意见,可以看到一些更严格、更优秀的标准,也有一些更优秀的工程师在周围作为同事一起工作。

所以我认为,对国内的工程师来说,尤其是新生代的程序员们,要走出国门,打开自己的视野,去看看全球最好的软件标准在什么地方,全球最佳的实践在哪里。如果有机会可以和世界上最好的工程师一起协同工作,尤其是现在有了开源项目,开源的协作变得更加广泛,与国际大神一起工作,已经变成了一件触手可及的事情。

如果说要提一点建议的话,我希望大家可以拥抱开源,拥抱全球化。因为在开源的过程中,你能够认识全球最好的一批工程师,能够学习到最好的代码规范和实践。同时,在拥抱开源和全球化的过程中,你也能第一时间发现全球化的机会,和全球最好的工程师去同台竞技,提升自己。

此外,中国工程师的聪明才智和勤奋都是全球数一数二的。在全球化的过程中,除了聪明和勤奋,还需要更多的软实力,这些软实力的提升一定要在全球化的竞争博弈格局内,才能得到历练和发展。我认为早点拥抱全球化,早点参与国际化竞争,这是接下来中国年轻工程师能够飞得更高、走得更远的先决条件。

— 推荐阅读 —
   
   
     
☞从中国到全球,微软携手合作伙伴布局生态战略新主张
Python 霸榜,学 SQL 工作更吃香,2022 IEEE 编程语言榜单发布!
80岁还在写代码!Hello World发明人、UNIX命名者项目登上GitHub热榜

登录查看更多
0

相关内容

蒋涛,CSDN创始人、CSDN(中国开发者网络)创始人,董事长,极客帮创投创始合伙人。超过28年软件和互联网工作经历,曾担任巨人集团开发部经理,金山软件副总经理,豪杰软件总经理。曾领导开发了金山词霸和超级解霸。2000年起先后创办了CSDN-全球最大开发者社区,程序员杂志,博文视点出版公司,中国云计算大会,中国移动开发者大会,中国大数据技术大会,中国区块链技术与应用大会。2012年创办极客帮创业投资基金,先后投资了柠檬微趣,OKCOIN, 聚合数据,巨杉数据库,达闼科技,易观大数据和IT桔子等90余家高科技创业公司,其中有三家在2020年申报A股上市。
中国“芯科技”新锐企业 50 强
专知会员服务
12+阅读 · 2022年11月12日
Neo4j知识图谱的技术解析及案例分享
专知会员服务
46+阅读 · 2022年7月15日
企业数据治理痛点与阿里巴巴数据治理方案
专知会员服务
44+阅读 · 2022年7月4日
实时数据湖在字节跳动的实践
专知会员服务
29+阅读 · 2022年5月28日
唐杉博士:人工智能芯片发展及挑战
专知会员服务
46+阅读 · 2021年12月4日
《Julia数据科学》及代码,166页pdf
专知会员服务
47+阅读 · 2021年11月4日
达摩院基于元学习的对话系统
专知会员服务
24+阅读 · 2021年1月1日
专知会员服务
51+阅读 · 2020年9月2日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
192+阅读 · 2020年6月29日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年11月23日
Arxiv
12+阅读 · 2022年1月26日
Reasoning on Knowledge Graphs with Debate Dynamics
Arxiv
14+阅读 · 2020年1月2日
Arxiv
12+阅读 · 2019年2月28日
Arxiv
22+阅读 · 2018年8月30日
VIP会员
相关VIP内容
中国“芯科技”新锐企业 50 强
专知会员服务
12+阅读 · 2022年11月12日
Neo4j知识图谱的技术解析及案例分享
专知会员服务
46+阅读 · 2022年7月15日
企业数据治理痛点与阿里巴巴数据治理方案
专知会员服务
44+阅读 · 2022年7月4日
实时数据湖在字节跳动的实践
专知会员服务
29+阅读 · 2022年5月28日
唐杉博士:人工智能芯片发展及挑战
专知会员服务
46+阅读 · 2021年12月4日
《Julia数据科学》及代码,166页pdf
专知会员服务
47+阅读 · 2021年11月4日
达摩院基于元学习的对话系统
专知会员服务
24+阅读 · 2021年1月1日
专知会员服务
51+阅读 · 2020年9月2日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
192+阅读 · 2020年6月29日
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员