从一线研发到公司创始人,基础软件创业者迷雾中与市场赛跑

2022 年 9 月 22 日 InfoQ

作者 | 褚杏娟

基础软件创业的路上,从来不缺勇士。

2018 年初,64 岁的刘新铭已经写下了近 150 万行代码。孩子硕士毕业后,再无后顾之忧的刘新铭与梁宇宁等好友一起创立了专注编译器和源代码分析的鉴释科技。

2020 年的疫情期间,当大多数人保险起见选择原地不动时,在 Pivotal 待了十年之久的 Greenplum 北京研发中心负责人姚延栋,却选择在 7 月辞职,用他话说是:“我看到了一个全新时代的到来,是时候了。”一个月后,他与之前共事多年的同事们一起创立了以超融合数据库为目标的四维纵横……

这些在行业里扎根多年的基础软件从业者们,在不同的时间都做了相同的选择:创业。但对他们来说,从技术一线走向市场,这样的角色转变并不容易。

警惕技术沉迷
“自嗨是创业者的大忌。”

基础软件创业是一场持久战,前期打磨产品很重要。

当前很多基础软件都是开源的。开源的核心在于开放,广泛吸纳社区的建议,吸引更多的开发者,接受更多用户的反馈;从而产品可以不断迭代,在某个垂直领域做得越来越好,下载量越来越多,用户也越来越认可,形成马太效应。

很多软件项目的创始人都曾是社区的核心贡献者,他们拥有很强的技术敏感性,这对于个人开发者来说当然是很大的优势。但要跳出单纯的开发者身份、出来创业,就需要让自己的产品叫好又叫座,不能过分沉迷技术,忽视产品本身。

“有人用”和“能赚钱”是两码事,姚延栋提醒道。姚延栋认为,初创公司最重要的是要尽快验证自己的 PMF。PMF,全称 Product Market Fit,即产品和市场达到最佳的契合点,产品正好满足市场需求,同时让客户满意。四维纵横是在去年底完成了验证,大约耗时 8 个月,其客户包括宁德时代、比亚迪、理想汽车、小米、浪潮信息、烽火通讯等,验证成功后,客户今年已投入生产。

在姚延栋看来,PMF 验证成功的产品同时满足三点:具有真正的价值、解决了客户的真实痛点,并且客户愿意为此付费。如果验证失败,则说明创业者的大方向选择、产品价值或对事情的理解可能存在问题。

要验证成功,创业团队要能够从众多客户需求中抽象出共同能力,并将其放到软件中。这就要求研发团队不能只崇拜技术而忽略用户,反而要多跟客户沟通、多看其他产品的优缺点,然后结合自己产品的特性进行改进。

“客户的耐心是有限的,他给了你机会后,你的产品一定不要让他失望。”姚延栋说道。因此,产品的性能和稳定性非常重要,前者满足用户需要,后者获得客户信任。

在整个 PMF 验证中,用户的付费意愿是最重要的。如果产品做得不错,但客户不愿意付费,那么说明产品解决可能不是用户真正关心的问题,或者这只是众多解决办法中的其中之一,用户还有很多其他的选择。此时,创业者需要先停下来反思哪里出了问题。

谁为软件付费
“国内要搞基础软件的创业很不容易,因为它看不见、摸不着,但是没它,硬件又跑不起来。”

整体而言,靠基础软件来赚钱有不小的难度。大家可以接受在游戏里充值,却依旧不习惯为软件付费。

“国内的老板们需要硬件那样看得见、摸得着的东西,才会觉得自己花的钱有回报。但软件就是看不到、摸不着,这是国内基础软件创业最难的点。”刘新铭感叹道。

刘新铭选择的编译器赛道是一个很偏门的、但又不可或缺的领域。对编译器依赖较重的是各种 CPU、GPU 和云计算企业。但目前企业大多选择使用免费的开源产品,但好用不好用,能看出来的人寥寥无几。

根据刘新铭观察,目前真正通过编译器优化性能来降低成本的大厂只有谷歌。谷歌的编译器团队挣的是帮助自家应用不断提升性能从而节省下来机器费用的那部分钱。比如,编译器团队通过优化将机器性能提升了 2%,那他们可能收取节省下来经费的 1% 作为回报。

不过,这种模式的前提是,每个部门买了多少机器、峰值低谷使用了多少等数据都是可以量化计算出来的。但在国内,这还是一笔糊涂账,很多企业根本估算不出来自己使用了多少机器、优化后性能提升了多少。

国内企业更习惯直接从第三方厂商那里购买机器。企业对“性能提升 10%”之类的话并不感冒,因为对到底省下了多少钱并没有清晰的认知,他们会更愿意跟华为、浪潮们砍价。这也导致了国内厂商容易陷入价格战中,价格战的后果就是大家都没有更多的钱投资到编译器中。

刘新铭团队创业之初的想法就是,做这件大厂们都不愿做的事情,并努力将成本控制在大厂的三分之一,从而赚取利润。但这会对销售团队有些依赖,需要自己去找用户,而不是用户自行上门。这种模式上的缺点也是很明显的,需要面对面交流的销售在疫情居家期间无法顺利进行,导致营收大幅下降。

怎么优化现有商业模式,可能是编译器领域创业需要解决的问题。而对于开源项目商业化的产品,则是另外一种玩法。

典型的开源项目一般有两种商业模式:一是除社区版本外,还提供商业版本,商业版会增加企业级的高可用、高可靠等性能;二是将服务云化,代替用户做运维、存储等工作,用户只关注业务即可。不同项目的差异在于目标用户的不同。

统信软件总经理、深度科技创始人刘闻欢曾表示,有些技术虽然很适合开源,但未必能找到好的商业模式,甚至有些项目可能永远无法在商业上取得成功,这是开发者必须认清的现实。

对于国内现在的操作系统市场来说更是要“虎口夺食”。Statcounter 数据显示,截至 2021 年 7 月,Android 的全球市场份额扩至 41.14%,Windows 市场份额为 31.36%,国内操作系统在 Linux 分类,占比不足 5%。

与国外存在技术差距是不可否认的事实,因此国内操作系统选择了不同的产品策略。统信除了解决大家众所周知的那些技术难点外,更将注意力放在了用户能感知到的如桌面环境和用户交互等方面,将 Linux 从面向极客,转变为面向更多的普通用户和消费者。

“在全球范围内超越微软和苹果是不现实的,但是在中国范围内或者某些应用场景里超过甚至换掉它,则是可以的。”统信总经理刘闻欢此前表示。根据统信提供的数据,目前中国 PC 出货每年有近五千万台,国产操作系统装机量大概有 5%,在市场推动下,未来三五年内每年装机量可以达到千万量级。

不过,路得一步步走。“没有市场,是不会有人去跟你一起来做生产的。可能有个别厂商,但是大部分不会来做。”

操作系统领域里,技术、产品、生态,每一个都是一道难关。

有件事让统信软件副总经理张磊印象深刻。2010 年左右,深度操作系统团队基于 Qt 做了大量工作,但 Qt  社区拒绝团队提交的一个补丁,数年后,团队发现社区接受了一个几乎一模一样的补丁,唯一的区别就是提交者为外国人。

“每个开源社区不太一样,有的社区比较封闭,我们就可能先不参与,寻找其他的替代品。有的社区比较友好,我们就真诚地跟他们沟通,努力把这个软件做得更好。有的社区可能真的怎么都沟通不下去,那我们就自己做。”张磊表示。

经过多年积累,像深度这样的开源社区已经到了布局根社区的阶段,预计今年会完成深度社区组织架构搭建。此外,统信表示还将积极参与开源基金会,并与厂商联合发起新的开源项目。

另外在桌面操作系统之外,IoT、AR、VR 的发展也给了国内操作系统空间。比如物联网对节能要求非常高,机车操作系统对延迟要求高,不同的需求给了国内操作系统各种机会。

人找钱还是钱找人
“整个风投行业,在基础软件领域的投资比重还是比较低的。”

事实上,除了营收,企业运营资金的另外一个重要来源就是融资。但根据基础软件投资人王晓妍的估算,整个风投资金投向基础软件大约不到 5%。

VC 们的钱,说好拿也好拿。去年,数据库资本市场火热之时,投资人都会催着大厂高管们赶紧出来创业。这股风潮得益于主打云数据仓库产品的硅谷独角兽 Snowflake 上市。

2020 年 9 月,Snowflake 正式登陆纽交所,上市首日股价涨幅超过 100%。Snowflake 背后有巴菲特旗下伯克希尔哈撒韦公司及软件巨头 Salesforce 的加持,两家各投了 2.5 亿美元。这足以引爆资本对数据库的热情,大家纷纷开始寻找下一个中国版“Snowflake”。

但是,VC 们的钱也不是谁都能拿到。VC 们希望找到具有国际竞争力的项目,在技术层面和用户体验上都能有很强的优势。此外,创始人和创始团队素质也非常重要。创始团队需要依靠对行业的多年认知,找到市场留给他们的空间。这意味着团队不仅要找到自己的产品定位,准确找到进入市场的切入点,还要有能力组织员工达成既定的目标和战略。

“我们比较喜欢不在主流大厂们视野里的行业方向,这个细分方向最好是增量市场,即现在市场规模可能不大,但未来有机会可以从一粒种子变成一颗参天大树。”王晓妍说道,“然后,我们就给其中非常精锐的创业团队机会,让他们抓住这个窗口期快速建立先发优势。”

例如在 VC 们看来,操作系统现在还是一门生态生意,桌面操作系统、移动操作系统已经是巨头独占的格局,相对已经饱和,要进入这些领域需要消耗非常多的资源,他们更倾向关注 IoT、AR/VR 操作系统的机会。

反观当前的数据库市场百花齐放,大家都还在摸索这条路怎么走,新的头号玩家还在摇篮之中,这种更受 VC 们青睐。

值得注意的是,数据库行业现在有国产替代的信创市场和参与全球化竞争的价值市场,前者代表有达梦、人大数仓等,他们背后大多有国有资本的身影,例如达梦第一股东就是具有国企背景的中国软件。像姚延栋这样的创业者则更多是在价值市场博取机会。这两个市场虽同属数据库,发展路径却截然不同。

VC 对于自己非常熟悉的领域,投资决定会特别快,预计两周左右就能完成所有工作,但需要做外围访谈和研究的项目耗时就会稍微久点,大约在一个月左右。

当然,VC 们也知道基础软件领域的投资回报周期相对较长,因此会给到企业更长的成长时间,对于技术出身的创业者,也会在其比较薄弱的财务管理等方面给予一定支持。

不过相对来说,国外风投对基础软件创业者们更有耐心,甚至能等待 10 年以上的时间。在王晓妍看来,这背后的原因,一是海外的钱更偏长钱,二是国外投资者对基础软件的成长周期有更深的认识,VC 的容忍度也会更高。

“我觉得投资基础软件也是需要一些信仰的,我们相信中国能走出世界级的基础软件公司,但这件事还未被完全验证。周期十分漫长或充满波折都会影响大家的信念,一些追逐风口的钱可能会因此而离开。”王晓妍说道。

随着资本变贵,今年全球资本市场底层投资逻辑也在发生变化。优秀的项目越来越紧俏,钱也在向这些优秀项目靠拢,特别是已经证明自身落地能力的优秀项目。

缺人、缺人,还是缺人
“年轻人都不愿意干这行,因为太苦了。”

基础软件行业除了缺钱,更缺人。这个行业不只对投资人来说投资回报周期长,对于个人从业者来说亦是如此。

早期,国内很多人都是凭借心中的梦想来做操作系统。张磊表示,当时自己的好些同事都是降薪去做操作系统,“从原来的几万降到了几千。”

此外,这还是一件十分辛苦的工作。“每次发版的时候,大家特别辛苦,我们很多时候都会工作到四、五点钟,办公室里,办公桌、行军床甚至地上都是躺着休息的人,但这在当时却是非常常见的。”张磊回忆道。

经过这么多年发展,操作系统研发的待遇已经好了很多,但国内操作系统在公开市场上竞争人才还是乏力,大家更倾向 Windows、安卓、iOS 等。

现在,统信操作系统的内核代码量已经接近三千万行,仅一个工具链的代码也有七百多万行。一个程序员一天大概能够写两百行代码,要很好地完成这样体量的工作,势必对人才的要求更高。而事实是,国内从事操作系统研发的人本就不多,专门从事国产操作系统研发的人就更少了。

同样的情况也发生在编译器领域。编译器是更加典型的精英需求市场。整个编译器行业真正需要的人才也就几百个,即使如此,编译器行业依旧人才凋零。

“一个好的编译器是普通编译器性能的两三倍,但知道什么是好编译器的人很少。”鉴释科技现在的研发团队不超过十个。据悉,当年惠普、谷歌的编译器团队里也就十来个人,很多人只能做核心外的工作。

刘新铭表示,真正好的编译器团队不只能调动硬件功能,更重要的是可以在硬件设计 CPU 时就给出建议。这不是小步快跑能做到的,需要长时间的积累。

“多数大学取消了编译器的课程,清华是少数例外之一。”刘新铭无奈地说道。刘新铭最近在十分用心地带一名实习生,但这个实习生最终能否留在公司,刘新铭也不确定,他能做的就是每天跟实习生保持沟通、联络联络感情。

“人家说我这把年纪还跟年轻人一起拼命干嘛,我说不是拼命,我很认真地在培养他们,教他们怎么做事,我就是能培养几个是几个。”刘新铭回忆道,2001 年到 2009 年间,他和合伙人与国内大学合作培养了二三十名博士,但留在国内的不超过三个,其他人去了待遇更好的谷歌、IBM 等硅谷大厂。

为了找到合适的人才,四维纵横负责招人的 HR 就有三个。“招人很麻烦,数据库核心研发最难,我们对人才的要求也比较高,面试的通过率基本是 100:1,所以我们专门招了三个人去招人。”姚延栋不由得感叹,“国内能真真正正把数据库做好的人太少了。”

为了更好的吸引和培养数据库人才,四维纵横采用诸如扁平化文化、定期研讨会、结对编程、新人 Bug 上手和项目实战等多种组合方法,其中结对编程对吸引新人和培养新人起到了重要作用,使得有潜力的新人在半年左右的时间可以成为团队的重要力量。

实际上,即便有营收和融资,几乎所有创业初期的企业都是亏损状态。像四维纵横、鉴释科技这样的企业,钱主要还是花在了“人”身上。

而像操作系统,这个领域的投入至少要以亿甚至十亿起步。目前,国内操作系统主要用在政府以及大型国有企业中,与互联网企业比,这些机构对安全性要求较高,这也使国内操作系统在安全问题上可以与国外操作系统掰掰手腕,但整体水平还是不足,技术难点还是需要真正的人才来解决。目前,统信计划尝试与更多社区联合的形式来培养人才。

不被理解的坚持
“创业是一件有压力、没压抑的事。”

那么,现在这些在基础软件领域很久的人为什么还在坚持呢?

刘新铭的回答道是:“年轻的时候,我天天跟着 John Hennessy 这种睿智的学者工作,这种美国大牌教授非常随和与直接,会跟任何一个没有经验的工程师深入地聊那些技术细节,而不是泛泛地跟人讲道理。在那种大环境里工作了几年,我就真的上瘾了,那是一种真正的成就感,不是来自金钱上的。”

张磊则提到了自己大学时候的一段经历。“当时,我们隔壁宿舍有一哥们在一个小破电脑上面敲着键盘,指头像飞一样,当时觉得特别羡慕,觉得这就是大神。然后我旁边的同学说,‘张磊你没问题的,一定可以取而代之。’”带着对未知的好奇,多年后的张磊将计算机从兴趣变成了职业,甚至踏入了少有人选择的操作系统领域。2004 年起,张磊零星参与深度的研发,2014 年开始全职参与,一直到了现在。

即使充满挑战,总有人还在坚持着。

“熟悉我们团队背景的人不理解我们为什么要做时序数据库,明明无论从商业机会还是成熟度来说,数仓都要好很多。”姚延栋表示,“但如果往后看五到十年,我们对现在做的事情没有任何怀疑,现在是万物智联的数智化时代,时序数据库只是我们的第一站,我们的目标是超融合数据库。为互联网而生的上一代技术栈不适合新时代,它太孤岛化、太慢、太复杂了,人们需要的其实仅仅是一个强大的数据库,而不用关心数据类型的多样性,也无需关心操作类型的多样性 ”。

姚延栋在 2005 年的时候从中科院软件所毕业,曾在 Sun Microsystem 和 Symantec 操作系统和存储部门工作多年,2010 年加入 Greenplum/EMC 后直到前年才离开。作为几乎完整经历了 Hadoop、NoSQL 生命周期的人,姚延栋表示自己一直都不认同这条技术路线。

“这条技术路线复杂而又低效,但引领社会十几年导致了重大的资源浪费。”姚延栋说道。但身处外企,很多次在做重大产品决策时,姚延栋都觉得自己束手束脚,错失了好多机会。

“但在当年,我的技术经验和社会履历都有限,即使认识到这一点也做不了太多的事情,只能不断沉淀,等待时机。”Hadoop 技术路线由于低投资回报率从 2015 年开始被告警,2019 年基本上走向了下坡路,成为被替代的对象。那个时候,姚延栋已经有了多年研发和管理团队的经验,同时物联网有了明显的发展势头,因此经过很长时间的考虑后,姚延栋决定创业,希望为万物智联的新时代创建一套“极简、极速”的技术栈。

创业后的姚延栋虽然没有了外部约束,但需要更多的自我约束,甚至是来自同事的约束。“不管什么样的约束都会有压力,但现在的我不会压抑感,更容易把精力放在应该做的事上。”

创业一年,姚延栋团队完成了 PMF 验证,虽然营收还需要提升,但姚延栋对此比较乐观:“做数据库,前三五年不会特别看重营收。”他预计,公司今年的营收相比去年可以提高 10 倍左右。

结束语

创业成功是一个极小概率事件,需要“天时、地利、人和”,缺一不可。年轻的创业者们像几年前的刘新铭、姚延栋一般,身藏百技,跃跃欲试。

但姚延栋提醒,对于新的创业者而言,加入数据库这样的基础软件赛道并不是一个很轻松的选择,因为这是一个“看似美好,但实际上非常惨烈的领域。只有当你真的发现了一个独特的价值,能够非常好的回答‘为什么是你’的问题时才进入,同样看准后,就不要只在自己的大脑里面推导,不要犹豫,快速出来试水,这个时机也不容易错过。”

没有哪个领域的创业能够轻易成功。无论外部环境如何变化,如何活下去以及如何活得更好都是摆在创业者们面前躲不开的现实,但也总有一些创业者可以突破局限、获得成功。谁能够成为这样的人呢?

接触过众多创业者的王晓妍总结道,“成功的人还是有一些共性的,比如创业者对事情的理解、格局和价值观,包括带团队的能力,对技术的执着和热爱,还有克服困难的勇气和决心。”

软件,特别是基础软件创新和创业,在中国还是熟悉的“陌生领域”。此时的基础软件创业者们正在迷雾中与影响市场的各种因素博弈,与市场赛跑。摸索路线的焦灼或是克服困难的喜悦,都是他们成长的必由之路。

今日好文推荐

Azure CTO 呼吁不要使用 C/C++ 启动新项目,C++ 之父回应:你们这些高管就爱喜新厌旧

NGINX 局限太多,Cloudflare 最终放弃它并用 Rust 自研了全新替代品

CEO 们突然介入到 IT 建设, 企业纷纷迁出 VM 虚拟机基础设施

“羊了个羊”一天宕机 3 次,马化腾辟谣日赚 468 万元;60 岁史玉柱“重返一线”改游戏;旷工为由辞退员工,脉脉被判赔 24 万|Q 资讯

活动推荐

如何用向量来检索海量的非结构化数据?向量数据库的优势和前景如何?如何在数据领域利用大规模深度学习网络来实现算法和模型的创新和应用?

首届非结构化数据峰会(Unstructured Data Summit 2022)将于 9 月 24-25 日在线上举行。峰会以「矩阵革命,向量连接世界」为主题,围绕人工智能在非结构化搜索领域的顶尖技术、热门话题展开分享、探讨。更多精彩请扫描下方二维码,预约峰会直播。

登录查看更多
0

相关内容

102页pdf!《自动驾驶卡车量产》白皮书
专知会员服务
57+阅读 · 2022年9月2日
华为发布业界首个《云原生数据库白皮书》,25页pdf
专知会员服务
46+阅读 · 2022年8月20日
2022年中国企业数字化学习行业研究报告
专知会员服务
33+阅读 · 2022年7月20日
企业数据治理痛点与阿里巴巴数据治理方案
专知会员服务
44+阅读 · 2022年7月4日
专知会员服务
47+阅读 · 2021年5月21日
【2020新书】软件和人工智能项目中的设计思维,157页pdf
专知会员服务
117+阅读 · 2020年8月30日
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
谈融资时,投资人最忌讳的是什么?
创业邦杂志
0+阅读 · 2022年3月26日
云片CEO林佳齐:只做颠覆式创新 | TGO专访
InfoQ
1+阅读 · 2021年12月16日
用半年时间,操盘一家出海创业公司
人人都是产品经理
0+阅读 · 2021年12月14日
一位女博士在人工智能领域创业的那五年
InfoQ
0+阅读 · 2021年11月22日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年11月26日
Arxiv
0+阅读 · 2022年11月24日
Arxiv
0+阅读 · 2022年11月23日
Arxiv
46+阅读 · 2021年10月4日
Knowledge Representation Learning: A Quantitative Review
VIP会员
相关VIP内容
102页pdf!《自动驾驶卡车量产》白皮书
专知会员服务
57+阅读 · 2022年9月2日
华为发布业界首个《云原生数据库白皮书》,25页pdf
专知会员服务
46+阅读 · 2022年8月20日
2022年中国企业数字化学习行业研究报告
专知会员服务
33+阅读 · 2022年7月20日
企业数据治理痛点与阿里巴巴数据治理方案
专知会员服务
44+阅读 · 2022年7月4日
专知会员服务
47+阅读 · 2021年5月21日
【2020新书】软件和人工智能项目中的设计思维,157页pdf
专知会员服务
117+阅读 · 2020年8月30日
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员