本文最初发布于 Cliff Harris 的个人博客。
我使用的一项服务,有时会将我的一些文件上传到某个地方(是哪家公司的服务并不重要,因为坦率地说他们都是一样的)。举个一个很简单的例子:指向我硬盘上的一个文件夹,将内容复制到一台远程服务器上,然后他们可能会做一些与数据库有关的操作,为那一堆文件分配一个名称,并核实谁下载了它。
这是一家大公司,所以他们的流程很长,而且可能经常遭到黑客攻击,所以需要一些安全保障,也需要一些验证,以确保我上传的文件和他们收到的文件之间没有被篡改过。我理解。
……但基本上,这个过程无非是列出一些文件,读取、上传、然后关闭连接,用一个日志文件说明是否成功,如果不成功是因为什么。这不是什么高科技。事实上,我自己也从头写过这样的代码,使用了 WinINet API 和 PHP(在一台可以访问 MySQL 数据库的服务器上)。与企业级的东西相比,我写的东西可能没有那么健壮,但确实也可以支持数十万个文件的上传(GSB 挑战数据)以及对它们的验证、下载和记录。或许是一个程序员 2 到 3 周的工作?
现如今,我使用的专用上传工具客户端文件总共有 230MB,这一处理过程涉及到 2700 个不同的文件。
你可能会觉得是我打字打错了,所以我澄清下。两千七百个文件和 237MB 的可执行文件及辅助性的东西,只是将一些文件从客户端复制到服务器上。臃肿、过度工程化都不足以描述这个情况了,这绝对是完全、彻底、确定无疑而又显而易见的荒谬和疯狂的。
问题是……我怀疑,其他任何大公司提供的此类软件也没什么不同。哦,还有,它给出了错误信息,它现在不能工作了。
我见过编码人员这样干。我知道这种情况是怎么发生的,这是因为编码人员不仅没有使用高效的底层代码来实现他们的目标,甚至他们从来没有见过写得好而又高效的底层代码。当他们都不知道有这种可能时,我们怎么能指望他们做得更好呢?
你可以用不到二十分之一的代码编写一个程序,将文件安全、快速地上传到服务器。它可以是单个的文件,仅一个小小的 exe,不需要成百上千的 DLL。这不仅可能,而且很容易做到,还更可靠,更有效,更容易调试,而且...... 让我再唠叨一句..... 它真的可以工作。
代码臃肿听起来像是五十多岁、脾气暴躁的老程序员(比如我)小题大做,因为我们年纪大,脾气暴躁,我明白这一点。但是,我们又老又暴躁是代码运行速度比它应该的要慢 50% 时,或者是代码大 50% 时,我们才会抱怨。其实,实际情况远比这更糟糕。我们已经到了这样的境地:我确信,你电脑上的文件中 99.9% 的代码绝对是没用的,甚至从来没有执行过。它只是在那里,在一堆 DLL 里,全都是因为一些编码人员想做一些微不足道的事情,比如保存一个位图,但不知道这有多容易,所以为了实现它而导入了一大堆垃圾。
如我所言,我真的不应该对年轻程序员这样做感到恼火。这就是他们学到的东西。他们不知道什么是高性能,也不知道什么是基于约束的开发。当你告诉他们,游戏 Elite 最初只有 64K,但却提供了一个庞大的星系、3D 空间战斗、职业发展系统、贸易以及成千上万可供玩家探索的星球,我想他们听到了你说的话,但并不真正理解与我们现在的差距。
我为何在意这个?原因有很多,其中最重要的是,如果你需要比平常多两千倍的代码来实现一件事,那么它就应该有效。更重要的是我知道,在我这台大电脑上,99.9% 的处理器时间是完全没用的。它每秒钟进行数十亿次的操作,只是为了原地打坐。我的电脑现在应该处于超低功率模式,关闭所有的风扇,处于完全的安静状态,因为我在 WordPress 中输入时,它只是做一些拼写检查。
如今,计算机的速度非常快,你可以把它们看作是绝对魔法。你能想象到的一切应该都可以在刷新率的 60 分之一的时间里发生。然而,当我在我的笔记本电脑(微软 Surface,相当新)上点击音量图标时,却有一个明显的延迟,因为机器一步步创建出一个新的用户界面元素,并最终确定了要绘制的图标,让它们弹出,然后开始运行。这需要时间,我怀疑有半秒,以 CPU 时间计,这就像 10 亿年。
如果我是对的(保守地说),我们的 PC 99% 的运行时间都被浪费掉了。也就是说,计算机能源消耗的 99% 被浪费掉了。这简直是犯罪,这是要干什么?我不知道,但只要看一下电脑的任务管理器,就会发现一大堆臃肿的废物,天知道它们在干什么。我现在正在做的就是输入这篇博文。
Windows 有 102 个后台进程在运行。我的 Nvidia 显卡当前占了其中的 6 个,其中一些还有子任务。这是要干什么?我现在不是在运行一个游戏,我所使用的显卡驱动程序的功能集与我二十年前的差不多,但却需要 6 个进程。
微软 Edge Web View 也有 6 个进程,还有微软 Edge。我甚至没有使用微软 Edge。我想是因为我昨天在里面打开过一个 SVG 文件,然后就这样了,12 段无用的代码,浪费着内存,可能还会轮询 CPU。
这太疯狂了,这就是为什么我们似乎什么都没做,却什么都很慢。这就是为什么你每年都需要一部新手机和一台新电视来加载那些臃肿的流媒体应用,它们也不得不运行这些糟糕的代码。
老实说,我认为情况只会变得更糟,因为像 Facebook、Twitter、Reddit 等大而无当的科技公司是这种趋势下最糟糕的例子。很快,他们雇用的成千上万的“程序员”在输入时都将使用机器学习从 GitHub 上复制粘贴臃肿、有缺陷而又杂乱的代码。只是将两个数字简单相加最终都将涉及 32 个 DLL、16 个 Windows 服务和 10 亿行代码。
Twitter 有两千名开发者,Tweetdeck 偶尔会无法加载用户栏。这种情况已经持续四年了。我打赌没有一名编码人员知道为什么会发生这种情况,因为其后台代码非常臃肿,有很多复制粘贴来的没用的东西。
Reddit,当从链接中推荐标题时,无法处理与号或分号或英镑符号。现在是 2022 年了,他们可能也有 2000 名开发人员。显然,他们中没有人能够提供一个有效的文本分析器。为什么他们还都能得到报酬?
曾经有一个编程的黄金时代,那时内存和 CPU 都有实实在在的限制。然而现在,我们生活在一个极端浪费的低效环境里,真是太可悲了。
查看英文原文:
https://www.positech.co.uk/cliffsblog/2022/06/05/code-bloat-has-become-astronomical/
点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!
“台湾省山西刀削面”搜索过多,百度地图宕机;BOSS 直聘即将实行末位淘汰;B 站回应 HR 称核心用户是 Loser |Q 资讯