人工智能与区块链都是今年被循环往复顶上风口浪尖的“热技术”,如果将这两者做个加法的话,“人工智能+区块链=?”,该组合又会碰撞出怎样的火花?
这一点,最初对于深脑链 CEO 何永来说,也是充满着好奇、疑惑甚至始料未及。
深脑链 CEO 何永
从最初对人机交互技术的研发,过渡到采用时下最热的区块链技术驱动人工智能算力并付诸实践,何永坦承,推动这件事儿的还是“痛点”两个字!
参看何永的履历,我们得知,关于 AI 研发,他可以称得上是相当资深,但在漫长的技术攻坚过程中,一个问题却始终困扰着他与团队。
数据不够,怎么办?机器也不够,又该如何是好?
人工智能就像一只需要非常庞大的数据来“饲养”的动物,量的要求已然让企业力不从心,暂且还未提及数据来源、质量以及隐私等诸多亟待解决的问题。
除了需要通过大量数据完成学习以及训练外,企业用于处理数据的 GPU 等各式各样的芯片也时常告急!
每年需要提高差不多 5-10 倍的性能才能勉强追上企业发展的步伐,飞快的更新迭代所带来的硬件设备的“海量”投入,早已让企业叫苦不迭。
各种花销这么多,发展负担如此重,此类普适性的行业问题究竟该如何解决?
何永与团队成员思忖良久。
“为了解决我们遇到的,也是诸多 AI 企业所困扰的,技术团队从 2016 年开始着手接触一些火热的新科技,最后锁定了区块链。最早我们只知道比特币,但从未想过人工智能如何与区块链相结合的事儿。”何永表示。
从 2016 年想法初现,2017 年上半年初步形成相对完成的解决方案,再到 2017 年下半年正式推出,何永以及团队马不停蹄地,在解决 AI 数据以及算力的问题上奔走!
过程总有曲折,谈及困难,何永很感慨,整个过程就如同向两个行业分别做知识普及一样。
毕竟人工智能与区块链都是技术含量很高的前沿科技,对于很多人来说,其中一种已经比较难懂了,更何况是两种相结合?推广的难度可想而知!
何永对记者说:“我们需要向懂区块链的人介绍何为人工智能、人工智能的价值以及行业优势等,还要告诉他们这个项目是用来解决人工智能领域相关问题的,这个推广实际来看很曲折。”
另外,由于人工智能行业对区块链技术了解的也不足够,只是将更多的目光聚焦在比特币的高价以及炒币的乱象上,对此何永以及团队还要将“区块链技术究竟对人工智能行业带来怎样的帮助”这一点讲透彻,“艰辛”成为了主旋律。
理念依靠普及,产品还需落地。
最终,何永及其团队选择通过区块链技术为人工智能搭建一个计算网络的方式,即深脑链(DBC),来解决人工智能企业算力成本以及数据隐私等问题。
这个“人工智能+区块链”合力作用的计算网络究竟玄机何在?
据记者了解,深脑链 DBC 的网络节点,主要以高性能 GPU 服务器为主,尤其是 4 卡、8 卡的 1080Ti 及以上的 GPU 组成。
通过区块链技术,网络节点之间形成了去中心化、分布式以及弹性算力的特征。
具体来说,整个网络的节点由个人设备、中小企业设备以及类似现代矿场的大设备群组成,所以并不像通常我们熟识的节点那样,呈现高度中心化的状态。
在这种机制的作用下,如果网络上有企业提出数据需求,只需要通过客户端打包随后充入 gas,可以单纯理解为手续费或者定金之类的。
然后满足要求的节点就开始运行相关程序来协助企业完成数据处理的需要,这个过程中,只要链接到 DBC 上的设备都可以作为处理器工作。
此外,用户还可以根据自身业务要求,使用 DBC 网络的弹性算力。
早在设计之初,DBC 网络节点就采用了结构化、非结构化的分布式,同时选用区块链的底层架构来进行垂直或者水平扩展以及大规模伸缩,所以无限扩展的功能得以保障。
网络的工作机制如此,计算节点的收入组成也有明确的规定。
每个 AI 计算节点的收入主要来自于 DBC 网络挖矿的奖励以及 AI 算力使用方支付的使用付费。
所以,AI 厂商可以提前购入 DBC Token,在需要算力的时候,直接支付就可以使用。
其实,DBC 网络不但为 AI 企业开启了最短时间集中稳定算力的高效通道,同时也出炉了相对完善的监控机制,主要用于约束挖矿行为以及规范 AI 企业的训练结果,避免算力的使用不当等问题。
对于参与 AI 训练和挖矿行为的企业和个人,如果存在恶意指令检测或者恶意行为检测等,将会考虑被扣除保证金。
此外,由于企业的 AI 训练行为可以同时发射到多台主机上并行,得出的结果也可相互验证,所以训练过程可以得到远程的实时监控,从而通过可视化的技术保障算力使用恰当。
需要提及的一点,由于 DBC 网络上涉及挖矿行为,所以挖矿节点的技术组成也是很复杂的,毕竟直接关系到一部分算力的产出。
据悉,挖矿节点主要由计算引擎、镜像管理系统、存储管理系统、身份服务引擎、网络管理引擎等几部分构成。
随着生态的逐步繁荣,对于节点性能的要求自然会逐步提高,如果做到持续拥有高效的 GPU 算力、充足的内存、较大的磁盘空间以及良好的带宽等,需要不断在技术上寻求突破,保障节点的高性能。
众所周知,安全作为每个产品必须提起重视的关键一环,DBC 网络对于数据安全、物理服务器安全以及企业身份验证等痛点又有何技术上的保障呢?
过去中心化的云计算平台,尽管在 API 访问权限以及存储管理等方面都做了“精心”的设置,但数据泄露的频率依旧很高,系统故障排除后必须进行的数据恢复也是个大大的问题。
相比传统的中心化平台,DBC 网络在数据安全方面利用技术优势,达成了多重加密、数据并行,可以理解为数据在不同的主机上完成切片并行训练的能力,来提升数据的安全性;此外还在不断探究同态加密、代理重加密的可行性,最终加大黑客攻击的成本。
问及同态加密的进展,何永表示,目前同态加密的理论可行,但关键的问题在于速度太慢。
对此,深脑链技术团队考虑到,随着机器性能的提升,或许能够发现进一步提升同态加密速度的方法;另外就是精细控制用于同态加密的数据量。
仔细想想,其实并不是所有的数据都需要通过这种技术手段来加密,所以优先选择特别隐私的或者体量较小的数据,从工程的角度出发落地这项技术才是正道。
很长一段时间,企业对于物理主机以及服务器的安全保障同样是比较纠结的一件事儿。
经常,中心化的物理主机或服务器如果遭到破坏,“旗下”负责管理的所有虚拟服务器都有可能遭到攻克或者破坏,之间产生的漏洞也会被利用。
“对于此类现象,我们选择将应用运行在容器内部,针对容器进行安全加固。无论是拦截恶意指令,还是监控恶意行为,企业只有自己掌握私钥才能访问数据,第三方根本没有权限。”何永补充道。
关于最头痛的身份验证呢?
深脑链提出的解决方案还是高效地利用了区块链技术。
主要将用户的信息进行二次加密,就算有人处心积虑的拿到数据,也是加密之后的,根本无法直接使用。
采访中,何永表示,目前 DBC 的测试网络已经支持了 TensorFlow、Caffe2、H2O 等 AI 和机器学习框架,同时团队在 AI TestNet 上也已经完成了多种 AI 训练任务。
训练任务从无人驾驶到人脸识别,从医学肿瘤检测到智能制造 AI 质检,范围涵盖了人机交互、交通、安全、医学、智能制造等多个领域;基于企业对于 AI 训练的算力迫切需求,深脑链与 AGI 等公司的合作也在有条不紊地进行着。
据记者了解,深脑链正式网(AI 训练网络正式网)将于 8 月 8 日上线。
早在北京时间 6 月 15 日,深脑链基金会已开启“天网计划”,向社会各界征集 AI 算力。
如果作为算力提供方,只需要拥有以下部分或全部资源就可满足“天网计划”的算力征集条件。
测试网计算节点要求:
GeForce GTX 1080Ti 或以上的 2、4、8 卡 GPU 及以上的 GPU 显卡资源;
4TB 以上的硬盘资源(您拥有的硬盘资源加起来总共 4TB 以上即可);
内存 64G 及以上;
带宽 100Mbps 以上。
测试网存储节点要求:
1TB 以上硬盘资源;
带宽 100 带宽 100Mbps 以上。
正式网上线后,AI 企业就可以在深脑链正式网进行真实 AI 训练,使用 DBC 代币支付训练费用并用于购买 AI 算力资源,预计要节省 70% 的算力成本,还可以完成构建 AI 解决方案的目标;此外,整个过程中,算力提供方可获得 DBC 奖励,企业可托管 AI 训练模型和 AI 数据,形成有序生态闭环。
据悉,深脑链 AI 矿机也将发货,并在 10 月底开始挖矿。
“我们真正立足人工智能行业,希望通过深脑链技术帮助企业降低成本,吸引更多的人工智能机器加入进来,这是一直以来的愿景。此外,还有一个阶段性目标,如果能在未来的三到五年中,有一百万且满足要求的 GPU 机器加入进来,充实这个网络,距离实现最终目标就又近了一步。”何永憧憬道。