CCCF专栏:硬盘,一种无意的“麦克风”

2018 年 10 月 22 日 中国计算机学会
本文研究发现,机械硬盘内部的精密机械组件可以实现和麦克风传感器一样的功能,并具有足够的精度来提取和解析人类语音。这项研究成果发表在网络安全领域的国际顶级会议 IEEE S&P 2019上,为网络安全开创了一个新角度。


随着人们对安全隐私问题的关注,很多有安全意识的用户会通过禁用设备上的传感器以增强对自身隐私的保护。然而,即使这样,也往往仍然会忽略那些非传感设备所暴露的物理攻击面。本文研究发现,机械硬盘内部的精密机械组件可以实现和麦克风传感器一样的功能,并具有足够的精度来提取和解析人类语音。通过这种“无意的麦克风”感知并录制的外界歌曲,其保真度高到可以让Shazam(一种音乐识别软件)准确识别。这项概念论证攻击揭示了即使在没有传统传感器的情况下,用户的隐私仍然可能受到威胁与侵犯。这项研究成果发表在网络安全领域的国际顶级会议IEEE S&P 20191上,为网络安全开创了一个新角度。


硬盘系统的安全问题



硬盘广泛应用在各个方面,包括个人电脑、监控系统、数据中心服务器,等等。硬盘作为重要数据的存储媒介,在许多实际应用中扮演着重要角色,因此也成为攻击者的重点目标之一。国际著名的信息安全厂商卡巴斯基曾报道过一个名为“Equation Group”的高级黑客组织,就是通过开发恶意软件来重新刷新受害者主机的硬盘固件,从而获得更高的使用权限。另外,还有研究者发现即使攻击者的攻击成本有限,其依然可以通过危害硬盘固件来创造高度隐蔽的后门。


虽然这些事件促使研究人员从数字层面调查硬盘中恶意软件的威胁,并在一定程度上解除这些威胁,但仍然只有很少人关注由于硬盘机械组件所暴露的物理攻击面。这种基于物理层面的攻击较之数字层面而言更加隐蔽而且难以防御。本文通过对基于硬盘对磁头位置控制的高精度以及读写操作采用的反馈控制机制进行研究发现,硬盘可感知到由外界声波引起的气压振荡,从而实现对硬盘附近语音的录取与还原,使硬盘成为一种“无意的麦克风”,打破了传统传感器的边界,对用户隐私安全提出了新的挑战。


“硬盘麦克风”的本质



 “硬盘麦克风”的成功实现使我们不禁产生疑问:“是否所有设备都具备对外界声音的感知能力?”实际上,并非所有设备都可以成为“无意的麦克风”,而硬盘之所以能成功的原因得益于两点:第一,硬盘对于自身读写磁头位置的控制精度要求很高。通常情况下,磁头可以容忍其偏离中心的误差仅在纳米量级上,因此,即使是声波引起的微小气压振荡也会被磁头感知。第二,为了提高硬盘对外界干扰的鲁棒性,硬盘生产商通常会在硬盘固件中引入一条基于磁头位置的反馈控制回路,而磁头位置误差信号(PES)则作为反馈回路的输入被硬盘固件读取与记录。正是由于这种可感知外界扰动的高细粒度PES信号能被硬盘读取,从而使硬盘可以实现和传统麦克风传感器一样的功能,比如去捕捉硬盘附近的人声。“硬盘麦克风”的本质揭示了非传感器类设备所隐藏的“泛感知”能力,拓宽了感知安全的范畴。


“硬盘麦克风”的渊源



本文研究所属实验室名为“智能系统安全实验室(USSLAB)”,依托于浙江大学电气工程学院。从2010年至今,实验室针对物联网安全尤其模拟态安全的研究积累了较为深厚的经验,在包括自动驾驶汽车安全、智能家居安全、可穿戴设备安全、工控PLC安全等一系列物联网垂直方向取得了一系列的成果,比如获得“Freebuf-WitAward 2017年度最佳安全团队奖”,2017年国际会议ACM CCS2最佳论文奖(国内首次)等。


“硬盘麦克风”的想法来源于实验室在国际会议 IEEE S&P 2018上发表的一项工作“Blue Note: How Intentional Acoustic Interference Damages Availability and Integrity in Hard Disk Drives and Operating Systems”。这项工作通过声波攻击干扰硬盘磁头和内部振动传感器,从而实现对硬盘甚至操作系统的DoS攻击。其中硬盘磁头对于声波扰动的敏感性引起了我们的注意。我们进一步迁移联想到为何不能基于硬盘的磁头位置将外界的声音以一种逆向的形式记录下来。怀着这样的好奇心,课题组立即设计实验进行验证,并最后成功发现了“硬盘麦克风”。此项工作的核心思路是利用磁头高精度的位置偏移来产生外界可分辨的噪声。



“硬盘麦克风”遇到的困难及其解决方法



“硬盘麦克风”在可行性验证的过程中也遇到了许多困难。首先,从弱信噪比的磁头位置误差信号中提取有用信息是复杂而且具有挑战性的。硬盘磁盘工作时偏离轴心的分量,磁头的热偏移以及磁盘快速旋转时产生的波动都会给磁头位置误差信号引入大量的噪声。对于这个问题,我们通过时域和频域中的数字滤波技术,成功地将信号中的噪声充分滤除,使得其可以在特定条件下完全重建人类语音。其次,提取硬盘固件以读取磁头位置误差信号是困难的。为了验证“硬盘麦克风”的存在,我们在实验中直接从运行中的硬盘端口上读取磁头位置误差信息。此验证实验足以说明具有固件访问权限的攻击者进行攻击时可能发生的信息泄露。最后,我们让Shazam 识别由磁头位置误差信号构成的音乐录制文件,成功验证了“硬盘麦克风”的可行性。


“硬盘麦克风”的影响与意义



“硬盘麦克风”的研究首先打破了传统传感器定义的边界,即使在没有传统传感器的情况下,攻击者仍然可以通过非传感器类设备的物理攻击面窃取与侵犯用户的隐私。虽然有安全意识的用户会通过移除或者禁用智能设备上的传感器以保护自身隐私,但是他们依然容易忽略那些非传感器类设备所具备的感知能力。另外,“硬盘麦克风”为安全研究打开了一个全新的领域,使人们的关注点从传统的传感器感知安全向全设备的“泛感知”安全发展,并且对于用户的隐私安全提出了全新的挑战。


作者介绍





徐文渊


•CCF专业会员。

•浙江大学教授。

•主要研究方向为物联网安全、电网安全。



傅佳偉

(Kevin Fu)

•密西根大学副教授。

•主要研究方向为医疗设备安全和嵌入式系统安全。


脚注



1  IEEE Symposium on Security and Privacy。

2  ACM Conference on Computer and Communications Security,计算机与通信安全大会。


中国计算机学会 


微信号:ccfvoice           

长按识别二维码关注我们

CCF推荐

精品文


点击“阅读原文”加入CCF。



登录查看更多
3

相关内容

S&P:IEEE Symposium on Security and Privacy。 Explanation:IEEE安全与隐私研讨会。 Publisher:IEEE。 SIT: http://dblp.uni-trier.de/db/conf/sp/
【2020新书】C++20 特性 第二版,A Problem-Solution Approach
专知会员服务
58+阅读 · 2020年4月26日
【ICMR2020】持续健康状态接口事件检索
专知会员服务
17+阅读 · 2020年4月18日
【中科院自动化所】视觉对抗样本生成技术概述
专知会员服务
35+阅读 · 2020年4月15日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
76+阅读 · 2020年3月15日
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
29+阅读 · 2020年3月5日
【反馈循环自编码器】FEEDBACK RECURRENT AUTOENCODER
专知会员服务
22+阅读 · 2020年1月28日
安全和健壮的医疗机器学习综述,附22页pdf
专知会员服务
46+阅读 · 2020年1月25日
被动DNS,一个被忽视的安全利器
运维帮
11+阅读 · 2019年3月8日
深度学习局限何在?图网络的出现并非偶然
机器之心
6+阅读 · 2019年1月24日
CCCF专栏 | 联邦学习
中国计算机学会
26+阅读 · 2018年11月19日
为什么分布式一定要有消息队列?
互联网架构师
4+阅读 · 2018年7月5日
CCCF专栏:黄铁军| 也谈强人工智能
中国计算机学会
5+阅读 · 2018年2月15日
一文读懂语音识别史
机械鸡
9+阅读 · 2017年10月16日
Spark的误解-不仅Spark是内存计算,Hadoop也是内存计算
边缘计算:万物互联时代新型计算模型
计算机研究与发展
14+阅读 · 2017年5月19日
Arxiv
11+阅读 · 2018年5月13日
Arxiv
7+阅读 · 2018年2月26日
Arxiv
5+阅读 · 2018年1月16日
Arxiv
3+阅读 · 2015年5月16日
VIP会员
相关VIP内容
【2020新书】C++20 特性 第二版,A Problem-Solution Approach
专知会员服务
58+阅读 · 2020年4月26日
【ICMR2020】持续健康状态接口事件检索
专知会员服务
17+阅读 · 2020年4月18日
【中科院自动化所】视觉对抗样本生成技术概述
专知会员服务
35+阅读 · 2020年4月15日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
76+阅读 · 2020年3月15日
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
29+阅读 · 2020年3月5日
【反馈循环自编码器】FEEDBACK RECURRENT AUTOENCODER
专知会员服务
22+阅读 · 2020年1月28日
安全和健壮的医疗机器学习综述,附22页pdf
专知会员服务
46+阅读 · 2020年1月25日
相关资讯
被动DNS,一个被忽视的安全利器
运维帮
11+阅读 · 2019年3月8日
深度学习局限何在?图网络的出现并非偶然
机器之心
6+阅读 · 2019年1月24日
CCCF专栏 | 联邦学习
中国计算机学会
26+阅读 · 2018年11月19日
为什么分布式一定要有消息队列?
互联网架构师
4+阅读 · 2018年7月5日
CCCF专栏:黄铁军| 也谈强人工智能
中国计算机学会
5+阅读 · 2018年2月15日
一文读懂语音识别史
机械鸡
9+阅读 · 2017年10月16日
Spark的误解-不仅Spark是内存计算,Hadoop也是内存计算
边缘计算:万物互联时代新型计算模型
计算机研究与发展
14+阅读 · 2017年5月19日
Top
微信扫码咨询专知VIP会员