Domain name encryptions (DoTH and ESNI) have been proposed to improve security and privacy while browsing the web. Although the security benefit is clear, the positive impact on user privacy is still questionable. Given that the mapping between domains and their hosting IPs can be easily obtained, the websites a user visits can still be inferred by a network-level observer based on the destination IPs of user connections. However, content delivery networks, DNS-based load balancing, co-hosting of different websites on the same server, and IP churn, all contribute towards making domain-IP mappings unstable, and prevent straightforward IP-based browsing tracking for the majority of websites. We show that this instability is not a roadblock for browsing tracking (assuming a universal DoTH and ESNI deployment), by introducing an IP-based fingerprinting technique that allows a network-level observer to identify the website a user visits with high accuracy, based solely on the IP address information obtained from the encrypted traffic. Our technique exploits the complex structure of most websites, which load resources from several domains besides their own primary domain. We extract the domains contacted while browsing 220K websites to construct domain-based fingerprints. Each domain-based fingerprint is then converted to an IP-based fingerprint by periodically performing DNS lookups. Using the generated fingerprints, we could successfully identify 91% of the websites when observing solely destination IPs. We also evaluated the fingerprints' robustness over time, and demonstrate that they are still effective at identifying 70% of the tested websites after two months. We conclude by discussing strategies for website owners and hosting providers to hinder IP-based website fingerprinting and maximize the privacy benefits offered by domain name encryption.


翻译:域名加密( DATH 和 ESNI ) 已被提议在浏览网络的同时改善安全和隐私。 虽然安全收益显而易见, 但用户隐私的正面影响仍然值得怀疑。 鉴于域与主机IP之间的映射可以轻松获得, 网站用户访问仍可以由基于用户连接目的IP的网络级观察员推断。 然而, 内容交付网络、 基于 DNS 的负载平衡、 在同一服务器和 IP 中共同托管不同网站, 都有助于使域名IP 映射工作不稳定, 并防止对大多数网站进行直接的 IP 浏览跟踪。 我们显示, 这种不稳定不是浏览跟踪的路障( 假设通用 DATH 和 ESNI 部署), 其方法是引入基于 IP IP 的指纹定位技术, 仅以加密的 IP 地址信息为基础访问用户访问。 我们的技术只是利用大多数网站的复杂结构, 将资源从多个主域域域进行存储, 而不是以自己的主域名 。 我们利用连接的域名在浏览网站后, 将浏览网站的域名转换为 220 。

0
下载
关闭预览

相关内容

如何构建你的推荐系统?这份21页ppt教程为你讲解
专知会员服务
64+阅读 · 2021年2月12日
专知会员服务
44+阅读 · 2020年10月31日
【KDD2020教程】多模态网络表示学习
专知会员服务
129+阅读 · 2020年8月26日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
神器Cobalt Strike3.13破解版
黑白之道
12+阅读 · 2019年3月1日
LibRec 精选:推荐系统的常用数据集
LibRec智能推荐
17+阅读 · 2019年2月15日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
人工智能 | 国际会议截稿信息5条
Call4Papers
6+阅读 · 2017年11月22日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年4月8日
Arxiv
0+阅读 · 2021年4月6日
Learning Recommender Systems from Multi-Behavior Data
Arxiv
9+阅读 · 2018年3月23日
VIP会员
相关资讯
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
神器Cobalt Strike3.13破解版
黑白之道
12+阅读 · 2019年3月1日
LibRec 精选:推荐系统的常用数据集
LibRec智能推荐
17+阅读 · 2019年2月15日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
人工智能 | 国际会议截稿信息5条
Call4Papers
6+阅读 · 2017年11月22日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员