刺激!一行代码即可导出所有浏览记录

2020 年 7 月 11 日 CSDN

作者 | 刘早起

来源 | 早起Python

行Python代码即可导出多种浏览器的历史记录?就像这样👇

现在来说说原理,不管是Windows还是MAC,Chrome等浏览器的历史数据都是存储在本地的SQLite数据库中,例如Windows用户可以在C:\Users\Administrator\AppData\Local\Google\Chrome\User Data\Default找到,当然在Python中我们可以使用内置OS模块找到该数据库文件,再使用Python内置的sqlite3模块可以轻松读取并导出浏览记录数据,而这个过程在GitHub上已经有一位外国小哥帮我们完成了,总共不到200行代码,现在我们只要使用pip install browserhistory安装,接着进入Python导入

import browserhistory as bh

现在只要一行代码即可查看全部历史浏览记录

bh.get_browserhistory()

JSON格式数据不怎么好看,可以借助Pandas转换为表格,并且可以查看指定浏览器的记录,比如Safari

import pandas as pdpd.DataFrame.from_dict(bh.get_browserhistory()['safari'])

当然也可以一行代码将历史记录导出为CSV

bh.write_browserhistory_csv()

打开我的Safari记录看看,最早的一条记录居然是去年6月的调试Django项目的记录,看来很久没有清空了

但是在保存数据时有一个小插曲,作者在源码中使用CSV模块来将数据写入CSV表格时使用的编码是UTF-8,这会导致中文乱码

所以只要进入源码将UTF-8改为utf-8_sig就能正常保存中文了,或者直接copy过来源码并修改也是可以的。并且要注意执行程序时要彻底退出浏览器,否则会丢失对应浏览器的记录。

最后,有了几万条浏览记录,就可以进行一些简单分析,比如面向搜索引擎编程的我,最常访问的网站就是百度、Google、GitHub、stack overflow等,当然你也可以写一个简单的脚本并打包,获取某人的浏览记录,看看TA上班是不是爱摸鱼,或者根据妹子的访问记录来找点话题,大家自由发挥

更多精彩推荐

2020,“拷问”AI创业与投资

☞开源巨头 SUSE 收购 Rancher Labs,云原生时代来临

B 站 Up 主自制秃头生成器,独秃头不如众秃头?

干货!仅有 100k 参数的高效显著性检测方法

看完这篇 HashMap ,和面试官扯皮就没问题了

密码学应用的四个进化阶段 | 博文精选

点分享
点点赞
点在看
登录查看更多
0

相关内容

SQLite 是遵守 ACID 的关系数据库管理系统,它包含在一个相对小的C库中。
【实用书】Python编程,140页pdf
专知会员服务
41+阅读 · 2020年8月20日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
192+阅读 · 2020年6月29日
【2020新书】使用高级C# 提升你的编程技能,412页pdf
专知会员服务
57+阅读 · 2020年6月26日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
161+阅读 · 2020年5月14日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
【书籍推荐】简洁的Python编程(Clean Python),附274页pdf
专知会员服务
179+阅读 · 2020年1月1日
Keras作者François Chollet推荐的开源图像搜索引擎项目Sis
专知会员服务
29+阅读 · 2019年10月17日
PC微信逆向:两种姿势教你解密数据库文件
黑客技术与网络安全
16+阅读 · 2019年8月30日
已删除
AI掘金志
7+阅读 · 2019年7月8日
GitHub 热门:各大网站的 Python 爬虫登录汇总
机器学习算法与Python学习
9+阅读 · 2019年3月20日
去哪儿网开源DNS管理系统OpenDnsdb
运维帮
21+阅读 · 2019年1月22日
Python | Jupyter导出PDF,自定义脚本告别G安装包
程序人生
7+阅读 · 2018年7月17日
Python3.7中一种懒加载的方式
Python程序员
3+阅读 · 2018年4月27日
利用python操作Excel教程
Python技术博文
4+阅读 · 2017年9月13日
Pluralistic Image Completion
Arxiv
8+阅读 · 2019年3月11日
Arxiv
3+阅读 · 2019年3月1日
Arxiv
5+阅读 · 2018年12月18日
Arxiv
3+阅读 · 2018年5月28日
Arxiv
25+阅读 · 2018年1月24日
VIP会员
相关VIP内容
【实用书】Python编程,140页pdf
专知会员服务
41+阅读 · 2020年8月20日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
192+阅读 · 2020年6月29日
【2020新书】使用高级C# 提升你的编程技能,412页pdf
专知会员服务
57+阅读 · 2020年6月26日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
161+阅读 · 2020年5月14日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
【书籍推荐】简洁的Python编程(Clean Python),附274页pdf
专知会员服务
179+阅读 · 2020年1月1日
Keras作者François Chollet推荐的开源图像搜索引擎项目Sis
专知会员服务
29+阅读 · 2019年10月17日
相关资讯
PC微信逆向:两种姿势教你解密数据库文件
黑客技术与网络安全
16+阅读 · 2019年8月30日
已删除
AI掘金志
7+阅读 · 2019年7月8日
GitHub 热门:各大网站的 Python 爬虫登录汇总
机器学习算法与Python学习
9+阅读 · 2019年3月20日
去哪儿网开源DNS管理系统OpenDnsdb
运维帮
21+阅读 · 2019年1月22日
Python | Jupyter导出PDF,自定义脚本告别G安装包
程序人生
7+阅读 · 2018年7月17日
Python3.7中一种懒加载的方式
Python程序员
3+阅读 · 2018年4月27日
利用python操作Excel教程
Python技术博文
4+阅读 · 2017年9月13日
Top
微信扫码咨询专知VIP会员