Python打造最强表白程序

2019 年 2 月 16 日 AI100


作者 | 痴海

转载自公众号痴海(ID:ch726612)


情人节刚过,朋友圈又是刷屏的节奏。但热闹总是别人的,我们好像只有吃狗粮的份。时间总是飞快流逝,很多事情早已改变,但仿佛只有你的单身状态从未改变。


单身久的我们,好像觉得一个人过也没什么的。但即使非常享受单身生活,大家也要保持“可勾搭”的待机状态,因为促进荷尔蒙分沁有益身心健康。


在这个人人都在秀的时候,做为程序员我们也要操作起来!散发你们的荷尔蒙!今天就大家奉献上最强表白程序!此程序结合数据抓取 + 微信自动发消息 + 定时任务,实现一个能每天自动定时给你心爱的 ta 发送:你们相识相恋天数 + 情话 + 我爱你的图片。具体的消息如下。



每天发送的消息格式如下:


    message = """
    亲爱的{}:

    早上好,今天是你和 Koc 相恋的第 {} 天~

    今天他想对你说的话是:

    {}

    最后也是最重要的!
    """
.format("你的好友名称", str(inLoveDays), love_word)


这里需要填写的第一个字段是 ta 的称呼,inLoveDays 为你们相识相恋的天数。


love_word 是每天为 ta 精心准备情话内容,当然如果你的文笔好也可以自己写。



当然最后也是最重要的!每天不尽相同的「我爱你」图片!



程序思路


本次程序运行的环境是 windows10 + Python 3.6,此次主要用到的库有 selenium、itchat、request。程序主要分为两部分第一数据的抓取,一些情话信息和图片信息。另一部就是利用 itchat 自动发送消息给你的好友。


情话信息


如果对你的文笔有信心,那你可以自己写些情话。当然大部分人的文笔跟我一样是比较差的,所以这时候我们就可以利用网上的资源,比如下面的情话网站。


http://www.binzz.com/yulu2/3588.html



在抓取这个网站的情话时,如果你利用普通的爬取思路,即利用 request 进行请求,你会发现网页获取的数据是乱码并且不完整。所以在这块为了操作方便,我利用了 selenium 的 PhantomJS 无头浏览器,来获取网站的信息。


通过 selenium + xpath 我们就可以很轻松的获取到网页情话,最后把获取到的数据保存到当前目录下的「love_word.txt」方便之后的读取。


表白图片资源


为了配合此次表白程序,我专门去找了些带有「我爱你」的图片资源。通过下面的贴吧贴子,我们就可以获取到大量的这样资源。


http://tieba.baidu.com/p/3108805355



此贴并没有很强的反爬措施,所以我简单的利用 request + re 来获取到图片资源,并保存到当前目录的下「img」文件里。


在保存图片资源之前,我会先检查当前目录下是否有「img」文件夹,如果没有则会自动创建。


表白程序源码


此次表白程序主要有 5 个函数



crawl_Love_words()


此函数通过 selenium + xpath 来抓取情话网站的资源,并存入到当前目录下的「love_word.txt」文件。


def crawl_Love_words():
    print("正在抓取情话...")
    browser = webdriver.PhantomJS()
    url = "http://www.binzz.com/yulu2/3588.html"
    browser.get(url)
    html = browser.page_source
    Selector = etree.HTML(html)
    love_words_xpath_str = "//div[@id='content']/p/text()"
    love_words = Selector.xpath(love_words_xpath_str)
    for i in love_words:
        word = i.strip("\n\t\u3000\u3000").strip()
        with open(love_word_path, "a"as file:
            file.write(word + "\n")
    print("情话抓取完成")



crawl_love_image()


此函数用来爬取贴吧带有「我爱你」的图片资源,通过 request + re 来实现。代码并不复杂,在正则表达式那也简单的写了一个,用来匹配当前也所有的图片资源。


def crawl_love_image():
    print("正在抓取我爱你图片...")
    for i in range(122):
        url = "http://tieba.baidu.com/p/3108805355?pn={}".format(i)
        response = requests.get(url)
        html = response.text
        pattern = re.compile(r'<div.*?class="d_post_content j_d_post_content.*?">.*?<img class="BDE_Image" src="(.*?)".*?>.*?</div>', re.S)
        image_url = re.findall(pattern, html)
        for j, data in enumerate(image_url):
            pics = requests.get(data)
            mkdir(pic_path)
            fq = open(pic_path + '\\' + str(i) + "_" + str(j) + '.jpg''wb')  # 下载图片,并保存和命名
            fq.write(pics.content)
            fq.close()
    print("图片抓取完成")


mkdir(path)


此函数用来在当前目录下创建一个新的文件夹,以便存储相应的数据。


def mkdir(path):
    folder = os.path.exists(path)

    if not folder:  # 判断是否存在文件夹如果不存在则创建为文件夹
        os.makedirs(path)  # makedirs 创建文件时如果路径不存在会创建这个路径
        print("---  new folder...  ---")
        print("---  OK  ---")
    else:
        print("正在保存图片中...")


send_new()


此函数通过利用 itchat 库,实现给你的微信好友自动发送消息。在这个函数中我利用 datetime 来计算你们之间相识相恋的时间。并且在登录的时候添加了一个「hotReload=True」,这样你就可以不用每次运行程序的时候都要登录。关于 itchat 更多的操作,大家可以去网上查找相应的资料。


def send_news():

    # 计算相恋天数
    inLoveDate = datetime.datetime(2018815# 相恋的时间
    todayDate = datetime.datetime.today()
    inLoveDays = (todayDate - inLoveDate).days

    # 获取情话
    file_path = os.getcwd() + '\\' + love_word_path
    with open(file_path) as file:
        love_word = file.readlines()[inLoveDays].split(':')[1]

    itchat.auto_login(hotReload=True# 热启动,不需要多次扫码登录
    my_friend = itchat.search_friends(name=u'你的好友名称')
    girlfriend = my_friend[0]["UserName"]
    print(girlfriend)
    message = """
    亲爱的{}:

    早上好,今天是你和 Koc 相恋的第 {} 天~

    今天他想对你说的话是:

    {}

    最后也是最重要的!
    """
.format("你的好友名称", str(inLoveDays), love_word)
    itchat.send(message, toUserName=girlfriend)

    files = os.listdir(pic_path)
    file = files[inLoveDays]
    love_image_file = "D:\\img\\" + file
    try:
        itchat.send_image(love_image_file, toUserName=girlfriend)
    except Exception as e:
        print(e)


main()


main() 函数就是我们主逻辑函数,程序运行的逻辑顺序就是在这个函数里规定的。在 main() 里我首先判断下当前路径下是否有「love_word.txt」文件,如果有则提示相应的信息,没有的话才去执 crawl_Love_words() 函数,去网上抓取一些情话数据。


其次再判断下当前目录下是否有「img」文件夹,用来判断我们是否有图片资源,没有则执行 crawl_love_image() 来抓取贴吧上的图片资源。


最后我们所需的数据都已准备完善,则调用 send_news() 函数,整理下要发送的数据格式,然后自动给你的 ta 发送消息。


定时任务


每天定时发送我主要是用 while True 简单的实现,通过判断当前的时间是否是你所需要发送的时间,来达到每天定时发送。


表白程序使用教程


首先你把相应的源码下载下来,后台回复「表白」即可获取。其次把相应的库先事先安装好,随后运行程序则会显示一个微信网页登录的二维码,扫描登录即可。



因为我在登录时添加了「hotReload=True」,所以程序在下次运行时就无需再重新登录。


总结


文章标题写着「最强表白程序」,虽然有点夸张了,但此次的程序还有很多可以继续添加的地方。比如对于发送的消息字段,我们还可以继续添加天气信息、星座信息、娱乐新闻、最近的趣事、最近好看的电影等等。只要你能想到的内容,都可以添加上去。


这些信息在网上都可以获取的到,我们只要通过同样的思路,先抓取到本地,然后进行读取。当然如果你觉得存储本地会有被删的风险,那么你也可以保存到云端,在云端上进行存储。


(本文为AI科技大本营原创文章,转载请微信联系 1092722531)

精彩推荐

推荐阅读:

                         

点击“阅读原文”,打开CSDN APP 阅读更贴心。

登录查看更多
0

相关内容

【2020新书】实战R语言4,323页pdf
专知会员服务
102+阅读 · 2020年7月1日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
198+阅读 · 2020年6月29日
一份简明有趣的Python学习教程,42页pdf
专知会员服务
77+阅读 · 2020年6月22日
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
269+阅读 · 2020年6月10日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
122+阅读 · 2020年5月10日
【干货书】流畅Python,766页pdf,中英文版
专知会员服务
226+阅读 · 2020年3月22日
算法与数据结构Python,369页pdf
专知会员服务
165+阅读 · 2020年3月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
168+阅读 · 2019年12月2日
手把手教你用Python做一个哄女友神器,小白可上手
网易智能菌
5+阅读 · 2019年6月15日
渗透某德棋牌游戏
黑白之道
12+阅读 · 2019年5月17日
一文看懂怎么用 Python 做数据分析
大数据技术
24+阅读 · 2019年5月5日
7 款实用到哭的App,只说一遍
高效率工具搜罗
84+阅读 · 2019年4月30日
如何编写完美的 Python 命令行程序?
CSDN
5+阅读 · 2019年1月19日
逆向 | C++ 加壳程序的编写思路
计算机与网络安全
9+阅读 · 2019年1月1日
Python 爬虫实践:《战狼2》豆瓣影评分析
数据库开发
5+阅读 · 2018年3月19日
教你用Python来玩跳一跳
七月在线实验室
6+阅读 · 2018年1月2日
别@微信团队了,我用Python给自己戴上了圣诞帽!
用 Scikit-Learn 和 Pandas 学习线性回归
Python开发者
9+阅读 · 2017年9月26日
Arxiv
29+阅读 · 2020年3月16日
A Comprehensive Survey on Transfer Learning
Arxiv
121+阅读 · 2019年11月7日
Meta-Learning to Cluster
Arxiv
17+阅读 · 2019年10月30日
Arxiv
136+阅读 · 2018年10月8日
VIP会员
相关VIP内容
【2020新书】实战R语言4,323页pdf
专知会员服务
102+阅读 · 2020年7月1日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
198+阅读 · 2020年6月29日
一份简明有趣的Python学习教程,42页pdf
专知会员服务
77+阅读 · 2020年6月22日
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
269+阅读 · 2020年6月10日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
122+阅读 · 2020年5月10日
【干货书】流畅Python,766页pdf,中英文版
专知会员服务
226+阅读 · 2020年3月22日
算法与数据结构Python,369页pdf
专知会员服务
165+阅读 · 2020年3月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
168+阅读 · 2019年12月2日
相关资讯
手把手教你用Python做一个哄女友神器,小白可上手
网易智能菌
5+阅读 · 2019年6月15日
渗透某德棋牌游戏
黑白之道
12+阅读 · 2019年5月17日
一文看懂怎么用 Python 做数据分析
大数据技术
24+阅读 · 2019年5月5日
7 款实用到哭的App,只说一遍
高效率工具搜罗
84+阅读 · 2019年4月30日
如何编写完美的 Python 命令行程序?
CSDN
5+阅读 · 2019年1月19日
逆向 | C++ 加壳程序的编写思路
计算机与网络安全
9+阅读 · 2019年1月1日
Python 爬虫实践:《战狼2》豆瓣影评分析
数据库开发
5+阅读 · 2018年3月19日
教你用Python来玩跳一跳
七月在线实验室
6+阅读 · 2018年1月2日
别@微信团队了,我用Python给自己戴上了圣诞帽!
用 Scikit-Learn 和 Pandas 学习线性回归
Python开发者
9+阅读 · 2017年9月26日
Top
微信扫码咨询专知VIP会员