0

    用python自动爬取海贼王漫画推送kindle

    2023.04.12 | admin | 191次围观

    之前闲着无聊,想找个项目练练手静态网页的爬取思路静态网页的爬取思路,这时我看到正在压着泡面的kindle。

    就你了,之前一直想在kindle上看漫画,可是想到又得下载资源还得发送到kindle,好麻烦,所以一直没有实现这个愿望,说干就干吧。

    kindle推送

    首先关于kindle推送的设置,可以参考下面链接设置。

    kindle是支持 JPEG (.jpeg, .jpg)、PDF (.pdf)等图片格式的。

    这里不推荐使用图片格式,因为漫画有多页,如果用图片推送的话,你会看到kindle上散乱着一堆的图片。

    思路整理

    1、把漫画下载到电脑

    2、将下载好的一话漫画(15-19页)转换为一张pdf格式文件

    3、通过邮件推送到kindle

    4、定时爬取网站发现漫画更新,立即推送漫画

    需要用到的模块挺多的,一共需要这几个模块。

    第一、

    从网上抓取漫画页

    具体哪个网站就不说了,低调。因为此网站为静态网页,结构较简单,所以爬取起来比较容易。

    这个函数主要为抓取一话里海贼王的所有图片地址,放到pic_list列表里并返回。

    第二、

    获取PDF文件

    然后定义一个函数(传入图片地址,文件保存地址)用来下载图片,这里是将下载好的图片转化为PDF文件

    第三、

    通过邮件推送到kindle

    PDF文件生成完毕后,就可以通过smtplib邮件服务来推送漫画了。

    QQ邮箱的服务器为:

    mail_host = "http://smtp.qq.com" mail_user = "邮箱地址" mail_pass = "邮箱密码"# qq邮箱一般需要授权码 receivers = [占位] # 这里填上kindle的亚马逊邮箱地址码,可填多个接收邮箱

    红色标记的就是kindle邮箱地址

    下面贴上代码:

    到这里主要功能都已写完,目前追到了最新最新951话,952话还没更新。

    运行效果

    版权声明

    本文仅代表作者观点。
    本文系作者授权发表,未经许可,不得转载。

    标签: kindle
    发表评论