Python+selenium+phantomjs实现WordPress自动更新文章

最近突然有个想法,通过SEO一个博客,导流到微信公众号。既然是一个尝试,就没必要花费太多人工投入,或者说只能前期投入。
于是我就想到了“人生苦短,我用python”,祭出UI自动化大杀器——selenium,以及无界面浏览器——phantomjs。
本来想直接用pymysql往MySQL数据库添加值,但是作为野路子程序员,插入数据后发现网站没有新增文章。另外字段太多,光做成json格式都花了不少时间。
后来就想到selenium,于是有了这篇文章。
文章内容采集自知乎,爬虫技术就不详细说了,直接requests.get(),知乎也很友好,像我这种对效率没要求,而且不是大量爬取数据的,几乎不会触发反爬机制。
更新WordPress时,采用无界面浏览器phantomjs,driver.find_element_by_css_selector()几乎可以定位一切元素,除了iframe。
定位iframe需要先切换到iframe

driver.switch_to_frame(browser.find_element_by_css_selector())

然后再定位需要的元素。
操作完成后还需要退出iframe

driver.switch_to.default_content()

当然实际操作中还有一些细节,比如“怎么勾选适合的分类目录”、“怎么提炼相关的标签”、“怎么重写相关度高的标题”、“怎么下载知乎图片并上传到七牛云/又拍云”、“图片自动加水印”等等。
如果想学习本文具体的实现方法,可以参照以下链接:

  • https://www.runoob.com/python3/python3-tutorial.html(python3教程)
  • https://zhuanlan.zhihu.com/p/33877792(Selenium的使用)

关于WordPress博客自动更新的细节,有机会再分享更多~~

没有账号? 忘记密码?

社交账号快速登录