摘要: 一、背景:近期学习python爬虫中看到,在对网页内容进行解析的技术中,re正则表达式工具也是一个很好的工具,使用re编制爬虫工具正好熟悉re正则表达式的使用。 二、环境及爬取目标 1、linux centos7系统 2、小说网站:http://www.xbiquge.la/15/15158 ,小说 阅读全文
posted @ 2019-08-14 16:31 sfccl 阅读(411) 评论(0) 推荐(0) 编辑
摘要: 一、背景:个人喜欢在网上看小说,但是,在浏览器中阅读小说不是很方便,喜欢找到小说的txt版下载到手机上阅读,但是有些小说不太好找txt版本,考虑自己从网页上爬一爬,自己搞定小说的txt版本。正好学习一下有关爬虫技术。 二、环境及爬取目标 1、linux centos7系统 2、小说网站:http:/ 阅读全文
posted @ 2019-08-14 16:00 sfccl 阅读(408) 评论(0) 推荐(0) 编辑