摘要: 最近经常听说或者接触关于网络爬虫的问题,只是一直看到被人写的代码。而没有真正的做过实践, 昨天做了一下尝试,其中采用网络流行的扩展类库 http://html-agility-pack.net/?z=codeplex 遇到的问题是:部分网站禁止爬虫,或者有规则验证,无法通过模拟http 请求获取 h 阅读全文
posted @ 2018-09-07 19:15 若水如引 阅读(172) 评论(0) 推荐(0) 编辑