使用debugging


{info} 每写一个规则。必须要使用debug测试列表页是否正常,标题是否正常,内容是否正常

方法

  • 第一步、查看网页是否可以采集、请看这篇文档
  • 第二步、分别测试 link,title,content 分别是否可以获取到正确的内容

然后保存规则就可以使用了,在采集时候打开控制台也可以看到每条数据具体的采集状态这篇文档

调试

  • 如果遇到不确定想要的内容是否可以采集到的,可以使用debug测试,填写url地址,范围填写 body 或者 html Jquery选择器可以留空,属性填写html(意思是获取页面中body中的所有内容)。点击测试按钮,看是否可以获取到页面的html,以来求证是否可以正常访问到到目标页面的html数据
  • 如果遇到网页看起来是可以采集的,但是内容是空的可以尝试更换编码

{success} 有些时候有些网站看起来是正常的,但是确实采集不了。采集有很多小细节太多,很多站点html结构并不规范,浏览器可以包容他,但程序是无法包容的,除非你根据目标站点为他写一些特殊的代码。一般鼠友可以选择放弃。