内容过滤功能描述

{success} 内容过滤功能可以帮助你剔除页面上你不想要的任何数据

正文内容中包含了作者信息、广告、版权声明等这些无用信息,我们需要从正文内容中过滤掉这些内容,这些内容是变化的,每篇文章都不一样,所以是无法直接用字符串替换函数去除的,胖鼠采集提供了非常简单的去除方式

他可以帮助我们过滤任何不想要的页面属性

  • img
  • p
  • div
  • 支持 id
  • 支持 class

还可以指定处理 第几个某某属性、

内容过滤选择器参数不光可以定义要移除的内容还可以定义要保留的内容,多个值之间用空格隔开

  • a 去除a标签保留a中文字
  • -a 去除并删除a标签
  • -img:gt(-4) 去除文章底部倒数3张图片!
  • -img:eq(1) 只过滤文章正文第2张图片 (程序从0开始)
  • -p:first 删除第一个p
  • -p 删除所有p
  • -p:last 删除最后一个p
  • ul>li>a:odd 只取奇数a
  • -.aaa 删除class等于aaa的标签
  • -#aaa 删除id等于aaa的标签

{primary} 多个过滤规则使用空格隔开。下面是部分Jquery语法,鼠友请百度更多使用方式请百度 Jquery 手册喔.


{info} 过滤规则要使用debug功能测试哦