微信公众号历史文章采集

{success} 我们很高兴地宣布,胖鼠采集现在支持微信公众号历史文档的采集功能啦!这是大家期待已久的功能,是我们另一位开源大佬的参与胖鼠采集的第一个功能,在此感谢这位大佬的贡献!我们希望大家能够按照以下流程来使用。此功能存在一定使用门槛,请鼠友根据文档进行操作!


请先做好准备工作:
1.需要鼠友有一个微信公众号账号。
2.需要具备一点点互联网基础。

逻辑上根据文档可以完成采集功能。如果鼠友实在不会,可以选择成为土豪鼠,添加胖鼠好友赞赏99元寻求帮助!
(不建议赞赏,学会了就一劳永逸了,希望鼠友可以花时间研究下)

{warning} 声明:功能仅用于开发者行业内部学习交流,禁止用于非法用途。

第一步

  • 首先打开浏览F12后登陆微信公众平台,登入一个公众号账户,登陆地址:https://mp.weixin.qq.com/
  • 进入微信公众号首页

{warning} 温馨提示,因此程序核心为调用微信公众号底层API,存在一定风险,请鼠友在使用过程不要短时间内密集使用或者有条件新建一个空白微信公众号当作风险缓冲


第二步

在控制台 console中 执行命令:
console.log(  new URLSearchParams(window.location.search).get("token"))

{info} 暂存返回结果,后续录入胖鼠采集工具中


第三步

  • 首先控制台切换到网络模块,在过滤URL中输入 https://mp.weixin.qq.com/cgi-bin/appmsgpublish
  • 选择可见的网络请求中最后一次请求点击
  • 会出现该请求的详细参数,选择消息头(火狐)或者标头(谷歌),下滑至请求头(火狐)或者请求标头(谷歌)
  • 找到Cookie参数,复制值(只要值)

{info} 暂存Cookie值,后续录入胖鼠采集工具中


第四步

打开胖鼠采集-采集中心-微信公众号历史文章采集

  • 录入步骤4获取的微信公众平台cookie
  • 录入步骤3获取的微信公众平台token
  • 输入要采集的微信公众号名称全称(必须全称)
  • 设置起始采集页数及要采集的页数(1页为20次文章发布)
  • 点击采集按钮,等待文章入库

    {info} 因官方接口返回的结果规律为每次发布(比方此公众号每日更新1次,每次更新5篇文章,那么采集1页为此公众号20天的发布,20天*每天5页=100条文章入库)


第五步

打开胖鼠采集-数据桶管理-微信 存在待采集文章时,待采集后面会显示一个play按钮,点击play按钮,等待全部入库完成

{info} 至此微信公众号历史文章采集工作完成

声明

{warning}

  • 为避免公众号被封禁,此功能已进行频率控制,请避免频繁使用。
  • 如需大批量采集,建议有条件的用户准备多个微信公众号参数并进行轮换使用,以规避频繁调用风险。
  • 其他选择是申请几个空白公众号专用于接口调用(无需备案或其他花费)。
  • 功能用于学习交流,对于因不当使用此功能而导致的账号封禁,请自行负责