• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

    WechatSpider: java抓取微信最新推送内容

    原作者: [db:作者] 来自: 网络 收藏 邀请

    开源软件名称:

    WechatSpider

    开源软件地址:

    https://gitee.com/hcxy/WechatSpider

    开源软件介绍:

    ##WechatSpider 能做什么

    • 是一依赖于jsoup通过搜狗引擎来抓取微信公共号最新10篇文章的工具类
    • 提供最基础的思路,大家自己自由发挥吧,改成别的语言也比较简单
    • 转眼已经两年没有更新了,时光过的好快,有很多中间人模式的更加稳定,但是操作起来稍微复杂一点吧

    ##如何使用

    • 首先导入 wechat.jar(需通过maven编译) 和 jsoup.jar 包到工程目录
    • 实例化类 WechatSpider spider = new WechatSpider("xiaomigongsi0406"); 参数为微信公共号的别名,通过搜过搜索相关的公众号,查看微信号我不写java好多年
    • 然后可以获取标题,作者,时间,内容,url,以及文章内图片等信息的列表

    ##如何把微信的文章保存到MySQL

    • WechatSpider 获取某个公共号最近10篇文件(搜狗限制)
    	WechatSpider spider = new WechatSpider("xiaomigongsi0406");//小米        String listUrl = spider.getListUrl();        System.out.println(listUrl);        List<String> list = spider.getTopicUrls(listUrl);        for (String url : list) {        	System.out.println(url);		Topic topic = spider.getTopicByUrl(url);		System.out.println(topic.getTitle());	}

    ##程序健壮性

    • 运行一个月,每天抓取100条左右,暂时没有异常出现
    • 微信推送的文章内的图片都是webp格式,在IOS上显示会有一定的问题,如果下载到自己本地服务器记得转格式
    • 验证码问题暂时解决

    ##有问题反馈在使用中有任何问题,欢迎留言反馈给我,可以用以下联系方式跟我交流。代码非常简单,希望大家有问题能够自己先解决一下,谢谢。


    鲜花

    握手

    雷人

    路过

    鸡蛋
    该文章已有0人参与评论

    请发表评论

    全部评论

    专题导读
    上一篇:
    quanjing: 快速创建一个网页场景的js框架。发布时间:2022-03-23
    下一篇:
    fastrpc: 基于java AIO实现的RPC调用框架发布时间:2022-03-23
    热门推荐
    阅读排行榜

    扫描微信二维码

    查看手机版网站

    随时了解更新最新资讯

    139-2527-9053

    在线客服(服务时间 9:00~18:00)

    在线QQ客服
    地址:深圳市南山区西丽大学城创智工业园
    电邮:jeky_zhao#qq.com
    移动电话:139-2527-9053

    Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap