autoname
V2EX  ›  Java

请教爬虫问题, discuz 论坛的验证老是失败,有老哥知道是什么情况吗

  •  
  •   autoname · Jul 11, 2020 · 1457 views
    This topic created in 2161 days ago, the information mentioned may be changed or developed.

    验证码提取= https://www.discuz.net/misc.php?mod=seccode&action=update&idhash=cS0&0.0423275371233075&modid=undefined

    验证码直链 =https://www.discuz.net/misc.php?mod=seccode&update=49424&idhash=cS0

    第一次请求 去拿 update,

    第二次请求 组合直链,

    我见百度上面都是这样的,写爬虫自动回复的

    但是为啥我老是 验证码错误,真的是奇怪了,cookie 什么的 都和浏览器发的没差,就是验证失败

    每爬一个页面我还都特意的 保存下 cookie 的,

    从登录页,以及帖子页,以及这个提取 update 的 js 页 全部都保存过

    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5550 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 05:58 · PVG 13:58 · LAX 22:58 · JFK 01:58
    ♥ Do have faith in what you're doing.