爱意满满的作品展示区。
qmqy

制作个性化的知乎首页 rss

  •  
  •   qmqy · Jul 29, 2014 · 4871 views
    This topic created in 4337 days ago, the information mentioned may be changed or developed.
    相信各位技术大大自己会写爬虫解决这个问题,就不献丑了,这篇文章主要是分享给像我一样不会写爬虫的非技术童鞋。
    知乎的更新时间很碎片化,效率极低;如果能把知乎首页的回答都通过rss进行输出,可以大幅度提升效率,无需整天泡在上面。
    http://www.zhihu.com/question/24294851/answer/27319381
    这是我自问自答,当做分享。
    8 replies    2014-07-31 10:03:16 +08:00
    imink
        1
    imink  
       Jul 30, 2014
    如果自己爬虫写的话,有没有相关教程推荐呢?
    qmqy
        2
    qmqy  
    OP
       Jul 30, 2014
    @imink
    自己写爬虫需要考虑很多问题:重复文章检测、数据存储、定时任务、定时删除等等.....我就是觉得这些加起来太耗时了,就不重复造轮子了........不过如果你有时间挑战下,可以看看这里:
    http://blog.csdn.net/wxg694175346/article/category/1418998
    或者去搜索编程语言+爬虫,也会有很多结果的。
    祝你顺利!
    imink
        3
    imink  
       Jul 30, 2014
    @qmqy 原来是汪海,这个博主年纪不大,爬虫博客写的多,我之前有看过。给楼主贴图写文章的精神鼓励。能这么认真写都挺不容易。 我去研究看看爬虫。
    qmqy
        4
    qmqy  
    OP
       Jul 30, 2014
    @imink
    祝你顺利~
    ccbikai
        5
    ccbikai  
    PRO
       Jul 30, 2014
    知乎首页是动态加载的,鼠标悬浮头像上边都有加载新东西,博主的方法貌似只能抓取默认的几个问题

    推荐个
    http://www.zhihu.com/rss
    qmqy
        6
    qmqy  
    OP
       Jul 30, 2014
    @ccbikai
    1.动态加载的问题,我是通过缩短抓取周期解决(8分钟抓一次)。
    2.“鼠标悬停头像上面都有加载新东西”是指?
    3.目前我方案有个缺点就是没办法抓取知乎专栏,不过我用你提供的东东解决了~
    4.http://www.zhihu.com/rss,我以前也是用这个来订阅,可是有两个缺点:
    a.会重复出现以前看过的问题。
    b.它是针对所有人的,无法做到定制化,也就是意味着你不喜欢、不关注的话题或人(太多了,相当烦人)它也会推进来,污染时间线,降低效率,这也是我放弃的最大原因。

    5.我看你的博客有个新浪微博点赞脚本,其中一个半自动化的方案可以直接在邮件里点赞,不知道你这个方案能否用到这里呢?直接在rss阅读器里面点赞。
    ccbikai
        7
    ccbikai  
    PRO
       Jul 30, 2014 via Android   ❤️ 1
    @qmqy 可以全自动点赞。微博也可以生成RSS,带点赞链接就行了
    qmqy
        8
    qmqy  
    OP
       Jul 31, 2014
    @ccbikai
    我指的是知乎也可以在rss里面点赞,请问可以做到么?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2886 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 45ms · UTC 12:37 · PVG 20:37 · LAX 05:37 · JFK 08:37
    ♥ Do have faith in what you're doing.