mon3
V2EX  ›  问与答

5000 多万的文章怎么做相关推荐??

  •  
  •   mon3 · May 5, 2017 · 2557 views
    This topic created in 3325 days ago, the information mentioned may be changed or developed.

    以前单独建表,分词,但是 tag 已经有 1 亿多个了,导致网站运行很慢。

    还有其他办法么?

    9 replies    2017-05-05 15:04:38 +08:00
    JasperYanky
        1
    JasperYanky  
       May 5, 2017
    现在采集站好做么
    mon3
        2
    mon3  
    OP
       May 5, 2017   ❤️ 1
    @JasperYanky 做了 4 个月,每天 50 刀左右。
    uuhp2009
        3
    uuhp2009  
       May 5, 2017
    @mon3 网站看可以看看不
    martyyyyy
        4
    martyyyyy  
       May 5, 2017
    @mon3 很厉害,网站可以看看不
    cevincheung
        5
    cevincheung  
       May 5, 2017
    上搜索引擎,缓存
    mon3
        6
    mon3  
    OP
       May 5, 2017
    @cevincheung 文章页调用 elasticsearch 的结果???
    cevincheung
        7
    cevincheung  
       May 5, 2017
    @mon3 #6 对啊。可以试试啊。
    mon3
        8
    mon3  
    OP
       May 5, 2017
    @cevincheung 我现在就是这样做的。我当时想了一上午想出了这个办法, 可是我感觉不是太好。 其他过亿数据量的站点也很多是这样做的?
    JasperYanky
        9
    JasperYanky  
       May 5, 2017
    @mon3 基本就是上 ES 后端直接渲染嫌慢的话 前端去 es 上查询;话说这样好像对 SEO 不太好

    对于这种采集类的网站,我的想法是上 ES 然后直接 每篇文章生成的时候就查询好相关文章 ,然后直接写到该数据里,简单粗暴;当然可以只保留 id 然后二次再查询。
    仅仅对采集站而言的,采集站有个特点是,用户浏览不多,但是搜索引擎爬的很厉害,所以简单粗暴也许更好点
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   4337 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 05:33 · PVG 13:33 · LAX 22:33 · JFK 01:33
    ♥ Do have faith in what you're doing.