dersu
V2EX  ›  外包

爬虫及数据处理系统外包

  •  
  •   dersu · Oct 17, 2016 · 1440 views
    This topic created in 3521 days ago, the information mentioned may be changed or developed.
    项目是为客户现有企业分析系统建设一个新的数据渠道。
    python 技术栈,基于 scrapy 框架。
    抓取网站的数据,并对指定数据进行提取和跟踪。
    同时提供接口服务,实现爬虫的管理和数据输出。

    项目是我们和合作公司一起做的,但合作公司上周单方面终止合同,临时退出了项目。
    团队内部商量后,觉得目前团队的工作量已经很饱和了,所以想找一个靠谱的团队或者个人把这块整体外包。

    系统爬虫部分比较简单,最基本的爬虫开发即可满足需求;接口服务对并发、性能要求都不高,实现需求即可。
    难点在于目标数据的鉴别,跟踪和提取,可能需要较复杂的算法来实现对特征量的识别和处理。
    我们自己团队评估过,数据处理上,有一两个功能点我们目前没想出特别好的处理方式,其他的尽管能实现,但也挺麻烦。
    所以,如果只是擅长基本的爬虫开发,请不要浪费时间来谈了,最好是有很丰富的数据处理经验。

    具体需求涉及商业机密,联系后另行说明。
    我们这边是公司,可以私人交易也可以签订正式商务合同,也可以接受在任意你选择的平台上交易。
    有兴趣的请发邮件至 heqiliao2 # outlook.com ,抱歉工作环境没法用 qq。
    我会把核心需求在邮件尽可能简单的说一下,如果确定能做,那我在把正式的需求协议发给你,然后商量一下价格和工期。
    谢谢
    4 replies    2016-10-20 15:29:25 +08:00
    songmeiya
        1
    songmeiya  
       Oct 19, 2016
    给您发了邮件没有收到回复,可以加我微信: shixianteam3,来聊聊。
    dersu
        2
    dersu  
    OP
       Oct 19, 2016
    @songmeiya 前面有三个人发来的联系邮件都被莫名的自动放到垃圾箱里了,我今天中午都已经回复了。现在你应该已经收到邮件了吧
    songmeiya
        3
    songmeiya  
       Oct 20, 2016
    然而并没有收到回复呀……
    songmeiya
        4
    songmeiya  
       Oct 20, 2016
    @dersu 真的没有收到回复 ,呜呜呜呜
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3184 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 14:09 · PVG 22:09 · LAX 07:09 · JFK 10:09
    ♥ Do have faith in what you're doing.