如果每天执行一次 job
表是每天建一个,还是更新之前的表?
还有就是,你们是这么写数据到 FS,然后再从 FS 到 hive 的
表是每天建一个,还是更新之前的表?
还有就是,你们是这么写数据到 FS,然后再从 FS 到 hive 的
1
atomstar Aug 7, 2018
如果是同类数据,肯定是根据时间分区啊 每天写入新的分区即可。
至于数据怎么写入,要看你的源从哪里流来的,可以直接写 hdfs,也是根据日期分区写,然后做一下分区关联 |