大数据量优化 - V2EX

Home Sign Up Sign In

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

This topic created in 578 days ago, the information mentioned may be changed or developed.

各位大佬，我主要干 GIS 领域，然后现在做一些地质类的项目的时候，就碰到了一个问题：
一个项目做勘察，可能有很多个钻孔，然后每个钻孔会有很多信息，存储不同的表。然后如果遇到做项目归档成果导出类似的需求的时候，就需要根据项目吧所有钻孔信息做整合生成报表。怎么样做才能使效率最高化，还不容易出错。（ JAVA 仔）

7 replies • 2024-11-08 10:18:17 +08:00

1

NikoXu

Nov 7, 2024

spring data jap 的 entity 支持继承吧 , 可以把公共的字段放在父表里面

2

7911364440

Nov 7, 2024

平铺吧，表越多就越复杂，效率也越慢

3

spritecn

Nov 7, 2024

不 join 的话,内存够的话,还是很快的吧,不行就提前全推给 ES,再拉出来

4

Rat3

Nov 7, 2024

我理解也不是很常调用的业务，每天凌晨跑个定时任务生成下聚合报表，需要的时候直接读这个报表就行了吧

5

young1

OP

Nov 7, 2024

@Meld 现在也是用的后台任务去执行，但是数据有可能会发生改变，而且客户更期望的是通过接口直接返回 ZIP 结果进行下载那种效果

6

Rat3

Nov 7, 2024

@young1 哦，那确实需要实时聚合下，数据量级大概是多大的？看起来数据量不大，只是拆的表比较细？

7

sampeng

Nov 8, 2024

导出报表是数据分析的活。数据量看有多大，笛卡尔积如果超过十亿。就应该上 clickhouse 之类的宽表服务

About · Help · Advertise · Blog · API · FAQ · Solana · 1096 Online Highest 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 38ms · UTC 18:42 · PVG 02:42 · LAX 11:42 · JFK 14:42
♥ Do have faith in what you're doing.