https://github.com/sailist/dbrecord
前一段时间训练文本数据集,为了方便 shuffle 操作整出来的,这两天简单重构后分享一下。
主要特性:
- 接口友好,提供 python list, dict 中大部分的(增改查)相关的操作方法
- 基于 sqlite ,使用简单,安装即可使用,不需要任何配置,一个文件可带走
- list 和 dict 基于相同的底层数据表,提供了尽可能兼容的互相转换操作,可以用 index 读 dict (可以看成是 OrderedDict ),也可以用 key 读 list ( list append 时候 key 是相应的 ns 时间戳)。
- 轻量:不到 500 行的代码(大概有一定的学习用途)
- 测试完善
用途:
- 可以用于构建配置文件
- 存储只有 key 或者 index 检索需求的数据(比如我曾经用于构建文本训练数据)
感兴趣可以关注一下: https://github.com/sailist/dbrecord