1 基础概念
TSDB 与传统 DB 比较
TSDB 应用场景
由时序产生,并且需要展现其历史趋势、周期规律、异常性的,进一步对未来做出预测分析的,都是时序数据库适合的场景。具体场景:各类设备的监控数据,医学中的血糖、血压、心率的监控数据,金融业中交易、成交数据等。
为什么选择 influxdb
influxdb 之 TSM 存储引擎概述
Shard——TSM 存储引擎之上的概念
2 项目由来
3 程序架构
官方开源 influxdb-relay 方案
未解决的问题:
饿了么 influxdb 高可用解决方案
优势:
劣势:
360 内部 influxDB-HA 解决方案
优势:
4 性能比较
与单机 influxdb 磁盘 IO 对比。
与单机 influxdb CPU 使用对比。
5 业务方接入 influxDB-HA 说明
influxDB-HA 管理 influxdb 实例配置。
Grafana 接入 influxDB-HA 说明。
三方程序接入 influxDB-HA 写入数据说明。
6 后期迭代计划
一个优秀的项目需要经历无数的版本迭代和优化,而对于开发者而言,能兼容各类需求、适应各类场景是沉淀、提升技术的不二法门。鉴于此,我们应该不断完善 influxDB-HA 以支持 360 内部各类使用场景。接来下,仅提出未来可见的优化点:
对接业务方分表,以支持更大数据规模场景下的解决方案,measurement 始终作为 influxDB-HA 集群中可拆分的最小单元,避免不同 measurement 的合并排序问题。
7 influxdb 使用注意事项
经过一段时间(近一个多月)的实践和对 influxdb 性能的综合观察,总结出以下结论供我们大家一起探讨:
1、continuous queries/select:
笔者看见很多对于 influxdb 的不满来自于对其性能的诟病。然而有目共睹的是其写入性能是极其优秀的,那究竟查询性能如何呢?
实践总结:对于超过 10 万样本数据的查询操作而言,我们通过索引(即 influxdb 中的 tag)查询将能够节省机器性能,大大降低查询时间。查询操作往往耗死机器的根本原因是:OOM(Out Of Memory)
那么在配置 CQ 时,应该:
2、retention policy:
配置数据的留存策略好处是数据持久化,但数据量较大时劣势也非常明显,会占用很大的 CPU,造成读写数据异常。所以配置 RP 时我们必须注意:
原文链接: