经过对实时数据库和时序数据库在功能架构等方面的对比分析之后,对于两种数据库的区别差异也就非常清晰了。其功能的不同也会在应用场景上展现出不同的特点,因此,本文将对两种数据库在应用时的特点进行对比分析。
一、数据库特点
1、实时数据库具有以下特点:
(1)海量数据的高效采集和存储;
(2)快速的查询响应,及时响应实时的查询需求,快速查找历史数据;
(3)高效丰富的数据处理和统计功能;
(4)超强的数据压缩能力,历史回补通知保证客户端数据的完整性及正确性;
(5)丰富的数据和编程接口,配置整套系统,兼容上百种协议;
(6)完备的安全保护机制,主备机制保证高可用性;
(7)对大量数据实时整合,提升企业对于数据的整合能力。
2、时序数据库具有以下特点:
(1)插入操作较多且较少有更新的需求;
(2)数据带有时间属性,数据量随着时间递增;
(3)插入数据量多;
(4)查询、聚合等操作主要针对近期插入的数据;
(5)时序数据能够还原数据的变化状态;
(6)可分析数据变化,对未来趋势进行一定预测。
通过以上对比,可发现时序数据库的数据特征,有与工业领域的实时数据相似的地方:
(1)单条数据不会很长,单数据量很大;
(2)都带有时间戳,且按顺序生成;
(3)数据大部分都是结构化,用于描述某个参数在某个时间点的特征;
(4)写入的频率会比查询频率高很多;
(5)已存储的数据很少有更新的需求;
(6)用户更关心一段时间的数据特征,而不是某一时间点;
(7)数据的查询分析大多基于某一个时间段或者某一个数值范围;
(8)需要进行统计和可视化的展示。
二、数据库区别对比
实时数据库的出现主要是因为现代工业制造流程及大规模自动化的发展,导致大量的数据需要集成和存储。时序数据库是在关系数据库基础上进行改进的,两种数据库处理的都是时间序列数据,但它们的发展历史、业务服务目标、产品定位、功能和用途并不完全一样,以下为对比表格:
| 实时数据库 | 时序数据库 |
开发模式 | 可直接使用,深层功能需二次开发 | 基本不可直接使用,需要开发人员根据业务进行二次开发及封装 |
工厂模型 | 具备工厂模型 | 不具备,需要二次开发厂家进行模型抽象才能匹配任务 |
设备场景 | 窄表,可灵活掌握每个测点的时间戳和质量戳,可匹配十几种规范的质量戳 | 宽表,多个测点以设备组方式共享时间戳和质量戳,不能对现场数据做灵活处理等工作 |
架构设计 | 冗余容错支持冷温热三种模式; 集群扩展采用分布式架构扩店扩容,支持从站控到调度多个环节 | 横向集成进行冗余容错设计,点数可无限扩展,不完全匹配工业现场,适合调度场景 |
响应时效 | 有规定时间内响应要求 | 响应时效较宽泛,不适合一体化智能管控场景的高度集成 |
商业模式 | 模型库、增值行业套件,是商品化单机收费模式 | 开源与商业结合,行业套件为空白,用户资产价值提升有限,运维模式不同 |
应用场景 | 全套解决方案,支持多种工业协议、工业场景的数据模型 | 在工业监控场景,在DevOps、IoT、金融等场景下皆可用 |
扩展性 | 设备配置较高,软件运行稳定性要求高,扩展较复杂 | 可水平扩展,不依赖昂贵的硬件设备,不会出现单点瓶颈或故障,使用成本低 |
商业价格 | 成套的解决方案及设备价格昂贵 | 存在开源免费及低成本数据库 |
存储服务 | 使用私有化部署,机器、软件、设备等存储,需技术人员进行维护 | 具备云存储服务,部分时序库不具备硬件设备 |
三、力控pSpace应用特点
实时数据库主要应用于工业控制、生产和工程等领域,它在工业领域应用时间久,产品性能一流,具备完整解决方案,同时配套工具、相关功能等方面非常成熟完备。
时序数据库制药应用在物联网、金融和监测等领域,时序数据库在工业领域的应用较为欠缺,大多数只用于监控分析的场景,部署依赖过多,配套工具不完善,实时反馈控制的时效性较弱。
在实时数据库中,pSpace作为力控元通在全球范围内推出的一款企业级实时历史数据库产品,以pSpace为核心,既可以构建MES、EMI等工业信息化解决方案,也可以构建分布式广域SCADA解决方案。在工业领域的应用中,力控pSpace实时数据库具有如下特点:
(1) 工业海量数据的高效采集和存储
在数据方面,支持浮点型、整型、布尔型等多种工业数据类型,支持OPC、Modbus等常用的标准工业协议,能够充分满足大规模工业对测点数量的需求。
在存储方面,历史数据存储仅受存储设备容量的限制,历史数据保存时间不受限制,同时支持历史数据的二次压缩。
(2) 高效丰富的数据处理和统计功能
全面的统计查询功能集,完整的实时、历史数据质量戳语义支持。第三方系统可以直接使用统计的结果数据,从而提升整个系统的响应速度。
(3) 丰富的数据和编程接口,第三方系统集成方便
支持广泛全面的编程接口。软件很好的支持C API、.Net API、Java API等编程接口以及OPC Server、SQLRouter等数据访问方式。
(4) 分布式架构,部署方便快捷
分布式架构可灵活的构建和组织系统,分散系统的性能压力,保障系统更加安全稳定的运行。
(5) 强大的群集功能
pSpace可以部署成群集以满足大点数、大数据量的应用需求。
(6) 冗余机制提高系统可靠性和稳定性
可支持数据库系统状态的监视并支持断线重连功能,在主要程序发生意外退出时自动故障恢复。
(7) 断线缓存机制和提高数据完整性
可保证在数据故障的情况下保证数据的完整性、一致性,不会因为通讯故障等原因而导致数据的终端或丢失。
(8) 支持时间戳、质量戳,提高数据准确性
数据采集程序完整支持OPC协议中对时间戳、质量戳的定义,允许用户根据现场情况选择使用设备的时间戳和质量戳还是采集程序的时间戳和质量戳。
(9) 历史回补通知保证客户端数据的完整性及正确性
pSpace检测到插入历史数据后会向客户端发送通知,客户端可根据通知的内容获取缺失的历史数据,或重新进行历史数据的统计计算。
(10) 完备的安全保护机制
用户管理具备多项可配置权限,限制对重要工艺参数的访问、修改等操作权限,同时设置不同的数据安全区,不同区不可互相操作,保证了数据的分布式的管理。
(11) 支持跨操作平台应用
能够很好的支持目前市场上主流的操作系统,其中包括:Windows系列、Linux系列:Red Hat/Ubuntu/CentOS/SUSE,可为用户提供更多的选择。
(12) 支持32位/64位架构
能够很好的支持目前市场上主流的32位架构和64位架构的服务器及操作系统,确保用户既可以兼容32位的应用,又可以发挥64位系统的优势,极大程度的提升了系统的整体性能。