关于数据压缩的几点看法
我最近对数据压缩技术做了一点研究,想发表一些不成熟的看法。
1。数据压缩技术不是实时数据库的主要技术,甚至不是实时数据库的必要技术,实时数据库的主要技术比这难得多。如果把数据压缩技术作为实时数据库的主要技术,主要技术指标,那就大错特错了。
2。数据压缩技术不是绝对需要的,是否需要数据压缩,要看数据本身的变化与存储周期的关系。如果存储周期较长,数据相对该存储周期变化较大,则可以考虑不需要数据压缩,例如存储周期为分钟级;如果存储周期较短,或数据变化快,就可以考虑或者必须使用数据压缩,例如存储周期为秒级毫秒级;重要数据可以不压缩,非重要数据压缩。
3。空间和时间是计算机技术的基本矛盾,不存在一种算法,既节约了空间,又节约了时间。数据压缩节约了空间,一定比不用数据压缩慢。说什么某实时数据库用了数据压缩技术后速度快了多少,一定是说外行话,替别人做免费广告。
4。压缩后的数据的存放要有额外的空间开销。不压缩的数据可以按预定的次序存放,而压缩后的数据的存放必须同时存放对应的检索信息。根据我们测算,4字节的浮点数(65536个数以内)的存放要至少多存1/4的信息,超过65536则需要存放更多的信息,而使实际的数据压缩比大大降低。在数据变化大时,如现场工艺波动时,压缩数据数据反而适得其反,需要更多空间。我们在出现事故时(事故追忆)时一律不进行数据压缩。
5。有一种“旋转门”数据压缩技术,只是数据压缩技术的一种,不需要吹得神乎其神。