正文 第501章 幻数据压缩算法2
作品:《脑回路清奇的主角们》 数据压缩算法统计算法
001100;001110;110001;110011;
把数据按照顺序对齐
001100;001110;110001;110011;
把数据按照大小对齐
110011;110001;001110;001100;
把数据按照近似对齐
110011和001100互为求反;110001和001110互为求反;
每一段数据,都有多个标签,通过添加标签的方式,从而减少数据穷举试错的次数。
有限进制速记算法
把任何数都可以记录为abcd;a的b次方乘以c的阶乘加d;
如43的37次方乘以31的阶乘加499739
433731499739
433727436762028363398179986072951166e60
31822283865417792281772556288e33
43373122560806735230762092253487562356e94
跳数统计速记算法
如101001000100001000001000000100000001
123456789012345678901234567890123456作者避免自己看看得眼睛疼,所以使用数字在特定字体下宽度和高度是一样的方式,来进行作为标尺,数间隔多少位用的。
使用跳一位1的方式统计,结果如下
奇数次1生效偶数次1被当做01中间有4个0,其中出现过一次11中间有8个0,其中出现过一次11中间有12个0,其中出现过一次1尾数00000001
偶数次1生效头数101中间有6个0,其中出现过一次11中间有10个0,其中出现过一次11中间有14个0,其中出现过一次1
然后把这些数据比对合并,就能得出源数据。
使用跳两位1的方式统计,结果如下
第一个1对齐1中间有8个0,其中出现过两次11中间有17个0,其中出现过两次11尾数00000001
第二个1对齐头数101中间有11个0,其中出现过两次11中间有20个0,其中出现过两次11
第三个1对齐头数101001中间有11个0,其中出现过两次11中间有14个0,其中出现过两次11尾数000000100000001
也就是说,当1和0不连续的情况出现得越多,那么使用跳n个1以及另一个注册表中跳n个0的统计数据,n的取值越大,压缩比例越高;当1和0不连续的情况出现得越少,那么使用跳n个1以及另一个注册表中跳n个0的统计数据,n的取值越小不排除n0的情况,压缩比例越高;
数据对齐算法
如
101001000100001000001000000100000001
101010101010101010101010101010101010
100110011001100110011001100110011001
123456789012345678901234567890123456
第一种标尺10循环充满
完全一致1,2,3,4,8,12,14,15,16,18,20,21,22,24,26,30,32,34
完全单比特求反5,6,7,9,10,11,13,17,19,23,25,27,28,29,31,33
第二种标尺1001循环充满
完全一致1,2,7,11,14,18,19,21,22,23,26,27,28,30,31,34,35,36
完全单比特求反3,4,5,6,8,9,10,12,13,15,16,17,20,24,25,29,32,33
第n种标尺
完全单比特一致,,
完全双比特一致,,
完全多比特一致,,
完全单比特求反,,
完全双比特求反,,
完全多比特求反,,
使用的算法越多,那么算法所生成的数据就越多,相应的就可以快速互相校验,从而避免1个比特的篡改导致最终损失1zb其中的900tb数据的极端压缩文件异常灾难;毕竟压缩率越高,就意味着一旦出现了压缩文件缺失以及特定数据不可读取比如硬件损坏,磁盘坏道,软件权限不足就会导致最终解压缩所缺失的部分越多;压缩率越高,就要求容错能力和纠错能力越强,比如说,把1zb的数据,压缩成1gb数据,1gb数据中随机有百分之五十的数据不可读取,是否能够通过剩下的百分之五十数据逆推出整个1gb数据内容从而可以解压缩成原先的压缩前的1zb数据当然了,容错和纠错就难免会增加试错和穷举的运算量。 ,请牢记:,免费最快更新无防盗无防盗
