教授给了我一篇研究论文,展示了一种有效压缩数据的方法。不值得对整个算法进行验证,因为这个问题并不是关于这个问题的,我只是介绍一个小例子,它应该让您了解真正的问题是什么。
我们的压缩算法有自己的字典,它是一个表(不管如何计算,只要假设压缩器和解压缩器都有),每个表行都有一个字符串。压缩器为了压缩消息,将打开它并从开始开始,它将在字典中搜索匹配项,并最终发送带有行id的匹配消息,如果没有发现,则发送带有要设置的消息的SET消息。注意,匹配并不一定是完全匹配的,它们可以后面跟着许多MISSMATCH消息,每个消息都包含字节偏移错误和正确的字节。
因此,例如,压缩程序可能需要编码:
现在,在论文中,他们说熵使用LZMA编码这个“数据流”,他们认为这是一件很简单的事情,而不给出更多的细节。
我在网上搜索过,但什么都没想出来。你知道最后一步该怎么做吗?你有什么参考资料吗?
发布于 2019-11-19 19:43:44
有一个流压缩算法与预设字典使用LZMA作为这个开源项目的一部分:阿达。预设的字典叫做“训练数据”。
https://stackoverflow.com/questions/58939788
复制相似问题