这是扩展问题:Tools to help reverse engineer binary file formats
是否有任何公开可用的工具可以使用聚类和/或数据挖掘技术对文件格式进行逆向工程?
例如,使用该工具,您将拥有一个具有相同格式的文件集合,并且该工具的输出将是泛型结构?
发布于 2009-12-05 07:42:44
如果有一种真正有效的二进制编码格式(例如ZIP文件),那么每一位中的信息含量都很高。从本质上讲,它看起来像一个完美的随机数。
如果没有额外的知识,你就不能从中推断出任何东西。
从理论上讲,如果二进制编码效率不高,那么您只有很小的机会看到结构。但这听起来仍然很难;您如何开始猜测字段的边界在哪里?
人工智能机器学习类型会告诉你,除非你已经“几乎”了解它,否则你什么都学不到。通常,他们的成功是通过使用至少您可以推理的问题令牌来编码问题。
如果不提供更多信息,我认为您无法做到这一点。你对文件格式有什么了解吗?字段大小总是小于N位?只对ASCII字符串进行编码,还是反之亦然?
https://stackoverflow.com/questions/1843974
复制相似问题