文章/答案/技术大牛

发布

社区首页 >问答首页 >大文件的搜索算法

问大文件的搜索算法
EN

Stack Overflow用户

提问于 2010-07-08 17:41:13

回答 2查看 879关注 0票数 1

我需要帮助，在决定与搜索算法用于搜索大文件。这就是我在做的事情。假设文件由时间范围t1到t2组成。(t2>t1)

我需要得到以下文件的偏移量：

时间t3比t1大
比时间t4小的时间t2 - t1 t3 t4 t2

朴素版本是在当前时间为t3时遍历整个文件并返回搜索，从返回查找开始，当前时间为t4，返回第二次搜索。

现在假设文件是100 get，我需要迭代，而文件只是为了得到2秒的周期。然后，这个逻辑变得过于CPU和文件系统昂贵。寻找更好的解决方案。使用中的语言是C.行目前是固定大小的，但是我想展望未来，并处理一些不使用固定大小长度的算法。

algorithm

回答 2

Stack Overflow用户

回答已采纳

发布于 2010-07-08 17:46:29

如果文件中的时间都已排序，则可以使用二进制搜索。如果您的文件中的记录是固定宽度的，则更好，但是您可能可以使用它，即使它们不是，通过一些工作。

票数 4

Stack Overflow用户

发布于 2010-07-08 17:53:16

由于值的宽度是固定的，所以像二进制搜索或插值搜索之类的东西听起来是最好的选择。另外，如果您计划使用那些大小类(100 of )中的文件，您应该考虑使用fgetpos/fsetpos，因为using的文件大小限制。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/3206395

复制

相似问题

问大文件的搜索算法
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问大文件的搜索算法EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问大文件的搜索算法
EN