我正在使用Erin Drummond的python脚本来抓取bittorrent tracker (https://github.com/erindru/m2t/blob/master/m2t/scraper.py),但是我在抓取UDP跟踪器时似乎遇到了问题。问题是返回的“完整”数字始终是10或更小。这对我来说似乎不太现实,因为据我所知,这是跟踪器注册了一个torrent的完整下载的次数。我用100d的infohashes进行了测试,以确保这不只是一个巧合。
我一直在调整本地网络的缓冲区大小(4096而不是2048)和套接字超时(10而不是8),但除此之外,我没有更改任何内容。有没有人有什么建议可能会导致不完整的“完整”数字?也许超时仍然太低?
发布于 2014-09-11 04:04:19
对于运行正常的bittorrent网络,完成的指标不是必需的。因此,许多客户端,包括我自己的客户端,可能无法正确实现它。完成的同级是指完成激流但不一定是种子的同级。你可能会发现seeders的值更准确,因为那些是拥有整个torrent的对等体。
增加缓冲区大小和超时将不起作用。除非抓取的信息散列的数量非常高,否则整个响应将适合给定的响应缓冲区。如果超时时间太短,则根本不会收到响应。
https://stackoverflow.com/questions/19785906
复制相似问题