有人知道谷歌机器人是用哪种编程语言编写的吗?
或者,更普遍的是,高效的网络爬虫是用哪种语言编写的?
我见过很多Java语言,但在我看来,它不是最适合开发网络爬虫的语言,因为它产生了太多的开销(尝试使用Heritrix网络爬虫,它非常重)。
发布于 2009-10-29 02:03:21
最早的版本,Backrub,was written in Python and Java。
发布于 2009-10-29 02:06:49
有根据的猜测是Python。他们employ the creator of it。然而,我可以想象他们的爬虫可能是一个利用MapReduce的分布式应用程序,在这种情况下,它实际上可能是一个C/C++应用程序。
不过,这并不是重点。你可以用许多不同的语言编写一个高效的网络爬虫,但仍然会得到相同的结果。即使是黄色或蓝色的锤子,锤子也会击中钉子。选择你最喜欢的颜色,并正确使用它。
发布于 2012-05-11 20:21:53
这可能会有帮助。原版google Paper。
http://infolab.stanford.edu/~backrub/google.html
https://stackoverflow.com/questions/1638973
复制相似问题