我有一个包含6000个公司名称(以及它们的总部地址)的列表,我需要找到每个公司的网址。我正在考虑使用Google Web API (显然这需要几天时间,因为每天只允许1,000个查询)来执行此操作(搜索"COMPANY_NAME CITY STATE"),然后获取第一个结果。然而,我不能百分之百地确定这是否会奏效,我觉得有更好的方法。我可以用任何我知道的语言做这件事,C++,Java,PHP,Python。这只需要运行一次。
我该如何使用WHOIS来做这件事?我知道如果我已经知道URL的话我会怎么做,但反过来就不知道了(从名字到URL)。如果它是私人注册的,我该怎么办?
顺便说一句,这些都是美国企业。
发布于 2009-12-04 02:31:37
你可以使用WHOIS,而不是Google API。
发布于 2009-12-04 02:34:39
使用Amazons Mechanical Turk。它非常适合于这些类型的任务,这些任务很难自动化,通常需要一个人来验证它们。它会花一点钱,但它应该是可管理的,这取决于你对结果的渴望程度。
https://stackoverflow.com/questions/1841872
复制相似问题