我正在做一个项目,要求我理解搜索引擎在网络上使用的不同技术。
我有很强的科学和发展背景,所以我不怕高度技术性的信息。
我正在寻找所有形式的技术信息,包括关于网络爬虫的信息,获取数据的其他技术,数据存储方法和如何查询,等等。
我是全新的学科,我正在寻找有用的资源和书籍的主题。如有任何建议,敬请见谅。
发布于 2011-09-03 20:34:47
这一研究领域被称为信息检索。这篇维基百科文章包含了一个很好的总结和许多有用的链接。
发布于 2011-09-03 20:36:10
首先,谷歌积极参与技术的“科学”,经常通过从研发部门发布论文来分享他们的知识。您可以从下面的参考链接中找到这些论文。我还没有搜索有关搜索检索算法的具体文章,但从非常技术的角度来看,应该有足够的关于这一主题的信息,以及关于存储大量数据集和有效查询数据的文章。
谷歌人员的出版物
除了Google的资源之外,我强烈建议您研究语义Web研究。语义web并不是一种搜索数据的方法,即使这个概念一开始看起来有点模糊,但是语义web“引擎”的明确含义是解析WWW中的信息,并将相关信息相互链接起来。
简而言之,语义网是一门科学,它是许多前瞻性思想家所希望的,并正在为互联网而努力,使其真正成为分析、解释和正确连接在一起的信息。我自己也没仔细研究过,所以我的一些信息可能有点不正确。然而,他们有大量的资源可供讨论语义网,许多人希望/等待/在领域内取得突破,希望为互联网创造“下一个大事件”。
当然,学习语义web的一个好起点是维基百科。
这些参考资料可能不是书,但它是大量的信息。阅读和筛选所有的技术信息会让你忙碌一段时间。
发布于 2011-09-04 09:26:38
根据@Andy的建议,我阅读了维基百科关于信息检索的页面,并跟踪参考资料。有很多在线信息,我发现这个信息检索导论,它是一本在线书,从2008年,所以很可能是最新的,这似乎是一个很好的介绍这个主题。
https://softwareengineering.stackexchange.com/questions/105656
复制相似问题