谷歌搜索是如何工作的!!

谷歌搜索 当前位置眨眼之间,它每天发生数十亿次,我们可以拥有我们头脑中能想到的任何东西!

null

gfg

让我们来探索使之成为可能的艺术和科学。

爬行和索引 :查询的过程在我们输入搜索之前就开始了,它会在数万亿文档的网络上爬行并建立索引。

谷歌使用的软件被称为 网络爬虫 发现公开可用的网页。最著名的爬虫叫 爬虫 .爬虫会查看网页并跟踪这些网页上的链接,从一个链接到另一个链接,并将这些网页的数据带回谷歌的服务器。

网络就像一个不断增长的公共图书馆,拥有数十亿册图书。谷歌基本上是在爬网过程中收集页面,然后创建一个索引,很像书后面的索引。谷歌索引包括关于单词及其位置的信息。当我们搜索时,在最基本的层面上,他们的算法会在索引中查找我们的搜索词,以找到合适的页面。

算法 :算法是一种计算机处理过程和公式,它从数千个包含有用信息的网页中提取我们的查询并解决它们。谷歌使用 PageRank 由创始人开发的算法 谢尔盖·布林 拉里·佩奇 今天,谷歌的算法依赖于200多个独特的信号,这些信号包括网站上的术语、内容的新鲜度和我们所在的地区,这使我们能够猜测我们真正想要的是什么。

垃圾邮件战斗 :垃圾网站试图通过反复重复关键词、购买通过PageRank的链接或在屏幕上放置不可见的文本等技术占据搜索结果的顶部。这对搜索不利,因为相关网站被掩埋,对合法网站所有者不利,因为他们的网站变得更难找到。好消息是,谷歌的算法可以检测到绝大多数垃圾邮件,并自动将其降级。 以下是谷歌搜索旅行的一瞥

相关文章:

重要链接:

  1. https://www.google.com/insidesearch/howsearchworks/thestory/
  2. http://infolab.stanford.edu/~backrub/谷歌。html (谷歌创始人的Pagerank论文)

本文由 阿卡什·帕尔 .如果你喜欢GeekSforgek,并想贡献自己的力量,你也可以使用 贡献极客。组织 或者把你的文章寄到contribute@geeksforgeeks.org.看到你的文章出现在Geeksforgeks主页上,并帮助其他极客。

如果您发现任何不正确的地方,或者您想分享有关上述主题的更多信息,请写下评论。

© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享