seo 是什么:从而提高搜索引擎的计算效率

发布时间:2020-06-06 15:58 编辑:西极电力网

搜索引擎的工作原理,在我们的培训中也经常会被提及,简单来说,主要是三个步骤,(cilimao磁力猫,tokyo hot n0479) 爬行和抓取,预处理(因为索引是预处理中主要组成部分,故也有人将这一步称为索引),(起凡seo,ssni056) 排名。排名这一块设计算法问题,暂且不去深究,这里主要(star-472,ipx058) 说说爬行和抓取以及预处理两个方面。

通过蜘蛛程序,各搜索引擎在访问网站时都会先去查看网站根目录下的robots.txt文件,从而获取网站中被禁止爬取网址的信息。对于被禁止抓取部分的网址,不会被搜索引擎收录,但是需要注意的一个现象是,百度目前会对部分将百度蜘蛛屏幕的网站以下列类似淘宝网的形式显示,据个人不完全观察发现,这种现象正逐渐变的普遍起来(特别强调一(驭宝seo,snis-850) 点,这不是说百度不遵守robots协议了,打开此类收录网(青岛谷歌seo,iptd-971) 址的快照,你会发现快照为空)。

为了获取更多的信息,蜘蛛会通过(ssni036,ipx058) 跟踪页面上的链接来抓取页面。从理论上来说,蜘蛛可以通过链接抓取整个互联网上的信息,但是在实际操作中,考虑到页面的复杂程度,蜘蛛会采(ktkp-073,mum-147) 取深度抓取和广度抓取两种方式来进行页面抓取的工作。为了避免重复爬行和抓取,搜索引擎会建立包括已发现但未被抓取以及已被抓取的两个网页地址库进行参考对比,而被抓取的页面会进入原始(seo兼职优化,iptd-343) 的页面数据库。到此为止,原始数据库的建立就告一段落了。

原始数据库建立完毕,搜索引擎会对网页进行文字提取的处理,当然,除了页面上显示的文字外,搜索引擎还会对诸如met(德井义实,mum-147) a标签、flash替代文件,锚文本、al(广州百度seo,ssni036) t标签等部分的文字进行提取。提取文字完毕,便会进入下一个阶段:分词。

正向索引结束,我们可以发现还不能用于排名,这时就需要倒排索引,即以关键词为主键,以包含该关键词的网址及对应内容为内容建立索引数据库,如下图所示。

TAG: 夫唯seo seo优化视频教程 seo公司排名 seo学些啥 seo优化代码 seo小黑 seo哪些知识 自学seo seo优化手段 黑帽 seo seo密度 seo白帽培训 陈年seo分析 外链seo seo文案案例 顺德seo seo处理 阳泉seo 广安seo 狼雨seo精灵

上一篇:专业网站优化:先看第一个内链的概念和举例 下一篇:优化大师免费下载网络优化是做什么的

相关阅读

精彩推荐