想要网站得到发展,就离不开搜索引擎,虽然说搜索引擎课网站之间是水能载舟亦能覆舟的关系,但是明显搜索引擎是舟,网站是水,网站想要浮出水面,就需要搜索引擎的鼎力相助,故而,如何和搜索引擎搞好关系,变成了一个非常值得研究的问题。nn为了能够是搜索引擎对网站更具有亲和力,我们首先需要搜索引擎的运作过程,简单的说,搜索引擎的工作原理可以看做是以下三个步骤:
从互联网上抓取网页
这一步主要是通过spider系统程序(专门用于检索信息的robot程序)并沿着任何网页中的所有的网址进行攀爬。到了另外一个网站之后会继续重复该项活动,并且会把所有网页的信息都收集回来,这个过程就是第一步,抓取。nn网页抓取主要是包括三方面的工作,分别是:搜集新出现的网页;搜索那些在上次搜集后有改动的网页;发现上次搜集后,已经不存在网页,将它删除掉。网页抓取的优先策略通常是按照重要性来排名,以便能够更有效的利用搜索引擎的资源。而评价重要性的标准包括连接的重要程度,或者说是连接的受欢迎度(方向链接的质量和数量);链接的字符串重要度,一般来讲,.com/home 等url的重要性质就比较高;链接的深度,一个种子站点集合中,每个种子如果存在一条链接路径到达该网页,那么平均连接深度就是该网页的一个链接指标,因为距离种子站点越近则说明被访问的机会就越多。
建立索引数据库
搜素引擎的系统程序会对收集回来的网页进行分析,从中提取相关网页信息,比如网页的url、代码类型、页面内容所包含的关键词,关键词的位置。生成时间、大小、与其他网页的链接关系等,根据一定的相关深度算法进行大量的复杂运算,得到每一个网页针对页面的文字中每一个关键词的相关度,利用这些相关信息建立网页索引数据库。
根据搜索进行排序
第三在索引数据库中根据搜索进行排序,这个就很好理解了,因为相关度已经被系统计算ok。只要根据用户的搜索把这些信息展示出来就好了。展示的结果就是我们都看到的结果列表页面。
近来我在运营一个新的站点,明明已经使用robots.txt 禁止所有搜索引擎收录,但是,搜搜(soso)还是给收录了。
关于搜索引擎的工作原理需要说明的重要问题
关于竞争度
一般来讲,搜索后出现的结果数量基本上可以体现出这个关键词的竞争程度,或者通过百度指数来查看。
关于排序规则
这个规则有很多的影响因素,比如关键词的分数、域名权重、外链分数、用户数据、内容质量分数、其他人工干预因素。
关键词可能对应的搜索结果和排序,好的搜索引擎会根据搜索关键词可能反映的搜索者的搜索意图在尽可能前列的链接中来做应和,这些结果是从统计意义上的大多数人所需要的,排序也是尽可能的满足大多数人对于各自链接内容重要性的认可,另外还能够非常好的展现时效性(针对新闻)。
以上则是搜索引擎运作过程以及SEO注意事项,希望能够对大家有所帮助,本文由霍常亮原创,欢迎转载,转载请注明霍常亮的博客