如何实时观察百度算法对行业的影响

如题所述

  百度算法实时观测思路

  一. 行业相关性

  行业相关性更具可比性,注意行业细分,不同网站的运营各有不同,只有找到同一种种数的网站进行观察才更有可比性。

  如同样是卖服装的网站,有的网站是综合性的,男女老少的服装都有,还有专门卖女装的网站,也有单独卖男装的网站,如何我们是以服装去搜索,以上同一行业,但如果我们用女装去搜,卖男装的网站就不是有可比价值了。

  二. 选择关键词

  每一个网站的关键词都不尽相同,除非是山寨站或者是镜像站。在这里我们选的关键词就是我们的目标关键词,要和别人亲竞争的关键词,如在企业站中的就是我们的主打产品,当然这个主打关键词必须有一定的百度指数,至少日平均搜索量在50以上,百度指数太低了可能就属于冷门的关键词。太冷门了或者生僻的,自己创造出来的词去观察的意义就失去了意义了。

  三. 关键词数量

  一般我们网站首页的目标关键词是3-5个左右,还有一些相关关键词,我们选取百度指数较高的关键词5-10个做为监测和观察的目标。

  四. 网站的筛选

  通过我们上面所提到的目标关键词,百度搜索,放到百度搜索一下,把在百度中自然排名在前3页(即前30名)的网站,纳入我们所要观察的网站筛选茫围,注重排除重复的网站,经过以上3-5个不同的目标关键词,我们大约可以收集到100个左右的网站,把网站的名称和网址一一记录。以后将以这些站点作为我们监测的目标。

  五. 监测的指标

  监测的指标我们可以参考站长之家的专业监测工具<<超级监控>>的SEO数据监控的一些思路,并结合SEO一些常规手段进来作为我们监测的一些参考指标,如:网站概况、页面SEO、快照日期、收录、反链、关键词、PR及权重、Alexa数据等方面。

  1.百度指数

  百度指数是用以反映关键词在过去30天内的网络曝光率及用户关注度!它能形象地反映该关键词的每天的变化趋势,反映不同关键词在过去一段时间里的“用户关注度”和“媒体关注度”。

  2.百度搜索量

  站点中有多少页面可以作为搜索候选结果,就是一个网站的索引量。站点内容页面需要经过搜索引擎的抓取和层层筛选后,方可在搜索结果中展现给用户。页面通过系统筛选,并被作为搜索候选结果的过程,即为建立索引。目前在百度中site语法的数值是索引量估算值,比较不准。

  3. 域名站龄

  域名站龄即网站的域名注册时间年龄。网站的建站年龄越长被百度赋予的权重越高,网站年龄在排名中影响很大。域名年龄与权重是有存在一定的关系,但不是绝对的指标,域名权重是靠积累起来的并非域名注册的越早,对排名越有利,还要与该域名相关性,是否被K或降权等各方面相匹配。

  4.百度排名

  网站在百度中的自然排名情况,网站排名是一个网站权重的体现,通过分析和统计监测网站排名升降情况,可以了解到该网站的权重变化情况。我们观察时要了解百度赋予该网站的排名是首页还是是内容页(即一级目录/二级目录或一级域名/二三级域名)。

  5.百度收录

  一个网页是否被收录与搜索引擎给予该网页的权重有密切的关系,因此网站的收录数量是有瓶颈的,瓶颈因素就是网站的整体权重,即网站收录数量可以侧面烘托出网站整体权重。

  6.百度反链

  外链是指从别的网站(B)导入到自己网站(A)的链接。

  百度相关域,大家都喜欢叫做百度反链,其实并不能算是反向链接,搜索命令是domian:不带www域名,搜索结果显示的根据是互联网上所有已经被索引的网页内容中含有被搜索域名的网页。反向链接是以超链接的形式存在,而百度相关域的要求仅仅是存在被搜索域名的网址,这种情况就会造成链接形式的网址和文本形式的网址都会被计算到百度相关域中,而其实这两者的比重,后者会相对多一点。

  2012年10月30日百度今日推出外链工具beta版,通过百度外链工具,可在页面中查看到需查询站点的外链总数。查看链接到自己网站的域,每个域的链接数量、链接的网页数的统计,链接自己网站的详细的链接url及定位文本统计,查询网站被链接的页面信息。

  7.友情链接

  友情链接,也称为网站交换链接、互惠链接、互换链接、联盟链接等,是具有一定资源互补优势的网站之间的简单合作形式,即分别在自己的网站上放置对方网站的LOGO图片或文字的网站名称,并设置对方网站的超链接(点击后,切换或弹出另一个新的页面),使得用户可以从合作网站中发现自己的网站,达到互相推广的目的,因此常作为一种网站推广基本手段。

  8.百度权重

  百度权重非百度官方推出的第三方网站欢迎度评估数据。百度权重并不是像谷歌的PR,搜狗的SR,IBM hits等那样的算法,是对网站的综合评级,百度权重只是针对关键词排名方面给网站带来的欢迎度进行评级。权重数值越大,说明网站流量越大。权重越高,所带来的其他词的相关排名的提升越高。

  9.Google PR值权重

  PR值,即PageRank,它是Google排名运算法则(排名公式)的一部分,用来标识网页的等级/重要性。级别从0到10级,10级为满分。PR值越高说明该网页越受欢迎(越重要)。

  10.Alexa排名

  Alexa排名是指网站的世界排名,主要分两种:综合排名和分类排名,Alexa提供了包括综合排名、到访量排名、页面访问量排名等多个评价指标信息,Alexa排名的高低,虽说数据精准度不准确,但在一定的程度上还是可以反映出某个站点的流量及受欢迎程度的。

  11.百度快照

  每个被收录的网页,在百度上都存有一个纯文本的备份,称为“百度快照”。百度快照可以反映出网站更新的频率和网站的权重的。网站百度快照天天更新的站点是可以说明站点对蜘蛛还是很友好的。

  12.页面SEO优化情况

  (1).网站标题title信息

  网页的title用于告诉用户和搜索引擎这个网页的主要内容是什么,而且当用户在百度网页搜索中搜索到你的网页时,title会做为最重要的内容显示在摘要中。 搜索引擎在判断一个网页内容权重时,title是主要参考信息之一。

  (2).网站描述meta信息

  meta description是meta标签的一部分,位于html代码的<head>区。

  meta description是对网页内容的精练概括。如果description描述与网页内容相符,百度会把description当做摘要的选择目标之 一,一个好的description会帮助用户更方便的从搜索结果中判断你的网页内容是否和需求相符。

  meta description不是权值计算的参考因素,这个标签存在与否不影响网页权值,只会用做搜索结果摘要的一个选择目标。 为每个网页创建不同的description,避免所有网页都使用同样的描述长度合理,不过长不过短。

  (3).网站关键字Keywords

  关键字标签"Keywords"是用来描述一个网页的属性,不过要列出的内容是“关键词”。这就意味着,要根据网页的主题和内容选择合适的关键词。在选择关键词时,除了要考虑与网页核心内容相关之外,还应该是用户易于通过搜索引擎检索的,过于生僻的词汇不太适合做META标签中的关键词。

  关键词密度是用来量度关键词在网页上出现的总次数与其他文字的比例,一般用百分比表示。许多搜索引擎都将关键字密度作为其排名算法考虑因素之一,每个搜索引擎都有一套关于关键字密度的不同的数学公式。合理的关键字密度可使你获得较高的排名位置,密度过大,起到相反的效果。

  (4).网站URL

  创建具有良好描述性、规范、简单的url,有利于用户更方便的记忆和判断网页的内容,也有利于搜索引擎更有效的抓取您的网站。网站设计之初,就应该有合理的url规划。

  (5).静态页参数

  在静态页参数方面,它重点考察网站是否在静态页面上使用了动态参数,这就会导致spider的多次和重复抓取,这一点无疑又是给百度增加了额外的负担。所以,网站的简洁化和静态化对于百度优化来说非常重要。

  (6).图片Alt信息

  建议为图片加alt说明。 这样在网速较慢图片不能显示时让用户明白图片要传达的信息,也能让搜索引擎了解图片的内容。 同理,使用图片做导航时,也可以使用alt注释,用alt告诉搜索引擎所指向的网页内容是什么。

  (7).Flash文字信息

  目前Baiduspider只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、图片中的文字,百度无法识别。 所以如果一定要使用flash,我们建议您给object标签添加注释信息。 这些信息会被看作是对Flash的描述信息。让搜索引擎更好的了解您flash的内容。

  (8).frame和iframe框架结构

  建议不要使用frame和iframe框架结构,通过iframe显示的内容可能会被百度丢弃。

  (9).网站地图SiteMap

  Sitemap是百度引入优质资源的入口,对于优质资源能够快速引入并呈现给用户,您可以通过Sitemap工具告知百度您的网站上有哪些可供抓取的优质网页。有助于百度Spider更了解您的网站,包括那些传统spider可能发现不了的网页。

  (10).robots.txt文件

  搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做 robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。

  请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。

  (11).网站访问速度

  对于蜗牛般的网站访问速度,是个用户都不会对其有好印象,而且搜索引挚对于空间的速度也是比较在意的,毕竟如果网站打开都要几分钟,不但用户进不了,而且蜘蛛也爬不进去,对排名权重都不会有帮助。

  查看的主要方面包括:服务器信息,协议类型,网页是否压缩,页面类型,原网页大小,压缩后大小,压缩比(估计值) 服务器类型 ,程序支持。

  (12).死链(404、403、503错误页面)

  页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链(页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等)和内容死链(服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。)两种形式。当网站死链数据累积过多时,并且被展示到搜索结果页中,对网站本身的访问体验和用户转化都起到了负面影响。另一方面,百度检查死链的流程也会为网站带来额外负担,影响网站其他正常页面的抓取和索引。

  (13).是否存在黑链

  黑链是SEO手法中相当普遍的一种手段,笼统地说,它就是指一些人用非正常的手段获取的其它网站的反向链接,最常见的黑链就是通过各种网站程序漏洞获取搜索引擎权重或者PR较高的网站的WEBSHELL,进而在被黑网站上链接自己的网站,其性质与明链一致,都是属于为高效率提升排名,而使用的作弊手法。

  (14).网站恶意镜像

  恶意镜像,也叫恶意克隆,恶意解析,是指有人通过域名A记录直接解析别人IP地址,从而得到一个在访问者眼中完全相同网站的过程。当浏览者打开两个截然不同网址,但网站内容却是一模一样。

  (15).网站安全性

  网站被黑,严重影响了网站运营和用户体验,同样也影响了搜索引擎的体验。如果您在百度搜索结果中发现自己的网站带有“该网站可能因黑客侵入而存在安全风险”的提示,可能是该网站被黑或者被挂马。

  (16).网站备案信息

  网站备案的目的就是为了防止在网上从事非法的网站经营活动,打击不良互联网信息的传播,如果网站不备案的话,很有可能被查处以后关停。网站关闭蜘蛛就无法抓取,对网站的SEO优化数据肯定有一定的影响。

  查看网站是否已经备案及备案情况。 观察百度是否对没有备案的网站有影响。

  (17).用户体验方面

  如网站整体布局设计,框架结构,美工色调,文章质量,原创性与否,转载和伪原创文章所占的比例,文章更新的时间周期,网站特色,专题频道的构思,网站跳出率,网络蜘蛛爬行情况等等。

  (17).推广营销方面

  当然除了以上的一些变化观察外,还要分析同行在其他平台上的营销手法,如博客,论坛,微博,软文等推广营销的手法,社会化分享等等。

  6. 统计的方法

  百度大更新时间规律为每月一次月更新,每周一次月更新。一般在周五周六这两天进行周更新,这在《2011-2012年百度历次大更新数据分析》文章中有重点介绍过。

  统计的时间为:每周六上午观察1次,每月4次,对其结果进行记录并存档。建议有条件的朋友可以把结果打印出来,这样更直观,可以对近期监测的数据结果作对比,一目了然。

  知已知彼,才能百战不殆,通过以上不同周期所监测到的数据进行统计分析,我们可以得出看出百度大致的算法调整方向,行业的变化,竞争对手的情况。进行综合性地分析,才能更加了解这个行业的未来的前景机遇和目前所面临的困境,如何突破这个瓶颈才能让自己的网站走的更远。
温馨提示:答案为网友推荐,仅供参考
相似回答