1. 柠檬SEO首页
  2. 谷歌SEO技术优化教程

搜索引擎的工作方式:抓取、索引和排名

正如我们在第一章中提到的,搜索引擎是应答机。它们的存在是为了发现,理解和组织互联网的内容,以便为搜索者提出的问题提供最相关的结果。

为了显示在搜索结果中,您的内容必须首先对搜索引擎可见。可以说,这是SEO难题中最重要的部分:如果找不到您的网站,那么您将永远不会出现在SERP(搜索引擎结果页)中。

搜索引擎如何工作?

搜索引擎具有三个主要功能:

  1. 抓取:抓取Internet上的内容,查看他们找到的每个URL的代码/内容。
  2. 索引:存储和组织在爬虫过程中找到的内容。一旦页面进入索引,它就会在运行中显示为相关查询的结果。
  3. 排序:提供最能回答搜索者查询的内容,这意味着搜索结果的排序方式从最相关到最不相关。

什么是搜索引擎抓取?

抓取是一种发现过程,搜索引擎在其中发现一组机器人(称为抓取器或蜘蛛)以寻找新的和更新的内容。内容可能有所不同-可能是网页,图像,视频,PDF等-但无论格式如何,内容都是通过链接发现的。

这个词是什么意思?

对本节中的任何定义有疑问吗?我们的SEO词汇表具有特定于章节的定义,以帮助您保持最新状态。

请参阅第2章的定义

搜索引擎机器人(也称为蜘蛛)会逐页爬行以查找新内容和更新内容。

Googlebot首先获取一些网页,然后按照这些网页上的链接查找新的URL。通过沿着链接的这种路径跳动,抓取可以查找新内容并将其添加到名为Caffeine的索引中(该Caffeine是一个庞大的已发现URL的数据库),稍后在搜索者搜索有关该URL上的内容为很适合。

什么是搜索引擎索引?

搜索引擎处理并存储他们在索引中找到的信息,索引是他们发现并认为足以为搜索者服务的所有内容的庞大数据库。

搜索引擎排名

当有人执行搜索时,搜索引擎会在索引中搜索高度相关的内容,然后对这些内容进行排序,以期解决搜索者的查询。搜索结果的相关性排序称为排名。通常,您可以假设网站的排名越高,搜索引擎认为该网站与查询的相关性就越高。

有可能阻止您的部分或全部站点访问搜索引擎爬虫程序,或者指示搜索引擎避免将某些页面存储在其索引中。尽管这样做可能有一定的原因,但是如果您希望搜索者找到您的内容,则必须首先确保其对爬虫程序是可访问的并且可索引。否则,它就像隐形一样。

在本章结束时,您将拥有与搜索引擎一起使用所需的上下文,而不是与之相反!

在SEO中,并非所有搜索引擎都是平等的

许多初学者想知道特定搜索引擎的相对重要性。大多数人都知道Google拥有最大的市场份额,但是对Bing,Yahoo和其他公司进行优化有多重要呢?事实是,尽管存在30多个主要的网络搜索引擎,但SEO社区实际上只关注Google。为什么?简短的答案是,绝大多数人都在Google搜索网络。如果我们将Google Images,Google Maps和YouTube(Google的一家网站)包括在内,则超过90%的网络搜索是在Google上进行的,这是Bing和Yahoo的总和的近20倍。

爬行:搜索引擎可以找到您的页面吗?

正如您刚刚了解的那样,确保对网站进行爬虫和索引编制是显示在SERP中的前提条件。如果您已经有一个网站,则最好先查看索引中有多少个页面来开始。这将对Google是否正在爬虫并找到您想要的所有页面,以及您不需要的所有页面产生一些深刻的见解。

检查索引页面的一种方法是高级搜索运算符 “ site:yourdomain.com” 。转到Google,然后在搜索栏中输入“ site:yourdomain.com”。这将返回Google在其指定网站的索引中具有的结果:

Google的site:moz.com搜索的屏幕截图,显示在搜索框下方。

Google所显示的结果数量(请参见上面的“关于XX个结果”)并不确切,但是它确实使您对网站上的哪些页面建立了索引以及它们当前在搜索结果中的显示方式有一个明确的了解。

为了获得更准确的结果,请在Google Search Console中监控和使用“索引覆盖率”报告。如果您目前没有免费的Google Search Console帐户,可以注册一个。使用此工具,您可以提交网站的站点地图,并监视实际上已将多少已提交的页面添加到Google的索引中。

如果您没有在搜索结果中显示任何位置,则可能有以下几种原因:

  • 您的网站是全新的,尚未进行爬虫。
  • 您的网站未从任何外部网站链接到。
  • 您网站的导航使机器人很难有效地对其进行爬虫。
  • 您的网站包含一些称为抓取指令的基本代码,这些基本代码会阻止搜索引擎。
  • 您的网站已因Google的垃圾内容手段而受到惩罚。

告诉搜索引擎如何抓取您的网站

如果您使用Google Search Console或“ site:domain.com”高级搜索运算符,但发现索引中缺少某些重要页面和/或某些不重要的页面被错误地编入索引,则可以进行一些优化实施,以更好地指导Googlebot您要如何抓取网络内容。告诉搜索引擎如何抓取您的网站可以使您更好地控制索引中的内容。

大多数人都考虑过确保Google可以找到自己的重要页面,但是很容易忘记您不想Googlebot找到某些页面。这些可能包括诸如内容稀疏的旧URL,重复的URL(例如电子商务的排序和过滤器参数),特殊的促销代码页,登录或测试页之类的东西。

要使Googlebot远离您网站的某些页面和部分,请使用robots.txt。

Robots.txt

Robots.txt文件位于网站的根目录(例如,yourdomain.com / robots.txt)中,并建议您把不重要的文件告诉爬虫,让搜索引擎知道哪部分是不重要的,以及它们爬虫网站的速度,通过特定的robots.txt指令。

Googlebot如何处理robots.txt文件

  • 如果Googlebot找不到网站的robots.txt文件,则会继续抓取该网站。
  • 如果Googlebot找到某个网站的robots.txt文件,则通常会遵守建议并继续抓取该网站。
  • 如果Googlebot在尝试访问网站的robots.txt文件时遇到错误,并且无法确定该网站是否存在,它将无法抓取该网站。

针对爬虫预算进行优化!

抓取预算是Googlebot离开前将在您的网站上抓取的URL的平均数量,因此抓取预算优化可确保Googlebot不会浪费时间在不重要的页面上进行抓取,而忽略了重要页面的风险。在拥有成千上万个URL的大型网站上,抓取预算是最重要的,但是阻止抓取工具访问您绝对不在意的内容绝不是一个坏主意。只要确保不阻止爬虫程序访问您在其上添加了其他指令(例如规范或noindex标签)的页面即可。如果Googlebot被阻止进入某个页面,它将无法查看该页面上的说明。

并非所有的网络机器人都遵循robots.txt。有恶意的人(例如,电子邮件地址抓取工具)会构建不遵循此协议的机器人。实际上,一些不良行为者会使用robots.txt文件来查找您的私人内容所在的位置。尽管将爬虫程序阻止在诸如登录和管理页面之类的私人页面中以使其不出现在索引中似乎是合乎逻辑的,但是将这些URL的位置放置在可公开访问的robots.txt文件中也意味着具有恶意意图的人可以更轻松地找到它们。最好NoIndex这些页面并将它们放在登录表单后,而不是将它们放在robots.txt文件中。

您可以在学习中心的robots.txt部分中阅读有关此内容的更多详细信息。

在GSC中定义URL参数

通过将某些参数附加到URL,某些站点(电子商务中最常见的站点)可以在多个不同的URL上提供相同的内容。如果您曾经在线购物,则可能已通过过滤器缩小了搜索范围。例如,您可以在Amazon上搜索“鞋子”,然后按大小,颜色和样式优化搜索。每次优化时,URL都会略有变化:

https://www.example.com/products/women/dresses/green.htmhttps://www.example.com/products/women?category=dresses&color=greenhttps://example.com/shopindex.php?product_id= 32&highlight = green + dress&cat_id = 1&sessionid = 123 $ affid = 43

Google如何知道要提供给搜索者的URL版本?Google在自行找出代表性URL方面做得很好,但是您可以使用Google Search Console中的URL Parameters功能来告诉Google到底您希望他们如何对待您的页面。如果您使用此功能告诉Googlebot“不使用____参数抓取网址”,则实际上是在要求从Googlebot中隐藏此内容,这可能会导致这些页面从搜索结果中删除。如果这些参数创建了重复的页面,那就是您想要的,但是如果您希望对这些页面建立索引,那将是不理想的。

抓取可以找到您所有的重要内容吗?

现在,您已经知道了确保搜索引擎抓取工具远离您不重要的内容的一些策略,下面让我们了解可以帮助Googlebot查找重要页面的优化方法。

有时,搜索引擎将能够通过爬虫找到网站的一部分,但是由于某些原因,其他页面或部分可能会被遮盖。重要的是要确保搜索引擎能够发现您想要索引的所有内容,而不仅仅是您的首页。

问问你自己:能机器人爬行通过您的网站,而不是仅仅把它?

登上的门,代表可以爬网但不能爬网的站点。

您的内容是否隐藏在登录表单后面?

如果您要求用户在访问某些内容之前登录,填写表格或回答调查,搜索引擎将不会看到那些受保护的页面。抓取绝对不会登录。

您依靠搜索表单吗?

机器人无法使用搜索表单。有些人认为,如果他们在自己的网站上放置搜索框,则搜索引擎将能够找到其访客搜索的所有内容。

文字是否隐藏在非文字内容中?

非文本媒体形式(图像,视频,GIF等)不应用于显示希望被索引的文本。尽管搜索引擎在识别图像方面变得越来越好,但并不能保证它们现在仍能够阅读和理解图像。始终最好在网页的<HTML>标签内添加文本。

搜索引擎可以跟随您的网站导航吗?

就像爬虫需要通过其他站点的链接来发现您的站点一样,它也需要您自己站点上的链接路径来引导页面之间的链接。如果您有要搜索引擎查找的页面,但未从任何其他页面链接到该页面,则该页面和不可见页面一样好。许多网站都犯了严重的错误,即以搜索引擎无法访问的方式来构建导航结构,从而阻碍了其在搜索结果中列出的功能。

爬网程序如何找到链接到的页面的描述,而网站导航中未链接到的页面则以孤岛形式存在,无法发现。

可能导致爬虫程序无法看到您所有站点的常见导航错误:

  • 移动导航显示的结果与桌面导航不同
  • 菜单项不在HTML中的任何类型的导航,例如启用JavaScript的导航。Google在抓取和理解Javascript方面已经变得更好,但是它仍然不是一个完美的过程。确保某些东西被Google发现,理解和索引的更可靠方法是将其放入HTML中。
  • 个性化设置,或显示与特定类型的访问者(相对于其他类型的访问者)的唯一导航,似乎在掩饰搜索引擎爬虫
  • 忘记通过导航链接到您网站上的主页-记住,链接是爬虫遵循的进入新页面的路径!

这就是为什么网站必须具有清晰的导航和有用的URL文件夹结构至关重要的原因。

您有干净的信息架构吗?

信息体系结构是对网站上的内容进行组织和标签以提高用户的效率和可发现性的一种做法。最好的信息体系结构是直观的,这意味着用户不必费劲就可以浏览您的网站或查找某些东西。

您是否在使用站点地图?

站点地图就是它的外观:爬虫程序可用来发现您的内容并为其编制索引的站点上的URL列表。确保Google查找优先级最高的页面的最简单方法之一是创建符合Google标准的文件,然后通过Google Search Console提交文件。虽然提交站点地图并不能代替对站点进行良好导航的需求,但它肯定可以帮助爬虫程序遵循通往所有重要页面的路径。

确保仅包含要由搜索引擎索引的URL,并确保为抓取提供一致的方向。例如,如果您已通过robots.txt阻止了该网址,则不要在您的站点地图中包含该网址,或者在您的站点地图中包含重复的网址,而不是首选的规范版本的网址(我们将在本章中提供有关规范化的更多信息5!)。

了解有关XML网站地图的更多信息

如果您的网站没有其他链接到该网站,则仍可以通过在Google Search Console中提交XML网站地图来对其进行索引。不能保证他们将在索引中包含一个提交的URL,但是值得一试!

抓取在尝试访问您的URL时是否出错?

在抓取您网站上的URL的过程中,抓取可能会遇到错误。您可以转到Google Search Console的“抓取错误”报告,以检测可能发生此错误的网址-该报告将向您显示服务器错误和未发现的错误。服务器日志文件还可以向您显示此信息,以及其他信息(例如抓取频率)的宝库,但是由于访问和剖析服务器日志文件是一种更高级的策略,因此我们不会在“初学者指南”中详细讨论它,尽管您可以在此处了解更多信息。

在使用抓取错误报告进行有意义的任何操作之前,了解服务器错误和“未找到”错误很重要。

4xx代码:当搜索引擎抓取由于客户端错误而无法访问您的内容时

4xx错误是客户端错误,这意味着请求的URL包含错误的语法或无法实现。最常见的4xx错误之一是“ 404 –未找到”错误。这些可能是由于URL链接错误,页面删除或重定向中断而引起的,仅举几个例子。当搜索引擎点击404时,它们将无法访问该URL。当用户点击404时,他们会感到沮丧并离开。

5xx代码:当搜索引擎抓取由于服务器错误而无法访问您的内容时

5xx错误是服务器错误,这意味着网页所在的服务器无法满足搜索者或搜索引擎访问该页面的请求。在Google Search Console的“抓取错误”报告中,有一个专门针对这些错误的标签。这些通常是由于对URL的请求超时而导致的,因此Googlebot放弃了该请求。查看Google的文档,以了解有关解决服务器连接问题的更多信息。

值得庆幸的是,有一种方法可以告知搜索者和搜索引擎您的页面已移动-301(永久)重定向。

创建自定义404页面!

通过添加指向站点上重要页面的链接,站点搜索功能甚至联系信息来自定义404页面。这样可以减少访问者在遇到404时从您的网站反弹的可能性。

了解有关自定义404页面的更多信息

将页面重定向到另一页面的描述。

 

假设您将页面从example.com/young-dogs/移至example.com/puppies/。搜索引擎和用户需要一个桥梁,以从旧的URL过渡到新的URL。该网桥是301重定向。

当您实施301时:

当您未实现301时:

链接权重 将链接权重从页面的旧位置转移到新URL。 如果没有301,则来自先前URL的权限不会传递到URL的新版本。
索引编制 帮助Google查找页面的新版本并为其建立索引。 仅在您的网站上出现404错误并不会损害搜索性能,但是让排名/被投放的页面404可能会导致它们不在索引之列,排名和访问量随之而来-!
用户体验 确保用户找到他们要查找的页面。 允许访问者单击无效链接会将他们带到错误页面,而不是预期的页面,这可能会令人沮丧。

301状态代码本身意味着该页面已永久移动到新位置,因此请避免将URL重定向到不相关的页面-旧URL内容实际上不存在的URL。如果页面正在为查询排名,而您将其301链接到具有不同内容的URL,则该页面的排名可能会下降,因为与该特定查询相关的内容不再存在。301很强大-负责任地移动URL!

您还可以选择302重定向页面,但这应该保留给临时移动,以及在传递链接净值并不是一件大事的情况下。302有点像绕道而行。您暂时通过某条路线吸引流量,但不会永远这样。

注意重定向链!

如果Googlebot必须进行多次重定向,可能很难到达您的页面。Google称这些为“重定向链”,他们建议尽可能限制它们。如果将example.com/1重定向到example.com/2,然后再决定将其重定向到example.com/3,则最好消除中间链接,只需将example.com/1重定向到example.com/3。

了解有关重定向链的更多信息

一旦确定您的网站针对爬虫能力进行了优化,接下来的工作就是确保可以对其进行索引。

索引:搜索引擎如何解释和存储您的页面?

确保对网站进行爬虫后,下一个工作就是要确保它可以被索引。没错-仅仅因为您的网站可以被搜索引擎发现和爬虫,并不一定意味着它将存储在其索引中。在上一节中,我们讨论了搜索引擎如何发现您的网页。索引是您发现的页面的存储位置。抓取找到页面后,搜索引擎便像浏览器一样呈现它。在此过程中,搜索引擎将分析该页面的内容。所有这些信息都存储在其索引中。

机器人将书存储在图书馆中。

继续阅读以了解索引的工作原理,以及如何确保您的站点将其纳入这个至关重要的数据库。

我可以看到Googlebot抓取如何看到我的页面吗?

是的,页面的缓存版本将反映Googlebot上一次对其进行爬虫的快照。

Google会以不同的频率抓取和缓存网页。更成熟,知名网站经常发表像https://www.nytimes.com将比备受不太知名网站罗杰的Mozbot的身边喧嚣,更频繁地抓取http://www.rogerlovescupcakes.com(如果它是真实的……)

您可以通过单击SERP中URL旁边的下拉箭头并选择“已缓存”来查看页面的已缓存版本的外观:

SERP中可在何处查看缓存结果的屏幕截图。

您还可以查看网站的纯文本版本,以确定是否有效地检索和缓存了重要内容。

页面是否曾经从索引中删除?

是的,可以从索引中删除页面!可能会删除网址的一些主要原因包括:

  • URL返回“找不到”错误(4XX)或服务器错误(5XX)–这可能是偶然的(页面已移动且未设置301重定向)或故意的(页面被删除并进行了404处理,以便将其从索引中删除)
  • 网址中添加了noindex元标签-网站所有者可以添加此标签,以指示搜索引擎从其索引中省略该页面。
  • 该网址已因违反搜索引擎的网站站长指南而受到了人工惩罚,因此已从索引中删除。
  • 已阻止访问该URL,并添加了访问者访问该页面之前所需的密码。

如果您认为不再显示以前在Google索引中的网站页面,则可以使用URL Inspection工具来了解页面的状态,或者使用具有“请求索引”功能的Google抓取方式来向索引提交单个URL。(奖金:GSC的“获取”工具还具有“渲染”选项,可让您查看Google在解释您的网页时是否存在任何问题)。

告诉搜索引擎如何为您的网站建立索引

机器人元指令

元指令(或“元标签”)是您可以向搜索引擎提供的有关如何处理网页的说明。

您可以告诉搜索引擎抓取工具,例如“不要在搜索结果中将此页面编入索引”或“不要将任何链接权重传递给任何页面上的链接”。这些指令是通过HTML页面<head>中的Robots Meta标签(最常用)或HTTP标头中的X-Robots-Tag执行的。

机器人元标签

可以在网页HTML的<head>中使用robots元标签。它可以排除所有或特定的搜索引擎。以下是最常见的meta指令,以及可能在哪些情况下应用它们。

index / noindex告诉引擎是否应该对页面进行爬虫并将其保留在搜索引擎的索引中以进行检索。如果您选择使用“ noindex”,则表示您正在与抓取进行通讯,希望该页面从搜索结果中排除。默认情况下,搜索引擎假定它们可以索引所有页面,因此不需要使用“ index”值。

  • 何时使用:如果您试图从Google网站索引中剪裁薄页(例如:用户生成的个人资料页),但仍希望访问者可以访问,则可以选择将页面标签为“ noindex”。

follow / nofollow告诉搜索引擎页面上的链接是应该跟随还是不被跟随。“关注”会导致漫游器跟踪您页面上的链接,并将链接所有权传递给这些URL。或者,如果您选择使用“ nofollow”,则搜索引擎将不会跟踪或将任何链接权重传递给页面上的链接。默认情况下,假定所有页面都具有“跟随”属性。

  • 何时使用:当试图阻止页面被索引以及阻止抓取跟踪页面上的链接时,nofollow通常与noindex一起使用。

noarchive用于限制搜索引擎保存页面的缓存副本。默认情况下,引擎将维护已索引的所有页面的可见副本,搜索者可以通过搜索结果中的缓存链接来访问它们。

  • 何时使用:如果您经营一个电子商务网站并且价格定期变化,则可以考虑使用noarchive标签,以防止搜索者看到过时的价格。

下面是meta的一个noindex,nofollow标签的示例:

<!DOCTYPE html> <html> <head> <元名称=“ robots” content =“ noindex,nofollow” /> </ head> <body> … </ body> </ html>

本示例将所有搜索引擎排除在对页面编制索引以及跟踪任何页面上链接之外。如果您要排除多个抓取工具(例如googlebot和bing),则可以使用多个机器人排除标签。

元指令会影响索引编制,而不是爬虫

Googlebot需要抓取您的页面才能看到其meta指令,因此,如果您试图阻止抓取工具访问某些页面,那么meta指令就无法做到这一点。必须抓取漫游器标签,以使其受到尊重。

Xrobots标签

x-robots标签用于URL的HTTP标头中,如果您想大规模阻止搜索引擎,则比meta标签提供更多的灵活性和功能,因为您可以使用正则表达式,阻止非HTML文件并应用站点范围内的noindex标签。

例如,您可以轻松排除整个文件夹或文件类型(例如moz.com/no-bake/old-recipes-to-noindex):

<Files〜“ /?no -bake /.*”>标头设置X-Robots-Tag“ noindex,nofollow” </ Files>

机器人元标签中使用的派生词也可以在X-Robots-Tag中使用。

或特定的文件类型(如PDF):

<Files〜“ .pdf $”>标头设置X-Robots-Tag“ noindex,nofollow” </ Files>

有关Meta Robot标签的详细信息,请浏览Google的Robot Meta Tag规范。

WordPress提示:

在控制台>设置>阅读中,确保未选中“搜索引擎可见性”框。这会阻止搜索引擎通过robots.txt文件进入您的网站!

了解影响爬虫和索引的不同方法将有助于您避免可能导致无法找到重要页面的常见陷阱。

排名:搜索引擎如何对URL进行排名?

搜索引擎如何确保当有人在搜索栏中键入查询时得到相应的结果呢?该过程称为排名,即搜索结果的排序,从最相关到与特定查询的最不相关。

对排名的一种艺术诠释,三只狗漂亮地坐在第一,第二和第三名的基座上。

为了确定相关性,搜索引擎使用算法,过程或公式,通过该过程或公式以有意义的方式检索和排序存储的信息。这些年来,这些算法经历了许多变化,以提高搜索结果的质量。例如,Google每天都会进行算法调整-其中一些更新是次要的质量调整,而其他一些则是为解决特定问题而部署的核心/广泛算法更新,例如Penguin则用于解决链接垃圾邮件。查看我们的Google算法更改历史记录,以获取可追溯到2000年的已确认和未确认的Google更新列表。

为什么算法如此频繁地更改?Google只是想让我们保持警惕吗?尽管Google并不总是透露他们为什么要做的细节,但我们确实知道Google进行算法调整时的目的是提高整体搜索质量。因此,在回应算法更新问题时,Google会回答以下问题:“我们一直在进行质量更新。” 这表明,如果您的网站在算法调整后遭受损失,请将其与Google的质量指南或搜索质量评估者指南进行比较,这两个方面都可以很好地说明搜索引擎的需求。

搜索引擎想要什么?

搜索引擎一直希望有同样的事情:以最有用的格式为搜索者的问题提供有用的答案。如果是这样,那么为什么现在看来SEO与过去不同?

从学习新语言的人的角度考虑。

最初,他们对语言的理解非常初级-“请参见Spot Run”。随着时间的流逝,他们的理解开始加深,他们学习语义-语言背后的含义以及单词和短语之间的关系。最终,通过足够的练习,学生将非常了解该语言,甚至可以理解细微差别,并且能够为模糊或不完整的问题提供答案。

当搜索引擎刚刚开始学习我们的语言时,通过使用实际上违反质量准则的技巧和策略来对系统进行游戏要容易得多。以关键字填充为例。如果您想为诸如“有趣的笑话”之类的特定关键字进行排名,则可以在页面上多次添加“有趣的笑话”一词,并将其加粗,以期提高该词的排名:

欢迎来到有趣的笑话!我们讲世界上最有趣的笑话。有趣的笑话是乐趣和疯狂。您有趣的笑话在等待。坐下来阅读有趣的笑话,因为有趣的笑话可以使您快乐和有趣。一些有趣的喜欢的有趣笑话。

这种策略带来了可怕的用户体验,而不是嘲笑有趣的笑话,而是使人烦恼,难以阅读的文本轰炸了人们。它可能在过去曾奏效,但这从来不是搜索引擎想要的。

链接在SEO中扮演的角色

当我们谈论链接时,我们可能意味着两件事。反向链接或“入站链接”是来自其他网站的指向您的网站的链接,而内部链接是您自己的网站上指向您其他页面(在同一网站上)的链接。

描述入站链接和内部链接的工作方式。

链接在SEO中一直扮演着重要角色。早期,搜索引擎需要帮助来确定哪些URL比其他URL更值得信赖,以帮助他们确定如何对搜索结果进行排名。计算指向任何给定站点的链接数量有助于他们做到这一点。

反向链接的工作方式与真实的WoM(口碑)推介非常相似。让我们以一个假设的咖啡店“珍妮咖啡”为例:

  • 来自他人的推荐=权威的好兆头
    • 示例:许多人都告诉过您,詹妮的咖啡是镇上最好的
  • 来自您自己的推荐=有偏见,因此不是权威的好兆头
    • 示例:珍妮声称珍妮的咖啡是镇上最好的
  • 来自不相关或低质量来源的引荐=权威性不好,甚至可能使您被标签为垃圾邮件
    • 示例:珍妮(Jenny)付钱让从未去过她的咖啡店的人告诉其他人咖啡店有多好。
  • 没有推荐=权限不明确
    • 示例:“珍妮的咖啡”可能不错,但是您找不到任何有意见的人,因此无法确定。

这就是创建PageRank的原因。PageRank(Google核心算法的一部分)是一种链接分析算法,以Google的创始人之一拉里·佩奇(Larry Page)命名。PageRank通过测量指向网页的链接的质量和数量来估计网页的重要性。假定网页越相关,重要和值得信赖,它将获得的链接越多。

您从高权限(可信)网站获得的自然反向链接越多,您在搜索结果中的排名就越高的几率就越大。

内容在SEO中扮演的角色

如果链接没有将搜索者引向某些内容,则没有任何意义。那东西很满足!内容不只是言语;它是供搜索者使用的所有内容-视频内容,图像内容,当然还有文本。如果搜索引擎是应答机,则内容就是这些引擎传递这些答案的方式。

每当有人进行搜索时,就会有成千上万种可能的结果,那么搜索引擎如何确定搜索者将在哪些页面中找到有价值的信息?确定页面对给定查询的排名的很大一部分是页面上的内容与查询意图的匹配程度。换句话说,此页面是否与搜索到的单词匹配并有助于完成搜索者试图完成的任务?

由于关注用户满意度和任务完成度,因此对于内容应持续多长时间,内容应包含关键字多少次或标题标签中的内容,没有严格的基准。所有这些因素都可以影响页面在搜索中的效果,但是重点应该放在将要阅读内容的用户上。

如今,排名排名前三的信号已经成百上千,甚至保持一致:指向您网站的链接(用作第三方信誉信号),页面内容(符合搜索者意图的高质量内容)以及RankBrain。

什么是RankBrain?

RankBrain是Google核心算法的机器学习组件。机器学习是一种计算机程序,它会随着时间的推移不断通过新的观察结果和训练数据来改善其预测。换句话说,它一直在学习,并且因为它一直在学习,所以搜索结果应该不断改进。

例如,如果RankBrain注意到排名较低的URL为用户提供的结果要比排名较高的URL更好,那么您可以押注RankBrain将调整这些结果,将相关性更高的结果移至较高的位置,并将相关性较低的页面降级为副产品。

该图显示了结果如何变化,并且具有足够的波动性,甚至可以在数小时后显示不同的排名。

就像搜索引擎中的大多数内容一样,我们并不确切知道RankBrain的组成部分,但显然Google的人们也不知道。

这对SEO意味着什么?

由于Google将继续利用RankBrain来推广最相关,有用的内容,因此我们需要比以往任何时候都更加专注于实现搜索者的意图。为可能登陆您页面的搜索者提供最佳信息和最佳体验,并且您已经迈出了迈出第一步的重要一步,以使其在RankBrain世界中表现出色。

参与度指标:相关性,因果关系,或两者兼而有之?

在Google排名中,参与度指标很可能是相关性和因果关系。

当我们说参与度指标时,是指代表搜索者如何通过搜索结果与您的网站进行互动的数据。这包括以下内容:

  • 点击次数(通过搜索访问)
  • 页面停留时间(访问者离开页面之前在页面上花费的时间)
  • 跳出率(用户仅浏览一页的所有网站会话的百分比)
  • Pogo-sticking(单击自然结果,然后快速返回到SERP以选择另一个结果)

包括Moz自己的排名因素调查在内的许多测试都表明,参与度指标与更高的排名相关,但因果关系一直受到激烈争论。良好的参与度指标是否仅表明排名较高的网站?还是因为网站拥有良好的参与度指标而使其排名很高?

Google说了什么

尽管他们从未使用过“直接排名信号”一词,但Google明确表示,他们绝对使用点击数据来修改特定查询的SERP。

根据Google前搜索质量总监 Udi Manber的说法:

“排名本身受到点击数据的影响。如果我们发现,对于特定查询,80%的人单击#2,而只有10%的人单击#1,过一会儿,我们就会发现#2是人们想要的,因此我们将其切换。”

前Google工程师Edmond Lau的另一条评论证实了这一点:

“很明显,任何合理的搜索引擎都会使用自己结果上的点击数据来反馈到排名中,从而提高搜索结果的质量。如何使用点击数据的实际机制通常是专有的,但Google显然可以将点击数据和其专利一起使用在经过排名调整的内容项等系统上。”

由于Google需要维持和改善搜索质量,因此参与度指标不仅仅是相关性,这似乎是不可避免的,但是Google似乎并没有将参与度指标称为“排名信号”,因为这些指标用于提高搜索质量,并且各个URL的排名只是其副产品。

哪些测试已确认

各种测试已证实Google会根据搜索者的参与度来调整SERP顺序:

  • 兰德·菲什金(Rand Fishkin)在2014年的测试中,大约200人点击了SERP上的URL,结果将第七名提升至第一名。有趣的是,排名改善似乎与访问该链接的人的位置无关。在许多参与者所在的美国,排名飙升,而在谷歌加拿大,谷歌澳大利亚等页面上,排名仍然较低。
  • 拉里·金(Larry Kim)对RankBrain前后的首页及其平均停留时间的比较似乎表明,谷歌算法的机器学习组件降低了人们花费时间不多的网页的排名。
  • Darren Shaw的测试表明用户行为也对本地搜索和地图包结果产生了影响。

由于用户参与度指标显然用于调整SERP的质量,并将排名变化作为副产品进行排名,因此可以肯定地说SEO应该针对参与度进行优化。参与度不会改变网页的客观质量,而是相对于该查询的其他结果,您对搜索者的价值。这就是为什么在您的网页或其反向链接没有变化之后,如果搜索者的行为表明他们更喜欢其他网页,则排名可能会下降。

在对网页进行排名方面,参与度指标就像事实检查者一样。诸如链接和内容之类的客观因素会首先对页面进行排名,然后,如果互动指标不正确,参与度指标就可以帮助Google进行调整。

搜索结果的演变

早在搜索引擎缺乏今天所具有的复杂性时,“ 10个蓝色链接”一词就被用来描述SERP的扁平结构。每次执行搜索时,Google都会返回一个包含10个自然结果的页面,每个结果都采用相同的格式。

10蓝链接SERP的屏幕快照。

在这个搜索环境中,排名第一的是SEO的圣杯。但是随后发生了一些事情。Google开始在搜索结果页面上以新格式添加结果,称为SERP功能。这些SERP功能包括:

  • 付费广告
  • 精选片段
  • 人们还问箱子
  • 本地(地图)包
  • 知识面板
  • 网站连结

Google一直在增加新的。他们甚至进行了“零结果SERP”实验,该现象是SERP上仅显示了知识图的一个结果,而没有下面的结果,只是“查看更多结果”的选项。

这些功能的添加引起一些最初的恐慌,主要有两个原因。一方面,许多功能导致有机结果在SERP上进一步下降。另一个副产品是,由于在SERP本身上回答了更多查询,因此较少的搜索者点击了自然搜索结果。

那么,为什么Google会这样做?这一切都可以追溯到搜索体验。用户行为表明,不同的内容格式可以更好地满足某些查询。请注意,不同类型的SERP功能如何与不同类型的查询意图匹配。

查询意图

可能触发的SERP功能

信息性 精选片段
信息一答案 知识图/即时答案
本地 地图包
交易性 购物

我们将在第3章中更多地讨论意图,但是到目前为止,重要的是要知道答案可以以多种格式传递给搜索者,并且内容的结构会影响其出现在搜索中的格式。

本地化搜索

像Google这样的搜索引擎拥有自己的本地商户列表专有索引,它可以从中创建本地搜索结果。

如果您要为有客户可以访问的实际位置的公司(例如牙医)或旅行去拜访客户的公司(例如水管工)执行本地SEO工作,请确保您声明,验证并优化了免费的Google我的商家信息。

对于本地化的搜索结果,Google使用三个主要因素来确定排名:

  1. 关联
  2. 距离
  3. 突出性

关联

相关性是本地企业与搜索者所寻找的匹配程度。为确保企业正在尽其所能与搜索者相关,请确保企业的信息被完整,准确地填写。

距离

Google使用您的地理位置来更好地为您提供本地搜索结果。本地搜索结果对邻近度极为敏感,邻近度指的是搜索者的位置和/或查询中指定的位置(如果搜索者包括一个)。

随机搜索结果对搜索者的位置敏感,尽管很少像本地搜索结果那样明显。

突出性

谷歌希望通过突出表现来奖励在现实世界中知名的企业。除了企业的离线影响力外,Google还利用一些在线因素来确定本地排名,例如:

评论

本地企业收到的Google评论数量以及这些评论的情绪对其在本地结果中排名的能力产生了显着影响。

引文

“企业引文”或“企业列表”是基于Web的对本地化平台(Yelp,Acxiom,YP,Infogroup,Localeze等)上的本地企业“ NAP”(名称,地址,电话号码)的引用。 。

本地排名受本地业务引用数量和一致性的影响。Google会从各种各样的来源中获取数据,以不断完善其本地业务指数。当Google找到对公司名称,位置和电话号码的多个一致引用时,它将加强Google对数据有效性的“信任”。然后,这使Google能够以更高的信心展示业务。Google还使用来自网络上其他来源的信息,例如链接和文章。

有机排名

SEO最佳做法也适用于本地SEO,因为Google在确定本地排名时还会考虑网站在自然搜索结果中的位置。

在下一章中,您将学习页面上的最佳做法,这些最佳做法将帮助Google和用户更好地理解您的内容。

[奖金!]本地参与

尽管Google并未将其列为本地排名因素,但随着时间的推移,参与的作用只会增加。Google不断整合现实世界的数据,例如热门访问时间和平均访问时间,从而丰富了本地搜索结果。

对某些本地企业的引用准确性感到好奇吗?Moz有一个免费的工具可以为您提供帮助,该工具的名称恰恰是Check Listing。

检查清单准确性

“热门访问时间”的屏幕截图可进行本地搜索。

…甚至使搜索者可以提出业务问题!

“问题与答案”的屏幕截图可进行本地搜索。

毫无疑问,现在,本地结果正受到现实世界数据的影响。这种互动性是搜索者与本地企业互动和做出反应的方式,而不是纯粹的静态(可玩游戏的)信息(如链接和引文)。

由于Google希望向搜索者提供最佳,最相关的本地业务,因此使用实时参与度指标来确定质量和相关性对他们来说是很有意义的。

您不必了解Google的算法的来龙去脉(这仍然是个谜!),但是到目前为止,您应该对搜索引擎如何查找,解释,存储和排名内容具有很高的基础知识。有了这些知识,让我们学习如何选择内容将在第3章(关键字研究)中定位的关键字!

[原创文章] 发布者:adimn,转载抄袭请注明本站链接:http://www.spsa.cn/1984.html

发表评论

登录后才能评论

评论列表(1条)

联系我们

15289893167

在线咨询:点击这里给我发消息
工作时间:周一至周日,9:30-18:30,节假休息

QR code