百度搜索引擎优化指南2.0
搜索引擎只是网站上的普通访问者。爬取网站的方式和网站/页面的价值判断也是从用户的角度出发的。任何对用户体验的改进都是对搜索引擎的改进。针对搜索引擎进行优化也会使用户受益。
搜索引擎的网站建设主要分为三个部分:如何更好的让搜索引擎收录网站的内容,如何在搜索引擎中获得好的排名,如何让用户从众多的搜索结果中点击你的网站. . 简单来说就是收集、整理、展示。下面我们将分别介绍这三个方面。
良好的包容性
机器可读
百度通过一个名为的程序抓取互联网上的网页,并将其处理成索引。目前只能读取文本内容,暂时无法处理flash、图片等非文本内容。放在flash和图片中的文字百度无法识别。
建议使用文字代替flash、图片等来展示重要的内容或链接。搜索引擎暂时无法识别Flash、图片等中的内容,无法搜索到这部分内容;只有链接指向的页面才会包含在flash中,百度可能不会被收录。
我们建议:
• 使用文本而不是 Flash、图像等来显示重要的内容或链接
• 如果必须使用Flash创建网页,建议同时创建文本版本供搜索引擎收录,并在首页使用文本链接指向文本版本
•Ajax等不被搜索引擎识别的技术,只用在需要用户交互的地方,而你希望搜索引擎“看到”的导航和文字内容没有放在Ajax中
• 不要使用框架和框架结构,通过显示器显示的内容可能会被百度丢弃
在上面的例子中,虽然网页提供了很多信息,但由于信息都在flash中,搜索引擎无法提取出来。对于搜索引擎来说,这个网页没有内容。
网站结构
网站应该有清晰的结构和清晰的导航,可以帮助用户快速从你的网站中找到他们需要的内容,也可以帮助搜索引擎快速了解网站每个页面的结构层次。
网站结构推荐使用树形结构,通常分为以下三个层次:首页-频道-文章页。就像一棵大树,先是树干(主页),然后是树枝(频道),最后是叶子(正常内容页面)。树形结构更具扩展性,当网站内容增加时,通过细分分支(渠道)可以轻松应对。
理想的网站结构应该是扁平的,从首页到内容页的层数尽可能少,这样搜索引擎处理起来会更容易。
同时,网站也应该是网状结构,网站上的每个页面都应该有上下页面和相关内容的链接:首页有链接到频道页,频道页有链接到首页页面和普通内容页面,普通内容页面有上级频道和首页的链接,内容相关的页面有相互链接。
网站上的每个页面都应该是网站结构的一部分,并且应该由其他页面链接到。
综上所述,一个合理的网站结构应该是扁平的树状网络结构。我们建议:
• 确保至少有一个文本链接可以访问每一页。
• 重要的内容应该可以从主页或站点结构中的较浅级别访问。
• 对网站内容进行合理分类,不要过度细分。
网站应该有简洁明了的导航,可以让用户快速找到自己需要的内容,也有助于搜索引擎更好地理解网站的结构。我们建议:
•在每个页面添加导航栏,方便用户返回频道和网站首页,也让搜索引擎轻松定位网页在网络结构中的层次。
通过面包屑导航,用户可以清楚的知道自己的页面在整个网站中的位置,返回之前的频道或者首页也很方便。
• 对于内容较多的网站,建议使用面包屑导航,更便于用户了解自己当前所在的位置:网站首页>频道>当前浏览页面
• 在导航中使用文本链接,无需复杂的 js 或 flash
• 在使用图片进行导航时,可以使用Alt 进行注释,并使用Alt 告诉搜索引擎网页的内容指向什么
子域和目录选择
选择使用子域或目录来合理分发网站内容,将对您的网站在搜索引擎中的表现产生更大的影响。
我们建议:
• 在频道内容不够丰富而不能作为独立站点存在之前,使用目录形式;等待频道积累足够的内容,然后将其转换为子域的形式
一个网页能否排在搜索结果的前面,“出处”很重要,如果来自一个网站权重高的网站,排在前面的可能性就更大,反之亦然。通常主站点的权重最高,子站点会从主站点继承一部分权重。继承量取决于子站点的质量。
在内容丰富到可以作为独立站点使用之前,通过将内容放在主站点的下一个目录中,可以在搜索引擎中获得更好的性能。
• 对于差异度大、相关性低的内容,采用子站点的形式
搜索引擎将识别网站的主题。如果网站中的内容相关性不高,可能会导致搜索引擎的错误识别。不高度相关的内容,放在不同的子域下,可以帮助搜索引擎更好地理解网站的主题
• 做好域间内容的权限,相互隔离,域下的内容无法通过
子域之间的内容可以相互访问,并且可能被搜索引擎作为重复内容进行去重。保留的 url 不一定在普通域名下。
• 不要滥用子域
滥用大量内容不丰富的子域,会被搜索引擎视为作弊处罚。
规范的简单 URL
创建一个描述性强、标准化、简单的url,有利于用户更方便地记忆和判断网页内容,也有利于搜索引擎更有效地抓取你的网站。在网站设计之初,就应该有一个合理的URL规划。
我们建议:
• 如果网站的同一页面,只对应一个url
如果一个网站上的多个 URL 可以访问相同的内容,则存在以下危险:
1、搜索引擎会选择一个url作为标准,可能和正版不一样
2、用户可能会推荐同一个网页的不同url,多种url形式分散了网页的权重
如果您的网站已经有多个URL表单,建议按如下方式处理:
1、在系统中只使用正常形式的url,防止用户访问异常形式的url
2、不要在url中放统计代码等不必要的内容
3、不同形式的url,301永久跳转到普通形式
4、启用备用域名防止用户输入错误,301永久重定向到主域名
5、使用 .txt 禁止抓取您不想显示给用户的表单
• 允许用户从url判断网页内容和网站结构信息,并预测他们将看到的内容
以百度空间为例,在url结构中添加用户id信息。当用户看到空间的url时,他可以很容易地判断它是谁的空间。url结构还添加了博客、相册等内容信息。用户可以通过url判断要查看的内容是博客还是相册。
• 使 URL 尽可能短。长 URL 不仅不美观,而且用户也难以从中获取额外的有用信息。另一方面,短网址还可以帮助减小页面大小,加快页面打开速度,改善用户体验。
例子中的第一个url会劝阻用户,第二个url搜索引擎优化,用户很容易判断是贴吧里的百度。
• 普通动态网址对搜索引擎没有影响。url是动态的还是静态的对搜索引擎没有影响,但是建议尽量减少动态url中包含的可变参数,这样不仅有利于减少url的长度,还可以降低搜索的风险引擎掉进黑洞
• 不要添加系统无法自动识别的字符作为 url 的一部分
在上面的示例中,诸如“;”之类的字符 和 "," 被添加到 url。当用户通过论坛、即时通讯工具等渠道推荐这些网址时,无法自动识别为链接,增加了用户访问这些网页的难度。
• 使用百度提供的 URL 优化工具查看
百度站长平台提供了网址优化工具,可以帮助检查网址对搜索引擎的友好度,并提出修改建议。
使用站长工具
互联网变得越来越庞大和复杂。为了更好地处理互联网上的信息,百度为站长提供了一些工具。合理使用这些站长工具可以达到事半功倍的效果。
•百度站长平台:
登录以获得更多帮助。
•:
百度站长平台支持网站内容的提交。通过让百度更全面、更快速地发现链接,使索引更高效。
•平:
Ping 是一种博客内容的提交方式,实时通知搜索引擎博客上的新内容。目前所有主流博客程序都支持ping。只需将百度的ping服务地址添加到博客后台并启用ping功能即可。
• 死链接删除:
百度站长平台通过向百度提交网站来支持死链接列表。一个网站的死链接太多,不仅影响用户的访问体验,也影响百度对网站质量的判断。通过死链接删除界面,百度可以更快更全面的找到网站死链接,从而有效删除。
注意:提交要删除的网址后,需要执行以下操作才能被百度有效删除:
1、使用.txt防止被爬取;
2、或者返回一个404状态码,表示当前页面不存在。
•网站管理员工具
- URL优化工具检查
百度站长平台提供了网址优化工具,可以帮助检查网址对搜索引擎的友好度,并提出修改建议。
- 网站安全检查
百度站长平台提供工具检测网站是否被黑,并提示站长帮助修改。
♦ 什么是“网站被黑”?
网站黑客攻击是指黑客利用网站程序和设置中的安全漏洞或管理员的安全疏忽(如密码复杂度低),在未经管理员授权的情况下篡改网站。
♦ 如何应对网站黑客攻击?
1、分析系统日志和服务器日志,查看自己站点的页数和流量是否有异常波动,是否有异常访问或操作日志;
2、检查网站文件是否被异常修改,尤其是首页等关键页面;
3、网站页面是否引用了未知站点的资源(图片、JS等),是否有异常链接到外部站点;
4、检查网站是否有异常添加文件或目录;
5、查看网站目录下是否有非管理员打包的网站源码、未知txt文件等。
♦ 如何防止网站被黑?
1、定期检查服务器日志等方法发现问题,检查非前端页面是否有可疑访问;
2、经常检查网站文件是否有异常修改或添加;
3、关注操作系统,以及您使用的程序的官方网站。及时下载补丁,修复安全漏洞;建议必要时直接更新到最新版本;
4、修改开源程序关键文件的默认文件名。作弊者通常使用程序自动扫描某些文件是否存在来判断是否使用了某个程序;
5、修改默认管理员用户名,提高管理后台的密码强度,使用字母、数字和特殊符号多种组合的密码;
6、关闭不必要的服务和端口;
7、关闭或限制不必要的上传;
8、设置防火墙等安全措施;
9、如果问题反复出现,建议重新安装服务器操作系统,重新上传备份网站文件;
10、对于缺乏专业维护人员的网站,建议咨询专业的安全公司;快速发现和处理被黑内容,做好防范黑客攻击,这体现了一个网站的运营水平。
以上几点只是初步参考。做好网站安全工作,需要站长和管理员的不断努力。
•百度搜索框提示功能
百度向站长免费开放“百度搜索框”代码和“百度搜索框提示”代码。
通过简单的设置,您可以快速将“百度搜索框(带提示功能)”功能添加到您的网页中。改善用户在网站上的搜索体验。
重新设计/更改域名
在互联网高速发展的情况下,网站改版、域名变更在所难免,但处理不当会造成较大的流量损失。重新设计或更改域名时需要考虑的第一点是如何确保老用户不流失。当用户访问旧内容时,可以将用户引导至新网站上的相应内容,从而避免用户无法访问之前收藏的网页的情况。
我们建议在重新设计或更改域名时将旧网页301永久重定向到内容对应的新网页,以便百度更容易检测到这种变化,并快速将旧网页的累积权重转移到相应的新网页。
其他建议:
• 除非必要搜索引擎优化,否则不要完全更换整个站点
当网站改版或网站内重要页面链接发生变化时,应将改版前的301页面永久重定向到改版后的相应页面
• 如果网站更换域名,旧域名的所有页面都应该永久重定向301到新域名的相应页面
更换网站域名后,尽量保持旧域名稳定,让用户有更多时间记忆新域名
• 网站修改/更改域名后,请将新的URL/新域名下的URL提交给百度,帮助百度更快的发现和调整。
合理的返回码
百度爬虫在爬取处理时,会根据http协议规范设置相应的逻辑,所以请参考http协议中返回码含义的定义进行设置。
百度对常用http返回码的处理逻辑如下:
• 404
404返回码的意思是“”。百度会认为该网页已经失效,所以一般会从搜索结果中删除,短期内如果再次找到该url也不会被抓取。
• 503
503返回码的意思是“”,百度会认为该网页暂时无法访问,这通常发生在网站暂时关闭,带宽受限时。对于返回503的网页,百度不会直接删除这个url,短期内会再次访问。届时,如果网页已经恢复,则正常爬取;如果继续返回503,短时间内会被多次访问。但如果网页长时间返回503,该url仍会被百度视为无效链接,从搜索结果中删除。
• 403
403返回码的意思是“”,百度会认为该网页目前被禁止访问。在这种情况下,如果是新发现的url,百度暂时不会爬取,短期内会再次查询;如果是已经被百度收录的url,目前不会直接删除,短期内会再次访问。届时,如果网页允许访问,则正常爬取;如果仍然不允许访问,则会在短时间内重复访问多次。但是如果网页长时间返回403,百度也会认为是无效链接,从搜索结果中删除。
• 301
301返回码的意思是“”,百度会认为网页当前正在跳转到新的url。遇到网站迁移、域名变更、网站改版等情况,建议使用301返回码,尽量减少改版带来的流量损失。虽然百度现在对301跳转的响应时间更长了,但还是推荐大家这样做。
我们建议:
• 如果网站暂时关闭,网页打不开时,不要立即返回404,建议使用503状态。503可以通知百度页面暂时不可用,请稍后再试。
• 如果百度对你的网站抓取压力太大,请尽量不要使用404,也建议返回503。这样百度会在一段时间后再次尝试抓取链接。如果那个时候站点是空闲的,就会爬取成功。
• 一些网站希望百度只收录一些内容,如审核后的内容、一段时间积累的新用户页面等。这种情况下,建议对新发布的内容暂时返回403,待审核或处理后再返回正常状态返回码。
• 网站迁移或域名变更时请使用301返回。
分类良好
涵盖页面主要内容的标题
网页标题用于告诉用户和搜索引擎该网页的主要内容是什么。当搜索引擎判断一个网页的内容权重时,标题是主要的参考信息之一。网页的标题是网页上主要内容的摘要。搜索引擎可以通过网页的标题快速确定网页的主题。每个网页的内容是不同的,每个网页都应该有一个唯一的标题。
我们建议页面标题描述如下:
•首页:网站名称或网站名称_服务介绍或产品介绍
• 频道页面:频道名称_网站名称
• 文章页面:文章频道名称_网站名称
title是指html文档中的标签,不是文章的标题,按如下形式放在html文档的标签中
推荐做法
• 每个网页都应该有一个唯一的标题,不要为所有页面使用默认标题
• 标题应明确主题并包含此页面上最重要的内容
• 简明扼要,不要列出与页面内容无关的信息
•用户从左到右浏览,重要内容应放在标题前面
• 用用户熟悉的语言描述。如果您有中英文网站名称,请尝试使用用户熟悉的名称作为标题描述
良好的内容建设
• 网站内容的建设主要是服务于网站的核心价值,提供给搜索引擎的内容也应该有助于网站的核心价值。内容建设要符合网站的主题。例如,如果你的网站是一个it新闻网站,你就不应该放一堆漂亮的图片。除了浪费服务器资源,也无助于网站的核心价值。看到漂亮图片的人,不会对它的新闻感兴趣。
对于一个sns网站来说,注册用户是它最重要的资源,也是它吸引新注册用户的主要依靠。搜索引擎名称搜索是潜在新用户的重要来源,它们提供了包含在搜索引擎中的注册用户名称资源。,可以引导搜索引擎用户进入其注册用户。
• 网站内容应以用户为导向。搜索引擎只是网站的普通访问者。提供满足用户需求的原创内容非常重要。
•编写锚文本
锚文本是指制作链接时使用的描述文本,用于告诉用户链接到网页的主题。锚文本描述越清晰,用户就越容易理解网页的内容。
用户通过指向其他网页的链接访问您的网页。这个链接的描述能否被用户理解,对于吸引用户访问非常重要。就像普通用户一样,当搜索引擎刚刚发现一个新的网页时,锚文本中对网页的描述是唯一的参考因素。
• 为图片添加替代标题
当图片在慢速网络上无法显示时,用户可以了解图片想要传达的信息,也可以让搜索引擎了解图片的内容。
• 资源丰富的内容可以以主题等更丰富的内容组织形式提供给用户,让用户以最低的成本获得所需的全部信息。
•Web2.0类网站应充分发挥自身优势,让用户通过投票、评论等方式自行判断资源质量,这些质量判断也可能被搜索引擎用来判断资源的价值。
某个视频站最受欢迎的视频质量很高。用户可以参考投票信息,降低筛选成本。
• 管理用户生成的内容产品,例如 web2.0。如果他们被作弊者利用,可能会影响整个网站的权重。
为您的网站赢得用户推荐
互联网上有许多提供相同内容和服务的网站。当内容相同时,哪个网站会排在搜索引擎的前面?决定性因素是推荐。我们常说的超链接就是推荐的超链接之一。
当你网站上的内容对用户有用时,用户就会向其他人推荐,推荐的形式可能多种多样:在即时通讯工具上发给你的朋友,在你的常用论坛转发和推荐,写博客非常郑重的介绍,推荐自己网站的链接等。这些推荐信息会被搜索引擎用来判断网页/网站的价值。适当地鼓励和引导用户推荐您的网站将极大地帮助您的网站在搜索引擎中的表现。
视频网站的分享和转发功能可以让用户更轻松地复制视频并分享给其他用户,大大降低了用户推荐网站内容的成本,用户也更愿意推荐。
很好的介绍
醒目的标题
当用户在百度网页搜索中搜索您的网页时,标题将作为最重要的内容显示在摘要中。一个主题明确的标题可以帮助用户更容易地从搜索结果中判断你网页上的内容是否满足他的需求。.
推荐做法:
• 标题应明确主题并包含此页面上最重要的内容
• 不要在文章页面的标题中添加过多的附加描述,这会分散用户的注意力
• 用用户熟悉的语言描述
•如果您的网站用户熟悉,建议在标题的适当位置列出网站名称,品牌效应会增加用户点击的概率
• 标题应该对用户有吸引力
• 让用户感到值得信赖
示例中的网页提供全国主要城市的天气预报服务。在第一个结果中,使用了百度地图的默认标题。用户在搜索结果中无法判断本网站提供的内容,也不会点击该结果。在第二个结果中,标题明确说明了提供的内容,更便于用户判断,选择这个结果的可能性比较高。
善用
它是网页内容的简明摘要。如果描述与网页内容相匹配,百度会将其作为摘要的选择对象之一。一个好的将帮助用户更容易地从搜索结果中判断你的网页内容是否满足他们的需求。它不是重量计算的参考因素。该标签的存在不影响网页的权重,仅作为搜索结果汇总的选择目标。
它是meta标签的一部分,位于html代码的区域
推荐做法:
• 网站首页、频道页、产品参数页等没有大段文字可以作为摘要的页面最适合使用
•准确描述页面,不要堆砌关键词
• 为每个页面创建不同的描述,避免对所有页面使用相同的描述
• 长度合理,但不能太长但不能太短
在示例中,第一个未应用,而第二个应用。可以看出,第一个结果的摘要对用户没有参考价值,而第二个结果的摘要更具可读性,可以让用户对网站有更多的了解。内容。
很多信息可咨询http://www.yoyi8.com