网站建立
域名注册
域名是网站的重要品牌印象。域名注册时应选择简单、易记、方便输入、贴近网站名称、能反映网站内容的域名。如fanli.qq.com、www.paipai.com。
域名一旦选定,不应随意变更;同一网站拥有多个域名应确定主要域名,并设置其他域名向主要域名跳转(301重定向)。
服务部署和网站上线
网站需要部署上线才能被用户访问。租用/购买安全可靠、高速稳定的服务器部署网站,是用户访问体验的有效保障,同时会影响搜索引擎爬虫的爬取。网站部署上线并进行域名解析后,即面向用户开发访问,同时也意味着向搜索引擎爬虫开放。
让搜索引擎发现网站
新建立的网站是互联网中的孤岛,搜索引擎也很难发现和收录它。在网站建立之初,可以将网站推荐给搜索引擎或者引导爬取收录。
1.向搜索引擎提交网站域名或入口。如向SOSO的提交新网站,http://www.soso.com/help/usb/urlsubmit.shtml;
2.建立外链,如创建友情链接、向导航网站申请收录等;
3.网站建立之初可重点经营内容列表页,在不影响用户体验的前提下,方便搜索引擎爬虫一次发现更多链接。
内容建设
树型扁平网状结构
层级分明的树型扁平网状结构是较理想的网站部署结构,每个页面与其父子页面有链接关联,可以帮助用户快速定位到感兴趣的频道、正文,也有利于搜索引擎理解网站结构层次和更好的爬取内容。
扁平的树型网状结构
1.明确区分出,网站首页、列表页/索引页/频道页、内容页,根据各个页面所在层级用链接相连,无孤岛页面;
2.层级、各层级分支内容不要过多,便于搜索引擎爬虫爬取;
3.内容和质量相似的页面组织在同一层级/目录中,便于搜索引擎进行聚合挖掘;
4.越重要的内容,越应放置于高层级位置,或在高层级页面中有链接直接可达;
5.在页面中建立导航链接、面包屑,便于用户和爬虫理解网站结构和在不同层级内容间跳转;
6.站点中新的内容应该尽量在深度较浅的列表页或首页发布入口,便于被搜索引擎爬虫快速发现。
腾讯网新闻频道,头条新闻放置于醒目位置
页面标题
页面标题是页面内容的重要标识,准确简洁的标题有助于用户快速识别页面内容。页面标题会被搜索引擎展现在搜索结果列表中,是用户通过搜索进入网站页面的重要入口。
1.标题内容在页面代码中被《title》标签包围,会被展现在搜索结果页、浏览器标题、页面标签、任务栏等位置,是用户识别/区分页面的重要依据;
2.标题内容是页面的最佳概括,应当主题明确,突出重点,内容不宜过长;
3.每个页面都应该拥有标题内容,避免不写标题,或无意义标题(如“无标题文档”、“网站建设中”);
4.避免不同页面使用相同标题(甚至全站公用相同标题);
5.不在标题内容中堆砌关键词,避免影响可读性和被判作弊;
6.“标题党”、“文不对题”对用户搜索体验和搜索引擎收录排序均有副作用,应坚决杜绝。
网页中的title标题书写
Meta信息
Meta信息中,keywords和description分别以关键词和概括摘要两种方式描述页面内容,会被搜索引擎特别关注。
1.keywords部分应填入最能表现页面内容的几个关键词,词与词之间以半角逗号间隔开;
2.description部分应填入一段介绍页面内容的文字,这段文字有可能被搜索引擎选取作为结果摘要。
3.网站首页、索引页、频道入口等无大篇幅页面正文的页面,应该尽可能提供description信息。
4.keywords和description信息缺失不会对排序权重产生直接影响;
5.在keywords和description信息中堆砌关键词作弊可能受到搜索引擎惩罚。
腾讯网的description信息:
腾讯网的description信息
腾讯网在网页搜索结果中的摘要展现:
腾讯网的搜索结果展示
链接 制定规范统一、简洁、可读的url,有利于搜索引擎的收录和排序,也会方便用户识别页面内容,记录和输入链接。 1.每个页面都应拥有其独一无二的正常态url: 2.网站内统一使用正常url,不出现异常url; 3.指向同一页面异常url,应跳统一跳转到正常url上; 4.必须带有参数的url需要精简参数个数和内容,对页面功能/展现无作用(如统计参数)的应尽量去除。 链接结构设计建议: 1.URL结构的设计应同时考虑用户和搜索引擎的需求,方便用户识别、记忆,并利于搜索引擎爬取和展现; 2..url应尽量短。较短的url会在搜索结果页完全展现,方便用户通过读取其以了解页面内容,也易于记忆和传播。搜索引擎本身不会对url进行限制,排序跟url长度无关; 3.url目录层级越少越好。层级过多的url设计可能对搜索引擎的爬取形成障碍,使得收录变少或不收录; 4.url中目录名、文件名应具有描述性,不使用无意义的名称; 5.url中尽量只使用小写字母或数字,特别注意不要使用特殊字符,如“.”“,”“;”等; 6.去除url中不必要参数和静态化。无论动态或静态url ,搜索引擎均可正常爬取和检索,但建议尽量精简去除url中不必要的参数,特别是与页面功能/展现无关的参数。 锚文本设计建议: 1.链接应选择文字作为链接描述,即锚文本,尽量少使用图片作为链接内容,必须使用图片时,应同时使用Alt标记补充文字描述,不要用flash、js替代文本链接(特别是重要入口); 2.锚文本应简洁精炼,明确描述页面内容;不要在锚文本里编写与页面内容无关的文字,更不要堆砌关键词或者“标题党”; 3.非必要的情况下,不要使用url本身作为锚文本。 链接设计建议: http://finance.qq.com/stock,http://t.qq.com/liuxiang,子域名、目录描述了页面主题或内容; http://finance.qq.com/a/20110317/005789.htm,新闻页面目录标识了发布日期; 链接设计避免: 1.链接url为js生成,搜索引擎无法爬取到链接指向页面。 2.链接陷阱(蜘蛛陷阱),这类url目录构造对用户和搜索引擎均无意义,搜索引擎可能不会爬取或者不索引这类url。 锚文本内容无意义。类似“更多”“返回”的文本对页面内容的描述没有贡献,不建议使用。 首页链接全部在flash内部,无法获取更多站内链接,同时结果页摘要显相关较差。 全站页面标题全部相同,无法体现页面内容,在搜索结果和浏览器中均不易让用户识别,同时搜索引擎无法通过标题了解页面内容; 页面内容和服务 1.提供高质量的网站内容和服务是网站的立足之本,同时也是影响搜索引擎对网站内容评价的重要因素和指标。 2.提供围绕网站主题或页面主题的内容或数据,自然、美观的书写页面内容,满足用户的阅读需求,这是对用户最有价值的服务: 3.给用户提供便于阅读的页面。页面布局合理,突出展现重点内容,内容间有主次、段落,避免一大堆文字的粗暴罗列; 4.在页面中放置面包屑导航。面包屑对用户辨识页面作为位置、层级有帮助,还能快速在不同频道间切换。SOSO音乐/SOSO问问/腾讯网新闻频道的面包屑导航; 5.提供与众不同的原创内容或服务,避免抄袭内容或重复发布相似、相同内容; 6.与主题不相关或弱关性的内容,如广告、站内推广链接等,应放置于页面次要内容,并且不占用过多篇幅; 7.不要有拼写错误或错别字。 同时,页面内容建设也照顾搜索引擎读取页面的“感受”: 1.页面正文用文本书写,不要用图片、flash代替,或用ajax生成; 2.站内导航和面包屑易于搜索引擎爬取页面、获取锚文本和分析链接权重; 3.使用图片作为内容时,为图片添加alt信息,图片文件使用简洁直白的命名(类似给页面的命名); 4.不要使用iframe构造页面。 robots.txt和Sitemap robots.txt和sitemap是站长和搜索引擎交流的工具,为搜索引擎的爬取、收录、排序行为提供参考。robots.txt和sitemap均不涉及对用户体验的直接影响。 robots.txt: 1.robots.txt文件,需要准确命名为”robots.txt”(文件名小写,扩展名为txt,),放置于网站域名的根目录下,能被正常访问; 2.可以使用robots.txt限制搜索引擎爬虫访问某些页面、目录或者整合网站。如供网站管理员使用的在线管理系统,或用户隐私信息页面,均可以此方法控制; 3.可以在robots.txt指定sitemap地址。 User-agent: * Disallow: /admin/ Disallow: /ads/ Sitemap:http://www.soso.com/sitemap.xml 以上是一段robots.txt文件的示例。标识了拒绝搜索引擎访问的路径和sitemap地址。 Sitemap: Sitemap中可以指定url的更新时间、更新频率、相对权重等信息; 重要的url应该出现在Sitemap中,给予较高权重; 搜索引擎会参考Sitemap中的信息进行爬取、索引和排序,但不会完全遵守; 其他 1.搜索引擎在响应网站内容变化需要时间,特别是针对网站内容建设的SEO是逐渐生效的,改变网站几个页网页内容就能迅速提高网站排名的观点是错误的; 2.搜索引擎对于不符合规范的网站建设方式或者过度SEO有一定容忍能力,并不会因为网站建设不当而直接拒绝爬取、收录、索引某个网站; 3.面向SEO的网站建设策略和用户体验应兼顾,甚至更多考虑用户体验,避免为了SEO而SEO。 网站运营和推广 面向用户的网站运营和推广工作,可以起到引入和沉淀用户、建设网站口碑、增强用户黏性的作用。而然,网站运营和推广同样可以在SEO工作中发挥作用,下面从这个维度来简单介绍。 内容运营 1、原创内容建设 网站建设以内容为王,在内容质量、原创、全面、权威等方面有优势的网站,更容易赢得用户好感,同时也会赢得搜索引擎收录和排序的倾向。 搜索引擎非常喜欢原创内容(特别是对于新站来说)在网站上主动发布或引导用户来发布原创内容,增加原创内容比例,会让搜索引擎更快收录,同时在内容权重、排序上占得优势。 2、规律的内容维护 规律的内容更新时间和更新规模,有助于搜索引擎合理调度爬虫进行抓取。更新较快较多的网站,也容易赢得搜索引擎爬虫的高频率光顾。 3、广告内容运营 广告能为网站带来收入,是网站运营不能回避的运营工作。从SEO角度看来,也有些应注意的优化点。 网站内容和广告内容应区分出主次,突出页面核心内容,利于搜索引擎理解页面内容,而不应满屏广告; 广告内容应配合页面内容,与页面内容、主题相关(搜索引擎爬虫可能采集广告内容作为页面正文);不要将广告内容伪装成页面正文或链接,诱导点击。 增加外链和积累有效锚文本 外部链接和锚文本是网站的重要SEO资源,承担着入口、页面内容识别、权重引入等诸多参与搜索引擎爬取、排重、排序工作的信息。对外链和锚文本的建设,是SEO工作中极重要的一环。 以下是一些外链、锚文本建设的建议: 1.互换友情链接、申请导航站收录; 2.建设外链资源时,应合理设置锚文本,尽量不要以url做锚文本; 3.不止网站首页需要外链,二级列表页、专题页、频道首页、特色页面等,同样需要外链建设; 4.可以发布网站功能特色介绍的文章,期间包含网站外链; 5.博客博文、微博、论坛帖子中出现的网站链接,对外链和锚文本建设有益,可将网站介绍文章转发于此,但不要泛滥建设; 6.博客评论区、留言板、bbs签名档等非主要区域的外链价值极低,可能被搜索引擎忽略; 7.外链、锚文本应避免泛滥建设,否则可能被判为作弊。 用户推荐和评价 用户有鉴别内容质量的能力,通过用户对网站内容的推荐和评价,可以帮助网站筛选好的内容,甚至制造外链。 1.建立用户对内容投票机制,获取用户评价; 2.提供方便的分享工具,可将内容推荐到其他产品平台,形成有价值外链; 3.培养用户黏性,并适当鼓励用户对朋友推荐网站内容(包括在IM、博客、论坛等平台上推荐)。 Sitemap说明 1.Sitemap文件采用.xml格式 2.Sitemap文件必须使用utf-8编码 3.可以采用gzip(.gz)格式来压缩Sitemap文件 4.Sitemap文件未压缩前不能大于2MB 5.一个Sitemap文件中包含的Url不能超过50000个 6.Sitemap中Url的优先权的值是一个表示当前站点中Url重要程序的相对值 7.Sitemap中Url的优先仅的缺省值是0.5 8.Sitemap中的Url必须是xml安全的(URL’s must be XML Safe (use XMLFormat()) Sitemap举例 <?xml version=’1.0′ encoding=’UTF-8′?> <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:xsi=”http://www.w3.org/2001/XMLSchema-instance” xsi:schemaLocation=”http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd”ote> <url> <loc>http://example.com/</loc> <lastmod>2006-11-18</lastmod> <changefreq>daily</changefreq> <priority>0.8</priority> </url> </urlset> url删除协议规范 协议文件规范 1.无论是数据文件还是索引文件,都必须符合如下规范: 2.文件采用xml格式 3.文件必须使用utf-8编码 4.可以采用gzip(.gz)格式来压缩删除协议文件 5.文件未压缩前不能大于2MB 6.文件中包含的Url不能超过50000个 7.文件中的Url必须是xml安全的(URL’s must be XML Safe (use XMLFormat()) 举例: deleted_url.xml <?xml version=’1.0′ encoding=’UTF-8′?> <urlset> <url> <loc>http://example.com/1.html</loc> <del>1</del> </url> <url> <loc>http://example.com/2.html</loc> <del>0</del>(1表示该url要删除、0表示该url之前删除过,现在已经复活了) </url> </urlset> 该文件的内容表示: http://example.com/1.html 是要删除的页面 http://example.com/2.html 是之前删除,现在已经复活,要恢复的页面 索引文件的标签 deleted_urlindex.xml <?xml version=”1.0″ encoding=”UTF-8″?> <urlindex> <url> <loc>http://www.example.com/deleted_url_1.xml.gz</loc> <lastmod>2004-10-01 08:32:12</lastmod> </url> <url> <loc>http://www.example.com/deleted_url_2.xml</loc> <lastmod>2005-01-01</lastmod> </url> </urlindex> Robots文件设置 User-agent: * Disallow: DeletedUrl: http://www.example.com/deletd_url_index.html