转到正文

什么是utf-8?什么是unicode?
一直在编码方面要求不是很高,所以对Unicode和UTF-8也不甚了解。
最近偶然翻到一篇UTF-8的文章,感觉解释的非常繁杂,因此才想到重新写一篇简单易懂一点的。
首先说明一下现在常用的一些编码方案:
1、在中国,大陆最常用的就是GBK18030编码,除此之外还有GBK,GB2312,这几个编码的关系是这样的。
最早制定的汉字编码是GB2312,包括6763个汉字和682个其它符号
95年重新修订了编码,命名GBK1.0,共收录了21886个符号。
之后又推出了GBK18030编码,共收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字,现在WINDOWS平台必需要支持GBK18030编码。

今天,厦门seo联盟发现,使用友情链接检测工具检测不到友情链接的情况,认真研究后发现有两种可能:
1.当首页做了跳转到例如:首页/index.php这样的首页链接后,用友情链接检测工具是无法检测到友情链接的。
2.部分时候,由于我们使用的友情链接检测工具使用的是gb2312编码,而有些页面用的是utf-8编码,导致友情链接检测工具在爬取页面时出现乱码,则无法识别出友情链接。
3.网站所在的服务器使用了cdn加速,目前这种情况用友情链接检测工具经常检测不到友情链接。
厦门seo联盟暂时只发现这三点,希望有知道其他情况的朋友能说说你们的看法。

模拟搜索引擎蜘蛛抓取网站出现乱码怎么办?
其实这个是常见问题,站长朋友们不用慌。
有些开源的建站程序所使用的编码是utf-8编码的,而模拟搜索引擎蜘蛛抓取网站时,对于中文站往往采用的是gb2312编码。所以在模拟抓取过程中,会出现乱码现象。
但是站长朋友们可以放心,这对seo是没有坏处的。因为搜索引擎在收录时会进行编码处理,所以,尽管搜索引擎抓取时是乱码,但是处理后我们所浏览的网页快照却还是正常的文字。
另附模拟搜索引擎蜘蛛抓取网站工具:http://tool.chinaz.com/Tools/Robot.aspx

百度快照是什么?
百度快照其实就是百度蜘蛛在爬取网页内容时,将网页文本内容独立创建一个文本文件,保存在百度数据库中的网页的“照片”。
很多时候,由于数据维护,网络建设等种种原因,导致在百度搜索结果中的某些网站或某些页面无法打开,这时候,你就可以点击每个搜索结果右下角的百度快照选项来阅读那些对你有用的文本。

在学习网站优化的过程中,很多人会遇到这样一个问题:alt标签是什么?
alt标签实际上是网站上图片的文字提示。在alt标签中加入关键词是很好的提升关键词密度的方法。
如图:
你可以看到,当鼠标移动到首页的图片上的时候,会出现提示“订阅厦门seo联盟RSS到抓虾”,这就是对这张图片所表示的意思或者说是这张图片链接所表示的意思的一种注释,能很好地增加用户体验,让用户知道这张图片的目的。
那么alt标签怎么写呢?
一般,alt标签在html语言中的写法是这样的:<img src=”图片路径” alt=”图片描述”/>
这里我们要说的一点是,图片描述最好是用简短的语句,描述这张图片的内容,如果是链接,则描述链接的作用,并带上关键词。
不好的习惯是每张图片都没有alt标签。而不可取的是,对于每个标签都采用关键词堆砌,这样就有可能会导致被视为Spam垃圾网站。

什么是淘宝客?淘宝客有什么用?
淘宝客在2009年1月前,叫淘客,后更名为淘宝客。淘宝客是指那些帮助淘宝卖家推广商品并按照成交效果获得佣金的人。
只需要从淘宝那里获得商品的推广链接,让顾客通过这个推广链接进入淘宝店铺购买商品并确认付款后,就能从卖家那里赚取由卖家支付的佣金。无需投入成本,无需承担风险,最高佣金可达成交金额的50%。巨大的诱惑是淘宝客发展的动力。

我们都知道淘宝在很早以前就将网站的robots.txt文件设定为禁止百度蜘蛛爬取,大家可以看淘宝网在百度的收录,可以发现除了首页,www域名下无网页被收录。
今天早些时候看到有文章说《网商巨子也低头 淘宝网解除对百度蜘蛛的屏蔽》的文章,我就在想:难道是昨天公布的三月份要开始实施的网店税务征收计划的效果?从我对马云的了解来看,凭现在的阿里巴巴应该不会向百度低头的。下午看了下淘宝的robots.txt(http://www.taobao.com/robots.txt)貌似又被改回去了,看来淘宝对于这次的robots.txt的改动应该是别有用心,是不是又是一次炒作?不得而知。从另一方面也可以看出,淘宝网作为网上商城的龙头老大,也一直被业界关注着。
另付上一张google的恶搞图片:

今天,厦门seo联盟在这里给大家介绍一下:什么是网站robots.txt?
我们都知道,搜索引擎来抓取网站内容的工具被称为搜索引擎机器人。而机器人的英文恰巧是robots。为了方便记忆,人们把放在网站根目录下的这个文件起名为robots.txt。
robots.txt文件有什么用处呢?