1、 唯一性
URL 的最基本的使命是唯一地代表 Internet 上的一个对象,URL 必须和 Internet 上的对象一对一匹配。很多是时候,我们可以看到不同的url对应到相同的页面,针对这个问题,可以使用 HTTP301机制,把相同内容的不同的url规范到一个url上面。
2、 永久性
URL 应该是永久的,这就要求在站点上线前就非常严谨地规划 URL。如果有一天,不得不更改 URL,一定使用 HTTP 301 机制,告诉浏览器和搜索引擎,那个 URL 所代表的对象,已经搬迁到新地址,这个机制可以保证旧地址所获得 PR 不会被清零。
3、一致性
站点内的所有 URL 必须保持一致的格式和结构,这样可以为用户带来信任感,如果必须更改 URL 格式和结构,需要使用 HTTP 301 机制。
如果URL 拥有很好的一致性,用户可以根据 URL 猜测别的内容的 URL,假如 /events/2010/01 指向 2010 年 1 月份的日程内容,那
/events/2012/01 应当指向 2012年 1 月的日程。
/events/2012 应当指向 2012 年全年的日程。
/events/2012/01/21 应当指向2012年1月21日的日程。
4、可读性
这是 URL 设计的根本,URL 应该为最终用户而设计。保持 URL 友好的一个好办法是在保证可读性的同时让它尽可能短。比如 /about 就好过 /about-acme-corp-page,当然,保持简短不能牺牲可读性, /13d2 一类的地址短则短矣,但并不友好。
5、关键词穿插
URL 中应该包含本页重点内容的关键词,比如 /posts/2010/07/02/trip-best-buy-memory-cards 一类的 URL 本身就是对页面内容的反应。在 URL 包含重点内容关键词,也可以提高 SEO 性能。SEO 的一个很重要的原则就是,在 URL 地址中包含内容关键词。
6、 字符统一,并且友好
URL 中所有字符都应使用小写,这更容易阅读。
在 URL 中体现网页标题的时候,往往会用到一些特殊字符,应当把它们转换为 URL 友好字符:
全部大写字符换成小写
诸如 é 一类的字符应转换成对应的 e
空格使用短划线代替
诸如 !, @, #, $, %, ^, &, * 一类的字符应该使用短划线代替
双短划线应该使用单短划线代替
另外,没有必要的话,避免使用 %20 一类的 URL 逃逸符。
7 、长度限制
URL 的最大长度是多少?W3C 的 HTTP 协议 并没有限定,然而,在实际应用中,经过试验,不同浏览器和 Web 服务器有不同的约定:
IE 的 URL 长度上限是 2083 字节,其中纯路径部分不能超过 2048 字节。
Firefox 浏览器的地址栏中超过 65536 字符后就不再显示。
Web 服务器:
Apache Web 服务器在接收到大约 4000 字符长的 URL 时候产生 413 Entity Too Large” 错误。
IIS 默认接收的最大 URL 是 16384 字符。
还有很多关于URL的知识点,比如关于是否使用www等,这里我只是在看了“关于 URL 的一些不可不知的知识”帖子后,稍微整理了,分享一下。