我对一点get和post的个人理解
web请求都是基于Http协议的,http协议的请求方式常用的方式是get和post,当然还有其他的,比如put,delete,options,trace等等
1.get请求是将请求参数直接挂在请求url地址后面,一般格式如下:
假定你的url请求地址是:http://localhost:8080/test.html
那get方式请求提交后url变成:http://localhost:8080/test.html?id=1&userName=zhangsan
?id=1&userName=zhangsan部分就是get方式需要提交给服务器的请求参数,?表示后面部分都是请求参数
参数都是用键值对方式表示,如id=1,多个参数用&符号分割,直接在url后面挂请求参数是有长度限制的,
一般限制在1KB一下。
2.而post方式则是将参数直接放入请求消息头中一并发送到服务器,格式如下:
post http://localhost:8080/test.html HTTP/1.1
Host www google hk
User-Agent Mozilla/5.0 (Windows NT 5.1; rv:2.0) Gecko/20100101 Firefox/4.0
Accept text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language zh-cn,zh;q=0.5
Accept-Encoding gzip, deflate
Accept-Charset GB2312,utf-8;q=0.7,*;q=0.7
Keep-Alive 115
Connection keep-alive
id=1&name=zhangsan
总结下,post请求由4部分组成:
请求行 请求头信息 一个空行 请求参数
请求行由3部分组成:请求方式、请求URI和HTTP版本,它们之间用一个空格分隔,这是固定格式,哪怕你中间空两个空格也是不对的。
HTTP规范定义了8种可能的请求方法:
GET 检索URI中标识资源的一个简单请求
HEAD 与GET方法相同,服务器只返回状态行和头标,并不返回请求文档
POST 服务器接受被写入客户端输出流中的数据的请求
PUT 服务器保存请求数据作为指定URI新内容的请求
DELETE 服务器删除URI中命名的资源的请求
OPTIONS 关于服务器支持的请求方法信息的请求
TRACE Web服务器反馈Http请求和其头标的请求
CONNECT 已文档化但当前未实现的一个方法,预留做隧道处理
只要掌握GET和POST就可以了,其他的知道有那么一回事就行。
再说说请求头信息,请求头信息一般由键值对组成,格式如下:
键冒号一个空格值,即Accept-Language: zh-cn
下面是HTTP1.1协议规范里请求头信息的一些设置项的解释说明(注意:所有的请求头信息配置项的键的名称是不区分大小写的):
HTTP/1.1中用到的头标
Accept 定义客户端可以处理的媒体类型,按优先级排序;
在一个以逗号为分隔的列表中,可以定义多种类型和使用通配符。例如:Accept: image/jpeg,image/png,*/*
Accept-Charset 定义客户端可以处理的字符集,按优先级排序;
在一个以逗号为分隔的列表中,可以定义多种类型和使用通配符。例如:Accept-Charset: iso-8859-1,*,utf-8
Accept-Encoding 定义客户端可以理解的编码机制。例如:Accept-Encoding:gzip,compress
Accept-Language 定义客户端乐于接受的自然语言列表。例如:Accept-Language: en,de
Accept-Ranges 一个响应头标,它允许服务器指明:将在给定的偏移和长度处,为资源组成部分的接受请求。
该头标的值被理解为请求范围的度量单位。例如Accept-Ranges: bytes或Accept-Ranges: nonea
Age 允许服务器规定自服务器生成该响应以来所经过的时间长度,以秒为单位。
该头标主要用于缓存响应。例如:Age: 30
Allow 一个响应头标,它定义一个由位于请求URI中的次源所支持的HTTP方法列表。例如:Allow: GET,PUT
Authorization 一个响应头标,用于定义访问一种资源所必需的授权(域和被编码的用户ID与口令)。
例如:Authorization: Basic YXV0aG9yOnBoaWw=
Cache-Control 一个用于定义缓存指令的通用头标。例如:Cache-Control: max-age=30
Connection 一个用于表明是否保存socket连接为开放的通用头标。例如:Connection: close或Connection: keep-alive
Content-Base 一种定义基本URI的实体头标,为了在实体范围内解析相对URLs。
如果没有定义Content-Base头标解析相对URLs,使用Content-Location URI(存在且绝对)或使用URI请求。
例如:Content-Base: www myweb com
Content-Encoding 一种介质类型修饰符,标明一个实体是如何编码的。例如:Content-Encoding: zip
Content-Language 用于指定在输入流中数据的自然语言类型。例如:Content-Language: en
Content-Length 指定包含于请求或响应中数据的字节长度。例如:Content-Length:382
Content-Location
指定包含于请求或响应中的资源定位(URI)。
如果是一绝。对URL它也作为被解析实体的相对URL的出发点。
例如:Content-Location: www myweb com
Content-MD5
实体的一种MD5摘要,用作校验和。
发送方和接受方都计算MD5摘要,接受方将其计算的值与此头标中传递的值进行比较。
例如:Content-MD5: <base64 of 128 MD5 digest>
Content-Range
随部分实体一同发送;标明被插入字节的低位与高位字节偏移,也标明此实体的总长度。
例如:Content-Range: 1001-2000/5000
Content-Type 标明发送或者接收的实体的MIME类型。例如:Content-Type: text/html
Date 发送HTTP消息的日期。例如:Date: Mon,10PR 18:42:51 GMT
ETag 一种实体头标,它向被发送的资源分派一个唯一的标识符。
对于可以使用多种URL请求的资源,ETag可以用于确定实际被发送的资源是否为同一资源。
例如:ETag: "208f-419e-30f8dc99"
Expires 指定实体的有效期。例如:Expires: Mon,05 Dec 2008 12:00:00 GMT
Form 一种请求头标,给定控制用户代理的人工用户的电子邮件地址。例如:From: webmaster@myweb.com
Host 被请求资源的主机名。对于使用HTTP/1.1的请求而言,此域是强制性的。例如:Host: www myweb com
If-Modified-Since
如果包含了GET请求,导致该请求条件性地依赖于资源上次修改日期。
如果出现了此头标,并且自指定日期以来,此资源已被修改,应该反回一个304响应代码。
例如:If-Modified-Since: Mon,10PR 18:42:51 GMT
If-Match 如果包含于一个请求,指定一个或者多个实体标记。只发送其ETag与列表中标记区配的资源。
例如:If-Match: "208f-419e-308dc99"
If-None-Match
如果包含一个请求,指定一个或者多个实体标记。资源的ETag不与列表中的任何一个条件匹配,操作才执行。
例如:If-None-Match: "208f-419e-308dc99"
If-Range
指定资源的一个实体标记,客户端已经拥有此资源的一个拷贝。必须与Range头标一同使用。
如果此实体自上次被客户端检索以来,还不曾修改过,那么服务器只发送指定的范围,否则它将发送整个资源。
例如:Range: byte=0-499<CRLF>If-Range:"208f-419e-30f8dc99"
If-Unmodified-Since
只有自指定的日期以来,被请求的实体还不曾被修改过,才会返回此实体。
例如:If-Unmodified-Since:Mon,10PR 18:42:51 GMT
Last-Modified 指定被请求资源上次被修改的日期和时间。例如:Last-Modified: Mon,10PR 18:42:51 GMT
Location
对于一个已经移动的资源,用于重定向请求者至另一个位置。
与状态编码302(暂时移动)或者301(永久性移动)配合使用。
例如:Location: http://www2 myweb com/index.jsp
Max-Forwards
一个用于TRACE方法的请求头标,以指定代理或网关的最大数目,该请求通过网关才得以路由。
在通过请求传递之前,代理或网关应该减少此数目。例如:Max-Forwards: 3
Pragma 一个通用头标,它发送实现相关的信息。例如:Pragma: no-cache
Proxy-Authenticate
类似于WWW-Authenticate,便是有意请求只来自请求链(代理)的下一个服务器的认证。
例如:Proxy-Authenticate: Basic realm-admin
Proxy-Proxy-Authorization
类似于授权,但并非有意传递任何比在即时服务器链中更进一步的内容。
例如:Proxy-Proxy-Authorization: Basic YXV0aG9yOnBoaWw=
Public 列表显示服务器所支持的方法集。例如:Public: OPTIONS,MGET,MHEAD,GET,HEAD
Range 指定一种度量单位和一个部分被请求资源的偏移范围。例如:Range: bytes=206-5513
Refener
一种请求头标域,标明产生请求的初始资源。对于HTML表单,它包含此表单的Web页面的地址。
例如:Refener: www myweb com/news/search.html
Retry-After
一种响应头标域,由服务器与状态编码503(无法提供服务)配合发送,以标明再次请求之前应该等待多长时间。
此时间即可以是一种日期,也可以是一种秒单位。例如:Retry-After: 18
Server 一种标明Web服务器软件及其版本号的头标。例如:Server: Apache/2.0.46(Win32)
Transfer-Encoding 一种通用头标,标明对应被接受方反向的消息体实施变换的类型。例如:Transfer-Encoding: chunked
Upgrade 允许服务器指定一种新的协议或者新的协议版本,与响应编码101(切换协议)配合使用。
例如:Upgrade: HTTP/2.0
User-Agent 定义用于产生请求的软件类型(典型的如Web浏览器)。
例如:User-Agent: Mozilla/4.0(compatible; MSIE 5.5; Windows NT; DigExt)
Vary 一个响应头标,用于表示使用服务器驱动的协商从可用的响应表示中选择响应实体。例如:Vary: *
Via 一个包含所有中间主机和协议的通用头标,用于满足请求。例如:Via: 1.0 fred.com, 1.1 wilma.com
Warning 用于提供关于响应状态补充信息的响应头标。例如:Warning: 99 www myweb com Piano needs tuning
www-Authenticate 一个提示用户代理提供用户名和口令的响应头标,与状态编码401(未授权)配合使用。响应一个授权头标。
例如:www-Authenticate: Basic realm=zxm.mgmt
上面这些不需要死记硬背,只需要掌握常用的几个,如:Content-Type,Content-Length,Accept-Charset,Content-Language,User-Agent,Server 等等
不管是以哪种方式往服务器发送请求,需要传递的参数都是需要首先经过浏览器进行编码的,
对于get方式,由浏览器根据自身特性去进行编码的,一般是按UTF-8进行编码,为什么说一般呢?因为IE浏览器只有你在工具--internet选项--高级--
最后一个选项【总是以UTF-8发送url】勾上,IE才会以UTF-8编码方式对请求头信息进行编码,否则会默认按浏览器的默认语言进行编码,浏览器的默认语言编码
查看方式为:工具--Internete选项--常规--语言中选择,默认中文XP操作系统的默认语言都是中文简体,代号就是zh_CN,对应的编码就是gb2312。
而Post方式则是根据请求头信息里的Content-Type设置决定,比如:Content-Type:text/html;charset=utf-8,则浏览器会以UTF-8编码对请求体进行编码,如果
Content-Type:text/html;charset=gb2312,则会以gb2312进行编码。
服务器接收到请求,对请求做一些业务处理,可能需要使用客户端提交过来的参数,假设服务器为Tomcat且运行的是servlet,
对于Post方式的请求,servlet默认会用ISO-8859-1编码方式将消息体中的参数解码转化为Unicode,对于中文字符,这样就会出现乱码。这是为什么呢?
因为ISO-8859-1编码是一个字节一个字节去编码的,而英文字符也都是一个字符占一个字节,所以不会出现乱码,而一个汉字是占2个字节,即这两个字节必须同时
在一起才能表示一个汉字,如果两个字节被ISO-8859-1编码拆开了,那这个汉字就无法正常显示了,这个道理你们应该懂的。
而我们经常使用的request.setCharacterEncoding("UTF-8");的作用就是告诉服务器servlet对客户端传送过来的请求参数以UTF-8的方式进行解码,你可能会问,
为什么这里要设置成UTF-8编码。因为前面我讲过了,post方式的请求体的编码方式是有请求头信息的content-Type决定的,而我们编程中,一般都是约定俗成的
要求一律使用UTF-8编码,这是编程习惯,不是必须的,所以这里就需要设置成UTF-8进行解码,也就是说post的content-Type是用什么方式编码的,那服务器端就要使用request.setCharacterEncoding
方法,使用相同一致的编码进行解码,否则就会出现乱码。
但是对于get方式使用request.setCharacterEncoding()方法设置解码方式是行不通的。你可能又会问为什么呢?因为get方式是直接把参数挂在请求url后,学过servlet应该都知道,
servlet需要在web.xml里配置一个url-patern,表示包含url-patern配置值的请求都会转到该servlet处理,也就是请求url的解码工作是由底层的服务器tomcat完成的,而Tomcat是按
ISO-8859-1去对url解码的,前面说过,get方式的默认编码一般是utf-8,IE个变态就不提了,这是编码和解码使用的字符集不一致,当然就会出现乱码,也就是我们经常遇到的:
get方式传递中文参数出现乱码的原因。但是遗憾的是,不是所有的服务器的默认解码方式都是ISO-8859-1,有的服务器则是按系统默认编码,而默认系统编码则由你操作系统所使用的语言决定。
由于各种服务器的解码方式不统一,令我觉得很蛋疼。由于get请求服务器的解码方式具有未知性,所以一般我们不建议使用get方式传递中文参数,一般就算你解决了在tomcat下不出现乱码,但是
如果服务器我换成weblogic,则又乱码了,正因为服务器端解码方式至今没有一个统一的标准,所以若要传递中文,建议请用post方式发送请求。这时,你可能会有疑问,咦,对于get方式中文传参,
在服务器端不是可以这样解决吗,
String param = new String(param.getBytes("ISO-8859-1"),"UTF-8");
那我就跟你讲下这句代码的作用吧,比如你get方式发送一个请求到后台,get方式的编码一般是取决于浏览器的默认编码的,一般浏览器默认编码是UTF-8,IE这个变态需要特殊设置,刚开始我提到过,就不啰嗦了。
由于是以utf-8方式编码的,而我们开发一般用的服务器都是tomcat,tomcat的默认解码方式ISO-8859-1。UTF-8编码规则是对于非英文字符(啥时候所有的编码字符集能以汉字为准就好了,唉),
是用3个字节来表示,为什么要用3位来表示,主要是由于汉字数量太多,不用3个字节表示不完。一个字节8位,那3个字节就是24位,2进制的24位最大是多少,你自己算算就是为什么UTF-8要用3个字节表示汉字了。
ISO-8859-1是用一个字节表示的,所以我们的UTF-8编码字符被ISO-8859-1拆成一个一个的字节,当然乱码了,而如果我们直接request.getParameter()获取参数值得到的是ISO-8859-1的一个一个字节,
再经过JVM编码成Unicode字符放入内存中,当我们调用String param = new String(param.getBytes("ISO-8859-1"),"UTF-8");时,首先加载内存中的该unicode字符解码成ISO-8859-1格式的一个一个字节,
,再按照UTF-8编码每3个字节去复原,之所以能复原是因为,字节虽然被ISO-8859-1拆开了,但是顺序没变。
但是这句代码String param = new String(param.getBytes("ISO-8859-1"),"UTF-8");也不是放之四海而皆准的,前提是你使用get方式是用utf-8编码的,且服务器端是用ISO-8859-1解码,如果换个服务器,
这个代码就说不定不管用了因为有的服务器默认是按照系统编码去解码的。由于我们一般使用的都是tomcat,所以使用它没什么问题。
前面提到了Unicode编码,它是JVM的默认编码,什么意思呢,就是我们编写的.java代码文件最终编译后生成的.class文件都是unicode编码,unicode编码是一种国际化通用的字符集编码,它采用双字节对字符进行编码,它兼容英文字符和其它国家民族的双字节字符编码,所以我们常说的UTF-8编码,GB2312编码都是他的一个子集,或者说unicode是其他编码的一个标准。java为了跨平台和实现国际化,所以JVM的默认编码就是采用的Unicode.
不知不觉写了 这么多,希望对大家理解HTTP协议有点帮助。有空再总结吧,最后欢迎大家拍砖!
本文来源 我爱IT技术网 http://www.52ij.com/jishu/86.html 转载请保留链接。
- 评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)
-
