C++中的HTTP协议问题
作者:king_weng
1、HTTP
Hyper Text Transfer Protocol(超文本传输协议)。
是一种通信协议,它允许将超文本标记语言(HTML)文档从Web服务器传送到客户端的浏览器。
在Internet中所有的传输都是通过TCP/IP进行的。HTTP协议作为TCP/IP模型中应用层的协议也不例外。
HTTP协议通常承载于TCP协议之上,有时也承载于TLS或SSL协议层之上,这个时候,就成了我们常说的HTTPS。HTTP默认的端口号为80,HTTPS的端口号为443。
如下图所示:
2、http请求-响应模型
HTTP是一个应用层协议,由请求和响应构成,是一个标准的客户端服务器模型。
HTTP协议永远都是客户端发起请求,服务器回送响应。这样就限制了使用HTTP协议,无法实现在客户端没有发起请求的时候,服务器将消息推送给客户端。
HTTP同时支持支持B/S及C/S模式。支持基本认证和安全认证。
3、主要特点
(1)简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
(2)灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
(3)HTTP 0.9和1.0使用非持续连接:限制每次连接只处理一个请求,服务器处理完客户的请求,并收到客户的应答后,即断开连接。HTTP 1.1使用持续连接:不必为每个web对象创建一个新的连接,一个连接可以传送多个对象,采用这种方式可以节省传输时间。
(4)无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。
4、工作流程
HTTP完整流程包括四部分:
(1)客户机与服务器建立连接。
(2)客户机发送请求给服务器。
(3)服务器接收到客户端的请求,给予相应的响应信息。
(4)客户端收到请求并处理。
5、http请求的组成
http请求由三部分组成:请求行,首部,请求正文。
- 请求报文格式为:请求行+首部+空行+实体组成
- 响应报文格式为:状态行+首部+空行+实体组成
(1)请求行:
以方法开头,以空格分开,紧随其后的是路径和版本(包括http请求的种类,请求资源的路径,协议的版本号)。
格式:
Method Request-URL HTTP-Version CLRF
注:
Method
:请求方法(get,post等)Request-URL
:统一的资源标识符HTTP-Version
:HTTP协议的版本CRL
:为回车和换行(回车和换行只能出现在结尾,不能再其他地方出现)。
请求方法:
GET
请求服务器的文档;POST向服务器发送信息;PUT
从服务器向客户端发送文档;DELETE为删除web网页;TRACE
为把到达的请求回送;HEAD为请求关于文档的信息,但不是文档本身; OPTIONS询问关于可用的选项;
(2)请求首部
http的头部信息,每一个用\r\n分割;
常用的首部有:
Connection
:允许客户端和服务器指定与请求/响应连接有关的选项(长连接,短连接等)Data
:提供日期和时间标志MIME-Version
:给出了发送端使用的MIME版本Client-IP
:描述客户端机器的IPFrom
:提供了客户端用户的E-mail地址Host
:给出请求的主机名和端口号Referer
:提供了包含当前请求的URL的文档的URLcookie
:向服务器传送一个令牌
(3)请求正文
为发送给服务器的查询信息(使用get时,body是空的,get只能读取,而post可以写入信息);
(4)响应报文也包括请求行,请求首部,空行,实体
请求行格式为:http版本+状态码+短语+\r\n 短语与状态码相对应
请求首部格式为:一系列首部名称:值\r\n的组合
请求实体为:服务端真正返回的信息
状态编码为:
- 100-199指定客户端响应的一些动作,请求已被服务接收 200-299表示请求被接受,处理成功
- 300-399表示已经移动的文件,重定向,需进一步处理
- 400-499指定客户端的错误,有语法错误无法实现 500-599指定服务端的错误,服务器未能实现合法的请求
6、短连接和长连接
HTTP1.1之后使用了长连接,长连接使数据传输完成后继续保持TCP连接不间断,等待相同域名继续使用这个通道进行数据传输。
HTTP1.0使用首部Connection:Keep-alive进行长连接的试验,HTTP1.1之后使用Connection:Close来告诉服务端不使用长连接。但是使用了Connection:Keep-alive这个首部并不代表采用长连接。
- 在短连接中:每一个请求/响应都需要建立一次TCP连接(三次握手),
- 长连接模式下:判断数据接收完成的方法有 --1--服务器关闭连接;--2--首部Content-Length判断是否传输完毕,指定了实体正文的长度。
7、http中的操作
HTTP/1.1协议中共定义了八种方法(有时也叫“动作”)来表明Request-URI指定的资源的不同操作方式,最基本的有4种,分别是GET,POST,PUT,DELETE对应着对这个资源的查,改,增,删4个操作。最常见的就是GET和POST了。GET一般用于获取/查询资源信息,而POST一般用于更新资源信息。具体方法:
(1)GET:向特定的资源发出请求
(2)POST:向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改。
(3)PUT:向指定资源位置上传其最新内容。
(4)DELETE:请求服务器删除Request-URI所标识的资源。
(5)HEAD:向服务器索要与GET请求相一致的响应,只不过响应体将不会被返回。这一方法可以在不必传输整个响应内容的情况下,就可以获取包含在响应消息头中的元信息。该方法常用于测试超链接的有效性,是否可以访问,以及最近是否更新。
(6)TRACE:请求服务器会送收到的请求信息,主要用于测试或诊断。
(7)OPTIONS:请求查询服务器的性能,或者查询与资源相关的选项和需求
(8)CONNECT:HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。(即留为将来使用)
8、GET与POST的区别
(1)GET提交的数据会放在URL之后,以?分割URL和传输数据,参数之间以&相连,如EditPosts.aspx?postid=6810130&update=1 ;POST方法是把提交的数据放在HTTP包的Body中。
(2)GET提交的数据大小有限制(因为浏览器对URL的长度有限制),而POST方法提交的数据没有限制。
(3)GET方式需要使用Request.QueryString来取得变量的值,而POST方式通过Request.Form来获取变量的值。
(4)GET方式提交数据,会带来安全问题,比如一个登录页面,通过GET方式提交数据时,用户名和密码将出现在URL上,如果页面可以被缓存或者其他人可以访问这台机器,就可以从历史记录获得该用户的账号和密码。
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。