10. 从零用Rust编写正反向代理, HTTP内网穿透支持修改头信息

wmproxy

wmproxy是由Rust编写,已实现http/https代理,socks5代理, 反向代理,静态文件服务器,内网穿透,配置热更新等, 后续将实现websocket代理等,同时会将实现过程分享出来, 感兴趣的可以一起造个轮子法

项目 ++wmproxy++

gite: https://gitee.com/tickbh/wmproxy

github: https://github.com/tickbh/wmproxy

修改header参数

但凡代理之类,基本上都有修改头参数的需求,就比如要获取客户端的真实IP,需要写入x-forward-for表示客户端的真实IP,要不然经过转发后的HTTP无法获取真实的客户端地址。

所以需要在转发的同时能进行处理头部信息的相关参数。故内网端不能仅做流量转发。而且客户端可能直接以纯HTTP2的协议请求内网的数据,所以同时需要支持HTTP/1.1及HTTP2,由于以上需求,我们把之前的简单的转发逻辑改成以服务端接收客户端请求的模式对数据进行重加工。

新流程如下

以下是数据从外网进入到内网服务器的加工流程

请求http端口
解析成Request
修改Request中的Header
发送HTTP请求数据给CenterClient
请求内网服务器转发数据
外网客户端
代理服务端-外网
请求端
新的请求端
代理客户端--内网
内网服务器

以下是内网服务器返回数据给外网客户端的流程

返回Response
发送HTTP数据给CenterServer
修改头信息加工
将数据转发给
返回数据
外网客户端
代理服务端-外网
新的返回端
返回端
代理客户端--内网
内网服务器

转发中的注意事项

我们可以获取完整的Request再进行请求吗?

如果我们这么操作,当数据包非常的大的时候例如1G,我们此时在内存中将有完整的1G内存,那么此时只需有数个同一类的请求,将会耗尽我们的内存,所以我们必须不能这么处理。

超大文件下载的转发

超大文件必须将得到的数据及时的转发给客户端,此时在内存中的值才不至于太大,又能及时的传输给客户端,要不然可能大文件下载到中转服务器的时间内客户端得不到任何数据就会空耗掉这时间。

http/1.1中的chunked的处理

因为http/1.1的chunked协议,由RFC 2616定义,

分块编码(Transfer-Encoding: chunked)是超文本传输协议(HTTP)中的一种数据传输机制,允许HTTP由网页服务器发送给客户端的数据可以分成多个部分。分块传输编码只在HTTP协议1.1版本(HTTP/1.1)中提供,如果头部中有该选项,则代表数据包是chunked格式。
数据分解成一系列数据块,并以一个或多个块发送,这样服务器可以发送数据而不需要预先知道发送内容的总大小。

比如我们常看到的

for data in res.chunk() {
}

就是表示的是数据分段接收,对于大数据这个尤为重要。

此种报文的示例
这时,报文中的实体需要改为用一系列分块来传输。
每个分块包含十六进制的长度值和数据,长度值独占一行,长度不包括它结尾的 CRLF(\r\n),也不包括分块数据结尾的 CRLF。
最后一个分块长度值必须为 0,对应的分块数据没有内容,表示实体结束。
例:

HTTP/1.1 200 OK
Content-Type: text/plain
Transfer-Encoding: chunkeda\r\n
01234567890\r\n
1e\r\n
wmproxy is very good nat tool\r\n
0\r\n
\r\n

此种报文中我们必须进行解析,因为客户端可能是keep-alive选项,可以连续进行多发。所以收到的Request和Response都是连续的。必须知道何处结束才能继续解析下一个Request/Response。http2不需要,因为http2自带的data分包机制就有这些数据的处理

header数据的定义

  • header的修改分为两部分,一部分是对请求Request的重写,另一部分是对返回Response的重写。所以我们必须同时支持这两种,且将其区分出来。每条header信息我们将定定义一个可变长的数组,如第一个字符为proxy则表示对Request修改。
  • 关于修改的动作有
    1. 添加,如x-forward-for需要末尾添加,我们用操作符+,比如[proxy, +, x-forward-for, $client_ip]
    2. 删除,我们用操作符+,如[-, hidden]
    3. 设置,设置我们默认不做任何参数,直接以header_name开头,如[custom-key, custom-value]
    4. 默认值,有些值有了参数我们就不将其重写,如果没有我们则设为默认值,我们用操作符?,如[?, server, wmproxy]

所以我们client.yaml的配置新增至如下:

# 连接服务端地址
server: 127.0.0.1:8091
# 连接服务端是否加密
ts: true# 内网映射配置的数组
mappings:#将localhost的域名转发到本地的127.0.0.1:8080- name: webmode: httplocal_addr: 127.0.0.1:8080domain: localhostheaders:- [proxy, +, x-forward-for, $client_ip]- [-, hidden]- [custom-key, custom-value]- [?, server, wmproxy]

mappings的结构修改

pub struct MappingConfig {pub name: String,pub mode: String,pub local_addr: Option<SocketAddr>,#[serde(default = "default_domain")]pub domain: String,#[serde(default = "default_header")]pub headers: Vec<Vec<String>>,
}

我们把headers定义成一个动态的数组。根据不同的类型做不同的数据,因为长度有变化所以做不定长参数。
以下是代码解析

pub fn parse<T: Buf>(header: ProtFrameHeader, mut buf: T) -> ProxyResult<ProtMapping> {must_have!(buf, 2)?;let len = buf.get_u16() as usize;let mut mappings = vec![];for _ in 0..len {let name = read_short_string(&mut buf)?;let mode = read_short_string(&mut buf)?;let domain = read_short_string(&mut buf)?;let mut headers = vec![];must_have!(buf, 2)?;let len = buf.get_u16();for _ in 0 .. len {let mut header = vec![];must_have!(buf, 1)?;let sub_len = buf.get_u8();for _ in 0..sub_len {header.push(read_short_string(&mut buf)?);}headers.push(header);}mappings.push(MappingConfig::new(name, mode, domain, headers));}Ok(ProtMapping {sock_map: header.sock_map(),mappings,})
}

如此解析成一个完整的对应域名的结构,因为服务端用不到local_addr所以不做传输。

核心代码的实现

核心处理代码在trans/http.rs下,外部传入一个可读可写的stream,可能是TcpStream也可能是TlsStream<TcpStream>或者其它,同时把接收的SocketAddr传入,以方便后续获取$client_ip的头文件信息。

预处理

pub async fn process<T>(self, inbound: T, addr: SocketAddr) -> Result<(), ProxyError<T>>
whereT: AsyncRead + AsyncWrite + Unpin + Debug,
{println!("new process {:?}", inbound);let build = Client::builder();let (virtual_sender, virtual_receiver) = channel::<ProtFrame>(10);let stream = VirtualStream::new(self.sock_map, self.sender.clone(), virtual_receiver);let mut client = Client::new(build.value().ok().unwrap(), stream);let (receiver, sender) = client.split().unwrap();let oper = HttpOper {receiver,sender,sender_work: self.sender_work.clone(),virtual_sender: Some(virtual_sender),sock_map: self.sock_map,mappings: self.mappings.clone(),http_map: None,};let mut server = Server::new(inbound, Some(addr), oper);tokio::spawn( async move {let _ = client.wait_operate().await;});let _ret = server.incoming(Self::operate).await;if _ret.is_err() {println!("ret = {:?}", _ret);}Ok(())
}

此时我们创建一个虚拟的Stream来做双边互传,但是此时我们还没有收到任何的Request请求,我们并不知道当前的Host,此时我们还未发送ProtCreate,等真正处理请求的时候做处理,HttpOper是处理每个操作时均会带的参数,我们可以根据自己需要带上该参数。

后续处理,其中我们读和写都用RecvStream,做到读多少数据转发多少数据,以保证数据处理的及时性

async fn inner_operate(mut req: Request<RecvStream>,data: Arc<Mutex<HttpOper>>,
) -> ProtResult<Option<Response<RecvStream>>> {println!("receiver req = {:?}", req.url());let mut value = data.lock().await;let sender = value.virtual_sender.take();// 传在该参数则为第一次, 第一次的时候发送Create创建绑定连接if sender.is_some() {let host_name = req.get_host().unwrap_or(String::new());// 取得相关的host数据,对内网的映射端做匹配,如果未匹配到返回错误,表示不支持{let mut config = None;let mut is_find = false;{let read = value.mappings.read().await;for v in &*read {if v.domain == host_name {is_find = true;config = Some(v.clone());}}}if !is_find {return Ok(Some(Response::builder().status(404).body("not found").ok().unwrap().into_type()));}value.http_map = config;}println!("do create prot {}, host = {:?}", value.sock_map, req.get_host());let create = ProtCreate::new(value.sock_map, Some(req.get_host().unwrap_or(String::new())));let _ = value.sender_work.send((create, sender.unwrap())).await;}if let Some(config) = &value.http_map {// 复写Request的头文件信息HeaderHelper::rewrite_request(&mut req, &config.headers);}// 将请求发送出去value.sender.send(req).await?;// 等待返回数据的到来let mut res = value.receiver.recv().await;if res.is_some() {if let Some(config) = &value.http_map {// 复写Response的头文件信息HeaderHelper::rewrite_response(res.as_mut().unwrap(), &config.headers);}return Ok(res);} else {return Ok(Some(Response::builder().status(503).body("cant trans").ok().unwrap().into_type()));}
}

以下是直接HTTP/1.1的请求示例
在这里插入图片描述

以下是直接HTTP/1.1升级成HTTP2的请求示例
在这里插入图片描述

以下是直接HTTP2的请求示例
在这里插入图片描述

请求的返回结果均带上了添加的头部信息,测试正常,至此HTTP的内网穿透数据打通。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/277654.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux 常用命令----mktemp 命令

文章目录 基本用法实例演示高级用法注意事项 mktemp 命令用于创建一个临时文件或目录&#xff0c;这在需要处理临时数据或进行安全性测试时非常有用。使用 mktemp 可以保证文件名的唯一性&#xff0c;避免因文件名冲突而导致的问题。 基本用法 创建临时文件: 命令 mktemp 默认…

微软microsoft推出了最新的小型但强大的开源语言AI模型Phi-2

微软推出了最新的小型开源语言模型 Phi-2。该模型只有 27 亿个参数&#xff0c;却能超过比它大 25 倍的模型的性能。Phi-2 是微软 Phi 项目的一部分&#xff0c;旨在制作小而强大的语言模型。该项目包括 13 亿参数的 Phi-1&#xff0c;据称在 Python 编码方面实现了最先进的性能…

Linux(22):X Window 设定介绍

X Window System X Window System 是个非常大的架构&#xff0c;他还用到网络功能。也就是说&#xff0c;其实 X 窗口系统是能够跨网络与跨操作系统平台的。 X Window系统最早是由 MIT (Massachusetts Institute of Technology&#xff0c;麻省理工学院) 在1984年发展出来的&…

Tomcat的结构分析和请求处理原理解析

目录 Tomcat服务器&#xff1f;Tomcat结构处理请求流程Tomcat作用其他的web服务器 Tomcat服务器&#xff1f; 我们经常开口闭口“服务器”、“服务器”的&#xff0c;其实“服务器”是个很容易引发歧义的概念 其实&#xff0c;Tomcat服务器 Web服务器 Servlet/JSP容器&#…

安路IP核应用举例(OSC、UART)

1.OSC(内部振荡器) 按照Project->New Project顺序新建工程后&#xff0c;后按照Tools->IP Generator顺序&#xff0c;创建IP核&#xff0c;如下图&#xff1a; 安路FPGA的内置OSC振荡模块频率可选30MHz、60MHz。 可选Verilog或VHDL语言。 如图&#xff0c;生成的.v文件只…

怎么把文件转成附件放在公众号里?这篇教程给你详细说清楚

文件转附件&#xff0c;其实就是把文件上传到某个网站&#xff0c;获得文件的下载链接&#xff0c;从而放到文章或者其他地方供读者下载使用。因为公众号并不支持直接在文章里面添加下载链接&#xff08;至少订阅号不行&#xff09;&#xff0c;所以把文件转成下载链接的方式并…

HPM6750系列--总章

本栏目介绍先楫半导体出品的HPM6750芯片&#xff08;基于HPM6750evkmini开发板&#xff09; ​​​​​​​ 内容概述 HPM6750系列--第一篇 初识HPM6750 介绍HPM6750芯片信息&#xff0c;包括主频、内存、外设配置&#xff0c;并列举了各种开发工具和开发资源。 HPM6750系列--…

异地现场工控设备,如何实现远程配置、调试?

南京某企业专注于工业物联领域&#xff0c;在相关项目中往往会在各个点位部署基于Linux系统的中控主机&#xff0c;实现各类物联设备信息的采集、汇总。但是&#xff0c;由于各点位分散多地&#xff0c;且数量达到了上百个&#xff0c;虽然中控主机具备4G物联网接入能力&#x…

Qt容器QMdiArea 小部件提供一个显示 MDI 窗口的区域

## QMdiArea ## 控件简介 QMdiArea 继承 QAbstractScrollArea。QMdiArea 小部件提供一个显示 MDI 窗口的区域。QMdiArea的功能本质上类似于MDI窗口的窗口管理器。大多数复杂的程序,都使用MDI框架,在 Qt designer 中可以直接将控件 MDI Area 拖入使用。 ## 用法示例 例 qm…

利用有限制通配符来提升API的灵活性

在Java中&#xff0c;有限制通配符&#xff08;bounded wildcard&#xff09;允许你在泛型中指定一个范围&#xff0c;从而提升API的灵活性。通配符使得你能够编写更通用、适用于多种类型的代码。以下是一个利用有限制通配符提升API灵活性的例子&#xff1a; 假设有一个简单的…

Elasticsearch面试题

Elasticsearch面试题&#xff08;来源&#xff1a;Elasticsearch&#xff09; 1 、为什么要使用 Elasticsearch&#xff1f; 系统中的数据&#xff0c; 随着业务的发展&#xff0c;时间的推移&#xff0c; 将会非常多&#xff0c; 而业务中往往采用模糊查询进行数据的搜索&…

解决:Component name “index“ should always be multi-word

原因 要求组件名称以驼峰格式命名&#xff0c;自定义组件名称应该由多单纯组成&#xff0c;防止和html标签冲突&#xff0c;所以index.vue 会报错 解决 1、按照规则驼峰格式&#xff0c;如&#xff1a;appIndex.vue 2、若有.eslintrc.js文件&#xff0c;并在规则中(rules)关…