前端使用StreamSaver.js流式下载大文件

news/2025/1/20 16:28:46/文章来源:https://www.cnblogs.com/yyshow/p/18681763

目前前端没有很好的api支持流式的文件的分片下载。如果直接把整个文件保存到Blob对象中再保存,有可能出现很多不可以预期的问题,可能会因为达到浏览器的Blob对象上限而下载失败。也有机会因为客户端内存太低而导致OOM。那如果我们有额外的文件服务器的话,可以选择把文件先导出到文件服务器,然后前端再通过文件路径由浏览器处理下载。但是如果又没有额外的文件服务器,又想要支持分片下载,这就是这篇文章的主题。

StreamSaver.js的工作原理

StreamSaver.js采用了不同的方法。现在,您可以创建一个直接到文件系统的可写流,而不是将数据保存在客户端存储或内存中(我说的不是chromes沙盒文件系统或任何其他网络存储)。这是通过模拟服务器如何指示浏览器使用某个响应头+服务工作者来保存文件来实现的 如果您试图保存的文件来自云/服务器,请使用服务器,而不是模拟浏览器使用StreamSaver在磁盘上保存文件的操作。添加那些额外的响应头,不要使用AJAX来获取它。FileSaver有一个很好的关于使用头的wiki。如果您无法更改标题,那么您可以使用StreamSaver作为最后手段。FileSaver、streamsaver和其他类似的应用程序主要用于浏览器内客户端生成的内容。

StreamSaver.js通过伪造一个服务器文件的链接,伪造的服务器收文件下载到请求返回Content-Disposition头告诉浏览器开始下载文件。但实际上这个文件服务器并不存在并且内容也不在服务器上。因此,他的解决方案是创建一个Service Worker(sw.js),它可以拦截请求并使用responsdWith()伪装成服务器。

中间人MITM

既然是伪造的服务器,那必然涉及到中间人,默认StreamSaver.js的MITM是https://jimmywarting.github.io/StreamSaver.js/mitm.html?version=2.0.0。

如果你的客户端是联网的而且是可以访问github那没有问题,那如果你的站点是内网或客户端根本无法访问github那问题就来了,下载根本无法触发。

 在JavaScript中,MITM代表"Man-in-the-Middle",这是一种网络攻击技术。在这种攻击中,攻击者秘密地插入他们自己的设备或软件,从而在一个两方或多方的通信中间接收、修改、甚至拦截消息。这种攻击可以在没有任何一方知道的情况下进行。在JavaScript中,你可能会在谈到网络安全性时听到MITM,尤其是在处理如HTTPS这样的安全协议时。在这些情况下,JavaScript可能会使用一些API或技术(例如Service Workers)来尝试防止或检测MITM攻击。

自部署MITM:

  • 下载文件
  1. https://github.com/jimmywarting/StreamSaver.js/blob/master/mitm.html
  2. https://github.com/jimmywarting/StreamSaver.js/blob/master/sw.js

 

  • 把下载的文件放入项目目录

目录:./public

 

StreamSaver.js整合

  • 安装
npm install streamsaver --save
  • 引入依赖
import * as streamSaver from 'streamsaver'
  • 下载方法封装
 
export async function download(url, parameters, fileName) {streamSaver.mitm = 'https://xxxx/mitm.html?version=2.0.0'const fileStream = streamSaver.createWriteStream(fileName)return fetch(url, {method: 'POST',body: JSON.stringify(parameters),cache: 'no-cache',headers: {'Content-Type': 'application/json'}}).then(res => {const readableStream = res.bodyif (window.WritableStream && readableStream.pipeTo) {return readableStream.pipeTo(fileStream)}window.writer = fileStream.getWriter()const reader = res.body.getReader()const pump = () => reader.read().then(res => res.done? window.writer.close(): window.writer.write(res.value).then(pump))pump()})
}
 
  • MITM设置

本地调试,设置中间人为localhost地址:
streamSaver.mitm = 'http://localhost:9527/mitm.html?version=2.0.0'
线上设置中间人为生产地址:
streamSaver.mitm = 'https://xxxx/mitm.html?version=2.0.0'

 

参考:

  • https://juejin.cn/post/6926447267452813325
  • https://github.com/jimmywarting/StreamSaver.js
  • 原理解释:https://juejin.cn/post/6985883442122604574

 

出处:https://www.cnblogs.com/keitsi/p/17715177.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/872214.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

认识西门子ET 200SP分布式I/O系统的接口模块

文章来源:认识西门子ET 200SP分布式I/O系统的接口模块西门子ET 200SP分布式I/O系统由接口模块和信号模块组成,信号模块插接在底板上,通过底板与接口模块相连接。一个接口模块可以连接多个信号模块,具体的数量与接口模块的类型有关。今天这篇文章,我们来介绍下接口模块。 接…

【DingTalk】JsApi 地理位置相关

最近接手同事新开的半成品项目,钉钉嵌入的地图API测试中出现了BUG 钉钉API文档见此: https://open.dingtalk.com/document/orgapp/obtain-current-geographic-location-information-single-positioning一、IOS位置获取组件无法打开 安卓手机是可以不需要JSAPI授权配置的,这点…

“国产双系统”出炉!复旦微FMQL20SM非对称AMP:Linux + 裸机

“非对称AMP”双系统是什么 AMP(Asymmetric Multi-Processing),即非对称多处理架构。“非对称AMP”双系统是指多个核心相对独立运行不同的操作系统或裸机应用程序,如Linux + RTOS/裸机,但需一个主核心来控制整个系统以及其它从核心。每个处理器核心相互隔离,拥有属于自己的…

CudaSPONGE与PySAGES初步性能测试

接前一篇关于PySAGES结合CudaSPONGE使用方法的文章,本文主要还是使用了一样的测试案例。仅通过不同的测试步长,来定性的分析PySAGES的MetaDynamics实现方案结合MD软件之后的性能数据。技术背景 在前面的一篇博客中,我们介绍过CudaSPONGE的基础使用方法、CudaSPONGE调用Pytho…

记一次移动光猫(GM219-S)安全测试

前言 过个年,WiFi密码忘记了…光猫管理密码也忘记了(这个光猫也不支持物理按钮重置设置),但是手机还连着WiFi,正规操作找回不了密码,那就用咱们测试的思维来试试PWN掉这个路由器。 过程 未授权获取WiFi连接密码 还好之前没闲着,发现管理的几个未授权访问的接口如下: 获取…

Web安全测试学习手册-业务逻辑测试

首先感谢朋友倾璇的邀请 ,参与了的相关撰写,目前负责业务逻辑测试这一块的撰写,目前初步已经成型,先发出来让大家看看,欢迎点评,也可以加入我们一起来撰写~ 业务逻辑测试 介绍:这里对Web应用业务逻辑方面的安全缺陷进行介绍和常见案例讲解。 任意用户密码重置 常见的缺陷…

串口、COM口、UART口 ;TTL、 RS-232、 RS-485

串口、COM口、UART口TTL、RS-232、RS-485区别首先 串口、COM口、UART口一般指的是硬件接口。而TTL、RS-232、RS-485则是逻辑电平0和1的不同表示标准 它们区别如下:1)和RS232相比,由于RS485采用了差分传输的方式,因此抗干扰能力强很多。TTL抗干扰能力最差。2)像STM32这类单…

ML.NET 图像分类

参考文档:https://www.cnblogs.com/mq0036/p/18302572using MLNET_Image; using static MLNET_Image.MLModel1;namespace MLNET.Image {public partial class MainForm : Form{public MainForm(){InitializeComponent();}private void btnSelectImage_Click(object sender, Ev…

【医疗行业】2024中国网络安全产业势能榜优能企业「医疗行业」典型案例展示

医疗行业涉及大量敏感数据,包括患者的健康信息和医疗记录。因此,医疗数据的保护一直是行业中的重中之重。随着电子病历、远程医疗等新技术的应用,医疗行业面临着更多的网络安全威胁。在本期,我们将展示医疗行业的一些典型案例,探讨如何加强医疗数据保护,保障患者隐私和数…

海康web3.0插件开发,登录成功预览失败

做个记录,使用官方的demo,发现有登录成功,预览和回放失败,代码1000,未知错误,我遇到的情况是获取端口信息错误导致的这个是硬盘录像机原始的配置,虽然配置显示没有启用UPnP,但是插件中的默认获取的端口信息是按照这张表中的外部端口获取的,但是如果你没有启用端口映射…

Emacs 折腾日记(十)——elisp符号

符号是有名字的对象,这么说可能有点抽象。我们先来回忆一下C/C++中关于符号的内容。 C/C++ 最终被编译成机器码直接执行,在机器码中不存在变量名称,函数名称等字符,它只有一串地址。但是在写C/C++代码的时候有变量名,函数名,类名,对象名等等名称。编译器是如何做到将符号…

如何通过跨境电商流程管理工具提升项目效率?几个工具推荐

在竞争激烈的跨境电商领域,合适的工具就如同得力的助手,能够显著提升运营效率、优化业务流程,助力企业在全球市场中脱颖而出。从市场调研、选品采购,到店铺运营、营销推广以及物流管理等各个环节,都有相应的专业工具可供选择。接下来,我们将深入探讨一系列跨境电商实用工…