20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）-编程知识

20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）

news/2025/3/12 10:14:58/文章来源:https://blog.csdn.net/wb4916/article/details/132196113

20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）
2023/8/9 19:02

由于喜欢看纪录片等外文视频，通过剪映/PR2023/AUTOSUB识别字幕之后，可以通过google翻译识别为简体中文的DOCX文档。
DOCX文档转换为TXT文档之后，还需要修饰其中的字幕序号才能得到最终所需要的简体中文SRT文档。

google.py

#f=open("./1574/%03d.ts"%(n+1),"wb")
f=open("12.txt","wb")

#f = open("p:\\ts\\1574.txt")
f1 = open("1.txt")
#for n in range(1,4000):
for n in range(1,4560):
   line = f1.readline()
   #f.write(response.content)
   #f.write(line)
   f.decode().write(line)

f.close()

google12.py
J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\py>python google12.py > test.srt

f_path=r'1.txt'

temp = 1
xuhao = 1;

with open(f_path) as f:
lines = f.readlines()

for line in lines:
if temp == 1:
print(str(xuhao))
temp=0
else:
if len(line) == 1:
#print("jiangedian!")
temp=1
xuhao = xuhao+1
print(line.rstrip())

txt2srt3all.py
【处理目录下的全部ANSI编码的TXT字幕为SRT字幕，但是不处理字目录！】

# coding=utf-8
import os

# 获取当前目录
path = os.getcwd()
# 查看当前目录下所有文件
files = os.listdir(path)

# 遍历所有文件
for file in files:
# 判断文件是否为 txt 文件
if file.endswith('.txt'):
# 构建新的文件名
#new_file = file.replace('.txt', '.json')
#new_file = file.replace('.txt', '.srt')
new_file = file.replace('.txt', '.cn.srt')
# 重命名文件
#os.rename(os.path.join(path, file), os.path.join(path, new_file))



f2=open(new_file,"wb")


#f_path=r'C:\Users\Admin\Desktop\shapenetcore_partanno_segmentation_benchmark_v0_normal_2\00000001\0.txt'
#f_path=r'1.txt'
#f_path=file

temp = 1
xuhao = 1;

#with open(f_path) as f:
with open(file) as f:
lines = f.readlines()

for line in lines:
if temp == 1:
#print(str(xuhao))
#f.decode().write(line)
#f2.decode().write(str(xuhao))
#f2.write(str(xuhao))
f2.write(str(xuhao).encode())
f2.write(str('\n').encode())
temp=0
else:
if len(line) == 1:
   #print("jiangedian!")
   temp=1
   xuhao = xuhao+1
   #print(line.rstrip())
   #f.decode().write(line)
   #f2.decode().write(line.rstrip())
   #f2.write(line.rstrip())
f2.write(line.encode())

#f=open(new_file,"wb")
f2.close()

LOG：
J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\ansi的TXT>dir
驱动器 J 中的卷是 18680688682
卷的序列号是 2A59-69C0

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\ansi的TXT 的目录

2023/08/09 19:11 <DIR> .
2023/08/09 19:11 <DIR> ..
2023/08/09 12:22 67,713 8月7日.txt
2023/08/09 12:22 113,997 AC3EN2.剪影.txt
2023/08/09 12:22 67,713 path_to_your_word_file.txt
2023/08/09 12:22 75,347 Red.Eye.2005.2160p.BluRay.REMUX.HEVC.DTS-HD.MA.5.1-FGT.eng9.txt
2023/08/09 19:11 1,715 txt2srt3all.py
2023/08/07 22:29 1,671 txt2srt3xuhao56.py
6 个文件 328,156 字节
2 个目录 50,770,313,216 可用字节

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\ansi的TXT>python txt2srt3all.py

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\ansi的TXT>dir
驱动器 J 中的卷是 18680688682
卷的序列号是 2A59-69C0

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\ansi的TXT 的目录

2023/08/09 19:11 <DIR> .
2023/08/09 19:11 <DIR> ..
2023/08/09 19:11 71,024 8月7日.cn.srt
2023/08/09 12:22 67,713 8月7日.txt
2023/08/09 19:11 120,955 AC3EN2.剪影.cn.srt
2023/08/09 12:22 113,997 AC3EN2.剪影.txt
2023/08/09 19:11 71,024 path_to_your_word_file.cn.srt
2023/08/09 12:22 67,713 path_to_your_word_file.txt
2023/08/09 19:11 81,213 Red.Eye.2005.2160p.BluRay.REMUX.HEVC.DTS-HD.MA.5.1-FGT.eng9.cn.srt
2023/08/09 12:22 75,347 Red.Eye.2005.2160p.BluRay.REMUX.HEVC.DTS-HD.MA.5.1-FGT.eng9.txt
2023/08/09 19:11 1,715 txt2srt3all.py
2023/08/07 22:29 1,671 txt2srt3xuhao56.py
10 个文件 672,372 字节
2 个目录 50,769,960,960 可用字节

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\ansi的TXT>

utf8txt2srt3all.py
【处理目录下的全部UTF8编码的TXT字幕为SRT字幕，但是不处理字目录！】

# coding=utf-8
import os

# 获取当前目录
path = os.getcwd()
# 查看当前目录下所有文件
files = os.listdir(path)

# 遍历所有文件
for file in files:
# 判断文件是否为 txt 文件
if file.endswith('.txt'):
# 构建新的文件名
#new_file = file.replace('.txt', '.json')
#new_file = file.replace('.txt', '.srt')
new_file = file.replace('.txt', '.cn.srt')
# 重命名文件
#os.rename(os.path.join(path, file), os.path.join(path, new_file))


#f2=open(new_file,"wb")
#with open(new_file, "w", encoding="UTF-8") as txt_file:
#f2 = open(new_file, "wb", encoding="UTF-8")
f2 = open(new_file, "w", encoding="UTF-8")

temp = 1
xuhao = 1;

#with open(f_path) as f:
#with open(file) as f:
#with open(new_file, "w", encoding="UTF-8") as txt_file:
#with open(file, "w", encoding="UTF-8") as f:
with open(file, "r", encoding="UTF-8") as f:
lines = f.readlines()

for line in lines:
if temp == 1:
#f2.write(str(xuhao).encode())
#f2.write(str('\n').encode())
f2.write(str(xuhao))
f2.write(str('\n'))
temp=0
else:
if len(line) == 1:
   temp=1
   xuhao = xuhao+1
#f2.write(line.encode())
f2.write(line)

f2.close()

参考资料：
https://pythonjishu.com/nwbuyryewwscpxl/
使用Python对文件进行批量改名的方法

python docx utf8 读写
https://deepinout.com/python/python-qa/t_how-to-read-and-write-unicode-utf-8-files-in-python.html
如何在Python中读写Unicode（UTF-8）文件？

UTF8的脚本的调试记录，写法有很大的差异的！

Microsoft Windows [版本 10.0.19045.2311]
(c) Microsoft Corporation。保留所有权利。

C:\Users\Administrator>cd J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT

C:\Users\Administrator>j:

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT>dir
驱动器 J 中的卷是 18680688682
卷的序列号是 2A59-69C0

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT 的目录

2023/08/09 19:14 <DIR> .
2023/08/09 19:14 <DIR> ..
2023/08/09 12:27 78,650 8月7日.txt
2023/08/09 12:27 133,327 AC3EN2.剪影.txt
2023/08/09 12:27 78,650 path_to_save_txt+utf8_file.txt
2023/08/09 12:27 78,650 path_to_your_word_file.txt
2023/08/09 19:11 1,715 txt2srt3all.py
5 个文件 370,992 字节
2 个目录 50,769,956,864 可用字节

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT>
J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT>python txt2srt3all.py
Traceback (most recent call last):
File "J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT\txt2srt3all.py", line 34, in <module>
lines = f.readlines()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xb7 in position 82: illegal multibyte sequence

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT>python txt2srt3all.py

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT>python utf8txt2srt3all.py
Traceback (most recent call last):
File "J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT\utf8txt2srt3all.py", line 23, in <module>
f2 = open(new_file, "wb", encoding="UTF-8")
ValueError: binary mode doesn't take an encoding argument

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT>python utf8txt2srt3all.py
Traceback (most recent call last):
File "J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT\utf8txt2srt3all.py", line 33, in <module>
lines = f.readlines()
io.UnsupportedOperation: not readable

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT>python utf8txt2srt3all.py
Traceback (most recent call last):
File "J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT\utf8txt2srt3all.py", line 38, in <module>
f2.write(str(xuhao).encode())
TypeError: write() argument must be str, not bytes

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT>python utf8txt2srt3all.py
Traceback (most recent call last):
File "J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT\utf8txt2srt3all.py", line 40, in <module>
f2.write(str('\n').encode())
TypeError: write() argument must be str, not bytes

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT>python utf8txt2srt3all.py

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT>python utf8txt2srt3all.py

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT>python utf8txt2srt3all.py

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT>dir
驱动器 J 中的卷是 18680688682
卷的序列号是 2A59-69C0

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT 的目录

2023/08/09 19:29 <DIR> .
2023/08/09 19:29 <DIR> ..
2023/08/09 19:29 75,580 8月7日.cn.srt
2023/08/09 12:27 78,650 8月7日.txt
2023/08/09 19:29 128,367 AC3EN2.剪影.cn.srt
2023/08/09 12:27 133,327 AC3EN2.剪影.txt
2023/08/09 19:29 75,580 path_to_save_txt+utf8_file.cn.srt
2023/08/09 12:27 78,650 path_to_save_txt+utf8_file.txt
2023/08/09 19:29 75,580 path_to_your_word_file.cn.srt
2023/08/09 12:27 78,650 path_to_your_word_file.txt
2023/08/09 19:29 86,176 Red.Eye.2005.2160p.BluRay.REMUX.HEVC.DTS-HD.MA.5.1-FGT.eng9.cn.srt
2023/08/09 19:28 89,228 Red.Eye.2005.2160p.BluRay.REMUX.HEVC.DTS-HD.MA.5.1-FGT.eng9.txt
2023/08/09 19:11 1,715 txt2srt3all.py
2023/08/09 19:24 1,568 utf8txt2srt3all.py
12 个文件 903,071 字节
2 个目录 50,767,888,384 可用字节

J:\！！！！文档整理20230625\en2cn\20230809在WIN10下使用python3处理Google翻译获取的SRT格式字幕（DOCX）\utf8i的TXT>

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/59699.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

后端进阶之路——万字总结Spring Security与数据库集成实践（五）

后端进阶之路——万字总结Spring Security与数据库集成实践（五）

前言「作者主页」：雪碧有白泡泡「个人网站」：雪碧的个人网站「推荐专栏」： ★java一站式服务 ★ ★前端炫酷代码分享 ★ ★ uniapp-从构建到提升★ ★ 从0到英雄，vue成神之路★ ★ 解决算法，一个专栏就够了★ ★ 架…

阅读更多...

Vue3弹出确认（Popconfirm）

Vue3弹出确认（Popconfirm）

效果如下图：在线预览 APIs 参数说明类型默认值必传title确认框的标题string | slot‘’falsedescription确认框的内容描述string | slot‘’falsecontent展示的文本string | slot‘’falseicon自定义弹出确认框 Icon 图标string | slot‘’falsemaxWidth弹出确认框…

阅读更多...

QT QLCDNumber 使用详解

QT QLCDNumber 使用详解

本文详细的介绍了QLCDNumber控件的各种操作，例如：新建界面、源文件、设置显示位数、设置进制、设置外观、设置小数点、设置溢出、显示事件、其它文章等等操作。实际开发中，一个界面上可能包含十几个控件，手动调整它们的位置既费时…

阅读更多...

数据挖掘全流程解析

数据挖掘全流程解析

数据挖掘全流程解析数据指标选择在这一阶段，使用直方图和柱状图的方式对数据进行分析，观察什么数据属性对于因变量会产生更加明显的结果。如何绘制直方图和条形统计图数据清洗观察数据是否存在数据缺失或者离群点的情况。数据异常的两种情况…

阅读更多...

【Windows】Windows开机密码重置

【Windows】Windows开机密码重置

文章目录前言一、问题描述二、操作步骤2.1 安装DaBaiCai_d14_v6.0_2207_Online.exe2.2 插入U盘2.3 打开大白菜，点击“一键制作USB启动盘”2.4 等待进度条走完2.5 重启电脑，开机按“F12”或者“F8”（具体百度一下，对应品牌电脑开机…

阅读更多...

vue3+ts+element-plus大屏看板---横向轮播（anime.js）

vue3+ts+element-plus大屏看板---横向轮播（anime.js）

vue3ts大屏看板---横向轮播（anime.js） 1. 安装和引入anime.js1. 安装2. 引入* 引入报错：引入时候报错 2. 基于vue3tsanime.js实现一个大屏组件轮播效果，如下1. 写一个需要轮播的模块样式✏️ 代码（有写注释&#xff09…

阅读更多...

分布式应用：ELK企业级日志分析系统

分布式应用：ELK企业级日志分析系统

目录一、理论 1.ELK 2.ELK场景 3.完整日志系统基本特征 4.ELK 的工作原理 5.ELK集群准备 6.Elasticsearch部署（在Node1、Node2节点上操作） 7.Logstash 部署（在 Apache 节点上操作） 8.Kiabana 部署（在 Node1 节点…

阅读更多...

基于短信宝API零代码实现短信自动化业务

基于短信宝API零代码实现短信自动化业务

场景描述： 基于短信宝开放的API能力，实现在特定事件（如天气预警）或定时自动发送短信（本文以定时群发短信为例）。通过Aboter平台如何实现呢？ 使用方法： 首先创建一个IPaaS流程&…

阅读更多...

网络安全设备-等保一体机

网络安全设备-等保一体机

本文为作者学习文章，按作者习惯写成，如有错误或需要追加内容请留言（不喜勿喷） 本文为追加文章，后期慢慢追加等保一体机的功能等保一体机产品主要依赖于其丰富的安全网元（安全网元包括：防火…

阅读更多...

uniapp 微信小程序上下滚动的公告通知（只取前3条）

uniapp 微信小程序上下滚动的公告通知（只取前3条）

效果图： <template><view class"notice" click"policyInformation"><view class"notice-icon"><image mode"aspectFit" class"img" src"/static/img/megaphone.png"></i…

阅读更多...

前端渲染数据

前端渲染数据

在前端对接受后端数据处理后返回的接收值的时候，为了解决数据过于庞大，而对数据进行简化处理例如性别，经常会使用1， 0这俩个来代替文字的男，女。以下就是前端渲染的具体实现。以下是部分代码 <el-table-columnpr…

阅读更多...

Java8 list多属性去重

Java8 list多属性去重

大家好，我是三叔，很高兴这期又和大家见面了，一个奋斗在互联网的打工人。在 Java 开发中，我们经常会面临对 List 中的对象属性去重的需求。然而，当需要根据多个属性来进行去重时，情况会稍微复杂一些。本篇…

阅读更多...

推荐文章

最新文章