AI大模型探索之路-实战篇1:基于OpenAI智能翻译助手实战落地

文章目录

  • 前言
  • 一、需求规格描述
  • 二、系统架构设计
  • 三、技术实施方案
  • 四、核心功能说明
  • 五、开源技术选型
  • 六、代码实现细节
    • 1.图形用户界面(GUI)的开发
    • 2.大型模型调用的模块化封装
    • 3.文档解析翻译结果处理
  • 总结


前言

在全球化的浪潮中,语言翻译需求日益增长。市场上涌现出各式各样的翻译工具和平台,然而,免费的解决方案往往局限于简短文本的翻译。面对长篇文档,用户通常不得不转向付费服务。鉴于大型预训练语言模型(LLMs)在自然语言翻译上的显著优势,利用这些模型打造一款高效、经济的翻译工具,不仅能满足市场需求,同时亦具备极高的商业潜力与数据安全性。

针对这一需求,我们提出了一个基于OpenAI智能翻译助手的实战落地项目。该项目旨在开发一款支持多语种互译、兼容多种文件格式的翻译工具,以满足用户对长篇文档翻译的需求。


一、需求规格描述

1)支持包括但不限于PDF、Word等多样化的文件格式;
2)实现多语种间的互译功能;
3)兼容并优化多种大型预训练语言模型架构设计

二、系统架构设计

在这里插入图片描述

1)用户通过客户端上传待翻译文件;
2)系统后端进行文件解析,调用适配的大型模型执行翻译任务,并将翻译结果整合为新文档;
3)最终将翻译后的文档返回给用户以供下载。

三、技术实施方案

1)方案一:基于目标大型模型选择对应的API接口,自主封装模型调用流程;
2)方案二:采用LangChain框架,以简化大型模型集成过程,该框架负责隔离并封装模型调用细节。

本次先采用方案一实现,后续再引入LangChain框架简化改造。

四、核心功能说明

  1. 文本:高精度文本解析;
  2. 表格:表格内容智能辨识与翻译;
  3. 图片:图片内文字暂不予处理,考虑到其处理难度及相对较低的需求优先级。

五、开源技术选型

选择对文本和表格支持性比较好的pdfplumber
在这里插入图片描述

六、代码实现细节

1.图形用户界面(GUI)的开发

核心代码样例:

def launch_gui(args):global global_argsglobal_args = argsiface = gr.Interface(fn=translate_with_gui,inputs=[gr.File(label="上传PDF文件"),gr.Dropdown(choices=["中文", "日语", "西班牙语"], value="中文", label="选择目标语言"),  # 这里添加了default参数gr.Dropdown(choices=["OpenAIModel", "GLMModel"], value="OpenAIModel", label="选择大模型"),  # 这里添加了default参数gr.Radio(choices=["PDF", "Markdown","word"], value="PDF", label="选择输出格式")  # 选择输出格式],outputs=gr.Textbox(label="输出结果"))iface.launch()

在这里插入图片描述

2.大型模型调用的模块化封装

核心代码样例:

class OpenAIModel(Model):def __init__(self, model: str, api_key: str):self.model = modelopenai.api_key = api_keydef make_request(self, prompt):attempts = 0while attempts < 3:try:if self.model == "gpt-3.5-turbo":response = openai.ChatCompletion.create(model=self.model,messages=[#{"role": "system", "content": super.get_system_prompt()},{"role": "user", "content": prompt},])translation = response.choices[0].message['content'].strip()else:response = openai.Completion.create(model=self.model,prompt=prompt,max_tokens=150,temperature=0)translation = response.choices[0].text.strip()return translation, True

3.文档解析翻译结果处理

1)文档解析:引用工具插件将对文档进行解析,页、内容(文段、表格、图片)
2)文档翻译:调用大模型API翻译:文段、表格
3)文档生成:将翻译后的内容回写生成新文档、输出下载
核心代码样例:

# 定义一个PDFTranslator类
class PDFTranslator:# 定义初始化函数,接收一个model_name参数def __init__(self, model: Model):# 创建一个model对象,用于执行翻译任务self.model = model# 创建一个PDFParser对象,用于解析PDF文件self.pdf_parser = PDFParser()# 创建一个Writer对象,用于写入文件self.writer = Writer()def translate_pdf(self, pdf_file_path: str, file_format: str = 'PDF', target_language: str = 'Chinese',output_file_path: str = None, pages: Optional[int] = None):# 使用PDFParser对象解析指定的PDF文件,并将结果赋值给self.bookself.book = self.pdf_parser.parse_pdf(pdf_file_path, pages)# 遍历self.book的每一页for page_idx, page in enumerate(self.book.pages):# 遍历每一页的每个内容for content_idx, content in enumerate(page.contents):#生成提示语prompt = self.model.translate_prompt(content, target_language)LOG.debug(prompt)translation, status = self.model.make_request(prompt)LOG.info(translation)# 更新self.document.pages中的内容content.apply_translated_paragraphs(translation)"""用book对象存储翻译的结果"""self.book.pages[page_idx].contents[content_idx].set_translation(translation, status)# 使用Writer对象保存翻译后的书籍,并返回保存的路径return self.writer.save_translated_book(self.book, output_file_path, file_format)

总结

1)Prompt工程是翻译质量的核心,要求开发者精通其构造与优化技巧;
2)LangChain的使用大幅简化了大型模型的集成和操作,极大提升了开发效率;
3)展望更多应用场景,例如基于大型模型重构的翻译应用、语音点餐系统、智能旅行助手、订票平台以及打车服务等,均有望在不久的将来得到实质性进展。

通过这个项目的实施,我们成功地实现了一个基于OpenAI智能翻译助手的实战落地工具。该工具不仅满足了市场对长篇文档翻译的需求,还具备高效、经济的特点,并且保证了数据的安全性。我们相信,随着技术的不断进步和应用场景的扩展,该工具将在未来得到更广泛的应用和发展。

👉实战系列篇
AI大模型探索之路-实战篇2:基于CVP架构-企业级知识库实战落地
AI大模型探索之路-实战篇3:基于私有模型GLM-企业级知识库开发实战

🔖更多专栏系列文章:AIGC-AI大模型探索之路

文章若有瑕疵,恳请不吝赐教;若有所触动或助益,还望各位老铁多多关注并给予支持。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/636742.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu无法安装向日癸15.2.0.63062_amd64.deb最新版

Ubuntu安装向日葵远程控制 安装包下载 安装方式 方式一&#xff1a;运行安装包安装 方式二&#xff1a;终端命令安装 通过以下教程可以快速的安装向日葵远程控制&#xff0c;本教程适用于Ubuntu18.04/20.04/22.04 安装包下载 进入向日葵远程控制下载官网下载向日葵远程控制Lin…

【Linux】对system V本地通信的内核级理解

一、system V版本的进程间通信技术 通过之前的学习&#xff0c;我们大致可以感受出来&#xff0c;共享内存&#xff0c;消息队列和信号量在使用的时候是有很多共性的。它们三个的接口&#xff0c;包括接口中传的参数有的都有很大的相似度。其实&#xff0c;共享内存&#xff…

Learn ComputeShader 01 First Computer Shader

使用Unity版本&#xff1a;2019.4.12f1 整体流程&#xff1a; 1添加一个quad object并添加一个无光照材质 2.相机投影模式设置为正交 3.调整quad使其完全显示在相机内 4.创建脚本并且使用计算着色器覆盖quad的纹理 5.创建一个compute shader 前三步完成以后结果应该是这…

宽带上网技术发展(xDSL、PON)

文章目录 xDSL&#xff08;x数字用户线&#xff0c;x Digital Subscriber Line&#xff09;IDSL(基于ISDN数字用户线路)ADSL(不对称数字用户线路)RADSL(速率自适应数字用户线路)HDSL(高速率数字用户线路)VDSL(极高速率数字用户线路)SDSL(单对线路/对称数字用户线路) PON&#x…

《深入浅出.NET框架设计与实现》笔记2——C#源码从编写到执行的流程

中间语言&#xff08;Intermediate Language&#xff0c;IL&#xff09; C#编译器在编译时&#xff0c;会将源代码作为输入&#xff0c;并以中间语言形式输入出&#xff0c;该代码保存在*.exe文件中或*.dll文件中。 公共语言运行时&#xff08;CLR&#xff09; 可以将IL代码…

Spring之CGLIB和JDK动态代理底层实现

目录 CGLIB 使用示例-支持创建代理对象&#xff0c;执行代理逻辑 使用示例-多个方法&#xff0c;走不同的代理逻辑 JDK动态代理 使用示例-支持创建代理对象&#xff0c;执行代理逻辑 ProxyFactory 如何自动在CGLIB和JDK动态代理转换 使用示例-使用CGLIB代理方式 使用示…

深入理解Java IO流:字节流

深入理解Java IO流&#xff1a;字节流 引言 在Java中&#xff0c;IO&#xff08;输入/输出&#xff09;操作是程序与外部世界交互的重要方式。 其中&#xff0c;File类是进行文件操作的基础&#xff0c;而字节流和字符流则是数据传输的两种主要方式。 本文将深入探讨这些概念及…

综合案例(前端代码练习):猜数字和表白墙

目录 一、猜数字 html代码&#xff1a; 点击 猜 按钮的js代码&#xff1a; 点击 重开游戏 按钮的js代码&#xff1a; 整体代码&#xff1a; 页面效果&#xff1a; 二、留言板 css代码&#xff1a; html代码&#xff1a; js代码&#xff08;主逻辑在这&#xff09;&am…

vision颜色工具_CogColorExtractorTool

颜色提取工具 CogColorExtractorTool 从彩色图像中抽取像素来创建灰度图像 添加图片和工具 复位 需求:提取中间的红色的玫瑰 参数介绍: 膨胀 形态操作:匹配到的到都是像素点,数值越大,匹配到的结果越完整 柔和度&#xff1a; 如果要生成灰度输出图像&#xff0c;该图像的…

第07-4章 网络层详解

7.1 网络层协议 IP协议ARP&#xff08;地址解析协议&#xff09;RARP&#xff08;反向地址解析协议&#xff09;ICMP&#xff08;互联网控制消息协议&#xff09; 7.2 IP协议详解 7.2.1 IP协议功能 寻址和路由传递服务&#xff08;不可靠&#xff0c;尽最大努力&#xff0c…

Unity面向切面编程

一直说面向AOP&#xff08;切面&#xff09;编程&#xff0c;好久直接专门扒出理论、代码学习过。最近因为某些原因&#x1f62d;还得再学学造火箭的技术。 废话不多说&#xff0c;啥是AOP呢&#xff1f;这里我就不班门弄斧了&#xff0c;网上资料一大堆&#xff0c;解释的肯定…

python怎么连接oracle

一&#xff1a;弄清版本&#xff0c;最重要&#xff01;&#xff01;&#xff01; 首先安装配置时&#xff0c;必须把握一个点&#xff0c;就是版本一致&#xff01;包括&#xff1a;系统版本&#xff0c;python版本&#xff0c;oracle客户端的版本&#xff0c;cx_Oracle的版本…