[Triton课程笔记] 1.2.3 编程实战-启动Triton Server

news/2024/10/5 23:19:07/文章来源:https://www.cnblogs.com/harrymore/p/18268946

课程链接:https://www.bilibili.com/video/BV1WY4y1g7Vj/?spm_id_from=333.788&vd_source=c2a322357481107ab7f418b1ae9ce618

一、最简单的方式

  • 开启Triton容器
  • 运行Triton服务

二、检查服务是否准备就绪

三、其他启动选项

--log-verbose <integer>: 开启verbose日志信息。

--strict-model-config <boolean>: 是否需要配置模型。

--strict-readiness <boolean>: ready状态显示状况。

--exit-on-error <boolean>: 模型加载部分失败,是否也启动。

--http-port <integer>: 指定http服务端口,默认是8000。

--grpc-port <integer>: 指定GRPC服务端口,默认是8001。

--metrics-port <integer>: metrics报告端口,默认8002。

--model-control-mode <string>: 模型管理模式,默认是none,把模型库中所有模型都load进来,并且无法动态卸载或者更新。explicit,server启动时不加载模型,可以通过api进行加载或者卸载模型;poll,动态更新模型,增加新的版本或者修改配置,服务都会动态去加载模型。

--repository-poll-secs <integer>: 模型控制模式为poll时,自动检查模型库变动的时间。

--load-model <string>: 模型控制模式为explicit时指定启动时加载的模型。

--pinned-memory-pool-byte-size <integer>:可以被Triton服务使用的锁页内存大小,关于锁页内存可以参考:https://cloud.tencent.com/developer/article/2000487。

--cuda-memory-pool-byte-size <<integer>:<integer>>:可以被Triton使用的cuda memory 大小。

--backend-directory <string>: backend搜索路径,可在使用custom backend的时候指定自己的库。

--repoagent-directory <string>:预处理模型库的库,譬如在load模型的时候进行加密。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/731594.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

神经网络

神经网络 神经网络,全称为人工神经网络(Artificial Neural Networks,ANNs),是一种模拟人脑神经系统的计算模型,用于信息处理和自动化学习任务。神经网络由大量的人工神经元(节点)组成,这些节点之间通过加权连接进行交互,能够学习和解决复杂的模式识别、分类、回归和其…

SpringMVC-01-回顾MVC架构

1、什么是MVCMVC是模型(Model)、视图(View)、控制器(Controller)的简写,是一种软件架构模式。 它通过将业务逻辑、页面控制、显示视图分离的方法来组织代码。 主要作用是降低了视图与业务逻辑间的双向偶合。 它不是一种设计模式,而是一种架构模式。当然不同的MVC存在差异。Mo…

new Class[]{User.class}和new Object[]{user}分别是什么意思

new Class[]{User.class}: new Class[]{User.class}是一个Java语法,它表示创建了一个包含User.class的Class数组对象。在这个表达式中,`User.class`是用来获取`User`类的Class对象。在Java中,每个类在加载到内存时都会有对应的`Class`对象,它包含了描述类的结构和行为的信…

10分钟掌握Python缓存

python的不同缓存组件的使用场景和使用样例全文速览python的不同缓存组件的使用场景和使用样例 cachetools的使用项目背景 代码检查项目,需要存储每一步检查的中间结果,最终把结果汇总并写入文件中 在中间结果的存储中可以使用context进行上下文的传递,但是整体对代码改动比…

stringboot

spring boot 遇到 Identify and stop the process thats listening on port 8080 or configure this application to listen on another port. 意思是:识别并停止在端口 8080 上监听的过程,或配置此应用程序以在其他端口上收听 就是说端口被占用了,用不了,要不就修改端口,…

pytorch笔记

pytorch笔记阅读有感 PyTorch 学习笔记(一):自动微分,简单模型的实现 | Shawn Wang (pengxiang-wang.github.io) 1.Tensor 基本数据结构,它的性质和用法就是数学上的张量 PyTorch 在 Tensor 中融入了深度学习相关的功能:在 GPU 上加速计算(Numpy 只能在 CPU); 储存梯度…

2024-06-26 mysql下载地址

https://dev.mysql.com/downloads/mysql/注意:你可以跳过Oracle的注册,点下面那个no thanks直接下载 或者,你对mysql的版本有需求,可以进一步选择mysql版本下载👇 https://downloads.mysql.com/archives/community/

一款开源、免费、现代化风格的WPF UI控件库 - ModernWpf

前言 今天大姚给大家分享一款开源(MIT License)、免费、现代化风格的WPF UI控件库:ModernWpf。 项目介绍 ModernWpf是一个开源项目,它为 WPF 提供了一组现代化的控件和主题,使开发人员能够创建具有现代外观的桌面应用程序。 项目特点可以轻松自定义的浅色和深色主题。 现代…

基于振弦采集仪的工程安全监测技术研究与应用

基于振弦采集仪的工程安全监测技术研究与应用 随着工程规模的不断扩大和复杂性的增加,工程安全监测变得越来越重要。工程安全监测的目的是保证工程的安全运行,预防事故的发生,保护人们的生命财产安全。其中,振弦采集仪作为一种重要的监测工具,具有广泛的应用前景。 振弦采…

c/c++语言 获取文件大小

前言全局说明一、说明二、获取文件大小 2.1 方法1 文件名:get_file_size_001.c // file name: // get_file_size_001.c // Data: // 2024/06/26 // Link: // https://www.cnblogs.com/wutou/p/18268849 // env: // ubuntu 18.04 // gcc version 7.5.0 (Ubuntu 7.5.0-3ubuntu…

FastAPI中请求URL传参

1、URL传参url请求参数是通过url请求地址携带的,例如,在以下 url 中: http://127.0.0.1:8000/items/?1 skip=0&limit=10 这些请求参数是键值对的集合,这些键值对位于 URL 的 ? 之后,并以 & 符号分隔。请求参数为:• skip :对应的值为 0• limit :对应的值为 …

vulnhub - ASSERTION1.0.1

LFI + aria2c提权vulnhub - ASSERTION 1.0.1 信息收集 nmap -sT --min-rate 10000 -p- 192.168.157.171 sudo nmap -sT -sV -sC -O -p22,80 192.168.157.171只开放了ssh和http,那就先从web入手 目录扫描 sudo gobuster dir -u 192.168.157.171 -w /usr/share/dirbuster/wordli…