Nginx从入门到精通(超级详细)

文章目录

  • 一、什么是Nginx
    • 1、正向代理
    • 2、反向代理
    • 3、负载均衡
    • 4、动静分离
  • 二、centos7环境安装Nginx
    • 1、安装依赖
    • 2、下载安装包
    • 3、安装
    • 4、启动
    • 5、停止
  • 三、Nginx核心基础知识
    • 1、nginx核心目录
    • 2、常用命令
    • 3、默认配置文件讲解
    • 4、Nginx虚拟主机-搭建前端静态服务器
    • 5、使用nignx搭建图片-文件服务器
      • (1)root和alias的区别
  • 四、挖掘accessLog日志
    • 1、nginx访问日志的用处
    • 2、Nginx统计站点访问量、高频url统计
    • 3、自定义日志格式,统计接口响应耗时
  • 五、nginx负载均衡
    • 1、常见负载均衡策略
      • (1)节点轮询(默认)
      • (2)weight 权重配置
      • (3)ip_hash(固定分发)
    • 2、节点状态配置
  • 六、Nginx探测后端节点可用性

一、什么是Nginx

  • Nginx (engine x) 是一个高性能的HTTP和反向代理web服务器,特点是占有内存少,并发能力强,事实上nginx的并发能力在同类型的网页服务器中表现较好。使用C语言开发。
  • Nginx专为性能优化而开发,性能是其重要的考量,实现上非常注重效率,能经受高负载的考验,能支持高达50000个并发连接数

1、正向代理

正向代理:代理的是客户端,隐藏的客户端。例如:VPN

  • 客户端和目标服务器之间的服务器,客户端向代理发送一个请求指定目标服务器,然后代理向目标服务器请求并获得内容,并返回给客户端,平时说的代理服务器一般是正向代理服务器
  • 核心:用户知道自己访问的目标服务器
  • 场景:跳板机、访问原来无法访问的网站, 比如国外的一些站点
    在这里插入图片描述

2、反向代理

反向代理:代理的是服务端,隐藏的是服务端。例如:Nginx

  • 客户端和目标服务器之间的服务器,客户端向代理发送一个请求,然后代理向目标服务器请求并获得内容,并返回给客户端。反向代理隐藏了真实的服务器
  • 核心:客户端不知道要访问的目标服务器是哪台服务器,代理会根据一定的策略选择一个真实的服务器进行请求
  • 场景:访问淘宝,知道访问的域名是taobao.com, 但是后面提供数据的具体是什么域名或ip我们是不知道的
    在这里插入图片描述

3、负载均衡

单个服务器解决不了,我们增加服务器的数量,然后将请求分发到各个服务器上,将原先请求集中到单个服务器上的情况改为将请求分发到多个服务器上,将负载分发到不同的服务器,也就是我们所说的负载均衡。

4、动静分离

为了加快网站的解析速度,可以把动态页面和静态页面由不同的服务器来解析,加快解析速度,降低原来单个服务器的压力

二、centos7环境安装Nginx

1、安装依赖

nginx是使用C语言开发的,在安装Nginx前需要安装一些依赖。这些依赖可以给nginx增加很多应用。
这些依赖可以一个个分开安装,也可以一个命令全部搞定。如下:

$ sudo yum -y install gcc zlib zlib-devel pcre-devel openssl openssl-devel

2、下载安装包

从官网上下载安装包,上传到服务器。或者结果通过wget命令下载到服务器。
我把它下载到了linux的 /usr/local/src/server目录下

$ sudo wget http://nginx.org/download/nginx-1.18.0.tar.gz

然后解压

$ sudo tar -zxvf nginx-1.18.0.tar.gz

3、安装

进入解压目录,检测、编译、安装

$ cd nginx-1.18.0
$ ./configure  # 检测
$ make         # 编译
$ make install # 安装

此次安装使用的是默认的配置安装。
默认安装路径:/usr/local/nginx

4、启动

进入sbin目录,启动

$ ./nginx

查看nginx进程

$ ps -ef | grep "nginx"

或者通过80端口就可以访问了。

5、停止

$ ./nginx -s stop

三、Nginx核心基础知识

1、nginx核心目录

conf  #所有配置文件目录nginx.conf    #默认的主要的配置文件nginx.conf.default  #默认模板html  # 这是编译安装时Nginx的默认站点目录50x.html #错误页面index.html #默认首页logs  # nginx默认的日志路径,包括错误日志及访问日志error.log  #错误日志nginx.pid  #nginx启动后的进程idaccess.log #nginx访问日志sbin  #nginx命令的目录nginx  #启动命令

2、常用命令

$ ./nginx  #默认配置文件启动
$ ./nginx -s reload #重启,加载默认配置文件
$ ./nginx -c /usr/local/nginx/conf/nginx.conf #启动指定某个配置文件
$ ./nginx -s stop #停止
#关闭进程,nginx有master process 和worker process,关闭master即可
$ ps -ef | grep "nginx"  # 查看进程
$ kill -9 PID # 杀死进程

3、默认配置文件讲解

# 每个配置项由配置指令和指令参数 2 个部分构成
#user  nobody;  # 指定Nginx Worker进程运行以及用户组
worker_processes  1;   # #error_log  logs/error.log;  # 错误日志的存放路径  和错误日志
#error_log  logs/error.log  notice;
#error_log  logs/error.log  info;#pid        logs/nginx.pid;   # 进程PID存放路径# 事件模块指令,用来指定NginxIO模型,Nginx支持的有select、poll、kqueue、epoll 等。不同的是epoll用在Linux平台上,而kqueue用在BSD系统中,对于Linux系统,epoll工作模式是首选
events { use epoll;# 定义Nginx每个进程的最大连接数, 作为服务器来说: worker_connections * worker_processes,# 作为反向代理来说,最大并发数量应该是worker_connections * worker_processes/2。因为反向代理服务器,每个  并发会建立与客户端的连接和与后端服务的连接,会占用两个连接worker_connections  1024; 
}http {include       mime.types;default_type  application/octet-stream;# 自定义服务日志#log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '#                  '$status $body_bytes_sent "$http_referer" '#                  '"$http_user_agent" "$http_x_forwarded_for"';#access_log  logs/access.log  main;# 是否开启高效传输模式 on开启 off关闭sendfile        on;#减少网络报文段的数量#tcp_nopush     on;#keepalive_timeout  0;# 客户端连接保持活动的超时时间,超过这个时间之后,服务器会关闭该连接keepalive_timeout  65;#gzip  on;# 虚拟主机的配置server {listen       80; # 虚拟主机的服务端口server_name  localhost; #用来指定IP地址或域名,多个域名之间用空格分开#charset koi8-r;#access_log  logs/host.access.log  main;#URL地址匹配location / {root   html;  # 服务默认启动目录index  index.html index.htm; #默认访问文件,按照顺序找}#error_page  404              /404.html;   #错误状态码的显示页面# redirect server error pages to the static page /50x.html#error_page   500 502 503 504  /50x.html;location = /50x.html {root   html;}# proxy the PHP scripts to Apache listening on 127.0.0.1:80##location ~ \.php$ {#    proxy_pass   http://127.0.0.1;#}# pass the PHP scripts to FastCGI server listening on 127.0.0.1:9000##location ~ \.php$ {#    root           html;#    fastcgi_pass   127.0.0.1:9000;#    fastcgi_index  index.php;#    fastcgi_param  SCRIPT_FILENAME  /scripts$fastcgi_script_name;#    include        fastcgi_params;#}# deny access to .htaccess files, if Apache's document root# concurs with nginx's one#location ~ /\.ht {#    deny  all;#}}# another virtual host using mix of IP-, name-, and port-based configuration##server {#    listen       8000;#    listen       somename:8080;#    server_name  somename  alias  another.alias;#    location / {#        root   html;#        index  index.html index.htm;#    }#}# HTTPS server##server {#    listen       443 ssl;#    server_name  localhost;#    ssl_certificate      cert.pem;#    ssl_certificate_key  cert.key;#    ssl_session_cache    shared:SSL:1m;#    ssl_session_timeout  5m;#    ssl_ciphers  HIGH:!aNULL:!MD5;#    ssl_prefer_server_ciphers  on;#    location / {#        root   html;#        index  index.html index.htm#    }#}
}

4、Nginx虚拟主机-搭建前端静态服务器

什么是虚拟主机?

  • 指在一台物理主机服务器上划分出多个磁盘空间,每个磁盘空间都是一个虚拟主机,每台虚拟主机都可以对外提供Web服务,并且互不干扰,就类似虚拟机
  • 利用虚拟主机把多个不同域名的网站部署在同一台服务器上,节省了服务器硬件成本和相关的维护费用
    虚拟主机的配置如下:
server {listen       80;server_name  aabbcc.com;location / {# aabbcc.com会访问服务器的路径 aabbcc.com:80/t9101.htmlroot   /usr/local/src/nginx/html;index  youyou.html;}
}
server {listen       80;server_name  aabbccdd.com;location / {# aabbccdd.com会访问nginx的root   html;index  youyou.html index.htm;}
}

这里需要在本机配置host域名:aabbcc.com和aabbccdd.com
我们开发的前端项目(例如:vue)就可以部署到这里。

5、使用nignx搭建图片-文件服务器

现在的项目中,是很少在javaweb项目中存放图片和文件。
公司一般会提供图片服务器(fastdfs)或者云厂商的CDN(阿里云的oss存储)

(1)root和alias的区别

Nginx指定文件路径有两种方式root和alias,这两者的用法区别在于对URI的处理方法不同。
区别:

  • alias是一个目录别名的定义,root则是最上层目录的定义。
  • 还有一个重要的区别是alias后面必须要用“/”结束,否则会找不到文件的。而root则可有可无
# alias
location /i/{alias /usr/local/nginx/html/admin/;
}
#若按照上述配置的话,则访问/i/目录里面的文件时,nginx会自动去/usr/local/nginx/html/admin目录找文件。# root 
location /i/ {root /usr/local/nginx/html/admin;
}
#若按照这种配置的话,则访问/i/目录下的文件时,nginx会去/usr/local/nginx/html/admin/i下找文件。

图片服务器配置:

server {listen       80;server_name  aabbccdd.com;location /app/img {alias /usr/local/software/img/;}
}

图片的访问地址如下:http://aabbccdd.com:80/app/img/a.jpg
同一个请求地址,会有如下两种访问地址:
alias : /usr/local/software/img/a.jpg
root : /usr/local/software/img/app/img/a.jpg

四、挖掘accessLog日志

1、nginx访问日志的用处

access.log日志用处

  • 统计站点访问ip来源、某个时间段的访问频率
  • 查看访问最频的页面、Http响应状态码、接口性能
  • 接口秒级访问量、分钟访问量、小时和天访问量

默认配置:

#log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
#                  '$status $body_bytes_sent "$http_referer" '
#                  '"$http_user_agent" "$http_x_forwarded_for"';

案例:

122.70.148.18 - - [04/Aug/2020:14:46:48 +0800] "GET /user/api/v1/product/order/query_state?product_id=1&token=xdclasseyJhbGciOJE HTTP/1.1" 200 48 "https://youyou.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36"

解析:

$remote_addr 对应的是真实日志里的122.70.148.18,即客户端的IP。$remote_user 对应的是第二个中杠“-”,没有远程用户,所以用“-”填充。[$time_local]对应的是[04/Aug/2020:14:46:48 +0800]。“$request”对应的是"GET /user/api/v1/product/order/query_state?product_id=1&token=xdclasseyJhbGciOJE HTTP/1.1"。$status对应的是200状态码,200表示正常访问。$body_bytes_sent对应的是48字节,即响应body的大小。“$http_referer” 来源,防盗链接。对应的是”https://youyou.com/“,若是直接打开域名浏览的时,referer就会没有值,为”-“。“$http_user_agent” 对应的是”Mozilla/5.0 (Macintosh; Intel Mac OS X 10.12; rv:56.0) Gecko/20100101 Firefox/56.0”。“$http_x_forwarded_for” 对应的是”-“或者空。

日志变量参考:https://www.cnblogs.com/wjoyxt/p/6178731.html

2、Nginx统计站点访问量、高频url统计

查看访问最频繁的前100个IP

awk '{print $1}' access_temp.log | sort -n |uniq -c | sort -rn | head -n 100

统计访问最多的url 前20名

cat access_temp.log |awk '{print $7}'| sort|uniq -c| sort -rn| head -20 | more

命令基础

awk 是文本处理工具,默认按照空格切分,$N 是第切割后第N个,从1开始
sort命令用于将文本文件内容加以排序,-n 按照数值排,-r 按照倒序来排案例的sort -n 是按照第一列的数值大小进行排序,从小到大,倒序就是 sort -rn
uniq 去除重复出现的行列, -c 在每列旁边显示该行重复出现的次数。

3、自定义日志格式,统计接口响应耗时

日志格式增加$request_time

从接受用户请求的第一个字节到发送完响应数据的时间,即包括接收请求数据时间、程序响应时间、输出响应数据时间
$upstream_response_time:指从Nginx向后端建立连接开始到接受完数据然后关闭连接为止的时间
$request_time一般会比upstream_response_time大,因为用户网络较差,或者传递数据较大时,前者会耗时大很多

配置自定义日志格式

log_format  main  '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_referer" ''"$http_user_agent" "$http_x_forwarded_for" $request_time';
server {listen       80;server_name  aabbcc.com;location / {root   /usr/local/nginx/html;index  xdclass.html;}#charset koi8-r;#access_log  logs/host.access.log  main;
}

统计耗时接口, 列出传输时间超过 2 秒的接口,显示前5条

cat time_temp.log|awk '($NF > 2){print $7}'|sort -n|uniq -c|sort -nr|head -5
备注:$NF 表示最后一列, awk '{print $NF}'

五、nginx负载均衡

负载均衡介绍

  • 负载均衡(Load Balance)
    • 分布式系统中一个非常重要的概念,当访问的服务具有多个实例时,需要根据某种“均衡”的策略决定请求发往哪个节点,这就是所谓的负载均衡,
    • 原理是将数据流量分摊到多个服务器执行,减轻每台服务器的压力,从而提高了数据的吞吐量
  • 负载均衡的种类
    • 通过硬件来进行解决,常见的硬件有NetScaler、F5、Radware和Array等商用的负载均衡器,但比较昂贵的
    • 通过软件来进行解决,常见的软件有LVS、Nginx等,它们是基于Linux系统并且开源的负载均衡策略
    • 目前性能和成本来看,Nginx是目前多数公司选择使用的

配置案例

upstream lbs {server 192.168.0.106:8080;server 192.168.0.106:8081;
}
server {listen 80;server_name aabbcc.com;location /api/ {proxy_pass http://lbs;proxy_redirect default;}
}

http://aabbcc.com:80/api/test/hello

访问流程如下:

浏览器输入:http://aabbcc.com:80/api/v1/getUser
匹配 域名      server_name     aabbcc.com
匹配 端口      listen          80
匹配 资源路径  location        api
默认轮询转发 服务列表 lbs
最终访问的地址:http://192.168.0.106:8080/api/v1/getUser 或者http://192.168.0.106:8081/api/v1/getUser

1、常见负载均衡策略

(1)节点轮询(默认)

  • 简介:每个请求按顺序分配到不同的后端服务器
  • 场景:会造成可靠性低和负载分配不均衡,适合静态文件服务器

(2)weight 权重配置

  • 简介:weight和访问比率成正比,数字越大,分配得到的流量越高
  • 场景:服务器性能差异大的情况使用
upstream lbs {server 192.168.159.133:8080 weight=5;server 192.168.159.133:8081 weight=10; 
}

(3)ip_hash(固定分发)

  • 简介:根据请求按访问ip的hash结果分配,这样每个用户就可以固定访问一个后端服务器
  • 场景:服务器业务分区、业务缓存、Session需要单点的情况
upstream lbs {ip_hash;server 192.168.159.133:8080;server 192.168.159.133:8081;
}

2、节点状态配置

upstream还可以为每个节点设置状态值

  • down 表示当前的server暂时不参与负载
server 192.168.159.133:8080 down; 
  • backup 其它所有的非backup机器down的时候,会请求backup机器,这台机器压力会最轻,配置也会相对低
server 192.168.159.133:8080 backup; 

六、Nginx探测后端节点可用性

  • max_fails 允许请求失败的次数,默认为1.当超过最大次数时就不会请求
  • fail_timeout : max_fails次失败后,暂停的时间,默认:fail_timeout为10s
  • 参数解释
    • max_fails=N 设定Nginx与后端节点通信的尝试失败的次数。
    • 在fail_timeout参数定义的时间内,如果失败的次数达到此值,Nginx就这个节点不可用。
    • 在下一个fail_timeout时间段到来前,服务器不会再被尝试。
    • 失败的尝试次数默认是1,如果设为0就会停止统计尝试次数,认为服务器是一直可用的。
  • 具体什么是nginx认为的失败呢
    • 可以通过指令proxy_next_upstream来配置什么是失败的尝试。
    • 注意默认配置时,http_404状态不被认为是失败的尝试。
upstream lbs {server 192.168.0.106:8080 max_fails=2 fail_timeout=60s;server 192.168.0.106:8081 max_fails=2 fail_timeout=60s;
}server {location /api/ {proxy_pass http://lbs;proxy_next_upstream error timeout http_500 http_503 http_404;}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/94954.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Docker技术--Docker简介和架构

1.Docker简介 (1).引入 我们之前学习了EXSI,对于虚拟化技术有所了解,但是我们发现类似于EXSI这样比较传统的虚拟化技术是存在着一定的缺陷:所占用的资源比较多,简单的说,就是你需要给每一个用户提供一个操作平台,这一个…

npm报错sass

1.删除node模块 2.删除node-sass: npm uninstall node-sass 3.重新下载对应版本node-sass: npm i node-sass7.0.3(指定版本 控制台报错什么版本就写什么版本) 4.再运行项目 或者

Java运行时jar时终端输出的中文日志是乱码

运行Jar时在控制台输出的中文日志全是乱码,这是因为cmd/bash默认的编码是GBK,只要把cmd的编码改成UTF-8即可 两种方式修改:临时修改和注册表永久修改 临时修改 只对当前的cmd页面有效,关闭后重新打开都会恢复成GBK, 打开cmd&am…

实战黑马苍穹外卖项目8.1-10.1

文章目录 软件开发的基本流程用户层网关层应用层数据层工具 数据库设计导入准备好的前端和后端工程基础工程代码分析完成员工功能完成菜品功能入门Redis实现店铺营业HttpClient微信小程序开发缓存Spring Cache实现地址功能用户下单实现订单推送状态apache对应的工具使用项目用到…

【LeetCode】85.最大矩形

题目 给定一个仅包含 0 和 1 、大小为 rows x cols 的二维二进制矩阵,找出只包含 1 的最大矩形,并返回其面积。 示例 1: 输入:matrix [["1","0","1","0","0"],["1&quo…

Ubuntu学习---跟着绍发学linux课程记录(第二部分)

文章目录 7 文件权限7.1 文件的权限7.2 修改文件权限7.3 修改文件的属主 8、可执行脚本8.2Shell脚本8.3python脚本的创建 9Shell9.1Shell中的变量9.2 环境变量9.3用户环境变量 学习链接: Ubuntu 21.04乌班图 Linux使用教程_60集Linux课程 所有资料在 http://afanihao.cn/java …

MPI之虚拟进程拓扑

什么是虚拟进程拓扑 在很多并行应用进程中,进程的线性排列不能充分的反映进程间在逻辑上的通信模型,通常由问题几何和所用的算法决定,进程经常被排列成二维或者三维网络形式的拓扑模型而通常用一个图来描述逻辑进程排列,此种逻辑…

MySQL高阶语句(三)

一、NULL值 在 SQL 语句使用过程中,经常会碰到 NULL 这几个字符。通常使用 NULL 来表示缺失 的值,也就是在表中该字段是没有值的。如果在创建表时,限制某些字段不为空,则可以使用 NOT NULL 关键字,不使用则默认可以为空…

Unity中Shader的遮罩的实现

文章目录 前言一、遮罩效果的实现主要是使用对应的纹理实现的,在属性中暴露对应的遮罩纹理,对其进行采样后,最后相乘输出即可二、如果需要像和主要纹理一样流动,则需要使用和_Time篇一样的方法实现流动即可 前言 Unity中Shader的…

Spring源码解析(十):spring整合mybatis源码

Spring源码系列文章 Spring源码解析(一):环境搭建 Spring源码解析(二):bean容器的创建、默认后置处理器、扫描包路径bean Spring源码解析(三):bean容器的刷新 Spring源码解析(四):单例bean的创建流程 Spring源码解析(五)&…

嵌入式学习笔记(1)ARM的编程模式和7种工作模式

ARM提供的指令集 ARM态-ARM指令集(32-bit) Thumb态-Thumb指令集(16-bit) Thumb2态-Thumb2指令集(16 & 32 bit) Thumb指令集是对ARM指令集的一个子集重新编码得到的,指令长度为16位。通常在…

MVC模式分层练习

新建库 新建表 插入点数据 先不用MVC模式写功能,来看下缺点是什么 新建一个空项目 选项项目使用的JDK 自己的IDEA总是要重启下 新建模块 因maven还没教 添加框架支持 添加后项目多了这些 添加些必要依赖 这里注意下,如果导入jar包不对可以重新导入下或者是jar包本身出了问…