ML:2-2-2 sigmoid 函数的替代方案

文章目录

  • 1. sigmoid function的替代方案
  • 2. 如何选择activation function
  • 3. 为什么模型需要activation function

【吴恩达p62-64】

1. sigmoid function的替代方案

  1. 来看上周的例子,预测一个商品是否能成为消冠。
  2. 这里的awareness可能是binary的。人们要么知道/不知道。但事实上,可能是知道一点,完全知道…
  3. 因此,与其用0/1来预测(太简单了)或者0-1之间的数字,不如直接尝试预测awareness的概率。让awareness可以取到负值。
  4. 使用该方程,来预测awareness,会得到左侧的图像。如果想让a1_2取到大雨1的数字,在neural network里更常见的是使用右侧图像的这种activation【ReLU】,这样g(z)就可以取到所有非负数。

请添加图片描述
5. 一些常见的activation function:
(1) Linear activation function【也可以说没有使用任何activation function, 因为会直接让a = wx+b】
(2)sigmoid
(3)RuLU

请添加图片描述

2. 如何选择activation function

  1. 如何选择output layer的activation function,这取决于target label / 真实值y是什么。
    (1)处理classification的问题,sigmoid function通常是最自然的选择。因为让neural network去预测y=1的概率,跟我们做logistic regression一样。
    (2)处理regression问题时,如果y值可正可负(预测股价变化)建议用linear activation function。因为y值可+可-。
    (3)处理regression问题时,如果y值只能是非负数,那么就用ReLU
    请添加图片描述
  2. 如何选择hidden layer的activation function:
    1. ReLU是neural network里最常见的一种选择。
      原因一:ReLU只有一个部分是平坦的,sigmoid有2部分,flat会导致gradient descent很慢。因为flat会导致cost function的偏导约等于0.
      原因二:它计算更快
      请添加图片描述
      请添加图片描述

3. 为什么模型需要activation function

  1. 如果model全用linear activation function在所有的neuron会怎么样?
    这个模型会完全等于linear regression。

请添加图片描述

  • 这个模型会完全等于linear regression。(过程)

请添加图片描述

  • 如果所有的hidden layer都用linear activation function,只有output layer用logistic activation function的话,这个模型会完全等于logistic regression。
    请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/423208.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

kafka参数配置参考和优化建议 —— 筑梦之路

对于Kafka的优化,可以从以下几个方面进行思考和优化: 硬件优化:使用高性能的硬件设备,包括高速磁盘、大内存和高性能网络设备,以提高Kafka集群的整体性能。 配置优化:调整Kafka的配置参数,包括…

钡铼新品 BL120 Modbus工业协议转换网关

随着物联网技术的迅猛发展,人们深刻认识到在智能化生产和生活中,实时、可靠、安全的数据传输至关重要。在此背景下,高性能的物联网数据传输解决方案——协议转换网关应运而生,广泛应用于工业自动化和数字化工厂应用环境中。 钡铼…

灰度图像的自动阈值分割

第一种:Otsu (大津法) 一、基于cv2的API调用 1、代码实现 直接给出相关代码: import cv2 import matplotlib.pylab as pltpath r"D:\Desktop\00aa\1.png" img cv2.imread(path, 0)def main2():ret, thresh1 cv2.…

理想架构的Doherty功率放大器理论与仿真

Doherty理论—理想架构的Doherty功率放大器理论与仿真 参考: 三路Doherty设计 01 射频基础知识–基础概念 ADS仿真工程文件链接:理想架构的Doherty功率放大器理论与仿真 目录 Doherty理论---理想架构的Doherty功率放大器理论与仿真0、Doherty架构的作用…

基于jQuery与Spring MVC实现用户密码异步修改的实战演示

文章目录 一、实战概述二、实战步骤(一)创建表单1、表单界面2、表单代码3、脚本代码 (二)后端控制器(三)测试代码,查看效果1、弹出更改密码表单2、演示更改密码操作 三、实战总结 一、实战概述 …

C++入门学习(十一)字符型

C中的字符型可以表示ASCII码中的所有字符,包括字母、数字、标点符号等。 ASCII码是一种用于编码字符的编码系统,它使用不同的数值来表示不同的字符。ASCII码使用7位或8位二进制数来表示每个字符,因此可以表示128或256个不同的字符。 在ASCI…

【力扣】记录一下竞赛分上 Knight

记录一下力扣上 Knight 力扣的题还是相对来说比较简单的,前两个月写的题多一点,后面几乎都是只做了每日一题,感觉正常来说刷个两三个月的题水平就差不多够了,甚至在我才刷半个月的时候就可以做三题了,排名和现在差不多…

Unity3D控制人物移动的多种方法

系列文章目录 unity知识点 文章目录 系列文章目录前言一、人物移动之键盘移动1-1、代码如下1-2、效果 二、人物移动之跟随鼠标点击移动2-1、代码如下2-2、效果 三、人物移动之刚体移动3-1、代码如下3-2、效果 四、人物移动之第一人称控制器移动4-1、代码如下4-2、效果 五、And…

计算视图里的General 和 advanced

1. data category: 是什么类型的视图 2. run with:执行脚本的计算视图时候,用什么权限来执行 3. type:标准视图还是个时间层级视图 4. default client: 用哪个client来过滤视图的值(一般在BW上就用session client,从底层很多个ERP clie…

如何使用 Helm 在 K8s 上集成 Prometheus 和 Grafana|Part 3

在本教程的前两部分,我们分别了解和学习了Prometheus 和 Grafana 的基本概念和使用的前提条件,以及使用 Helm 在 Kubernetes 上安装 Prometheus。 在今天的教程中,我们将为你介绍以下内容: 安装 Grafana;集成 Promethe…

[ACM学习] 背包问题深化

01背包的优化 因为我们更新数据时,都是从左到右进行更新的,所以我们可以把二维的dp变成一维的dp,并从后往前进行更新(这样可以保证进行更新的数据都是由旧数据更新新数据,而不是由新数据更新旧数据) 多重背…

LeetCode-135】分发糖果(贪心)

LeetCode135.分发糖果 题目描述 老师想给孩子们分发糖果,有 N 个孩子站成了一条直线,老师会根据每个孩子的表现,预先给他们评分。 你需要按照以下要求,帮助老师给这些孩子分发糖果: 每个孩子至少分配到 1 个糖果。…