statistic learning outlook

supervised learning

  • 贝叶斯估计

  • 决策树与信息熵

    • 信息熵 H ( D ) = − ∑ i = 1 n p ( X = x i ) l o g ( P ( X = x i ) ) = − ∑ p i l o g ( p i ) H(D)=-\sum_{i=1}^n p(X=x_i)log(P(X=x_i))=-\sum p_ilog(p_i) H(D)=i=1np(X=xi)log(P(X=xi))=pilog(pi),信息熵越大,(种类的)不确定度越大,H(D)=0,样本完全确定
    • 对分类问题,按照信息熵 → \to 信息增益比= 1 H A ( D ) g ( D , A ) = 1 H A ( D ) ( H ( D ) − H ( D , A ) ) \frac 1{H_A(D)}{g(D,A)=\frac 1 {H_A(D)} (H(D)-H(D,A))} HA(D)1g(D,A)=HA(D)1(H(D)H(D,A))最大化的原则选择特征,逐级下降形成决策树,
    • 据信息熵的有ID3,C4.5 alg
    • ifC(Tson)>C(Tpat),cut Tson,有CART算法,对regression question,select j,s to minimize ∑ x ∈ R 1 ( j , s ) ( y i − c 1 ) 2 + ∑ x ∈ R 2 ( j , s ) ( y 2 − c 2 ) 2 \sum_{x\in R_1(j,s)} (y_i-c_1)^2+\sum_{x\in R_2(j,s)}(y_2-c_2)^2 xR1(j,s)(yic1)2+xR2(j,s)(y2c2)2
    • to sorting problem,based on G i n i A ( D ) Gini_A(D) GiniA(D)(similar to information entropy),select A to minimize Gini(D),剪枝,select best tree
    • image-20230112095816653
  • logistic

    • logistic采用极大似然估计,和最大熵模型 − ∑ P ~ ( x ) P ( y ∣ x ) l o g P ( y ∣ x ) -\sum\widetilde{P}(x)P(y|x)logP(y|x) P (x)P(yx)logP(yx)(其中P(y|x)满足 E P ( f i ) = E P ~ ( f i ) E_P(f_i)=E_{\widetilde P}(f_i) EP(fi)=EP (fi)),求 m i n P ∈ C m a x w L ( P , w ) \underset{P\in C}{min}\ \underset{w}{max}L(P,w) PCmin wmaxL(P,w)
    • 对偶问题, m a x w m i n P ∈ C L ( P , w ) \underset{w}{max}\ \underset{P\in C}{min}L(P,w) wmax PCminL(P,w)
    • m i n P ∈ C L ( P , w ) \underset{P\in C}{min}L(P,w) PCminL(P,w) ,对P(y|x)求导,转化为求 m a x w ψ ( w ) \underset{w}{max}\ \psi(w) wmax ψ(w)
    • 这一步用improved iterative scaling求 L ( w ) = ∑ x , y P ~ ( x , y ) ∑ i = 1 n w i f i ( x , y ) − ∑ x P ~ ( x ) l o g Z w ( x ) L(w)=\underset{x,y}{\sum}\widetilde P(x,y)\sum_{i=1}^{n}w_if_i(x,y)-\underset{x}{\sum}\widetilde P(x)logZ_w(x) L(w)=x,yP (x,y)i=1nwifi(x,y)xP (x)logZw(x)关于w的极大值,或用拟牛顿法
  • SVM

    • 硬间隔支持向量机、软间隔支持向量机、非线性支持向量机(核方法)
  • Boost方法——组合权重不同的同一种分类器,得到强分类器

  1. Boost与前向分布算法的联系

  2. 二分类学习,boost 错误分类的sample weight和误差率低的分类器权重,可用加法模型、损失函数为指数函数、的前向学习算法解释

  3. 回归学习提升树,
    利用前向分布算法 f m ( x ) = f m − 1 ( x ) + T ( x ; Θ ( m ) ) , Θ ( m ) = a r g m i n Θ ( m ) ( L ( y , f m − 1 ( x i ) + Θ ( x i , Θ ( m ) ) f_m(x)=f_{m-1}(x)+T(x;\Theta(m)),\Theta(m)=arg \underset{\Theta(m)}{min}(L(y,f_{m-1}(x_i)+\Theta(x_i,\Theta(m)) fm(x)=fm1(x)+T(x;Θ(m)),Θ(m)=argΘ(m)min(L(y,fm1(xi)+Θ(xi,Θ(m))
    if loss function=均方误差损失, Θ m = ( R 1 , s 1 ) , . . . , ( R j , s j ) = y − f m − 1 ( x ) ; \Theta_m={(R_1,s_1),...,(R_j,s_j)}=y-f_{m-1}(x); Θm=(R1,s1),...,(Rj,sj)=yfm1(x);commonly ,由lagrange中值公式,残差用 ∂ L / ∂ f m − 1 ( x ) a p p r o a c h \partial L/\partial f_{m-1}(x)approach L/fm1(x)approach

    • EM——极大似然法的迭代求解(要选好初值点),正确性与收敛性的证明,求导干极值点,高斯混合模型的期望表示+极大化,期望极大值对应F函数的极大-极大,迭代可以用其他方式,可用于无监督学习?
  • recessive markov——根据隐变量表示出output的最大似然估计 P ( i , o ∣ θ ) P(i,o|\theta) P(i,oθ),计算其在 P ( i , o ∣ θ ‾ ) P(i,o|\overline\theta) P(i,oθ)下期望,\
    拉格朗日乘子法求极大值得\overline\theta,来估计o对应的i,

  • 维比特算法用动态规划求得state 1,2,…,T(近似alg不能保证整体most probably)

  • conditional random field——T为高维向量 ( X , Y w ) (X,Y_w) (X,Yw)的随机过程(x,t)

    根据状态特征 s l ( y i , x , w ) s_l(y_i,x,w) sl(yi,x,w)和transfer feature t k ( y i − 1 , y i , x , w ) t_k(y_{i-1},y_i,x,w) tk(yi1,yi,x,w)定义条件随机场P(y|x),可以用前向/back学习算法计算, P ( y i ∣ x ) a n d P ( y i , y i + 1 ∣ x ) P(y_i|x)\ and\ P(y_i,y_{i+1}|x) P(yix) and P(yi,yi+1x),针对 P w ( y ∣ x ) P_w(y|x) Pw(yx)的极大似然估计,梯度下降迭代得w,维比特算法得 y ∗ = a r g m a x y P w ( y ∣ x ) y^*=arg max_{y} P_w(y|x) y=argmaxyPw(yx)

non-supervised learning

Preface
  1. 无监督学习有聚类,降维,用于数据分析/监督学习的前处理

image-20230322105836591

  1. 监督学习的方法→层次聚类+k均值聚类
  2. SVD用于LSA,SVD用于PCA
LSA

  1. LSA👉PLSA,EM用于PLSA👉隐Markov model
  • 以p(z|x)、p(y|x)为参量,单词-文本的出现次数为因变量,对数似然估计,数值解
  1. 图的随机游走就是条件随机场吗?什么是PageRank
  • 普通的markov模型,(p1,…,pk)n+1=(p1,…,pk)n·A → 特征值分解后,类似裂项相消
  • 平稳分布的充要性?非周期,不可约
Stochastic P review

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

  • 问题与Improve——随机图上马尔科夫链未必具有平稳分布

​ ==?==添加一个等概率因子就可以避免

  • 什么是迭代计算→名字,什么是代数计算👉R=dMR+ 1 − d n 1 ⃗ \frac {1-d}n \vec1 n1d1
  • R模型已定,如果让我门估计,未知数为参量,用对数似然或平方为损失函数,梯度下降极值得估计
SVD的性质
  1. 我们的终极Boss👉LDA

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/112537.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

多线程中的Semaphore信号量

在Java多线程编程中,Semaphore是一种用于控制资源访问的机制。Semaphore允许您限制同时访问某个资源的线程数量。这在需要限制并发访问的情况下非常有用,例如数据库连接池或有限数量的线程池。 创建Semaphore 要使用Semaphore,首先需要创建…

Go 语言学习总结(9)—— Go 与 Java 全面对比总结

基本语法格式 Golang: 编码风格相对统一,简单,没有太多的语法糖等,Java层次清晰,全面面向对象。 变量相关 变量的声明及使用 在Java或者PHP、Python中,声明了变量,可以不使用,也不报错。 p…

火山引擎 ByteHouse:ClickHouse 如何保证海量数据一致性

背景 ClickHouse是一个开源的OLAP引擎,不仅被全球开发者广泛使用,在字节各个应用场景中也可以看到它的身影。基于高性能、分布式特点,ClickHouse可以满足大规模数据的分析和查询需求,因此字节研发团队以开源ClickHouse为基础&…

django创建web服务器

安装 pip install django 创建项目 django-admin startproject report django-admin startapp data //project下可创建多个app 执行使用 python manage.py migrate //orm代码到数据库 python manage.py runserver 0.0.0.0:80 权限管理 python manage.py createsuperuser 创建…

创龙TL6678F开发板: 实现FPGA与DSP之间 SRIO(3.125Gbps, 4x)通信

创龙TL6678F开发板官方Demo:SRIO_AD9613 实现了FPGA和DSP之间的SRIO通信, SRIO的速率为5Gbps. 在FPGA端, srio_gen_2 模块的参考时钟为 125MHz. 而Demo: udp_10g_echo 实现了10G以太网通信, ten_gig_eth_pcs_pma模块的参考时钟为156.25 MHz. 两者共用一个 cdcm61002, 且两个参考…

ssh登录时间久或登陆后报错

情况1 问题描述: ssh登录时间很久,登录后出现abrt-cli status timed out 的报错 问题原因: .lock文件被锁导致 执行systemctl status abrtd.service可以看到被锁的.lock 处理方式: ps -ef | grep pid 找到被锁的进程kill掉…

视觉SLAM(1):orbslam3复现

文章目录 环境依赖安装OpencvPangolinEigen3DBoW2 and g2oPythonboostlibssl-dev ORB_SLAM3的编译和安装数据集测试参考 环境 ubuntu18.04-x86nvidia-3080工作站 依赖安装 Opencv 参考这篇博客。 Pangolin 安装v0.6版本的,最新版会报错 error: ‘slots_refere…

SAP CRM 模块:概述,体系结构

前言 CRM 代表“客户关系管理”,是一组有助于以有组织的方式管理客户关系的方法和工具。 在当今竞争激烈的商业环境中,顶级公司的注意力越来越集中于其最有价值的资产– 客户。 因此,这些公司需要一种合适的软件解决方案来迎合其客户&#…

〔022〕Stable Diffusion 之 生成视频 篇

✨ 目录 🎈 视频转换 / mov2mov🎈 视频转换前奏准备🎈 视频转换 mov2mov 使用🎈 视频转换 mov2mov 效果预览🎈 视频无限缩放 / Infinite Zoom🎈 视频无限缩放 Infinite Zoom 使用🎈 视频转换 / mov2mov 如果想将视频换成另一种风格,或者想将视频中的人物替换掉,…

FastAdmin 列表多选后批量操作数据

需求如下图 html增加代码 <a href"javascript:;" class"btn btn-info btn-charge {:$auth->check(code/change)?:hide}" title"{:__(批量转移)}" >{:__(批量转移)}</a> 对应的js文件增加以下代码&#xff1a; // 初始化表格参…

Python基础指令(上)

Python基础指令上 常量和表达式变量和类型1. 什么是变量2. 变量的语法2.1 定义变量2.2 使用变量 3. 变量的类型4. 为什么要有这么多类型5. 动态类型特性 注释输入输出1. 程序与用户的交互2. 通过控制台输出3. 通过控制台输入 运算符1. 算术运算符2. 关系运算符3. 逻辑运算符4. …

日常电脑出现msvcp140.dll丢失的解决办法

msvcp140.dll 文件解析msvcp140.dll 是 Microsoft Visual C Redistributable 的一个组件&#xff0c;它包含了 C 运行时库的一些函数和类&#xff0c;这些函数和类在开发 C 应用程序时非常重要。msvcp140.dll 文件通常位于 Windows 系统目录下&#xff0c;它的主要作用是在 Win…