计量经济学|学习笔记以及学习感悟

        初级计量经济学着重于介绍基本的统计工具和经济模型,以帮助理解经济数据和经济现象之间的关系。它包括回归分析、假设检验和预测方法等内容。中级计量经济学则深入研究这些方法的理论基础和实际应用,包括更复杂的模型和技术,如面板数据分析、时间序列分析和因果推断等。中级课程还探讨了更多的计量经济学理论,如内生性问题、工具变量和因果推断的困难等。

一、回归模型

(一)常用—实证模型选择及结果解读

1.常用实证模型选择

名称用途功能stata代码
OLS回归(普通最小二乘回归)适用于连续因变量,假设因变量和自变量之间有线性关系。最基本的线性回归模型。
它试图找到一个线性方程,使得所有观察点与回归线之间的距离的平方和最小。
例: 研究教育水平《自变量)如何影响个人收入《因变量)eg y xx1 x2 x3火导出结果
reg 被解释变量 解释变量 控制变量 1控制变量 2yeariindustrest store regusing 主变量回归结果.rtt, replace nogap ar2 b (%6.4f)t (9%6. 4f) star(* 01 ** 0.05 *** 0.01)
分位数回归它提供了不同分位数(如下四分位数、中位数、上四分位数)的回归系数估计。与OLS不同,分位数回归不是最小化误差的平方和,而是关注特定分位数(如中位数)的误差。例:研究培训项目《自变量)对员工工资(因变量)在不同工资水平(如中位数上四分位数)的影响
分位数为 0.1 0.25 0.50,75 0.9,可根据研究问题自行调整5qreg y x x2 x3,9 (1.25.5.75.9 )
Probit模型适用于需要估计某事件发生的概率的情境。Probit模型用于处理二元因变量的情况,例如“是/否”类型的响应。
它使用正态分布累积分布函数来预测二元结果的概率。
例:分析个人的某些特征《如年龄、教育水平)如影响其是否选择退休《二元因变量:退休/不退休)y为虚拟变量 01
probit y x xl x2 x3
Logit模型它是分析二元响应变量的常用方法,尤其在医学和社会科学研究中。类似于Probit模型,但使用的是逻辑分布函数。
Logit模型同样适用于二元因变量,如“成功/失败”。
*y为虑拟变量01
ogit y x xl x2 x3
Tobit模型:常用于处理非负数据或有上限的数据。用于处理有下限或上限的因变量,例如测量值不能低于零。
Tobit模型考虑了截断数据的问题,可以提供对截断数据更准确的估计
xttobit y x x x2 x3,11 (0)
nolog tobit
固定效应模型适用于研究个体(如国家、公司、个人)随时间变化的行为。在面板数据(时间序列和横截面数据的组合)分析中常用。
通过控制不随时间变化的个体特定效应,从而减少遗漏变量偏误
例:分析公司政策对员工生产力的影响,固定效应模型可以控制每个公司的特定持征《如公司文化》。
设为面板数据
xtsetid year
*固定效应模型
treg y xx1 x2 x3, feest sttore reg!
随机效应模型随机效应模型更适用于个体效应被假设为随机且与其他解释变量不相关的情况。
它可以提供固定效应模型无法提供的跨个体比较
也用于面板数据,但假设个体效应与解释变量无关。例:在分析多个国家的经济增长数据时,每个国家的特定效应可能被视为随机随机效应模型
ktreg y xx1 x2 x3,reest store reg2
导出回归结果
xtreg 被解释变里var1 var2 var3. year i. industry, fe
est store reg2
esttab reg1reg2 using 回以结果. rtf,replace b(%6.4f) t (%6.4f)nogapar2 star("01**0.05·.0.011

2.回归分析实证结果解读

1)相关分析
        表一展示的是变量Y与X1和X2的 Pearson相关系数结果:能够看出,Y与X1之间的相关系数为0.4574,大于0,可见二者之间呈现正向的相关关系,并且其相应的P值为.0003,小于0.05,可见在5%的显著性水平下,两个变量之间的相关程度能够很好的反映总体Y与X2的相关系数为0.2441,大于0,二者之间呈现正向的相关关系,且相应的P值为0.0672,大于0.05,小于0.10,可见在10%的显著性水平下,这两个变量之间的相关程度也能够较好的反映总体。
虽然Y与X1和X2之间存在正向的相关关系,但是要判断具体的影响程度,还需要通过构建线性回归模型进行分析。
2)多元线性回归分析
        表二展示的是回归分析的估计结果:能够看出,变量1对应的估计系数为5.09*10^(-7),经过T检验对应的统计值为3.2548,相应的P值为0.0020,小于0.05,可见在5%的显著性水平下,该自变量对因变量的影响是显著的;变量X2的估计系数为0.0001,T统计值为0.5636,相对应的P值为0.5754,大于0.05,可见在5%的显著性水平下,2对因变量Y的影响并不显著。
两个变量的经济意义解释为:在保持另一个变量不变的情况下,X1每增加一个单位,Y平均增加5.09*10^(-7)个单位;且在保持另一个变量不变的情况下,X2每增加一个单位,Y平均增加0.0001个单位。
        该方程对应的修正后的拟合优度为0.1847,与1相距较大,可见该方程的拟合程度相对较差,并且其F统计值为7.340,相应的P值为0.0015,小于0.05,可见在5%的显著性水平下自变量整体对因变量的影响是显著的。

(二)简单线性回归模型

1.简单线性回归笔记


 

2.

二、时间序列模型

(一)时间序列基本定义与概念

1.时间序列—给定时间段以及每个时间点的随机变量得到一个观测值后的数值序列

# 基于聚宽接口
prices = get_price('000300.XSHG', start_date='2018-01-01', end_date='2019-12-13', frequency='daily', fields='close')
fig = plt.figure(figsize=(10, 6))
ax = fig.add_axes([0.2, 0.2, 1.2, 1.2])ax.plot(prices, color="blue", linewidth=1.5, linestyle="-", label=r'hs300')
plt.legend(loc='upper right', frameon=False)

 2.平稳性—较为宽松的条件就是使它们的统计特征保持不变

3.自相关系数—同一个时间序列内的两个不同的时间段的相关性

(二)常见的时间序列模型

1.白噪声—非常简单的一种建模时间序列的模型

2.随机游走—random walk是对白噪声的简单延伸。

3.AR、MA以及ARMA—时间序列分析中常见的模型

1)自回归模型(AR)
自回归模型是一种用于描述时间序列数据内部相关性的模型。在自回归模型中,当前时刻的数值由过去时刻的数值线性组合得到,即当前值与过去值之间存在相关性。AR模型通常表示为AR(p),其中p代表模型中考虑的过去时刻的数量。例如,AR(1)模型表示当前值仅由一个时间步长前的值影响。

 2)移动平均模型(MA)
移动平均模型是另一种用于时间序列建模的方法。在移动平均模型中,当前时刻的数值由随机误差或残差项的线性组合得到,而不是依赖于过去时刻的数值。MA模型通常表示为MA(q),其中q代表模型中考虑的过去误差的数量。例如,MA(1)模型表示当前值仅由一个时间步长前的误差项影响。

3)自回归移动平均模型(ARMA)
自回归移动平均模型是将AR模型和MA模型结合起来的模型。ARMA模型结合了考虑过去数值相关性的自回归部分和考虑误差影响的移动平均部分。ARMA模型通常表示为ARMA(p, q),其中p代表自回归部分的阶数,q代表移动平均部分的阶数。ARMA模型能够更灵活地捕捉复杂的时间序列数据内部结构。

(三)平稳性检验

        白噪声、MA模型一定是平稳的(这里的平稳都是弱平稳);随机游走一定是不平稳的;ARMA模型取决于其AR部分。所以唯一需要做平稳性检验的就是AR模型。

1.单位根检验—检验AR序列是否平稳,就是检验是否存在某个根大于等于1

2.ADF检验—经典的单位根检验方法

        ADF检验的全称是Augmented Dickey-Fuller test,它是Dickey-Fuller(DF)检验的扩展。DF检验只能应用于一阶AR模型的情况。当序列为高阶时,存在滞后相关性,于是可以使用更适用的ADF检验。

        ADF检验(Augmented Dickey-Fuller test)是一种用于检验时间序列数据是否具有单位根(unit root)的统计检验方法。单位根存在意味着时间序列数据具有非平稳性,即其均值或方差随时间变化而不稳定。

1)检验原理
        ADF检验建立在自回归模型(AR)的基础上,用于判断时间序列数据是否具有单位根。其原假设(H0)是时间序列数据具有单位根,即非平稳;备择假设(H1)是时间序列数据不具有单位根,即平稳。通过对序列进行差分运算,可以将具有单位根的非平稳序列转化为平稳序列。

        ADF检验的关键是引入滞后项(lagged terms),以考虑时间序列数据中的自相关性。通过比较包含不同滞后项的回归模型,可以确定序列是否具有单位根。

2)检验步骤
        1. 提出原假设和备择假设。
        2. 构建带有滞后项的回归模型,其中包括一阶差分项来探索时间序列数据的特性。
        3. 使用所构建的回归模型进行统计检验,其中检验统计量与相应的临界值进行比较。
        4. 根据检验统计量的显著性水平,判断是否拒绝原假设,从而得出时间序列数据的平稳性结论。

3)结果解释
        如果检验统计量小于临界值,我们可以拒绝原假设,并得出时间序列数据是平稳的结论;反之,如果检验统计量大于临界值,则无法拒绝原假设,表明时间序列数据具有单位根,即非平稳。

        4) 应用领域
ADF检验常用于金融、经济学等领域,用于验证时间序列数据的平稳性,从而为后续的时间序列分析和建模提供基础。

        当我们采用ADF进行检验的时候,我们实际上已经假设用AR模型对序列进行建模了。

3.图形判法—直观且主观的判断方法

  1)主要步骤
1. 时序图(Time Series Plot):** 首先绘制时间序列数据的时序图,即将时间序列的数值随时间的变化进行简单的折线图展示。时序图可以帮助我们观察时间序列数据是否在整体上呈现出趋势或季节性变化。

2. 自相关图(Autocorrelation Plot):** 绘制时间序列数据的自相关图,用于观察不同滞后阶数下的自相关系数。自相关图可以帮助我们了解时间序列数据是否存在明显的自相关性,以及可能的非平稳特征。

3. 部分自相关图(Partial Autocorrelation Plot):** 绘制时间序列数据的部分自相关图,用于观察不同滞后阶数下的部分自相关系数。部分自相关图有助于识别时间序列数据中的滞后效应,从而揭示可能的非平稳性特征。

2)图形解读
- 时序图:** 如果时序图呈现出明显的趋势、季节性或周期性,通常意味着时间序列数据可能不具有平稳性。
- 自相关图和部分自相关图:** 如果自相关图和部分自相关图显示出长期的自相关性结构,或者在较大滞后阶数上仍然存在显著的相关性,这也可能表明时间序列数据存在非平稳性。

3)注意事项
- 图形判断法通常作为初步分析的手段,为后续的严格统计检验提供参考。
- 单独使用图形判断法可能会产生主观偏差,因此最好与定量的统计检验方法相结合,以得出更可靠的结论。

参考引用

[1](时间序列相关介绍)

[2]stata实证分析代码🫡模型篇-(常用实证模型)

[3]回归结果怎么看?✅手把手教你看懂回归结果---(回归结果解读)

[4]计量经济----(简单线性回归笔记来源)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/307814.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python 操作 MySQL:使用 mysql-connector-python 操作 MySQL 数据库

大家好,我是水滴~~ 当涉及到使用 Python 操作 MySQL 数据库时,mysql-connector-python 库是一个强大而常用的选择。该库提供了与 MySQL 数据库的交互功能,使您能够执行各种数据库操作,如连接数据库、执行查询和插入数据等。在本文…

IDEA使用HDFS的JavaApi

注:以下代码操作是利用junit在java测试文件夹中实现。 1. 准备工作 1.1 创建测试类 创建测试类,并定义基本变量 public class HDFSJAVAAPI {// 定义后续会用到的基本变量public final String HDFS_PATH "hdfs://hadoop00/";Configuration …

CleanMyMac X 4.14.6中文版2024年最新必备的Mac系统清理工具

CleanMyMac X 4.14.6中文版是一款专业的Mac系统清理软件,可一键智能扫描清理mac系统日志缓存磁盘垃圾和多余语言安装包,快速释放电脑内存,轻松管理和升级Mac上的应用。同时CleanMyMac X 破解版可以强力卸载恶意软件,修复系统漏洞&…

CSI多普勒效应

CSI多普勒效应 一、定义二、应用三、计算方法1方法2STFT和DFT间的区别 一、定义 多普勒频移是指由于运动引起的信号频率的变化。当信号源相对于接收器运动时,由于多普勒效应,信号的频率会发生改变。多普勒频移可以通过以下公式表示: 二、应…

acwing 前缀差分

二维差分 构造差分时,在读入矩阵元素时同时构建差分即最初差分矩阵是一个全零矩阵的差分读入一个元素时,差分矩阵随即更新即该数组是一个含有已读入元素的矩阵的差分矩阵随后对于区间累加,执行相应操作,因为当前矩阵已经是构造好…

最小覆盖子串(LeetCode 76)

文章目录 1.问题描述2.难度等级3.热门指数4.解题思路参考文献 1.问题描述 给你一个字符串 s 、一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串,则返回空字符串 “” 。 注意: 对于 t 中重复字符&#xff…

再见2023,你好2024(附新年烟花python实现)

亲爱的朋友们: 写点什么呢,我已经停更两个月了。2023年快结束了,时间真的过得好快,总要写点什么留下纪念吧。这一年伴随着许多挑战和机会,给了我无数的成长和体验。坦白说,有时候我觉得自己好像是在时间的…

Kindle使用USB数据线传书封面无法显示问题

以下内容只针对USB传书(非越狱版本,越狱了有相关插件,这里不谈),不包括邮件传书。 恶心图如下: 直接把mobi/azw3/azw (epub模式不能直接拷贝,kindle无法读取)格式的电子…

机器人中的数值优化之罚函数法

欢迎大家关注我的B站: 偷吃薯片的Zheng同学的个人空间-偷吃薯片的Zheng同学个人主页-哔哩哔哩视频 (bilibili.com) 本文ppt来自深蓝学院《机器人中的数值优化》 目录 1 L2-Penalty Method 1.1等式约束 1.2不等式约束 2 L1-Penalty Method 3 Barrier Method …

Python 简易图形界面库easygui 对话框大全(续)

目录 EasyGUI库 主要特点 使用场景 对话框样式 10. 文件打开框 fileopenbox 11. 文件保存框 filesavebox 12. 目录打开框 diropenbox 13. 索引对话框 indexbox 14. 例外报告框 exceptionbox 15. 代码文本框 codebox 16. 密码输入框 passwordbox 17. 多重文本框 mul…

全球知名数字资产平台LBank 与 The Sandbox Korea 达成战略合作

全球知名数字资产平台LBank,携手韩国元宇宙创新者The Sandbox Korea,共同开启了一场数字与虚拟世界的奇妙之旅。自2023年11月22日起,这两大巨头正式结成战略联盟,以提升用户体验为核心目标,开启了全新的合作篇章。 在…

模拟控制方式(PWM)

引言 PWM(脉冲宽度调制)是一种常见的模拟控制方式,通过调节脉冲宽度来控制功率输出的占空比,从而实现模拟信号的传输和控制。在许多领域中,PWM都得到了广泛的应用,如电机控制、LED调光、音频控制等。本文将…