EViews样本区间怎么修改 EViews样本区间改动后结果为什么会变化-EViews中文网站

　　在跑回归、做描述统计还有预测这些分析的时候，工作文件里装着的数据量，其实并不等于当前这一次计算真正会用到的数据量。要搞清楚EViews里面样本区间怎么去改，以及为什么改动过后结果就会跟着发生变化，这里的关键，就是得把工作文件的范围和当前样本的范围给区分开来。工作文件里面保存的是完整的数据，而当前样本才真正决定了这一次计算到底要用到哪些观测值。EViews的官方教程里面也强调过，当前样本的设置，会影响到后续所有的数据处理和统计操作。

　　一、EViews样本区间怎么修改

　　样本区间这个设置，既可以通过菜单来调整，也可以直接在命令栏里敲命令来实现。不过时间序列、截面数据，还有面板数据，它们填写区间的格式是不太一样的，所以在动手改之前，得先看一眼工作文件现在的观测频率是什么。

　　1、从菜单里去修改样本区间

　　先把工作文件给打开，然后点一下【Quick】→【Sample】，在跳出来的输入框里面，把想要分析的那一段起始时间和结束时间给填进去，再点一下确定就行了。当然，直接去双击工作文件窗口上方那个显示样本信息的区域，也能进到同一个设置界面里。EViews的官方教程把这两种办法都列为了比较常用的入口。

　　2、用smpl命令来快速切换

　　如果你的数据是月度的，那就可以直接敲smpl 2020m1 2025m12这样的命令；如果是季度数据，那格式稍微变一下，写成smpl 2020q1 2025q4就行。等到后面想把全部数据都给恢复回来的时候，只要敲一个smpl all就搞定了。另外记两个小标记也会很方便： first代表的是工作文件最开头的那一期， last代表的是最末尾的那一期，所以用smpl first last命令，也同样可以把完整的范围给找回来。

　　3、截面数据就按观测值的序号来设置

　　碰上没有日期信息的那种工作文件，可以直接对着观测值的序号去填，比如敲一下smpl 1 120，就表示只取前面一百二十条记录来用。要是你只是想把开头那几条有些异常的记录给排除掉，那也很简单，敲一个smpl 5 last，就可以从第五条开始一直拉到结尾了。

　　4、如果某个区间要反复调用，就把它存成一个样本对象

　　当你发现自己经常要重复用到某一段固定的区间时，就可以先生成一个Sample对象，比如敲下sample train 2018m1 2022m12，就能把这一段训练用的区间给存好。后面再想调用它的时候，直接用smpl train这条命令就可以了。在EViews里面，smpl是专门用来切换当前样本范围的，而sample这个命令是用来把一套筛选规则给保存下来的，这俩东西可不要给弄混了。

　　二、EViews样本区间改动后结果为什么会变化

　　只要样本区间被调整过，回归跑出来的系数、做显著性检验的结果、算出来的均值、标准差，还有预测出来的数值，都可能跟着发生变化。这里头的原因其实不算复杂，最主要的就是参与计算的数据条数，还有数据本身的结构发生了变动。

　　1、观测值的数量本身发生了变化

　　样本一旦被增加或者减少，模型在背后使用的数据点自然也就不一样了。碰上有那么几年经济波动特别大，或者某几个月里存在一些很扎眼的异常值，一旦把这些记录给纳进来或者踢出去，最后算出来的系数和检验结论，当然就会跟着起变化。

　　2、缺失值会继续让有效的样本数量往下掉

　　哪怕你在设置界面上圈定了一百条记录，也不等于模型最后就真会用满这一百条。只要变量里面有哪个位置是NA，跟它相关的那些观测就很有可能被排除在计算之外，EViews本身也会用NA去标记那些不可用的数据。

　　3、滞后项会消耗掉开头的几期数据

　　如果模型里面加进去了类似y(-1)、x(-2)这样的滞后变量，或者做了差分处理，那么样本区间一开头的那几期记录，往往就没办法参与这一步的计算了。比如你的样本是从一月开始的，但模型用到了二阶滞后，那么最前面的两期数据，一般就进不了最终估计的结果里。所以在调整完区间以后，还得同时去查看一下结果里实际显示的那个Included observations数量。

　　4、条件样本会跟着变量的值动态地去变

　　EViews是支持在设定样本范围的同时，再额外追加一些筛选条件的，比如敲一条smpl 2020m1 2025m12 if sales>0。只有当记录满足了if后面那个条件时，它才会被拿来用。官方教程里也讲过，这种样本规则在每一次处理数据的时候，都会被重新计算一次，所以一旦相关变量的值发生了变化，满足条件的那些观测也会跟着一块儿变。

　　三、EViews样本区间修改后怎样复核

　　等到样本区间被调整完了以后，可别一看到结果就着急直接把它给复制走。更应该先核对一遍实际参与计算的观测值到底有多少条，再去看看模型前后发生的变化，是不是符合自己的预期。

　　1、去查看一下样本的基本信息

　　每一次修改完区间，第一件事就是去看一看工作文件上方显示的那一行样本范围。等跑完回归之后，还要再去看一下结果页面里的Sample和Included observations这两项，确认一下上面标着的区间，和实际真正参与计算的记录数量，是不是能对得上。

　　2、先把全部样本恢复过来，做一个对比

　　敲一下smpl all，把完整的范围给找回来，然后用这组完整的数据再把同一个模型给跑一次。拿到完整样本的结果之后，把它跟刚才缩小区间跑出来的结果放在一起，去比一比系数的方向还对不对、显著性变没变、拟合得好不好，还有残差又发生了什么变化。

　　3、检查一下有没有缺失值和异常值

　　把用到的那些序列挨个打开来看一看，尤其要留意样本区间的边界附近，有没有藏着NA、零值，或者那种一眼看上去就特别离谱的异常值。要是发现跑出来的结果突然之间变化特别大，那第一步不要急着去改模型的形式，应该先回过头去看一看数据本身。

　　4、把这一次用的样本口径给记录下来

　　在写正式报告的时候，一定得把数据的观测频率、起止的具体时间、真正被纳入计算的观测数量、对缺失值是怎么处理的，还有模型里用了几阶的滞后，这些信息全都交代清楚。只有这样，后面万一有其他人要拿同一套数据去做复算，也才能照着这同样的口径，得出比较接近的结果。

　　总结

　　EViews里样本区间怎么修改，以及改动之后结果为什么会跟着变，大概可以照着下面这个顺序来：先用菜单里的【Quick】→【Sample】，或者直接用smpl命令，把分析的范围给调好，然后再去查看一下实际参与计算的观测数量，最后再去核对一遍缺失值、滞后项，还有条件筛选这些地方。样本区间本身就是模型结果当中很重要的一个组成部分，只要它被改过了，就一定得回过头去把统计的结果和报告里用的口径再检查一下。