EViews中文网站 > 热门推荐 > EViews样本区间怎么修改 EViews样本区间改动后结果为什么会变化
EViews样本区间怎么修改 EViews样本区间改动后结果为什么会变化
发布时间:2026/06/29 10:29:10

  在跑回归、做描述统计还有预测这些分析的时候,工作文件里装着的数据量,其实并不等于当前这一次计算真正会用到的数据量。要搞清楚EViews里面样本区间怎么去改,以及为什么改动过后结果就会跟着发生变化,这里的关键,就是得把工作文件的范围和当前样本的范围给区分开来。工作文件里面保存的是完整的数据,而当前样本才真正决定了这一次计算到底要用到哪些观测值。EViews的官方教程里面也强调过,当前样本的设置,会影响到后续所有的数据处理和统计操作。

  一、EViews样本区间怎么修改

 

  样本区间这个设置,既可以通过菜单来调整,也可以直接在命令栏里敲命令来实现。不过时间序列、截面数据,还有面板数据,它们填写区间的格式是不太一样的,所以在动手改之前,得先看一眼工作文件现在的观测频率是什么。

 

  1、从菜单里去修改样本区间

 

  先把工作文件给打开,然后点一下【Quick】→【Sample】,在跳出来的输入框里面,把想要分析的那一段起始时间和结束时间给填进去,再点一下确定就行了。当然,直接去双击工作文件窗口上方那个显示样本信息的区域,也能进到同一个设置界面里。EViews的官方教程把这两种办法都列为了比较常用的入口。

 

  2、用smpl命令来快速切换

 

  如果你的数据是月度的,那就可以直接敲smpl 2020m1 2025m12这样的命令;如果是季度数据,那格式稍微变一下,写成smpl 2020q1 2025q4就行。等到后面想把全部数据都给恢复回来的时候,只要敲一个smpl all就搞定了。另外记两个小标记也会很方便: first代表的是工作文件最开头的那一期, last代表的是最末尾的那一期,所以用smpl first last命令,也同样可以把完整的范围给找回来。

 

  3、截面数据就按观测值的序号来设置

 

  碰上没有日期信息的那种工作文件,可以直接对着观测值的序号去填,比如敲一下smpl 1 120,就表示只取前面一百二十条记录来用。要是你只是想把开头那几条有些异常的记录给排除掉,那也很简单,敲一个smpl 5 last,就可以从第五条开始一直拉到结尾了。

 

  4、如果某个区间要反复调用,就把它存成一个样本对象

 

  当你发现自己经常要重复用到某一段固定的区间时,就可以先生成一个Sample对象,比如敲下sample train 2018m1 2022m12,就能把这一段训练用的区间给存好。后面再想调用它的时候,直接用smpl train这条命令就可以了。在EViews里面,smpl是专门用来切换当前样本范围的,而sample这个命令是用来把一套筛选规则给保存下来的,这俩东西可不要给弄混了。

 

  二、EViews样本区间改动后结果为什么会变化

 

  只要样本区间被调整过,回归跑出来的系数、做显著性检验的结果、算出来的均值、标准差,还有预测出来的数值,都可能跟着发生变化。这里头的原因其实不算复杂,最主要的就是参与计算的数据条数,还有数据本身的结构发生了变动。

  1、观测值的数量本身发生了变化

 

  样本一旦被增加或者减少,模型在背后使用的数据点自然也就不一样了。碰上有那么几年经济波动特别大,或者某几个月里存在一些很扎眼的异常值,一旦把这些记录给纳进来或者踢出去,最后算出来的系数和检验结论,当然就会跟着起变化。

 

  2、缺失值会继续让有效的样本数量往下掉

 

  哪怕你在设置界面上圈定了一百条记录,也不等于模型最后就真会用满这一百条。只要变量里面有哪个位置是NA,跟它相关的那些观测就很有可能被排除在计算之外,EViews本身也会用NA去标记那些不可用的数据。

 

  3、滞后项会消耗掉开头的几期数据

 

  如果模型里面加进去了类似y(-1)、x(-2)这样的滞后变量,或者做了差分处理,那么样本区间一开头的那几期记录,往往就没办法参与这一步的计算了。比如你的样本是从一月开始的,但模型用到了二阶滞后,那么最前面的两期数据,一般就进不了最终估计的结果里。所以在调整完区间以后,还得同时去查看一下结果里实际显示的那个Included observations数量。

 

  4、条件样本会跟着变量的值动态地去变

 

  EViews是支持在设定样本范围的同时,再额外追加一些筛选条件的,比如敲一条smpl 2020m1 2025m12 if sales>0。只有当记录满足了if后面那个条件时,它才会被拿来用。官方教程里也讲过,这种样本规则在每一次处理数据的时候,都会被重新计算一次,所以一旦相关变量的值发生了变化,满足条件的那些观测也会跟着一块儿变。

 

  三、EViews样本区间修改后怎样复核

 

  等到样本区间被调整完了以后,可别一看到结果就着急直接把它给复制走。更应该先核对一遍实际参与计算的观测值到底有多少条,再去看看模型前后发生的变化,是不是符合自己的预期。

 

  1、去查看一下样本的基本信息

 

  每一次修改完区间,第一件事就是去看一看工作文件上方显示的那一行样本范围。等跑完回归之后,还要再去看一下结果页面里的Sample和Included observations这两项,确认一下上面标着的区间,和实际真正参与计算的记录数量,是不是能对得上。

 

  2、先把全部样本恢复过来,做一个对比

 

  敲一下smpl all,把完整的范围给找回来,然后用这组完整的数据再把同一个模型给跑一次。拿到完整样本的结果之后,把它跟刚才缩小区间跑出来的结果放在一起,去比一比系数的方向还对不对、显著性变没变、拟合得好不好,还有残差又发生了什么变化。

 

  3、检查一下有没有缺失值和异常值

 

  把用到的那些序列挨个打开来看一看,尤其要留意样本区间的边界附近,有没有藏着NA、零值,或者那种一眼看上去就特别离谱的异常值。要是发现跑出来的结果突然之间变化特别大,那第一步不要急着去改模型的形式,应该先回过头去看一看数据本身。

 

  4、把这一次用的样本口径给记录下来

 

  在写正式报告的时候,一定得把数据的观测频率、起止的具体时间、真正被纳入计算的观测数量、对缺失值是怎么处理的,还有模型里用了几阶的滞后,这些信息全都交代清楚。只有这样,后面万一有其他人要拿同一套数据去做复算,也才能照着这同样的口径,得出比较接近的结果。

  总结

 

  EViews里样本区间怎么修改,以及改动之后结果为什么会跟着变,大概可以照着下面这个顺序来:先用菜单里的【Quick】→【Sample】,或者直接用smpl命令,把分析的范围给调好,然后再去查看一下实际参与计算的观测数量,最后再去核对一遍缺失值、滞后项,还有条件筛选这些地方。样本区间本身就是模型结果当中很重要的一个组成部分,只要它被改过了,就一定得回过头去把统计的结果和报告里用的口径再检查一下。

读者也访问过这里:
135 2431 0251