对于Stata初学者而言,把面板数据顺利的导入到Stata中,过程是比较“艰辛”的!但是如果你能够迈过这个坎,那么你的Stata实际操作将有一个显著的提升,对于Stata的数据格式也会有更深的理解。要想把数据输入到Stata中,你首先要知道Stata是如何组织面板数据的。在Stata中,面板数据有两种格式——宽型(wide form)和长型(long form),这两种格式可以很方便地进行相互转换,通常使用的是长型数据。图1展示了这两种格式的数据,你可能不太明白什么意思,但下面我们会通过一个实际的例子来展示这两种数据格式。

图2是一个实际的例子,列示了三家大银行的2007——2015年的部分财务数据,这样的数据安排是长型面板。我习惯在收集整理数据时,按照Stata要求的格式在Excel中先安排好数据格式(按照你的偏好或者安排数据的便捷程度,可以选择长型和宽型)。在此,我们以长型数据示例。

假设你已经在Excel中组织好数据,个体(id)、时间(year)及其他变量都有了,下一步就是把这些数据导入到Stata中,此处以Stata14为例。启动软件后,顺次点击file>import>excel,依次选择文件路径等选项,确认之后,就可以看到如图3图4的结果。


可以看到,汉字是红色标识的,这是“字符型”数据,其他数字是黑色的,是“数值型”数据,数值型数据可以进行数值运算和逻辑运算。如果你发现导入结果中有一列数字是红色的,比如图5中的ld变量。

这时候你需要检查一下数据了,可能是Excel中的数据格式不对,这种情况下,使用destring命令可以将字符型数据转换为数值型数据,
但更多情况是原始数据有误,特别是手动输入数据时,更容易出错,检查一下可以发现,原始数据中有一个数多了一个小数点。

此时,可以点击这个按钮,调整到数据编辑状态,进行修改(修改后还是红色
,该怎么办呢???),也可以在Excel中修改原始数据,然后重新导入。

完成以上的数据输入工作并检查无误之后,下一步可以定义面板数据了,输入如下命令:
xtset id year(这里的个体和时间变量是我自己定义的),显示的结果如下。

至此,我们就完成了面板数据的导入和定义,拥有了自己的面板数据,接下来就可以尽情“回归”了!(当然不要忘了各种检验)
以上是以长型面板数据为例展示数据导入和定义,那么宽型数据呢???利用reshape命令我们可以得到相应的宽型面板数据(请自行查看该命令的帮助文档!),

至于结果什么样,请你自己动手操作一下看看结果吧!这里就有一份现成的数据!!
本帖隐藏的内容
工作簿1.xlsx (12.6 KB)
本帖隐藏的内容
lnw.xls (11 KB)
Ps:有的同学可能数据量比较大,特别是手动搜集的数据,十分辛苦,觉得这样操作太慢!!!但我还是建议初学者按这个流程走一遍,在此过程中,你可能会接触到以下命令:sort drop order bysort gen destring append ……
注意:遇到问题,请多多使用百度搜索和论坛的搜索功能,基本上你遇到的问题以前也有人遇到,而各路大神已经给出了简洁高效的解决方案!!!
最后,祝大家都能尽快掌握Stata这一科研利器

以上有不当之处,还请各位多多指教。

图2是一个实际的例子,列示了三家大银行的2007——2015年的部分财务数据,这样的数据安排是长型面板。我习惯在收集整理数据时,按照Stata要求的格式在Excel中先安排好数据格式(按照你的偏好或者安排数据的便捷程度,可以选择长型和宽型)。在此,我们以长型数据示例。

假设你已经在Excel中组织好数据,个体(id)、时间(year)及其他变量都有了,下一步就是把这些数据导入到Stata中,此处以Stata14为例。启动软件后,顺次点击file>import>excel,依次选择文件路径等选项,确认之后,就可以看到如图3图4的结果。


可以看到,汉字是红色标识的,这是“字符型”数据,其他数字是黑色的,是“数值型”数据,数值型数据可以进行数值运算和逻辑运算。如果你发现导入结果中有一列数字是红色的,比如图5中的ld变量。

这时候你需要检查一下数据了,可能是Excel中的数据格式不对,这种情况下,使用destring命令可以将字符型数据转换为数值型数据,

但更多情况是原始数据有误,特别是手动输入数据时,更容易出错,检查一下可以发现,原始数据中有一个数多了一个小数点。

此时,可以点击这个按钮,调整到数据编辑状态,进行修改(修改后还是红色


完成以上的数据输入工作并检查无误之后,下一步可以定义面板数据了,输入如下命令:
xtset id year(这里的个体和时间变量是我自己定义的),显示的结果如下。

至此,我们就完成了面板数据的导入和定义,拥有了自己的面板数据,接下来就可以尽情“回归”了!(当然不要忘了各种检验)
以上是以长型面板数据为例展示数据导入和定义,那么宽型数据呢???利用reshape命令我们可以得到相应的宽型面板数据(请自行查看该命令的帮助文档!),

至于结果什么样,请你自己动手操作一下看看结果吧!这里就有一份现成的数据!!
本帖隐藏的内容

本帖隐藏的内容

Ps:有的同学可能数据量比较大,特别是手动搜集的数据,十分辛苦,觉得这样操作太慢!!!但我还是建议初学者按这个流程走一遍,在此过程中,你可能会接触到以下命令:sort drop order bysort gen destring append ……
注意:遇到问题,请多多使用百度搜索和论坛的搜索功能,基本上你遇到的问题以前也有人遇到,而各路大神已经给出了简洁高效的解决方案!!!
最后,祝大家都能尽快掌握Stata这一科研利器


以上有不当之处,还请各位多多指教。