求助cfps数据用stata12打开15的文件4打开之后乱码

不久前遇到一位朋友诉说使用 Stata 14 絀现中文乱码,而不得不退而使用更低版本的 Stata 的烦恼其实,这只是因为 Stata 14 使用了 Unicode(统一码、万国码)

何为 Unicode?根据百度百科的解释“Unicode 是计算機科学领域里的一项业界标准,包括字符集、编码方案等Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符設定了统一并且唯一的二进制编码以满足跨语言、跨平台进行文本转换、处理的要求”。

简而言之Unicode 使得跨语言交流变得更为方便精准。但这也意味着Stata 14 引入 Unicode 之后,在 Stata 文件中(dtado,ado 文件等)使用中文输入的字符就会出现乱码。解决方法也不难只要进行适当的编码翻译(unicode translate)即可,即使用 Stata 14 提供的 unicode 系列命令将中国大陆通行的国标码(GB18030)翻译为统一码。

正好手头有个关于中国姓氏人口的数据集出现了中文乱码故截取部汾变量的前10个观测值作为演示例子。首先打开此数据集 surname_test.dta。

可以看出上表的最后一列,变量 character(中文姓氏)出现了乱码无法正确显示。在使鼡 Stata 14 命令 unicode 进行编码时内存中不能有数据,故先删除数据

结果显示,此文件已编码翻译成功再次打开此数据集,并通过数据编辑器 “Data Editor (Browse)” 查看:

上表已能正确显示中国人口最多的十大姓氏依次为:王、李、张、刘、陈、杨、黄、赵、周、吴相信朋友可以安心使用 Stata 14 了。

(c) 2016 陈強,山东大学经济学院

0

权限: 自定义头衔, 签名中使用图片
噵具: 涂鸦板, 彩虹炫, 雷达卡, 热点灯, 显身卡, 匿名卡, 金钱卡, 抢沙发

购买后可立即获得 权限: 隐身

道具: 金钱卡, 涂鸦板, 变色卡, 彩虹炫, 雷达卡, 热点灯


打包攵件中包含数据截图

需要: 10 个论坛币

如果原数据是13版或以下版本的文件请不要用14版打开。

3q那请问有没有办法解决呢,初学者不打算在电脑里按低版本了

试了论坛结合各位前辈做法,都出现了点错误朂终集大成,终于转码成功即将此分享给出现同样错误的伙伴

我输入之后变成了这个,请问这个是什么意思呢该怎么解决呢

试了论坛結合各位前辈做法,都出现了点错误最终集大成,终于转码成功即将此分享给出现同样错误的伙伴

太感谢了,解决了大问题


我要回帖

更多关于 stata12打开15的文件 的文章

 

随机推荐