如何解决Stata14的中文乱码问题

如题所述

可以转码。

命令:

unicode analyze *

unicode encoding set gb18030

unicode translate *

注意:运行这三个命令前,当前目录需是你欲转换文件所在目录,且内存中不能有stata数据文件。

CODEPAGE中的编码:

utf8编码

<%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%>

gb2312编码

<%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%>

meta标签中的编码:

utf8编码

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

扩展资料:

一般是软件程序解码错误。如浏览器把GBK码当成是Big5码显示,或电子邮件程序把对方传来的邮件错误解码。如果在发送时编码错误,收件者的电邮程序是不能解码的,需要寄件者的电邮程序重新编码再寄。字体档案(font file)不对。来源编码错误,或文件受到破坏。

一种语言版本的操作系统安装了另外一种语言版本的应用程序,或者应用程序安装的升级补丁的语言版本与应用程序原来安装的语言版本不一致。

参考资料来源;百度百科-乱码

温馨提示:答案为网友推荐,仅供参考
第1个回答  2017-05-20
首先,打开此数据集 surname_test.dta。

. use surname_test.dta, clear

点击数据编辑器 “Data Editor (Browse)” 的快捷键,查看数据:

可以看出,上表的最后一列,变量 character(中文姓氏)出现了乱码,无法正确显示。在使用 Stata 14 命令 unicode 进行编码时,内存中不能有数据,故先删除数据。

. clear

然后,将需要编码的文件(在此为 surname_test.dta),放入当期工作路径(current working directory),通常在Stata的左下角显示。

也可使用命令pwd(path of working directory)来显示当期工作路径。或使用命令cd(change directory)将当期工作路径改为文件 surname_test.dta 所在的位置,详见“help cd”。

. pwd

C:\Program Files (x86)\Stata14

接下来,使用命令 unicode analyze 分析数据集 surname_test.dta 是否需要编码翻译。

. unicode analyze surname_test.dta

结果显示,有一个字符串变量需要编码翻译(1 str# variable needs translation)。为此,将编码设为国标码(GB18030),再进行翻译。

. unicode encoding set gb18030

(default encoding now gb18030)

. unicode translate surname_test.dta

(using gb18030 encoding)

结果显示,此文件已编码翻译成功。再次打开此数据集,并通过数据编辑器 “Data Editor (Browse)” 查看:

. use surname_test.dta,clear

上表已能正确显示中国人口最多的十大姓氏依次为:王、李、张、刘、陈、杨、黄、赵、周、吴。相信朋友可以安心使用 Stata 14 了。本回答被提问者采纳
第2个回答  2020-12-26

解压文件出现中文乱码怎么办解决办法

华为Mate50 Pro曲面旗舰手机

¥6799

苹果 AirPods Pro 2代

¥1699

索尼65英寸4K HDR专业游戏电视

¥7499

惠普战66五代15.6英寸轻薄本

¥4399

相似回答