单字节字符集SBCS指在该字符集中的字符最多由2个字节表示。一个字节8位,仅支持2的8次方=256个码点。 双字节字符集DBCS(Doule-Byte Character Set)指该字符中的字符最多由2个字节表示。 多字节字符集MBCS(Multiple-Byte Character Set)是指该字符集中的字符以多个字节来表示。如UTF-8.
在启动SAS时,相应的Locale会在启动时加载的SAS配置文件中指定。
SAS提供了系统选项ENCODING=以及一些数据集选项、逻辑库选项和读写文件选项,便于灵活地出各种编码的数据。 (1)会话编码(2)SAS数据集的编码(3)读写外部文件(4)排序序列(SORT默认的排序是二进制排序)
PROC SORT DATA=数据集 SORTSEQ=转换表|编码|LIGNUISTIC; RUN;
从SAS9.3开始,引入了语言切换(Language Switching)选项,并且在SAS9.4中得到了增强。
/* 根据美国和中国的对身高的不同标准 运行该代码会在逻辑库sas的物理路径下生产两个文件formats.sas7bcat和formats_zh_cn.sas7bcat */ proc format lib=saslib.formats; value size low - 56 = 'Short' 56 - 66 = 'Medium' 66 - high = 'Tall'; run; options locale=zh_CN; proc form lib=saslib.formats locale; value size low - 50 = '偏瘦' 50 - 60 = '中等' 60 - high = '偏高' run; /* 接下来按Locale使用逻辑库saslib中的格式size.,代码如下: */ option fmtsearch=(saslib/locale); proc print data=sashelp.class(obs=5); format height size.; run;
SAS提供了字符串函数和CALL例程,以使用户能够很容易地处理字符数据。K函数。 K函数使用以字符为基础的偏移长度,可用于处理SBCS、DBCS、MBCS(UTF-8)数据,使用K函数更加符合语言处理习惯,而且不需要知道每个字符存储为多少个字节。
为了使同一个SAS程序能支持多种语言,需要将代码中的文本字符串提取出来,并在需要使用该字符串的地方使用其通用的表示方式,该过程称为字符串外部化(String Externalizatin)。 步骤: (1)第一步:抽取字符串并生成.smd文件 (2)第二步:根据.msd文件创建数据集 (3)第三步:在SAS代码中获取字符串
/* 保证所有文本在不同的Locale下以对应的语言显示,包括页眉、页脚、标签等,目前需要支持英文和简体中文。 */ /* 第一步创建myapp_zh_CN.smd,使用Unicode转义字符,将utf-8原文件转换成Uncode */ %macro SMD2ASCII(inf=,outf=,inencoding=,lrecl=); data _null_; attrib tmp length=$ &lrecl; infile "&inf" lrecl=&lrecl; input; file "&outf" lrecl=&lrecl; tmp = kpropdata(_infile_,"uesc","&inencoding","ascii"); put tmp; run; %mend SMD2ASCII; %SMD2ASCII(inf = E:\SHANGHAIRUIMIN\sas\data\shenrufenxisas\ch8\smd\myapp_han.smd, outf = E:\SHANGHAIRUIMIN\sas\data\shenrufenxisas\ch8\smd\myapp_zh_CN.smd, inencoding = utf-8, lrecl = 300); /* 第二步根据.smd文件创建数据集 */ %SMD2DS(dir = E:\SHANGHAIRUIMIN\sas\data\shenrufenxisas\ch8\smd, basename = myapp, locale = zh_CN, lib = saslib); /* 在使用SASMSG函数从消息数据集中获取文本字符串 */ %let ds=saslib.myapp; %let user=SBJKUX; %let adate=%sysfunc(today(),nldate.); proc datasets library=saslib nolist; modify order_summay; label Qountry = %sysfunc(sasmsg(&ds,Country_Label,noquote)); label Quantity = %sysfunc(sasmsg(&ds,Quantity_Label,noquote)); label Price = %sysfunc(sasmsg(&ds,Price_Label,noquote)); run; title %sysfunc(sasmsg(&ds,Report_Title,noquote)); footnote %sysfunc(sasmsg(&ds,Report_Fn,noquote,'&adate',&user)); proc report data=saslib.sales; run;
本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。
我来说两句