首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >JavaScript|计算字符串的字节数

JavaScript|计算字符串的字节数

作者头像
算法与编程之美
发布2020-07-28 14:24:29
4.2K0
发布2020-07-28 14:24:29
举报

问题描述

问题中提到计算字节数,首先需要对字节进行了解,Byte数是一个单位计量数值,其中字符串中单个的字符(英文、数字、特殊字符等)为一个字节,中文汉字是两个字节。

解决方案

1.正则表达式法

由于中英文字符所占字节数不一样,但英文字符字节数和字符长度一致,因此,可以将一个中文字符替换为两个任意英文字符,便能直接用length计数。

因为JS使用Unicode编码,因此,这里用[^\x0000-\x00ff]来匹配中文汉字字符(双字节字符)。

代码如下:

function getBytesLength(str) {

     return str.replace(/[^\x0000-\x00ff]/g, '我是xxx').length;

}

2.循环判断计数法

这里依然需要用正则判断为中文字符或英文字符,英文字符计数累加1,中文字符计数累加2。

需要用到JS中的函数:charAt(num) 获取字符串的num位置的字符。

代码如下:

var str='我是xxx';

function BytesCount(str){

     var cnt = 0;

     for(var i=0; i<str.length; i++){

              var c = str.charAt(i);

         if(/^[\u0000-\u00ff]$/.test(c)){

                        cnt++;

              }else{

                        cnt+=2;

              }

     }

     return len;

}

结语

本例中在使用正则表达式时,使用的是匹配双字节字符的[^\x0000-\x00ff],其中也包含中文字符;而专门匹配中文字符的正则表达式是[\u4e00-\u9fa5]。

END

主 编 | 王楠岚

责 编 | wrape

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-07-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 算法与编程之美 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档