前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Java String类型含普通字符以及中文字符,计算等价的中文字符串长度

Java String类型含普通字符以及中文字符,计算等价的中文字符串长度

作者头像
bear_fish
发布2018-09-19 14:54:23
4.5K1
发布2018-09-19 14:54:23
举报
/*
    获取中文字符串的长度
    我的12 = 3
    我的1 = 3
    我的123456 = 5
 */
public int getChineseStrLen(String str) throws UnsupportedEncodingException {
    int ULen = str.getBytes("utf-8").length;
    int len = str.length();
    int CLen = (ULen - len) / 2;
    return CLen + (len - CLen + 1) / 2;
}

问题描述:

        向Oracle数据库中一varchar2(64)类型字段中插入一条String类型数据,程序使用String.length()来进行数据的长度校验,如果数据是纯英文,没有问题,但是如果数据中包含中文,校验可以通过,但是在数据入库时经常会报数据超长。

问题分析:

        既然问题是数据超长,那么问题应该就是出在数据长度校验上,也就是出在String.length()这个方法上,来看看JDK是如何描述这个方法的:

[plain] view plain copy

  1. length  
  2. public int length()返回此字符串的长度。长度等于字符串中 Unicode 代码单元的数量。   
  3. 指定者:  
  4. 接口 CharSequence 中的 length  
  5. 返回:  
  6. 此对象表示的字符序列的长度。  

[java] view plain copy

  1. public static void main(String[] args) throws UnsupportedEncodingException {  
  2.     String a = "123abc";  
  3.     System.out.println(a.length());  
  4.     a = "中文";  
  5.     System.out.println(a.length());  
  6. }  

结果为6和2。这个方法判断的是String串的字符长度,但是Oracle数据库中却是以字节来判断varchar2类型数据长度(如:字段定义为varchar2(64),则存入该字段的字符串的字节长度不得超过64)。如果String串为纯英文,那么一个英文字母是一个字符,长度为1,占1个字节,不会出错,但如果String串中包含中文,一个中文汉字也是一个字符,长度为1,但是却占多个字节(具体占几个字节跟使用的编码有关),如果数据中包含中文,数据的长度就很有可能会超过数据库中对应字段的长度限制

不同数据库对字符串类型数据长度的计算方式不同,如:MySQL数据库中以字符长度来判断varchar类型数据的长度(如:字段定义varchar,长度定为64,小数位定义为0,则存入该字段的字符串的字符长度不得超过64)

解决方式:

        既然是判断数据长度时以字符为标准导致出错,那么思路就很明确了,在进行数据长度校验时,取数据的字节长度:

[java] view plain copy

  1. public static void main(String[] args) throws UnsupportedEncodingException {  
  2.     String a = "123abc";  
  3. int num = a.getBytes("utf-8").length;  
  4.     System.out.println(num);  
  5.     a = "中文";  
  6.     num = a.getBytes("utf-8").length;  
  7.     System.out.println(num);  
  8. }  

结果为6和6,为什么转换成utf-8呢,因为数据库使用的是utf-8编码,既然数据最终是要存到数据库中,那么首先先要保证数据在程序中时、在数据库中时的编码一致(同一个字符在不同的编码格式中所占的字节位数不一致,这点很关键),然后再保证程序和数据库判断数据长度的方式一致,才能避免程序校验通过,入库时却提示数据长度超长的问题

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2016年10月12日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云数据库 MySQL
腾讯云数据库 MySQL(TencentDB for MySQL)为用户提供安全可靠,性能卓越、易于维护的企业级云数据库服务。其具备6大企业级特性,包括企业级定制内核、企业级高可用、企业级高可靠、企业级安全、企业级扩展以及企业级智能运维。通过使用腾讯云数据库 MySQL,可实现分钟级别的数据库部署、弹性扩展以及全自动化的运维管理,不仅经济实惠,而且稳定可靠,易于运维。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档