Loading [MathJax]/jax/output/CommonHTML/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >C++迭代具有混合字符长度的utf-8字符串

问C++迭代具有混合字符长度的utf-8字符串
EN

Stack Overflow用户

提问于 2016-10-14 19:46:54

回答 1查看 4.9K关注 0票数 7

我需要循环一个utf-8字符串，并得到字符串的每个字符。字符串中可能有不同类型的字符，例如长度为一个字节的数字、长度为三个字节的汉字等等。

我看了这个帖子，它可以完成80%的工作，除了当字符串在1字节数字之前有3字节的汉字时，它会看到数字也有3字节，并将数字打印为1**，其中*是胡言乱语。

举个例子，如果字符串是'今天周五123'，结果将是：

今

天

周

五

1**

2**

3**

在那里*是胡言乱语。然而，如果字符串是'123今天周五'，数字将打印罚款。

上面提到的帖子中的经过最少修改的代码在这里复制：

#include <iostream>
#include "utf8.h"

using namespace std;

int main() {    
    string text = "今天周五123";

    char* str = (char*)text.c_str();    // utf-8 string
    char* str_i = str;                  // string iterator
    char* end = str+strlen(str)+1;      // end iterator

    unsigned char symbol[5] = {0,0,0,0,0};

    cout << symbol << endl;

    do
    {
        uint32_t code = utf8::next(str_i, end); // get 32 bit code of a utf-8 symbol
        if (code == 0)
            continue;

        cout << "utf 32 code:" << code << endl;

        utf8::append(code, symbol); // initialize array `symbol`

        cout << symbol << endl;

    }
    while ( str_i < end );

    return 0;
}

这里有人能帮我吗？我是c++新手，虽然我查看了utf8 cpp的文档，但我仍然不知道问题出在哪里。我认为创建这个库是为了处理具有不同长度的utf-8编码的问题，所以应该有一种方法.已经挣扎了两天了..。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-10-14 20:01:27

插入

memset(symbol, 0, sizeof(symbol));

在此之前

utf8::append(code, symbol);

如果由于某种原因这仍然无法工作，或者如果您想摆脱库，那么识别代码点并不是那么复杂：

string text = "今天周五123";
for(size_t i = 0; i < text.length();)
{
    int cplen = 1;
    if((text[i] & 0xf8) == 0xf0) cplen = 4;
    else if((text[i] & 0xf0) == 0xe0) cplen = 3;
    else if((text[i] & 0xe0) == 0xc0) cplen = 2;
    if((i + cplen) > text.length()) cplen = 1;

    cout << text.substr(i, cplen) << endl;
    i += cplen;
}

然而，在这两种解决方案中，请注意多个cp符号的存在，以及不能单独打印的cp符号。

票数 14

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40054732

复制

相关文章

【EF】数据表全部字段更新与部分字段更新

java https 网络安全

在更新数据库的过程中，出现了” 更新条目时出错。有关详细信息，请参见内部异常。“的问题。

全栈程序员站长

2022/08/09

1.8K0

更新Mapx地图的字段

'更新地图的字段 Dim ftr As Feature Dim rs As ADODB.Recordset Map1.Layers("油井").KeyField = "name" For Each ftr In Map1.Layers.Item("油井").AllFeatures Set rs = oCn.Execute("select * from petro_well where wellname='" & ftr.KeyValue & "'") If Not rs.EO

用户1075292

2018/01/23

1.1K0

MySQL中"更新时间"字段的更新时点问题

sql 数据库云数据库 SQL Server 腾讯云开发者社区

我们在设计表时，通常为了记录数据插入和更新的时间，会定义两个字段，create_time/insert_time和update_time，按照需求，记录插入的时间，会存储到create_time/insert_time字段中，记录更新的时间，会存储到update_time字段中，当创建记录时，会同步更新create_time/insert_time和update_time，然而，当更新记录时，只会更新update_time字段。

bisal

2022/09/29

5.2K0

update自更新字段添加新字段是否会更新旧数据

验证：一张具备自更新字段的表，如果新增一个字段，原表数据的update_time字段是否会更新？

薄刀刀

2022/04/29

1.1K0

MP字段更新策略

mybatis email null 配置注解

添加@TableField(updateStrategy = FieldStrategy.IGNORED)

阿超

2022/10/28

1K0

它来了，它来了，Power BI的5月更新带着【字段参数】向你走来了

https://powerbi.microsoft.com/en-us/blog/power-bi-may-2022-feature-summary/

陈学谦

2022/05/25

8660

它来了，它来了，Power BI的5月更新带着【字段参数】向你走来了

hibernateTemplate update 只更新被修改字段

数据库 java sql https 网络安全

如果你用hibernateTemplate操作数据库，感觉的确很省代码，一行代码解决数据库增改删查，但当你做到一个功能只更新一个字段，你就有点懵逼了，怎么试就是不行，总的就是下面的异常报错。

全栈程序员站长

2022/09/07

7850

突击并发编程JUC系列-原子更新字段类AtomicStampedReference

他来了，他来了，他带着 ABA 问题走来了，小伙伴们，大家好，我们又见面了，突击并发编程 JUC 系列实战原子更新数组类马上就要发车了。

山间木匠

2020/09/25

3790

突击并发编程JUC系列-原子更新字段类AtomicStampedReference

mongodb 更新删除内嵌list字段值

mongodb sql 数据库云数据库 MongoDB

查询结果如下，现在需要把 “证券代码” =》 “code” ； “发行人中文名称” =》 “COMP_NAME”

周小董

2019/03/25

3.1K0

MongoDB数据插入、删除、更新、批量更新某个字段

编程算法 mongodb 数据库 sql 云数据库 MongoDB

查询出hospitalName是xx医院和openId以2开头的所有记录，并且更新my_booking表中的payType为1.

周小董

2019/03/25

26.8K0

MongoDB数据插入、删除、更新、批量更新某个字段

PostgreSQL update/delete/upsert关联更新字段数据

postgresql select set upsert 数据

update ori_table_name a set col = (select col from new_table b where a.rel_col=b.rel_col);

chimchim

2023/10/17

3270

Power BI 重大更新：字段参数详解 - 基础篇

bi dax desktop excel 报表

虽说是一个点，且在官方说明的篇幅非常少，但是这个特性却意义重大而深刻。我们会用不同的文章来说明这个特性的各种特点。

BI佐罗

2022/07/07

4.2K0

Power BI 重大更新：字段参数详解 - 基础篇

Spring Data JPA: 更新字段采坑记

三个注解缺一不可!!! 缺少@Modifying.报错如下!

JavaEdge

2018/08/02

2.3K0

Spring Data JPA: 更新字段采坑记

Rafy 框架 - 实体支持只更新部分变更的字段

单元测试编程算法

Rafy 快一两年没有大的更新了。并不是这个框架没人维护了。相反，主要是因为自己的项目、以及公司在使用的项目，都已经比较稳定了，也没有新的功能添加。但是最近因为外面使用了 Rafy 的几个公司，找到我，提出了一些明确的需求，期望我做一些相应的升级。所以可能最近几个月，会陆续更新 Rafy 框架。

用户1172223

2021/10/15

1.2K0

mysql更新字段中的部分内容

存储 icon mysql table 域名

在实践中，会出现某些字段中的内容变了，比如三方提供的图标地址变了，那么或许对字段中存储的图片域名进行更新，此时就需要用到mysql更新字段中的部分内容的功能。

程序新视界

2020/05/18

2.4K0

Golang MongoDB Driver 更新符合条件的数组元素的字段

mongodb 数据库 sql 云数据库 MongoDB

在 MongoDB 的 Shell 里修改文档里某个符合条件的数组里的值的字段，可以这样：

饶文津

2020/08/05

4.1K0

DRF中多对多ManytoMany字段的更新和添加

django django-rest-framework

drf的序列化器给模型输出带来了便利但是对于多对多字段网上查询的内容却是很少(也有可能是本人不会搜答案)

对你的承诺

2023/09/07

9790

sql server 更新两个表的某个字段

--临时表 create table tmp_cup ( a varchar(20), b varchar(50), c varchar(20) ) select * from t_customer --//更新简称字列 update t_customer set SHORTNAME=(select shortname from tmp_cup where a=custid) 不过如此的话，如果子查询的某个查询返回多条数据的话就有可能报错：消息 512，级别 16，状态 1，

乔达摩@嘿

2020/09/11

2.1K0

mysql更新同一个表的同个字段

https 网络安全

需求：数据表express_log的字段option_time，将状态为30的更新为状态为0的加上2秒

用户1571008

2022/11/18

2.3K0

点击加载更多

相似问题

Sitecore字段的编程更新

25

Sitecore以编程方式更新NameValueList

12

如何使用编辑器以编程方式发布已更新的Sitecore项

31

以编程方式更新Drupal CCK字段

20

能否以编程方式更新ACF Wysiwyg字段？

22

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例