首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何将包含在windows-1252中编码的字节的std::string转换为包含utf8编码数据的字符串?

如何将包含在windows-1252中编码的字节的std::string转换为包含utf8编码数据的字符串?
EN

Stack Overflow用户
提问于 2022-06-14 07:22:12
回答 1查看 230关注 0票数 0

使用现代C++和std库,将包含windows-1252编码字符的std::string转换为utf-8的最简单、最干净的方法是什么?

我的用例是解析一个windows-1252编码的CSV文件,然后使用Node-Api (Node)将它的一些数据推送到节点-js,这需要编码字符串

EN

回答 1

Stack Overflow用户

发布于 2022-06-14 08:43:20

仅使用标准库,最接近的解决方案可能是使用带有自定义Windows1252方面的std::wstring_convertstd::string转换为std::wstring,然后使用带有标准UTF-8方面的std::wstring_convertstd::wstring转换为std::string

然而,自从std::wstring_convert之后,C++17就不再受欢迎了,没有任何替代的迹象。因此,您最好使用第三方Unicode库来处理转换,比如iconv、ICU等,或者平台特定的API,比如MultiByteToWideChar()WideCharToMultiByte()

或者,您可以自己实现转换,因为Windows-1252是一个非常简单的编码,它只定义了251个字符。将每个8位字符转换为其UTF-8等价物的普通查找表就足够了。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72612974

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档