c++如何将string转换为wstring_c++宽窄字符转换【源码】

发布时间 - 2026-01-24 00:00:00    点击率:
应使用MultiByteToWideChar(Windows)或std::mbrtowc(跨平台),而非弃用的std::codecvt或locale依赖的mbstowcs;源字符串编码必须明确为UTF-8,不可依赖系统locale。

std::string 转 std::wstring 用 mbstowcs 还是 std::codecvt?

在 C++11 及以后,std::codecvt 已被弃用(C++17 标准中标记为 deprecated),且 MSVC 和 GCC 都不推荐继续使用。直接调用 mbstowcsMultiByteToWideChar(Windows)更可靠、更可控。

关键点在于:源 std::string 的编码必须明确——它通常是 UTF-8(Linux/macOS 默认)、GBK(中文 Windows 系统本地代码页),或其它 locale-dependent 编码。不能假设“系统 locale 就是 UTF-8”。

  • Linux/macOS 下多数终端和文件 I/O 默认 UTF-8,mbstowcsLC_CTYPE 设为 en_US.UTF-8 时可安全转换 UTF-8 到 wchar_t
  • Windows 控制台默认是 GBK(如 Chinese_PRC.936),此时若传入 UTF-8 字符串却用 mbstowcs,会乱码或截断
  • std::wstring_convert 同样已弃用,不要在新项目中使用

Windows 下用 MultiByteToWideChar 转 UTF-8 到 wstring

这是 Windows 上最稳妥的方式,尤其当你明确知道输入是 UTF-8(比如从 JSON、网络 API、UTF-8 文本文件读取的 std::string)。

示例(无异常处理简化版):

std::wstring string_to_wstring(const std::string& str) {
    if (str.empty()) return std::wstring();
    int len = MultiByteToWideChar(CP_UTF8, 0, str.c_str(), -1, nullptr, 0);
    std::wstring result(len - 1, L'\0'); // -1 排除 null terminator
    MultiByteToWideChar(CP_UTF8, 0, str.c_str(), -1, &result[0], len);
    return result;
}
  • CP_UTF8 明确指定输入为 UTF-8;别用 CP_ACP(当前 ANSI 代码页),它在中文 Windows 上是 GBK,和 UTF-8 混用必出错
  • 两次调用:第一次获取所需缓冲区长度,第二次写入;避免硬分配过大 buffer 或栈溢出
  • 返回值含末尾 L'\0',但 std::wstring 自身不依赖它,所以 len - 1 是安全的字符数

跨平台(UTF-8 输入)用 std::mbrtowc 手动转换

如果不想引入 Windows API,又需兼容 Linux/macOS,可用 std::mbrtowc 逐字符解析 UTF-8 —— 它是 C 标准库函数,行为定义清晰,且不依赖全局 locale 设置(只要传入正确的 mbstate_t 初始化状态)。

注意:std::mbrtowc 不是“一次转整个字符串”,需循环调用:

std::wstring utf8_to_wstring(const std::string& u8str) {
    std::wstring result;
    result.reserve(u8str.size()); // 粗略预分配(UTF-8 中 ASCII 占 1 字节,汉字占 3,wchar_t 通常 4 字节)
    mbstate_t state = {};
    const char* ptr = u8str.c_str();
    const char* end = ptr + u8str.size();
    while (ptr < end) {
        wchar_t wc;
        size_t r = std::mbrtowc(&wc, ptr, end - ptr, &state);
        if (r == static_cast(-1)) break; // 无效 UTF-8
        if (r == static_cast(-2)) break; // 截断(不完整多字节序列)
        if (r > 0) {
            result.push_back(wc);
            ptr += r;
        } else {
            ptr++; // r == 0,遇到 '\0'
        }
    }
    return result;
}
  • 必须初始化 mbstate_t state = {},否则未定义行为
  • 返回值 -1 表示非法字节

    序列(如 "\xFFabc"),-2 表示输入结束但多字节未完成(如只剩 "\xE4\xB8"
  • 该函数不修改 locale,因此比 mbstowcs 更可预测——前提是输入确实是 UTF-8

为什么不能直接 reinterpret_cast(str.data())?

因为 std::stringstd::wstring 的内存布局完全不同:前者是连续 char(1 字节),后者是连续 wchar_t(Windows 是 2 字节,Linux/macOS 通常是 4 字节)。直接 reinterpret_cast 会导致:

  • 字节序错乱(如 UTF-8 的 "中"\xE4\xB8\xAD,强制当 wchar_t 读成 0xE4B80x00E4B800,完全不是 U+4E2D)
  • 越界访问(str.size() 字节 ≠ wstr.size()wchar_t
  • 程序崩溃或静默数据损坏,尤其在开启 ASAN 或不同平台时表现不一

这种“捷径”只在极特殊场景(如你 100% 确定 string 是按 wchar_t 大小对齐的二进制 dump,且平台一致)下才可能成立,日常开发中等同于埋雷。


# linux  # js  # json  # windows  # 编码  # 字节  # mac  #   # c++  # macos  # win  # cos  # 标准库  # 为什么  # String  # const  # 字符串  # char  # wchar_t  # 循环  # len  # 多字  # 返回值  # 这是  # 不依赖  # 都不  # 已被  # 当你  # 设为  # 两次  # 所需 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: 如何用花生壳三步快速搭建专属网站?  Laravel如何为API生成Swagger或OpenAPI文档  湖南网站制作公司,湖南上善若水科技有限公司做什么的?  Laravel如何为API编写文档_Laravel API文档生成与维护方法  历史网站制作软件,华为如何找回被删除的网站?  悟空浏览器如何设置小说背景色_悟空浏览器背景色设置【方法】  Laravel如何使用Service Container和依赖注入?(代码示例)  公司网站制作需要多少钱,找人做公司网站需要多少钱?  如何有效防御Web建站篡改攻击?  Laravel怎么配置自定义表前缀_Laravel数据库迁移与Eloquent表名映射【步骤】  做企业网站制作流程,企业网站制作基本流程有哪些?  如何用低价快速搭建高质量网站?  rsync同步时出现rsync: failed to set times on “xxxx”: Operation not permitted  通义万相免费版怎么用_通义万相免费版使用方法详细指南【教程】  php结合redis实现高并发下的抢购、秒杀功能的实例  Laravel怎么使用Markdown渲染文档_Laravel将Markdown内容转HTML页面展示【实战】  宙斯浏览器怎么屏蔽图片浏览 节省手机流量使用设置方法  Laravel的Blade指令怎么自定义_创建你自己的Laravel Blade Directives  Laravel distinct去重查询_Laravel Eloquent去重方法  Win11怎样安装网易有道词典_Win11安装词典教程【步骤】  齐河建站公司:营销型网站建设与SEO优化双核驱动策略  jquery插件bootstrapValidator表单验证详解  laravel怎么为应用开启和关闭维护模式_laravel应用维护模式开启与关闭方法  Android利用动画实现背景逐渐变暗  Laravel如何与Inertia.js和Vue/React构建现代单页应用  如何快速使用云服务器搭建个人网站?  Laravel的.env文件有什么用_Laravel环境变量配置与管理详解  如何快速配置高效服务器建站软件?  如何在景安云服务器上绑定域名并配置虚拟主机?  Laravel怎么返回JSON格式数据_Laravel API资源Response响应格式化【技巧】  浅谈Javascript中的Label语句  Laravel如何配置中间件Middleware_Laravel自定义中间件拦截请求与权限校验【步骤】  瓜子二手车官方网站在线入口 瓜子二手车网页版官网通道入口  HTML5段落标签p和br怎么选_文本排版常用标签对比【解答】  微信小程序 input输入框控件详解及实例(多种示例)  网站制作大概多少钱一个,做一个平台网站大概多少钱?  Laravel Debugbar怎么安装_Laravel调试工具栏配置指南  Laravel Eloquent:优雅地将关联模型字段扁平化到主模型中  Midjourney怎样加参数调细节_Midjourney参数调整技巧【指南】  制作公司内部网站有哪些,内网如何建网站?  Laravel PHP版本要求一览_Laravel各版本环境要求对照  高防服务器如何保障网站安全无虞?  如何实现建站之星域名转发设置?  北京的网站制作公司有哪些,哪个视频网站最好?  网站建设保证美观性,需要考虑的几点问题!  Javascript中的事件循环是如何工作的_如何利用Javascript事件循环优化异步代码?  Laravel Telescope怎么调试_使用Laravel Telescope进行应用监控与调试  如何在局域网内绑定自建网站域名?  为什么要用作用域操作符_php中访问类常量与静态属性的优势【解答】  如何挑选高效建站主机与优质域名?