C++中输出十六进制形式的字符串

发布时间 - 2026-01-10 22:08:01    点击率:

前言

在进行 i18n 相关的开发时,经常遇到字符编码转换的错误。这时如果能把相关字符串用十六进制的形式打印出来,例如,"abc" 输出成 "\\x61\\x62\\x63" 这对于 i18n 的除错来说是很有帮助的。Python 里面,只需要使用 repr() 函数就行了。可在 C++ 中如何做到这点呢?

下面是用 ostream 的格式化功能的一个简单的实现:

std::string get_raw_string(std::string const& s)
{
 std::ostringstream out;
 out << '\"';
 out << std::hex;
 for (std::string::const_iterator it = s.begin(); it != s.end(); ++it)
 {
 out << "\\x" << *it;
 }
 out << '\"';
 return out.str();
}

看上去简单直接,但很可惜这段代码不能实现我们的意图。它还是按字面输出了每个字符。可我们明明指定了使用 std::hex 来格式化输出啊!?问题原来是出在 std::hex 只是一个针对整数类型的输出格式设置,当输出字符类型时,C++ 流还是按照字面输出。到 ostream 的文档去细查才知,原来 C++ 标准输出流对于格式化输出的控制很弱,只能提供有限的几种格式定制,而且大部分都是针对整数和浮点数类型的,对于字符类型完全没有参数可以控制。有点讽刺的是, ostream 利用了 C++ 的函数重载和强类型机制做到了在表达力不输于 C 的同时,又杜绝了臭名昭著的 printf 带来的无穷的麻烦,大大增加了安全。可在这里,强类型安全反而是我们达到目的的障碍:我就是想让 ostream 把字符当成整数打印啊!还好,C++ 还有类型强转这招可以让我们绕过强类型匹配这道安全闸门:

out << std::hex << "\\x" << static_cast<int>(*it);

好了,这下字符都按整数来输出了,而 std::hex 又指示 ostream 用十六进制表示去输出整数。问题解决了。且慢,为什么输出 UTF-8 中文编码的时候会变成这样:

"\xffffffe4\xffffffb8\xffffffad" // get_raw_string("中")

这么多的 F word 太影响市容了。能不能把它们去掉?其实原因在于,我们输出的是强制类型转换成 int 的整形数值,而 int 是 32 bit 长,所以会多出前面这么多位来。如果要去掉,只要转成 8 bit 的整数不就行了吗。可惜 C/C++ 中没有 8 bit 的整数,你唯一能做到的是

typedef char int8_t;

可是用这样得来的 int8_t 去转也还是不行,因为在 C++ 中,typedef 并没有产生一个新的类型,而只是定义了一个原来类型的别名。而这个别名是不参与到函数重载的匹配计算当中的。换言之,ostream 说了,别以为你披上件 int8_t 的马甲我就不认识你了,我还是把你当 char 来输出。此路不通!

那我们就放弃利用 ostream 了吗?且慢,其实 ostream 默认是不会输出前面的 0 的,那只要把最后 8 bit 之前的位都抹成 0 不就能达到我们的要求了吗。

好了,下面就是无错最终版:

std::string get_raw_string(std::string const& s)
{
 std::ostringstream out;
 out << '\"';
 out << std::hex;
 for (std::string::const_iterator it = s.begin(); it != s.end(); ++it)
 {
 // AND 0xFF will remove the leading "ff" in the output,
 // So that we could get "\xab" instead of "\xffab"
 out << "\\x" << (static_cast<short>(*it) & 0xff);
 }
 out << '\"';
 return out.str();
}

经历了几番波折,终于成功利用了 ostream 提供的十六进制输出的功能实现了打印字符串十六进制的功能。其实细究起来,之所以那么绕,还是因为 ostream 本身在格式化输出控制方面太弱了。进一步的,C++ 里还有更好的工具做这件事吗? boost::format 看起来象是,但它依然不能正确处理我们上面遇到的两难境地。好在,另一个 boost 库给出了合适的答案: boost::spirit::karma

Karma 是 boost::spirit 库的一部分。大家可能比较熟悉的是用 spirit 库做 parser 来解析字符串。而 spirit 通过 Karma 提供的功能就恰好相反,它是专门用来将 C++ 数据结构格式化为字符流的。

我们恰好就需要它,下面就是用 karma 库重写的代码:

template <typename OutputIterator>
bool generate_raw(OutputIterator sink, std::string s)
{
 using boost::spirit::karma::hex;
 using boost::spirit::karma::generate;

 return generate(sink, '\"' << *("\\x" << hex) << '\"', s);
}

std::string get_raw_string_k(std::string const& s)
{
 std::string result;
 if (!generate_raw(std::back_inserter(result), s))
 {
 throw std::runtime_error("parse error");
 }

 return result;
}

这里面最主要就是利用了 karma 内置的一个输出模块 karam::hex 来帮我们完成工作,而这个 hex 是一个多态的生成器。它不象 ostream 的类型重载,只能针对某些类型输出 hex 格式,而是针对所有类型都能输出 hex 格式,包括 char 。还有一个优点,代码的表达力更强了,输出的格式完全在一行代码中体现:

// 输出格式为 "\x61\x62\x63",方便直接贴到 python 或 C++ 的代码中
'\"' << *("\\x" << hex) << '\"'

如果想要改变输出格式,只需要改这行代码即可,例如:

// 输出格式变为 "0x61 0x62 0x63 "
'\"' << *("0x" << hex << " ") << '\"'

那么效率方面有没有任何性能损失呢?下面是一段测试代码,分别用两种算法转换相同的字符串:

#include "boost/test/unit_test.hpp"
#include "boost/../libs/spirit/optimization/measure.hpp"
#include "string.hpp" // The function for test

static std::string const message = "hex output performance test data 中文";

struct using_karma : test::base
{
 void benchmark()
 {
 this->val += get_raw_string_c(message).size();
 }
};

struct using_ostream : test::base
{
 void benchmark()
 {
 this->val += get_raw_string(message).size();
 }
};

BOOST_AUTO_TEST_CASE(TestStringPerformance)
{
 BOOST_SPIRIT_TEST_BENCHMARK(
 100,
 (using_karma)
 (using_ostream)
 );

 BOOST_CHECK_NE(0, live_code);
}

下面是运行的结果,分别是两种算法需要的时间,值越小越好:

算法 耗时(s)
karma 6.97
ostream 14.24

可能出乎意料,大致来说 karma 比 ostream 快了一倍。这也与 spirit 官方给出的性能数据差不多。这里的函数返回值是通过 std::string 值拷贝返回的,消耗了不少时间,如果纯从格式化输出来说,猜测 karma 的性能优势只会更大。另一份测试 表明,karma 应该是 C/C++ 里面你能找到的速度最快的格式化字符流方案了。

对于这么简单的功能来说,这篇文章已经显得太长了,庆幸的是,我们最终还是找到了一个表达力强,性能高的十六进制输出方案。人说好事难双,可 C++ 这门复杂的语言,却经常能找执行飞快又高度抽象的代码方案。只是有些过于复杂了 ...

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流。


# c  # 十六进制输出  # 十六进制字符串  # c语言十六进制输出  # C++实现十六进制字符串转换成int整形值的示例  # 详解C++中十六进制字符串转数字(数值)  # C++实现十六进制字符串转换为十进制整数的方法  # C++实现数字转换为十六进制字符串的方法  # C++如何将十六进制字符串转换为二进制字符串  # 的是  # 好了  # 两种  # 且慢  # 可在  # 只需要  # 能把  # 这篇文章  # 都是  # 是一个  # 就行了  # 此路不通  # 我就  # 出了  # 就能  # 让我们  # 说了  # 臭名昭著  # 都能  # 没有任何 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: 如何安全更换建站之星模板并保留数据?  如何利用DOS批处理实现定时关机操作详解  胶州企业网站制作公司,青岛石头网络科技有限公司怎么样?  公司门户网站制作流程,华为官网怎么做?  如何基于PHP生成高效IDC网络公司建站源码?  JS中页面与页面之间超链接跳转中文乱码问题的解决办法  Laravel Seeder怎么填充数据_Laravel数据库填充器的使用方法与技巧  如何获取PHP WAP自助建站系统源码?  5种Android数据存储方式汇总  如何快速建站并高效导出源代码?  php增删改查怎么学_零基础入门php数据库操作必知基础【教程】  php读取心率传感器数据怎么弄_php获取max30100的心率值【指南】  北京网站制作费用多少,建立一个公司网站的费用.有哪些部分,分别要多少钱?  详解CentOS6.5 安装 MySQL5.1.71的方法  如何快速生成ASP一键建站模板并优化安全性?  Laravel如何实现多级无限分类_Laravel递归模型关联与树状数据输出【方法】  JavaScript中的标签模板是什么_它如何扩展字符串功能  Laravel如何使用Service Container和依赖注入?(代码示例)  想要更高端的建设网站,这些原则一定要坚持!  网站图片在线制作软件,怎么在图片上做链接?  浅谈redis在项目中的应用  Linux系统命令中tree命令详解  作用域操作符会触发自动加载吗_php类自动加载机制与::调用【教程】  如何在 React 中条件性地遍历数组并渲染元素  高端网站建设与定制开发一站式解决方案 中企动力  香港服务器网站卡顿?如何解决网络延迟与负载问题?  大学网站设计制作软件有哪些,如何将网站制作成自己app?  打造顶配客厅影院,这份100寸电视推荐名单请查收  Laravel如何记录自定义日志?(Log频道配置)  香港服务器租用每月最低只需15元?  Laravel怎么配置自定义表前缀_Laravel数据库迁移与Eloquent表名映射【步骤】  Laravel如何实现一对一模型关联?(Eloquent示例)  MySQL查询结果复制到新表的方法(更新、插入)  Laravel如何使用Socialite实现第三方登录?(微信/GitHub示例)  如何快速搭建高效WAP手机网站吸引移动用户?  如何用花生壳三步快速搭建专属网站?  Laravel如何使用Spatie Media Library_Laravel图片上传管理与缩略图生成【步骤】  Bootstrap整体框架之CSS12栅格系统  如何在建站之星绑定自定义域名?  Laravel如何配置和使用队列处理异步任务_Laravel队列驱动与任务分发实例  Windows驱动无法加载错误解决方法_驱动签名验证失败处理步骤  Laravel怎么配置不同环境的数据库_Laravel本地测试与生产环境动态切换【方法】  Laravel如何设置定时任务(Cron Job)_Laravel调度器与任务计划配置  网站制作企业,网站的banner和导航栏是指什么?  Android实现代码画虚线边框背景效果  Laravel Seeder填充数据教程_Laravel模型工厂Factory使用  javascript中的数组方法有哪些_如何利用数组方法简化数据处理  laravel怎么为应用开启和关闭维护模式_laravel应用维护模式开启与关闭方法  香港代理服务器配置指南:高匿IP选择、跨境加速与SEO优化技巧  深圳网站制作平台,深圳市做网站好的公司有哪些?