本文作者:StubbornHuang
版权声明:本文为站长原创文章,如果转载请注明原文链接!
原文标题:C++ – UTF8编码下的全角字符转半角字符
原文链接:https://www.stubbornhuang.com/1848/
发布于:2021年12月04日 11:58:39
修改于:2021年12月04日 11:58:39

1 C++ UTF8编码下的全角字符转半角字符
如果输入的字符std::string是UTF8编码,因为UTF8字符串长度的不确定性,需要先将UTF8编码的字符串转换为宽字符Unicode编码的字符串,再进行全角到半角字符的转换,具体的转换过程参考以下代码:
#include <iostream>
#include <locale>
#include <codecvt>
std::wstring Std_UTF8ToUnicode(const std::string& utf8Str)
{
std::wstring ret;
try
{
std::wstring_convert< std::codecvt_utf8<wchar_t> > conv;
ret = conv.from_bytes(utf8Str);
}
catch (const std::exception& e)
{
}
return ret;
}
std::string Std_UnicodeToUTF8(const std::wstring& unicodeStr)
{
std::string ret;
try
{
std::wstring_convert< std::codecvt_utf8<wchar_t> > conv;
ret = conv.to_bytes(unicodeStr);
}
catch (const std::exception& e)
{
}
return ret;
}
static std::string DoubleByteCharToSingleByteChar_UTF8(const std::string& srcStr)
{
// 先转成Unicode字符
std::wstring srcStr_Uniocde = Std_UTF8ToUnicode(srcStr);
std::wstring destSrt_Unicode = L"";
std::string dstStr = "";
int tempChar;
int length = srcStr_Uniocde.length();
for (int i = 0; i < length; i++)
{
tempChar = srcStr_Uniocde[i];
if (tempChar == 12288)
{
tempChar = 32;
}
else if (tempChar >= 65281 && tempChar <= 65374)
{
tempChar -= 65248;
}
destSrt_Unicode += tempChar;
}
// 然后将处理过后的全角转半角字符Unicode转utf8
dstStr = Std_UnicodeToUTF8(destSrt_Unicode);
return dstStr;
}
int main()
{
std::string input_str = u8"55555。你好。";
std::string output_str = DoubleByteCharToSingleByteChar_UTF8(input_str);
std::cout << output_str << std::endl;
}
当前分类随机文章推荐
- C++ - linux编译C++代码出现error: use of deleted function std::atomic
::atomic(const std::atomic 阅读2348次,点赞0次&) - GCC/GG++中编译优化选项-O -O0 -O1 -O2 -O3 -Os -Ofast -Og -Oz各自的区别和作用 阅读3080次,点赞2次
- C++11 - 使用std::thread::join()/std::thread::detach()方法需要注意的点 阅读2694次,点赞0次
- C++ - 将std::vector中的数值拷贝到数组中 阅读2126次,点赞1次
- C++ – Unicode编码下的全角字符转半角字符 阅读1870次,点赞0次
- C++ - 将Unicode std::wstring字符串转换为Unicode std::string转义字符,类似于\uxxxx的形式 阅读1421次,点赞0次
- C++ - return this和return *this的含义和区别 阅读270次,点赞0次
- C++读取Shp文件并将Shp转化为DXF 阅读3038次,点赞1次
- C++ - 在两个互有依赖关系的类中使用std::shared_ptr和std::weak_ptr进行内存管理 阅读594次,点赞0次
- C++11/std::shared_ptr - 循环引用问题 阅读3999次,点赞0次
全站随机文章推荐
- 书籍翻译 – Fundamentals of Computer Graphics, Fourth Edition,第5章 Linear Algebra中文翻译 阅读1492次,点赞5次
- 资源分享 - GPU Pro 360 - Guide to GPGPU 英文高清PDF下载 阅读2082次,点赞0次
- 资源分享 - Game AI Pro 360 - Guide to Character Behavior 英文高清PDF下载 阅读1488次,点赞0次
- FFmpeg - 通过h264编码的视频文件开始很清晰后面逐渐模糊 阅读3586次,点赞2次
- 宝塔面板 - 安装Php扩展如memcached失败的解决方案 阅读1467次,点赞0次
- Mediapipe – 将Mediapipe HolisticTracking封装成动态链接库dll/so,实现在桌面应用中嵌入全身关节点识别、手势识别、抬手放手检测识别功能 阅读5796次,点赞14次
- Pytorch - 手动调整学习率以及使用torch.optim.lr_scheduler调整学习率 阅读522次,点赞0次
- Pytorch - 为什么要设置随机数种子? 阅读440次,点赞0次
- C++ - 随机洗牌算法,std::random_shuffle和std::shuffle 阅读1310次,点赞1次
- C++ - 只有在Debug模式下才使用std::cout输出调试日志,Release发布版本不输出调试日志 阅读4153次,点赞0次
评论
167