• 问题反馈可发送邮件到stubbornhuang@qq.com

  • 如果觉得本站的内容有帮助,可以考虑打赏博主哦!

  • 感谢大家访问本站,希望本站的内容可以帮助到大家!

  • 本站会放置Google广告用于维持域名以及网站服务器费用。

  • 在本站开通年度VIP,无限制下载本站资源和阅读本站文章

  • 欢迎大家交换友链,可在https://www.stubbornhuang.com/申请友情链接进行友链交换申请!

  • 本站由于前段时间遭受到大量临时和国外邮箱注册,所以对可注册的邮箱类型进行了限制!

  • 工资「喂饱肚子」,副业「养活灵魂」!

  • 计算机图形学与计算几何经典必备书单整理,下载链接可参考:https://www.stubbornhuang.com/1256/

C++ – UTF8编码下的全角字符转半角字符

C++ 发布于2021-12-04 阅读 5,691次 0次评论 0次点赞 本文共1227个字,阅读需要4分钟。

1 C++ UTF8编码下的全角字符转半角字符

如果输入的字符std::string是UTF8编码,因为UTF8字符串长度的不确定性,需要先将UTF8编码的字符串转换为宽字符Unicode编码的字符串,再进行全角到半角字符的转换,具体的转换过程参考以下代码:

#include <iostream>
#include <locale>
#include <codecvt>

std::wstring Std_UTF8ToUnicode(const std::string& utf8Str)
{
    std::wstring ret;
    try
    {
        std::wstring_convert< std::codecvt_utf8<wchar_t> > conv;
        ret = conv.from_bytes(utf8Str);
    }
    catch (const std::exception& e)
    {

    }
    return ret;
}

std::string Std_UnicodeToUTF8(const std::wstring& unicodeStr)
{
    std::string ret;
    try
    {
        std::wstring_convert< std::codecvt_utf8<wchar_t> > conv;
        ret = conv.to_bytes(unicodeStr);
    }
    catch (const std::exception& e)
    {

    }
    return ret;
}


static std::string DoubleByteCharToSingleByteChar_UTF8(const std::string& srcStr)
{
    // 先转成Unicode字符
    std::wstring srcStr_Uniocde = Std_UTF8ToUnicode(srcStr);
    std::wstring destSrt_Unicode = L"";

    std::string dstStr = "";
    int tempChar;
    int length = srcStr_Uniocde.length();

    for (int i = 0; i < length; i++)
    {
        tempChar = srcStr_Uniocde[i];
        if (tempChar == 12288)
        {
            tempChar = 32;
        }
        else if (tempChar >= 65281 && tempChar <= 65374)
        {
            tempChar -= 65248;
        }

        destSrt_Unicode += tempChar;

    }

    // 然后将处理过后的全角转半角字符Unicode转utf8
    dstStr = Std_UnicodeToUTF8(destSrt_Unicode);

    return dstStr;
}

int main()
{
    std::string input_str = u8"55555。你好。";

    std::string output_str = DoubleByteCharToSingleByteChar_UTF8(input_str);

    std::cout << output_str << std::endl;
}


欢迎扫码关注我的微信公众号,及时获取文章更新

微信公众号二维码

本文作者:StubbornHuang

版权声明:本文为站长原创文章,如果转载请注明原文链接!

原文标题:C++ – UTF8编码下的全角字符转半角字符

原文链接:https://www.stubbornhuang.com/1848/

发布于:2021年12月04日 11:58:39

修改于:2023年06月26日 21:00:38

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

文章末尾
上一篇
资源分享 - Data Structures and Algorithms for Game Developers 英文PDF下载
计算几何与计算机图形学资源
下一篇
C++ – Unicode编码下的全角字符转半角字符
C++
当前分类随机文章推荐

发表评论

您必须 [ 登录 ] 才能发表留言!

关注我们的公众号

微信公众号