std::wstring_convert<Codecvt,Elem,Wide_alloc,Byte_alloc>::to_bytes
来自cppreference.com
< cpp | locale | wstring convert
在标头 <locale> 定义
|
||
byte_string to_bytes( Elem wchar ); |
(1) | |
byte_string to_bytes( const Elem* wptr ); |
(2) | |
byte_string to_bytes( const wide_string& wstr ); |
(3) | |
byte_string to_bytes( const Elem* first, const Elem* last); |
(4) | |
用构造时提供的 codecvt
平面进行宽到多字节转换。
1) 转换
wchar
为 byte_string
,如同它是长为 1 的字符串。2) 转换始于
wptr
所指向宽字符的空终止宽字符序列为 byte_string
。3) 转换宽字符串
str
为 byte_string
。4) 转换宽字符序列
[first, last)
为 byte_string
。所有情况下,转换始于初始迁移状态,除非提供给此 wstring_convert
的构造函数非初始起始状态。记忆转换的字符数和转换状态的终止,并且能以 state() 和 converted() 访问它们。
返回值
含有宽到多字节转换结果的 byte_string
对象。若转换失败,且有用户提供的字节错误字符串提供给此 wstring_convert
的构造函数,则返回该字节错误字符串。
异常
若此 wstring_convert
不以用户提供的字节错误字符串构造,则在转换失败时抛出 std::range_error 。
示例
运行此代码
#include <iostream> #include <string> #include <locale> #include <codecvt> #include <iomanip> // 输出用的工具函数 void hex_print(const std::string& s) { std::cout << std::hex << std::setfill('0'); for(unsigned char c : s) std::cout << std::setw(2) << static_cast<int>(c) << ' '; std::cout << std::dec << '\n'; } int main() { // 宽字符数据 std::wstring wstr = L"z\u00df\u6c34\U0001f34c"; // 或 L"zß水🍌" // 宽到 UTF-8 std::wstring_convert<std::codecvt_utf8<wchar_t>> conv1; std::string u8str = conv1.to_bytes(wstr); std::cout << "UTF-8 conversion produced " << u8str.size() << " bytes:\n"; hex_print(u8str); // 宽到 UTF-16le std::wstring_convert<std::codecvt_utf16<wchar_t, 0x10ffff, std::little_endian>> conv2; std::string u16str = conv2.to_bytes(wstr); std::cout << "UTF-16le conversion produced " << u16str.size() << " bytes:\n"; hex_print(u16str); }
输出:
UTF-8 conversion produced 10 bytes: 7a c3 9f e6 b0 b4 f0 9f 8d 8c UTF-16le conversion produced 10 bytes: 7a 00 df 00 34 6c 3c d8 4c df
参阅
转换字节字符串为宽字符串 (公开成员函数) | |
给定状态,转换宽字符串为窄多字节字符串 (函数) | |
[虚] |
将字符串从 InternT 转换到 ExternT ,例如在写入文件时 ( std::codecvt<InternT,ExternT,StateT> 的虚受保护成员函数) |