[已解决]在微软 UCRT 的实作中,_setmode(_fileno(stdout), _O_U8TEXT); 对于文字终端机的串流会开启 Unicode 模式,直接使用 WriteConsoleW 送出,因此只要 Unicdoe 字元都可以正常显示。但 SetConsoleOutputCP(CP_UTF8); 是透过档案输出给终端机后,才由终端机依据指定的 codepage 解译文字,在从串流输出到终端机的过程中,就会经过几道转码程序,导致 \'🍌\' 这种在 Unicode 辅助平面的字元,在转码过程中被丢弃,无法显示出来。以上处理都是针对输出到文字模式终端机的串流才会发生。


请教在 Windows 上使用

SetConsoleOutputCP(CP_UTF8);

_setmode(_fileno(stdout), _O_U8TEXT);

让程式可以在终端机输出 Unicode 字元的差异是什么?我的测试中,例如:

#include <locale.h>
#include <stdio.h>
#include <wchar.h>
#include <windows.h>
#include <io.h>
#include <fcntl.h>

int main(void)
{
// _setmode(_fileno(stdout), _O_U8TEXT);
SetConsoleOutputCP(CP_UTF8);
setlocale(LC_ALL, "en_US.utf8");
wchar_t* const str_ch = L"\\r🍌金黄色的曙光\\n";
wchar_t* const str_ja = L"\\r🍌金色の暁\\n";

wprintf(str_ch);
wprintf(str_ja);
}

使用 SetConsoleOutputCP() 的方式 \'🍌\' 会消失:

金黄色的曙光
金色の暁

但若是使用 _setmode(),则可以完整显示:

🍌金黄色的曙光
🍌金色の暁

请请教为什么会有这样的差别?

至于为什么要在宽字元字串开头加 \'\\r\',那又是另外一个问题。

1 个回答

0

zivzhong

iT邦研究生 4 级 ‧ 2025-01-22 00:29:19

要不试试

SetConsoleOutputCP(65001);

  • 1

meebox

iT邦新手 3 级 ‧
2025-01-23 09:19:43

这其实跟 SetConsoleOutputCP(CP_UTF8); 是一样的。

修改