Visual Studio 2019 C++ 项目中的特殊字符并用它们执行 CMD 命令

2023-12-05

首先，我只想在控制台中使用波罗的海字符并用它们执行 CMD 命令，但问题是从默认/标准控制台 C++ 应用程序开始的。

#include <iostream>
int main() {
    string output = "āāāčččēēēē";

    cout << output << endl;
}

早些时候，我在堆栈上提出了这个问题 -如何在 DEFAULT C++ 项目中或在 Visual Studio 2019 中使用 C++ 的 mysql 连接器时使用 UTF8 字符（Latin7_general_ci 到 UTF-8）？

我在测试中发现：如果我将 UTF8 字符串转换为 Latin1 字符串，然后 cout 或打印十六进制值，我会在控制台中输出一些特殊字符。例如 -

**char s2[256] = "\xc3\xa9";**  printed is outputted as "ķ" THAT MEANS I need to convert strings into correct HEX values when it is needed, and some people might know how it might be one.

但我的代码逻辑需要一个功能来使用此字符串在 CMD 中使用 cp。因此，稍后转换为字符串，我的 CMD 无法工作，尽管 cp 命令 CMD 必须执行的输出似乎在控制台中正确显示。

// Example program
#include <iostream>
#include <string>
#include <fstream>
#include <sstream> 
#include <stdexcept>
#include <stdlib.h> 
#include <stdio.h> 
#include <time.h> 
#include <cstring> 
#include <cstdint>
#include <locale> 
#include <cstdlib>





int GetUtf8CharacterLength(unsigned char utf8Char)
{
    if (utf8Char < 0x80) return 1;
    else if ((utf8Char & 0x20) == 0) return 2;
    else if ((utf8Char & 0x10) == 0) return 3;
    else if ((utf8Char & 0x08) == 0) return 4;
    else if ((utf8Char & 0x04) == 0) return 5;

    return 6;
}

char Utf8ToLatin1Character(char* s, int* readIndex)
{
    int len = GetUtf8CharacterLength(static_cast<unsigned char>(s[*readIndex]));
    if (len == 1)
    {
        char c = s[*readIndex];
        (*readIndex)++;

        return c;
    }

    unsigned int v = (s[*readIndex] & (0xff >> (len + 1))) << ((len - 1) * 6);
    (*readIndex)++;
    for (len--; len > 0; len--)
    {
        v |= (static_cast<unsigned char>(s[*readIndex]) - 0x80) << ((len - 1) * 6);
        (*readIndex)++;
    }

    return (v > 0xff) ? 0 : (char)v;
}

// overwrites s in place
char* Utf8ToLatin1String(char* s)
{
    for (int readIndex = 0, writeIndex = 0; ; writeIndex++)
    {
        if (s[readIndex] == 0)
        {
            s[writeIndex] = 0;
            break;
        }

        char c = Utf8ToLatin1Character(s, &readIndex);
        if (c == 0)
        {
            c = '_';
        }

        s[writeIndex] = c;
    }

    return s;
}


int main()
{
    char s2[256] = "\xc3\xa9";
    Utf8ToLatin1String(s2);

    std::cout << s2 << std::endl;

    std::string locations2 = ("C:\\Users\\Janis\\Desktop\\TEST2\\");
    std::string txtt = (".txt");
    std::string copy2 = ("copy /-y ");

    std::string space = " ";
    std::string PACIENTI2 = "C:\\PACIENTI\\";




    std::string element = copy2 + locations2 + s2 + txtt;

    std::string cmd = element + space + PACIENTI2 + s2 + txtt;

    std::cout << cmd << std::endl;

    FILE* pipe = _popen(cmd.c_str(), "r");
}

所以我们需要真正解决两个问题，从已经给定的十六进制字符串创建，并确保它在 CMD 中工作。

我在你的另一个问题中已经给你提供了很好的答案。这是类似的东西。

你的程序可以使用UTF-8编码和控制台可以使用不同的编码，但是您必须向标准库提供如何对每个数据源进行编码的提示。
当然，如果目标编码没有涵盖不支持特定字符，则必须启动一些后备（请参见底部的示例）。

必须明确定义编码才能使一切正常工作的 4 个领域：

你的源代码。 VS 使用系统区域设置来使用编码，这很糟糕。强制 VS 和所有编辑器使用通用编码，UTF-8 选择是最好的。最好告知编译器源代码是如何编码的：cl /source-charset:utf-8 .....
你的可执行文件。您必须定义在最终可执行文件中应编码哪种编码字符串文字。这里UTF-8也是最好的：cl .... /execution-charset:utf-8 .....
当您运行应用程序时，您必须告知标准库您的字符串文字定义的编码类型或程序逻辑中使用的编码类型。因此，在执行开始时，代码中的某个位置需要这样的内容：

std::locale::global(std::locale{".utf-8"});

最后你必须指示流应该使用哪种编码。因此对于std::cout and std::cin您应该设置系统默认的区域设置：

    auto streamLocale = std::locale{""}; 
    // this impacts date/time/floating point formats, so you may want tweak it just to use sepecyfic encoding and use C-loclae for formating
    std::cout.imbue(streamLocale);
    std::cin.imbue(streamLocale);

之后，一切都应该按预期工作，无需显式进行转换的代码。
由于有 4 个地方会出错，这就是人们遇到麻烦的原因，并且互联网上充满了“黑客”解决方案。

这是一些测试程序来证明我的观点：

#include <iostream>
#include <locale>
#include <exception>
#include <string>

void setupLocale(int argc, const char *argv[])
{
    std::locale def{""};
    std::locale::global(argc > 1 ? std::locale{argv[1]} : def);
    auto streamLocale = argc > 2 ? std::locale{argv[2]} : def;
    std::cout.imbue(streamLocale);
    std::cin.imbue(streamLocale);
}

void printSeparator()
{
    std::cout << "---------\n";
}

void printTestStuff()
{
    std::cout << "Wester Europe: āāāčččēēēēßÞÖöñÅÃ\n";
    std::cout << "Central Europe: ąĄÓóŁłĘężćźŰűÝýĂă\n";
    std::cout << "China: 字集碼是把字符集中的字符编码为指定集合中某一对象\n";
    std::cout << "Korean: 줄여서 인코딩은 사용자가 입력한\n";
}

int main(int argc, const char *argv[]) {
    try{
        setupLocale(argc, argv);
        printSeparator();
        printTestStuff();
        printSeparator();
    }
    catch(const std::exception& e)
    {
        std::cerr << e.what() << '\n';
    }
}

以及它是如何构建和运行以显示其工作原理的（请注意，这也涵盖了使用无效编码的情况）：

C:\Users\User\Downloads>cl /source-charset:utf-8 /execution-charset:utf-8 /EHsc encodings.cpp
Microsoft (R) C/C++ Optimizing Compiler Version 19.28.29336 for x86
Copyright (C) Microsoft Corporation.  All rights reserved.

encodings.cpp
Microsoft (R) Incremental Linker Version 14.28.29336.0
Copyright (C) Microsoft Corporation.  All rights reserved.

/out:encodings.exe
encodings.obj

C:\Users\User\Downloads>chcp
Active code page: 437

C:\Users\User\Downloads>encodings.exe
---------
Wester Europe: Ä?Ä?Ä?Ä?Ä?Ä?Ä"Ä"Ä"Ä"AYAzA-AA±A.Aƒ
Central Europe: Ä.Ä,A"A3Å?Å,Ä~ÄTÅ¼Ä╪ÅºÅ°Å±A?A½Ä,Äƒ
China: å--é>+ç¢¼æ~_æSSå--ç¬▌é>+ä,-çs,å--ç¬▌ç¼-ç ?ä,ºæO╪årsé>+å?^ä,-æY?ä,?å_1è±¡
Korean: ì,ì-¬ì,o ì?,ì½"ë"cì?? ì,¬ìscìz?ê°? ìz.ë ¥ío
---------

C:\Users\User\Downloads>encodings.exe .65001
---------
Wester Europe: aaaccceeeeß_ÖöñÅA
Central Europe: aAOóLlEezczUuYyAa
China: ????????????????????????
Korean: ??? ???? ???? ???
---------

C:\Users\User\Downloads>encodings.exe .65001 .437
---------
Wester Europe: aaaccceeeeß_ÖöñÅA
Central Europe: aAOóLlEezczUuYyAa
China: ????????????????????????
Korean: ??? ???? ???? ???
---------

C:\Users\User\Downloads>encodings.exe .65001 .1250
---------
Wester Europe: aaaccceeeeß_ÖöñÅA
Central Europe: aAOóLlEezczUuYyAa
China: ????????????????????????
Korean: ??? ???? ???? ???
---------

C:\Users\User\Downloads>chcp 1250
Active code page: 1250

C:\Users\User\Downloads>encodings.exe .65001 .1250
---------
Wester Europe: aaačččeeeeß?ÖönAA
Central Europe: ąĄÓóŁłĘężćźŰűÝýĂă
China: ????????????????????????
Korean: ??? ???? ???? ???
---------

C:\Users\User\Downloads>chcp 65001
Active code page: 65001

C:\Users\User\Downloads>encodings.exe
---------
Wester Europe: ÄÄÄÄÄÄÄ“Ä“Ä“Ä“ÃŸÃžÃ–Ã¶Ã±Ã…Ãƒ
Central Europe: Ä…Ä„Ã“Ã³ÅÅ‚Ä˜Ä™Å¼Ä‡ÅºÅ°Å±ÃÃ½Ä‚Äƒ
China: å—é›†ç¢¼æ˜¯æŠŠå—ç¬¦é›†ä¸çš„å—ç¬¦ç¼–ç ä¸ºæŒ‡å®šé›†åˆä¸æŸä¸€å¯¹è±¡
Korean: ì¤„ì—¬ì„œ ì¸ì½”ë”©ì€ ì‚¬ìš©ìžê°€ ìž…ë ¥í•œ
---------

C:\Users\User\Downloads>encodings.exe .65001
---------
Wester Europe: āāāčččēēēēßÞÖöñÅÃ
Central Europe: ąĄÓóŁłĘężćźŰűÝýĂă
China: 字集碼是把字符集中的字符编码为指定集合中某一对象
Korean: 줄여서 인코딩은 사용자가 입력한
---------

C:\Users\User\Downloads>encodings.exe .65001 .65001
---------
Wester Europe: āāāčččēēēēßÞÖöñÅÃ
Central Europe: ąĄÓóŁłĘężćźŰűÝýĂă
China: 字集碼是把字符集中的字符编码为指定集合中某一对象
Korean: 줄여서 인코딩은 사용자가 입력한
---------

C:\Users\User\Downloads>

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

VisualStudio

UTF8

ISO88591

Visual Studio 2019 C++ 项目中的特殊字符并用它们执行 CMD 命令的相关文章

使用遗留代码（使用reinterpret_cast）真的是一种很好的技术吗？

下面的代码来自一篇关于C 面试问题的帖子here https www toptal com c plus plus interview questions 我从来不知道这种技术尽管它声称是一种很好的技术我的问题是什么情况下需要使用它
集群（）：是否可以仅检查文件是否已锁定，而不实际获取锁定（如果没有）？

我的用例如下我有一个程序它强制在任何给定时间只能运行它的一个实例因此在启动时它总是尝试在标准位置获取锁定文件并在该文件终止时终止已经被锁定这一切都工作正常但现在我想用一个新的命令行选项来增强程序当指定该选项时将导致程序只打印
std::map find 在 C++ 中不起作用[重复]

这个问题在这里已经有答案了我使用以下几行创建了一个哈希映射和一个迭代器 std map
C++ STL 映射，std::pair 作为键

这就是我通过地图定义的方式 std map
MVVM：来自 FileOpenPicker 的图像绑定源

我将 OnActivated 添加到 app xaml cs 中它可以正常工作 protected async override void OnActivated IActivatedEventArgs args var continua
使用 C 的另一个结构内的灵活长度结构数组

你好我正在尝试使用 C 来实现一个简单的结构 2 个盒子每个盒子包含不同数量的颗粒 main 中传递的粒子的确切数量我写了以下代码 typedef struct Particle float x float y float vx fl
字符串/分段错误

Program to calculate trip and plan flights define TRIP 6 define NAMEMAX 40 define DEST 1 include
图片框、双击和单击事件

我有一个奇怪的问题我有一个图片框双击事件以及单击事件问题是即使我双击该控件也会引发单击事件如果我禁用单击事件则双击事件正在工作这个问题已经在这里讨论过 https stackoverflow com questions 1830
如何将 dll 中包含的组件嵌入到 exe 中，以便它可以从内存运行？

我正在尝试制作一个必须从内存运行的程序通过Assembly Load bin 如上所述here http www codeproject com Articles 13897 Load an EXE File and Run It fro
MVC BaseController 处理 CRUD 操作

我想重构我的基本 CRUD 操作因为它们非常重复但我不确定最好的方法我的所有控制器都继承 BaseController 如下所示 public class BaseController
使用c#在mac上启动外部进程

我成功地使用 System Diagnostics Process Start 在 Windows 上启动我的外部单声道可执行文件然而在mac上却失败了我没有收到任何错误只是什么也没发生我尝试按以下方式进行操作 System Dia
如何在 Windows 上的 GCC 中链接 CS50 C 库

我是编程新手一直在尝试使用以下命令编译我的代码MinGW https en wikipedia org wiki MinGW GCC 但我尝试包括CS50 https en wikipedia org wiki CS50 cs50 c
C++：避免在重载中将字符串自动转换为布尔值

我想创建一组方法这些方法将根据其类型输出具有特殊格式的值当我这样做时到目前为止看起来还不错 static void printValue std ostringstream out int value out lt lt value
仅使用一个 #include 表达式一次包含多个头文件？

是否有任何表达式可以使语法一次包含多个标头而无需为每个新文件编写 include 表达式例如 include
如何在 C++11 中返回类成员向量

我读了几篇关于如何从方法返回向量的文章其中包括 c11 右值和移动语义混淆返回语句 https stackoverflow com questions 4986673 c11 rvalues and move semantics conf
我想找到 C# 代码中所有后面没有括号的 if 语句。通过正则表达式

我想找到所有if声明和for后面没有大括号的语句当你在一个文件中写入一行时if声明您大多不会将其括在大括号中所以我想找到所有这些if and for声明请帮忙就像我想捕捉这个声明 if childNode Name B return
如何在C++中列出Python模块的所有函数名称？

我有一个 C 程序我想导入一个 Python 模块并列出该模块中的所有函数名称我该怎么做我使用以下代码从模块中获取字典 PyDictObject pDict PyDictObject PyModule GetDict pModule
为什么 C# 中的命名空间允许循环依赖？

在 c 中您可以在文件 a cs 其命名空间为 MyApp A 中拥有一条语句 using MyApp B 而文件 b cs 其名称空间为 MyApp B 已经包含该语句 using MyApp A 如果类似的依赖关系存在于不同的 dll
在 OSX 上检测 Objective C 或 C++ 中的文件夹访问（如 fs_usage 命令）

我正在 OSX 上开发实时病毒扫描程序 OSX 的命令行命令fs usage可以通过以下方式确定文件夹访问权限并且只能以 root 用户身份运行 fs usage w f pathname grep Users Documents Use
C# 使用 .Equals() 比较两个 double

我使用 ReShaper 当我用比较两个双精度值时它建议我应该使用 Math 具有公差的 ABS 方法看 https www jetbrains com help resharper 2016 2 CompareOfFloatsByE

随机推荐

使用 urllib 删除 python 中的换行符

我正在使用Python 3 x 使用时urllib request要下载网页我得到了很多 n之间我正在尝试使用论坛其他线程中给出的方法删除它但我无法这样做我用过strip 函数和replace 功能但没有运气我在 eclipse
如何创建以当前时间命名的文件？

我想在 log 目录下创建一系列文件每个文件根据执行时间命名在每个文件中我想为我的程序存储一些日志信息例如起作用的函数原型等通常我使用 fopen log a 的硬方法这不是为了这个目的我只是写了一个时间戳函数 char ti
无法将文件 .mdf 作为数据库附加

我是 MVC 技术的新手正在阅读培训材料并遇到了以下实体框架错误消息在这里我尝试从 SQL Server Compact 数据库获取一条记录但出现错误EmployeeController步骤中的类 Employee employe
Java 8 使用Optional 避免空指针检查

是否可以编写这样的内容并避免检查元素是否不为空并且集合是否不为空 response getBody getRequestInformation getRequestParameters get 0 getProductInstances g
计算数据框列中的单词数

我有一个数据框第一列中有句子我想计算其中的单词数 Input Foo bar bar example lalala foo example sentence foo Output foo 3 bar 2 example 2 lalala
使用 Thread.sleep 让 UI 线程等待

我用 C 为 WP7 编写了这段代码 public void btn handler object sender EventArgs args Button btn Pressed Button sender ImageBrush br n
SQLite 片段函数实现不会将 TextView 中的文本格式化为 HTML

我正在使用 SQLite 全文搜索实现搜索功能我想像 Google 搜索一样用粗体查询文本显示结果我已经实现了类似下面的代码但它显示没有任何 HTML 格式的纯文本虽然将视图绑定到光标适配器并设置文本格式TextView 我无法弄清楚
简化重复的 LESS

我正在为 WordPress 网络创建一个主题系统该系统支持多种布局主题可以支持各种大学的配色方案为此我定期编译一个带有学校特定变量的 LESS 文件使用 lessphp 并实质上将其用作主题中的辅助类库每所学校都有 3 种颜色
Facebook iOS SDK Poke

是否可以使用 iOS 版 Facebook SDK 来戳 Facebook 好友我尝试过在线 API 浏览器并筛选文档但找不到公共 API 有谁知道我可以通过 iOS 应用程序发出 Graph API 请求来戳 Facebook 好友
基于用户的字符串模板

我有一个用户选择的字符串模板我需要采用该模板并填写所需的信息 string templateString author title year 我可以执行 Contains 和 Replace 但是模板可能有大量输入或少量输入例如 str
让elasticsearch只返回某些字段？

我正在使用 elasticsearch 来索引我的文档是否可以指示它只返回特定字段而不是它存储的整个 json 文档是的使用更好的选择源过滤器如果您使用 JSON 进行搜索它将如下所示 source user message qu
发送：spawn id exp7 未打开

当我尝试执行 autoexpect 文件时出现错误send spawn id exp7 not open这是我的文件sh exp usr bin expect mysql credentials and connection data db
Apache2 - 使用基本身份验证针对某个位置授权用户，但仅适用于本地子网之外的用户

在我的 Apache 2 配置中我有一个VirtualHost看起来像这样
错误：操作必须是普通对象。在 redux 中使用自定义中间件进行异步操作

下面是我的动作创建者的代码 export function fetchPosts const request axios get ROOT URL posts API KEY return type FETCH POSTS payload
根据日期过滤 Spark 数据框

我有一个数据框 date string string 我想选择某个时间段之前的日期我尝试了以下方法但没有成功 data filter data date lt new java sql Date format parse 2015 03
我发现一些显示/隐藏桌面图标的代码，但它在过程中移动了图标。如何编辑代码以不移动图标？

我正在为 Rainmeter 使用两个批处理文件一个用于隐藏所有图标然后启动 Rainmeter 另一个用于显示所有图标并退出 Rainmeter 以使我的桌面再次看起来正常我的最终目标是将这两个批处理文件制作成任务栏上的按钮我可以
在 ios UIKeyboard 上启用向上键和向下键 [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心我们正在尝试创建一个 uikeyboard 它将收集用
前置视觉块在 vim 中不起作用

I m really fond of this idea of using Ctrl V Ctrl Q in windows to modify a visual block The technique is explained here
如何在格式化字符串上使用 strlen()？

我想为以下内容编写一个包装函数mvwprint mvwchgat ncurses在指定窗口中打印消息然后更改其属性的函数然而 mvwchgat需要知道它应该改变多少个字符我不知道如何告诉mvwchgat格式化字符串有多长因为strle
Visual Studio 2019 C++ 项目中的特殊字符并用它们执行 CMD 命令

首先我只想在控制台中使用波罗的海字符并用它们执行 CMD 命令但问题是从默认标准控制台 C 应用程序开始的 include

Visual Studio 2019 C++ 项目中的特殊字符并用它们执行 CMD 命令

Visual Studio 2019 C++ 项目中的特殊字符并用它们执行 CMD 命令 的相关文章

随机推荐

热门标签

Visual Studio 2019 C++ 项目中的特殊字符并用它们执行 CMD 命令的相关文章