如何在 C++ 正则表达式中使用 Unicode 范围

2024-02-09

我必须在 C++ 的正则表达式中使用 unicode 范围。基本上我需要的是有一个正则表达式来接受所有有效的 unicode 字符..我只是尝试使用测试表达式并面临一些问题。

std::regex reg("^[\\u0080-\\uDB7Fa-z0-9!#$%&'*+/=?^_`{|}~-]+$");

问题是与\\u?

这应该可以正常工作，但你需要使用std::wregex and std::wsmatch。您需要将源字符串和正则表达式转换为wide字符 unicode（Linux 上为 UTF-32，Windows 上为 UTF-16(ish)）以使其正常工作。

这对我有用，源文本在UTF-8:

inline std::wstring from_utf8(const std::string& utf8)
{
    // code to convert from utf8 to utf32/utf16
}

inline std::string to_utf8(const std::wstring& ws)
{
    // code to convert from utf32/utf16 to utf8
}

int main()
{
    std::string test = "john.doe@神谕.com"; // utf8
    std::string expr = "[\\u0080-\\uDB7F]+"; // utf8

    std::wstring wtest = from_utf8(test);
    std::wstring wexpr = from_utf8(expr);

    std::wregex we(wexpr);
    std::wsmatch wm;
    if(std::regex_search(wtest, wm, we))
    {
        std::cout << to_utf8(wm.str(0)) << '\n';
    }
}

Output:

神谕

Note:如果您需要一个UTF我使用的转换库THIS ONE https://sourceforge.net/projects/utfcpp/在上面的例子中。

Edit:或者，您可以使用此答案中给出的功能：

C++ 字符串代码点和代码单元有什么好的解决方案吗？ https://stackoverflow.com/questions/43302279/any-good-solutions-for-c-string-code-point-and-code-unit/43302460#43302460

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

regex

如何在 C++ 正则表达式中使用 Unicode 范围的相关文章

MVC 重定向到没有控制器的视图

希望应该是一个简单的我创建了一个通用错误视图当整个站点的操作方法内发生异常时我想显示该视图我创建了一个部分页面所有导航都位于其中因此我不需要在此视图上使用控制器那么如何从控制器内的操作方法重定向到它像这样的东西 HttpPo
C# 中的协变和逆变

首先我要说的是我是一名正在学习 C 编程的 Java 开发人员因此我会将我所知道的与我正在学习的进行比较我已经使用 C 泛型几个小时了我已经能够在 C 中重现我在 Java 中知道的相同内容除了几个使用协变和逆变的示例我正在读
为什么派生类不使用基类的operator=（赋值运算符）？

以下是实际问题的简化版本而不是打电话Base operator int 代码似乎生成了一个临时的Derived对象并复制它既然函数签名似乎完美匹配为什么不使用基本赋值运算符这个简化的示例没有显示任何不良影响但原始代码在析构函数中有
如何将pdf页面设置设置为打印属性对话框？

大家好我想知道如何设置 pdf 页面设置到打印属性对话框例如如果我的 PDF 页面设置为横向则布局会自动显示横向而不是纵向如果我的 PDF 页面设置为纵向则布局会自动显示纵向我在这个主题上做了很多研发但没有找到任何满意的链接
返回 int& 的函数[重复]

这个问题在这里已经有答案了我在网上查了一下发现一篇试图解释的文章std move和右值 http thbecker net articles rvalue references section 01 html并发现了一些我实在无法掌握的东
通过引用传递时取消引用指针

当通过引用传递给函数时取消引用指针时会发生什么这是一个简单的例子 int returnSame int example return example int main int inum 3 int pinum inum std cout
在通过网络发送之前压缩位图

我正在尝试通过网络发送位图屏幕截图因此我需要在发送之前对其进行压缩有一个库或方法可以做到这一点吗当您将图像保存到流时您have选择一种格式几乎所有位图格式 bmp gif jpg png 都使用一种或多种压缩形式因此只需选择适
使用反射获取基类的受保护属性值

I would like to know if it is possible to access the value of the ConfigurationId property which is located in the base
如何使用泛型类型的 DataContractSerializer 编写自定义序列化器？

我想编写一个自定义序列化器用于将会话状态存储到Azure 缓存预览版这意味着这个自定义序列化器必须实现IDataCacheObjectSerializer 如果我错了请告诉我我需要编写这个自定义序列化程序的原因是我需要序列化一些包
Microsoft.Graph - 如何从具有不同用户名的共享邮箱发送？

我目前正在将使用 SMTP 的服务代码移植到 Office 365 通过 SMTP 我可以使用发件人字段在来自共享收件箱的邮件上设置不同的用户名同时保留共享电子邮箱地址这似乎无法通过 Office 365 运行其工艺流程为客户填
数据损坏 C++ 和 Python 之间的管道

我正在编写一些代码从 Python 获取二进制数据将其通过管道传输到 C 对数据进行一些处理在本例中计算互信息度量然后将结果通过管道传输回 Python 在测试时我发现如果我发送的数据是一组尺寸小于 1500 X 1500 的 2
更改其他页面的主窗口内容

在 WPF 应用程序的主窗口中我有一个 Badged 元素来自材料设计这是我的代码
C# 中处理 SQL 死锁的模式？

我正在用 C 编写一个访问 SQL Server 2005 数据库的应用程序该应用程序是数据库密集型的即使我尝试优化所有访问设置适当的索引等我预计迟早会遇到死锁我知道为什么会发生数据库死锁但我怀疑我能否在某个时候发布不发生死锁的
如何在 VS Code 中为 CMake 项目设置 C/C++ IntelliSense？

我正在尝试使用 libTooling 编写一个工具我对其进行了设置以便它可以使用 LLVM 文档中的示例进行编译然而 C C IntelliSense 似乎不适用于 CMake 项目我的工具位于
realloc()：重新分配为 char * 上的 strcat 腾出空间时下一个大小无效 [重复]

这个问题在这里已经有答案了我在以下代码中收到无效内存错误 printf s n FINE 5 printf s LENGTH IS d n FINE 6 strlen buffer char realloc buffer strlen b
C++ 标准中短语“构造函数没有名称”的含义

在尝试理解 C 标准中的构造函数没有名称这句话时我似乎在 clang 中发现了一个错误有人可以证实这一点吗 VS2015 and gcc rejects this code and I think they it are is co
你能解释一下这个C++删除问题吗？

我有以下代码 std string F WideString ws GetMyWideString std string ret StringUtils ConvertWideStringToUTF8 ws ret return ret W
是否有任何不使用公共虚拟方法的正当理由？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案是否有任何不使用公共虚拟方法的正当理由我在某处读到我们应该避免使用公共虚拟方法但我想向专家确认这是否是有效的声明对于良好且稳定的 API
将一个 long 转换为两个 int 以进行重构

我需要将一个参数作为两个 int 参数传递给 Telerik Report 因为它不能接受长参数将 long 拆分为两个 int 并在不丢失数据的情况下重建它的最简单方法是什么使用掩蔽和移位是最好的选择根据文档 long 保证为 64
创建带有部分的选项卡式侧边栏 WPF

我正在尝试创建一个带有部分的选项卡式侧边栏如 WPF 中的以下内容我考虑过几种方法但是有没有更简单更优雅的方法呢方法一列表框 Using a ListBox并将 SelectedItem 绑定到右侧内容控件所绑定的值为了区分标

随机推荐

Java 框架中的单页 Web 应用程序或示例？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案有没有人看过 Java 中的示例或执行过以下操作 http duganchen ca single page web app archit
如何计算两个给定日期之间的月数（基线和后续日期）

我正在尝试确定基线和随访之间的月数我的约会看起来像这样 Baseline Follow Up 10 6 15 10 10 17 10 6 15 4 20 18 10 6 15 4 18 18 10 6 15 7 2 18 10 6 15
Seam / Spring WebFlow 应用程序中的 StackOverflowError

我们正在逐步用 Spring MVC 和 Spring Webflow 替换 Seam 组件运行 JMeter 测试几个小时后日志会因 StackOverFlowErrors 变得混乱 javax servlet ServletExce
如何在Xcode LLVM中编写有关LOOP的内联汇编代码？

我正在研究内联汇编我想在 Xcode 4 LLVM 3 0 编译器下的 iPhone 中编写一个简单的例程我成功编写了基本的内联汇编代码例子 int sub int a int b int c asm sub 0 1 2 r c r
使用插件扩展 Java Web 应用程序

我的这个 Web 应用程序已经变得一团糟难以管理我想将其分成一个通用的框架部分仍然包括页面和图像等网络内容和几个添加额外功能和屏幕的模块我希望这种重构也可以作为第三方扩展的插件系统所有模块都需要是单独的部署单元最好是 wa
Jersey + Jackson JSON日期格式序列化-如何更改格式或使用自定义JacksonJsonProvider

我正在使用 Jersey Jackson 为我的应用程序提供 REST JSON 服务层我遇到的问题是默认的日期序列化格式如下所示 CreationDate 1292236718456 起初我以为这是一个 UNIX 时间戳但它太长了我
迁移到 Rails 3.2.1 后，关系“translations”不存在

我从 Rails 3 1 3 迁移到 3 2 1 加载主页时出现以下错误 PGError ERROR relation translations does not exist LINE 4 WHERE a attrelid translat
如何将加载图像添加到 HTML5 视频？

除了海报图像之外我还希望在下载视频时显示加载程序图像 gif 动画这怎么可能一种便宜的方法可能是在poster视频开始播放时将替换的属性例子
如何使用 MS graph 访问 sharepoint 在线站点中的文档库

我可以通过如下请求访问我的一个驱动器上的文档 https graph microsoft com v1 0 me drive root children 我可以通过如下请求访问我公司根共享点站点的文档库 https graph micros
在 Grails 3.x 中将配置文件 application.yml 转换为 application.groovy

我正在尝试创建一个简单的 Grails 3 项目但遇到了一些非常简单的问题因此我希望我的数据源属性来自我在 IntelliJ IDE 中设置的 VM 选项在 Grails 2 x 之前我经常这样做 environments dev
缓存还是存储在会话中？

我有一个页面从我的数据库加载了大量数据我想加快加载时间我已经缓存了查询但加载时间仍然比我希望的要长是否可以渲染包含数据的表并将其存储在会话中以在每次新页面刷新时加载我什至考虑使用 ob start 将其放入外部文本文件中最好的处
LinkedIn 帖子检查员在 https URL 上遇到服务器错误

在 LinkedIn 帖子检查器中检查给定 URL 会返回以下摄取反馈 Error We encountered a server error while trying to inspect the URL URL 重定向轨迹显示 1 0
将网格 3D 数据插值到更精细的比例

我有一个概率曲面的 NetCDF 文件它是一个 30x30 的网格纬度经度间隔为 0 25 度并在 z 维度中描述概率表面我可以轻松地将其导入 NetCDF 查看器 Panoply 然后轻而易举地选中一个框将原始数据插值平滑
在同一环境中使用同一编译器编译同一程序时，未指定和未定义的行为是否需要保持一致？

让我们假设我的程序包含 C 标准规定为未指定行为的特定构造这基本上意味着实现必须做一些合理的事情但允许不记录它但是每次编译具有未指定行为的特定构造时是否需要实现产生相同的行为或者是否允许在不同的编译中产生不同的行为未定义的行为
如何显示多个权限请求的权限理由？

我正在使用 Android API 25 需要在应用程序中发出权限请求有大量关于如何发出请求以及如何显示基本原理的代码示例这个链接在这里 https github com googlesamples android RuntimePer
项目是否必须创建为精灵套件，还是可以简单地添加框架？

我正在退一步学习我正在制作的 2D 游戏的精灵套件而不是使用 UIKit 在我读过的所有教程中他们将新项目创建为 Sprite Kit 而不是单一视图只是想知道我是否需要重新创建我的游戏或者我是否可以简单地将精灵套件框架添加到我现有
根据条件在多对多表中执行左连接

一般案例当您想要向关系的外部添加条件时如何在多对多关系中执行左连接具体案例我们正在处理两个表 team and pool 还有一个team pool表充当它们之间的多对多联结表另外一个pool has a stage id co
错误：函数返回局部变量的地址

我是 C 初学者正在自学我正在创建以下函数 char foo int x if x lt 0 char a 1000 char b blah x x 1 char c foo x strcpy a b strcat a c return
如何用docker文件覆盖nginx默认配置？

我有一个使用 React router 的应用程序我为它创建了一个 docker 镜像我正在使用 nginx 服务器并且它可以工作但是刷新页面会出现 nginx 404 错误我知道我需要覆盖 nginx 配置文件才能使其工作但不
如何在 C++ 正则表达式中使用 Unicode 范围

我必须在 C 的正则表达式中使用 unicode 范围基本上我需要的是有一个正则表达式来接受所有有效的 unicode 字符我只是尝试使用测试表达式并面临一些问题 std regex reg u0080 uDB7Fa z0 9 问题是与

如何在 C++ 正则表达式中使用 Unicode 范围

如何在 C++ 正则表达式中使用 Unicode 范围 的相关文章

随机推荐

热门标签

如何在 C++ 正则表达式中使用 Unicode 范围的相关文章