如何从字符串[]中删除非字母字符？ [复制]

2023-12-09

这是代码：

StringBuilder sb = new StringBuilder();
Regex rgx = new Regex("[^a-zA-Z0-9 -]");

var words = Regex.Split(textBox1.Text, @"(?=(?<=[^\s])\s+\w)");
for (int i = 0; i < words.Length; i++)
{
    words[i] = rgx.Replace(words[i], "");
}

当我做的时候Regex.Split()这些单词还包含内部带有字符的字符串，例如：

Daniel>

Hello:

\r\nNew

hello---------------------------

我只需要得到没有所有符号的单词

所以我尝试使用这个循环，但我最终认为，在很多地方都有""而有些地方只有------------------------

我不能稍后在我的代码中使用它作为字符串。

您不需要正则表达式来清除非字母。这将删除所有非 unicode 字母。

public string RemoveNonUnicodeLetters(string input)
{
    StringBuilder sb = new StringBuilder();
    foreach(char c in input)
    {
        if(Char.IsLetter(c))
           sb.Append(c);
    }

    return sb.ToString();
}

或者，如果您只想允许拉丁字母，您可以使用此

public string RemoveNonLatinLetters(string input)
{
    StringBuilder sb = new StringBuilder();
    foreach(char c in input)
    {
        if(c >= 'a' && c <= 'z') || (c >= 'A' && c <= 'Z')
           sb.Append(c);
    }

    return sb.ToString();
}

基准与正则表达式

public static string RemoveNonUnicodeLetters(string input)
{
       StringBuilder sb = new StringBuilder();
       foreach (char c in input)
       {
            if (Char.IsLetter(c))
                sb.Append(c);
       }

            return sb.ToString();
}



static readonly Regex nonUnicodeRx = new Regex("\\P{L}");

public static string RemoveNonUnicodeLetters2(string input)
{
     return nonUnicodeRx.Replace(input, "");
}


static void Main(string[] args)
{

    Stopwatch sw = new Stopwatch();

    StringBuilder sb = new StringBuilder();


    //generate guids as input
    for (int j = 0; j < 1000; j++)
    {
        sb.Append(Guid.NewGuid().ToString());
    }

    string input = sb.ToString();

    sw.Start();

    for (int i = 0; i < 1000; i++)
    {
        RemoveNonUnicodeLetters(input);
    }

    sw.Stop();
    Console.WriteLine("SM: " + sw.ElapsedMilliseconds);

    sw.Restart();
    for (int i = 0; i < 1000; i++)
    {
        RemoveNonUnicodeLetters2(input);
    }

    sw.Stop();
    Console.WriteLine("RX: " + sw.ElapsedMilliseconds);


}

输出（SM = 字符串操作，RX = 正则表达式）

SM: 581
RX: 9882

SM: 545
RX: 9557

SM: 664
RX: 10196

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

regex

如何从字符串[]中删除非字母字符？ [复制] 的相关文章

在 C++ 中使用 matlab 结构（matlab 函数调用的返回值）（由 matlab 编译器生成的库）

你好我有一个相当简单的 matlab 函数例如 function MYSTRUCT myfunc MYSTRUCT prop1 test MYSTRUCT prop2 foo MYSTRUCT prop3 42 end 我用 matla
未提供参数时如何指定 C# System.Commandline 行为？

在我的控制台应用程序中当未提供控制台参数时将执行我指定列表在本例中为参数 3 的任何处理程序调用该处理程序时布尔参数设置为 false 但对我来说根本不调用它更有意义如何防止这种情况发生并显示帮助文本 using System
Directory.Delete 之后 Directory.Exists 有时返回 true ？

我有非常奇怪的行为我有 Directory Delete tempFolder true if Directory Exists tempFolder 有时 Directory Exists 返回 true 为什么可能是资源管理器打开了
如何将非静态类成员“std::bind”绑定到 Win32 回调函数“WNDPROC”？

我正在尝试将非静态类成员绑定到标准WNDPROC http msdn microsoft com en us library ms633573 aspx功能我知道我可以通过将类成员设为静态来简单地做到这一点但是作为一名 C 11 ST
复制 std::function 的成本有多高？

While std function是可移动的但在某些情况下不可能或不方便复制它会受到重大处罚吗它是否可能取决于捕获变量的大小如果它是使用 lambda 表达式创建的它依赖于实现吗 std function通常被实现为值语义小缓
C中的malloc内存分配方案

我在 C 中尝试使用 malloc 发现 malloc 在分配了一些内存后浪费了一些空间下面是我用来测试 malloc 的一段代码 include
在 LINQ 中按 Id 连接多表和分组

我想按categoryId显示列表产品的名称组这是我的代码我想要我的视图显示结果 Desktop PC HP Red PC Dell Yellow PC Asus Red SmartPhone Lumia 720 Blue 我的组模型
单个对象的 Monogame XNA 变换矩阵？

我读过一些解释 XNA Monogame 变换矩阵的教程问题是这些矩阵应用于 SpriteBatch Begin matrix 这意味着所有 Draw 代码都将被转换如何将变换矩阵应用于单个可绘制对象就我而言我想转换滚动背景使其自
如何使用 LINQ2SQL 连接两个不同上下文的表？

我的应用程序中有 2 个数据上下文不同的数据库并且需要能够通过上下文 B 中的表的右连接来查询上下文 A 中的表我该如何在 LINQ2SQL 中执行此操作 Why 我们正在使用 SaaS 产品来跟踪我们的时间项目等并希望向该产品发
将 Word 文档另存为图像

我正在使用下面的代码将 Word 文档转换为图像文件但是图片显得太大内容不适合有没有办法渲染图片或将图片保存到合适的尺寸 private void btnConvert Click object sender EventArgs e
标准化 UTF-8 到底是什么？

The 重症监护室项目 http userguide icu project org transforms normalization 现在也有一个PHP库 http us php net manual en class normalize
与有效正则表达式匹配的正则表达式

是否存在与有效正则表达式匹配的正则表达式我知道正则表达式有多种风格其中一种就可以了是否存在与有效正则表达式匹配的正则表达式根据定义它非常简单 No 所有正则表达式的语言是no regular语言只需查看嵌套括号因此不可能有re
DbContext 和 ObjectContext 有什么区别

From MSDN 表示工作单元和存储库模式的组合使您能够查询数据库并将更改分组在一起然后将这些更改作为一个单元写回存储 DbContext在概念上类似于ObjectContext 我虽然DbContext只处理与数据库的连接以及针对数
Qt - ubuntu中的串口名称

我在 Ubuntu 上查找串行端口名称时遇到问题如您所知为了在 Windows 上读取串口我们可以使用以下代码 serial gt setPortName com3 但是当我在 Ubuntu 上编译这段代码时我无法使用这段代码 se
如何在 32 位或 64 位配置中以编程方式运行任何 CPU .NET 可执行文件？

我有一个可在 32 位和 64 位处理器上运行的 C 应用程序我试图枚举给定系统上所有进程的模块当尝试从 64 位应用程序枚举 32 位进程模块时这会出现问题 Windows 或 NET 禁止它我认为如果我可以从应用程序内部重新启动
C#：帮助理解 UML 类图中的 <>

我目前正在做一个项目我们必须从 UML 图编写代码我了解 UML 类图的剖析但我无法理解什么 lt
将 MQTTNet 服务器与 MQTT.js 客户端结合使用

我已经启动了一个 MQTT 服务器就像this https github com chkr1011 MQTTnet tree master例子该代码托管在 ASP Net Core 2 0 应用程序中但我尝试过控制台应用程序但没有成
WebSocket安全连接自签名证书

目标是一个与用户电脑上安装的 C 应用程序交换信息的 Web 应用程序客户端应用程序是 websocket 服务器浏览器是 websocket 客户端最后用户浏览器中的 websocket 客户端通过 Angular 持久创建并且
当从finally中抛出异常时，Catch块不会被评估

出现这个问题的原因是之前在 NET 4 0 中运行的代码在 NET 4 5 中因未处理的异常而失败部分原因是 try finallys 如果您想了解详细信息请阅读更多内容微软连接 https connect microsoft com
当我使用 OpenSSL1.1.0g 根据固定的 p 和 g 值创建 Diffie Hellman 密钥协议密钥时，应该执行哪些检查？

您好我尝试通过这段代码使用修复 p 和 g 参数来制作 Diffie Hellman Keysanswer https stackoverflow com a 54538811 4706711 include

随机推荐

无法使用 [UIImage imageWithContentsOfFile:] 创建 UIImage 并且文件存在

我google了这个问题大多数使用了错误的方法 UIImage imageNamed 我不是并且我确定该文件存在以下代码在iOS8 1上运行 self cachePath NSSearchPathForDirectoriesInDom
如何在 VBscript 中将字符串数组转换为变体数组？

我在 vbscript 中使用一个函数它返回一个变量字符串数组 JobIDs objDoc ConnectedSubmit objServer 问题是我无法从该数组中获取作业 ID 值因为 vbscript 不处理类型变量当我尝试对
Laravel 5 Entrust - 用户属于许多应用程序

我在 Laravel 5 3 中使用 Entrust 包来管理用户角色和权限它工作得很好问题是我的users 属于许多人 apps 所以我需要检查角色和权限并考虑到他们在每种情况下尝试在哪个应用程序中执行操作由于 Entrust 不
保存和加载数据 - CoreData

我是 CoreData 的新手在我的 iPhone 应用程序中我想知道如何保存一些文本然后将其重新加载但诀窍是当 UIDatePicker 中的日期与我保存它时的日期相同时加载它就像日历一样 Update 感谢您的回复尤其是代码
在 C# 中使用已知模式解析 Lisp S 表达式

我正在使用一项以类似 Lisp 的 S 表达式字符串形式提供数据的服务这些数据到达的速度又快又厚我想尽快地处理它最好是直接在字节流上它只是单字节字符而不进行任何回溯这些字符串可能非常长我不希望 GC 为整个消息分配字符串而造成
Xcode 6.0.1 命令 /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/swiftc 失败，退出代码 1

我在存档时收到此错误命令 Applications Xcode app Contents Developer Toolchains XcodeDefault xctoolchain usr bin swiftc 失败退出代码 1 怎么解
Ajax Laravel 返回视图 500 错误

我通过 Ajax 将幻灯片 Jquery Ui Slider 中的每个滑块值获取到我的控制器 Slider Ajax 看起来像这样 sliderNumCh slider range min min 0 max 20 step 1 value
以全屏模式查看 silverlight 应用程序 (F11)

有没有办法直接在 F11 模式下加载我的 silverlight 应用程序我用过 window open url self toolbar no status no location no menubar no resizable yes
R中两个数据帧的行之间的欧几里得距离

计算欧氏距离R简单可以找到一个很好的例子HERE 矢量化形式为 sqrt known data 1 unknown data 1 2 known data 2 unknown data 2 2 获得一个数据帧的每一行与另一个数据帧的所有行
在任务管理器中更改程序进程名称？

好吧我一直在四处寻找但在任何地方都找不到答案我希望我的程序做的是每次运行它时任务管理器中显示的名称都是随机的有一个名为 Liberation 的程序当您运行它时它会将进程名称更改为一些随机字符例如 AeB4B3wf52 tm
使用 maxLines 选取框

如何使用 MaxLines 而不是 SingleLine 来制作选取框这是我的 TextView
MySQL：用户“user”@“IP_ADDRESS”的访问被拒绝 - 允许某些主机的远程访问对其他主机失败

背景我可以从某些子网访问 mysql 实例但不能从其他子网访问至少看起来是这样网络上的机器10 0 21 xx能够连接到 MySQL 实例但从10 0 7 xx I get 使用密码的用户访问被拒绝有趣的是 MySQL 安装在与
动态访问 PHP 数组

我尝试访问 this gt arrDataName key 在带有键的元素上 key从数组 this gt arrDataName 但 PHP 解释错误我尝试过周围的 arrDataName to this gt arrDataName
我可以强制报表顶部的图表始终可见吗

我有以下报告 In Excel我会用一个叫做Freeze Pane在图表下方这意味着当用户向下滚动时表格将滚动但图表将始终保持可见是否可以在中实现此行为RS EDIT 注图表和tablix使用不同Datasets 是的您可以通过
从设计角度应该如何对待 CouchDB 修订版？

据我所知 CouchDB 修订版不应被视为文档版本控制这个词的意义从其他帖子来看它们似乎被视为暂时数据直到粗粒度的数据出现为止 compact操作称为我的问题是如果我有兴趣使用 CouchDB 来维护文档以及这些文档的版本历史记录
如何为history.pushState和replaceState设置“默认”值？

对于使用的浏览器titleparam 我们应该使用什么值来告诉浏览器使用其默认值 In Safari 5 1 7 7534 57 2 if I put null or undefined as the title param it uses
Haskell：在不使用spawn的情况下分割管道（广播）

这个问题有点代码高尔夫而且很新鲜我正在使用很棒的pipesHaskell 中的库我想拆分一个管道以沿多个通道发送相同的数据进行广播这Pipes Concurrent教程建议使用spawn创建邮箱利用Output的幺半群状态例如
查找视图依赖的所有表[重复]

这个问题在这里已经有答案了我有一个 Oracle 视图我想找到我的视图所依赖的所有表可能我的视图依赖于其他视图在这种情况下我想递归地导航依赖项并访问表这是我的架构的示例 CREATE TABLE T1 A NUMBER CRE
如何获取当前页面中显示的所有项目？

For the 官方示例多选时如果设置每页显示 50 行并单击标题行中的全选复选框则实际上表中的所有行都被选中问题是我只想选择当前页面中的所有行有什么方法可以实现吗我不想手动单击每一行我为你想要实现的目标创建了一个演示 http
如何从字符串[]中删除非字母字符？ [复制]

这个问题在这里已经有答案了这是代码 StringBuilder sb new StringBuilder Regex rgx new Regex a zA Z0 9 var words Regex Split textBox1 Text

如何从字符串[]中删除非字母字符？ [复制]

如何从字符串[]中删除非字母字符？ [复制] 的相关文章

随机推荐

热门标签