PHP:删除unicode文本中少于3个字符的单词

2024-02-29

我使用这些正则表达式来删除少于 3 个字符的单词:

$str = preg_replace("!\\b\\w{1,3}\\b!", "", $str);  

and

$rdu = "/\b[^\b]{1,2}\b/";
$str = preg_replace($rdu , " ", " " . $str . " "); 

但在 unicode 文本中返回我:

� �� �� �������� ��� �� � �� �� �������� ��� �� 
....

有没有办法使用或不使用正则表达式来删除 unicode 文本中少于 3 个字符的单词?

THXA


Use the u用于 UTF-8 支持的修饰符 http://php.net/reference.pcre.pattern.modifiers:

/\b\w{1,2}\b/u
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

PHP:删除unicode文本中少于3个字符的单词 的相关文章

  • 正则表达式字符串中第一个和最后一个非点的位置

    我希望找到字符串的第一个和最后一个非点元素的位置 理想情况下我想这样做regex在基地R 我已经写过R解决问题的代码 不过 我对一个感兴趣regex解决方案 感谢您的任何建议 这是一个示例数据集和R代码以获得所需的结果 此代码拆分字符串并使
  • 将上部字符转换为下部字符,将下部字符转换为上部字符(反之亦然)[重复]

    这个问题在这里已经有答案了 我需要将某些字符串中的所有较低字符转换为较高字符 并将所有较高字符转换为较低字符 例如 var testString heLLoWorld 应该 HEllOwORLD 转换后 在不保存临时字符串的情况下实现此目的
  • Javascript 正则表达式来匹配正则表达式

    我正在研究一个特殊的正则表达式来匹配 javascript 正则表达式 现在我有这个正则表达式工作 i g m 例如 foo match i g m gt foo foo undefined foo i match i g m gt foo
  • Java中字符串中特殊字符的替换

    Java中如何替换字符串 E g String a adf sdf 如何替换和避免特殊字符 您可以删除除此之外的所有字符可打印的 ASCII 范围 http en wikipedia org wiki ASCII ASCII printab
  • REgex从oracle中的字符串中获取数字

    我有以下格式的字符串 阿克拉姆 88 jamesstree 20140418 阿克兰 8 约翰街 20140418 阿克兰 888 johnstreet 20140418 现在我只想检索 88 8 和 888 值 我为此编写了以下查询 SU
  • 检查给定字符串是否等于给定字符串集中的至少一个字符串的有效方法

    给定一组字符串 比如说 String1 String2 StringN C 中确定最有效的方法是什么 返回true or false 是否给定string s匹配上面集合中的任何字符串吗 Boost Regex 可以用于此任务吗 std u
  • 解析西班牙姓氏

    西班牙姓氏由三部分组成 父亲的名字 可选的母亲姓名 可选配偶的父亲姓名 这三个部分中的每一部分都是一个单词 前面可能带有 De Del De La De Los 或 De Las 这些前缀中的每一个都以大写字母开头 并且每个部分可能只有一个
  • Python:删除字符串开头的数字

    我有一些这样的字符串 string1 123 123 This is a string some other numbers string2 1 This is a string some numbers string3 12 3 12 T
  • 为什么我只得到第一个捕获组?

    https stackoverflow com a 2304626 6607497 https stackoverflow com a 2304626 6607497 and https stackoverflow com a 370042
  • 在 SQLite 中搜索时排除 HTML 标签和一些 UNICODE 字符

    更新 4 我已经成功运行了firstchar例如 但现在的问题是使用regex 即使包含头文件 它也无法识别regex操作员 有什么线索可以解决这个问题吗 更新 2 我已经编译了sqlite3我的项目中的库 我现在正在寻找任何人帮助我为我的
  • 使用 php/regex 验证美国电话号码

    EDIT 我混合并修改了下面给出的两个答案 以形成完整的功能 现在它可以完成我想要的功能 然后是一些 所以我想我会将其发布在这里 以防其他人来寻找同样的东西 Function to analyze string against many p
  • Python 3.4 十六进制转日语字符

    我目前正在编写一个脚本 从我的网站中提取包含日语字符的信息 到目前为止 我的脚本已从网站上提取数据 它以字符串形式返回 xe5 xb9 xb4 xe3 x81 xab xe4 xb8 x80 xe5 xba xa6 xe3 x81 xae
  • Java中使用正则表达式确定字符串是否为URL [重复]

    这个问题在这里已经有答案了 可能的重复 检查字符串是否为有效 URL 的最佳正则表达式是什么 https stackoverflow com questions 161738 what is the best regular express
  • 所见即所得与 Unicode

    我在 Delphi 中编写了一个 Windows 程序 该程序使用 GetCharWidth 和 Em Square 将文本非常精确地放置并换行到屏幕和打印机 这对于 ANSI 文本效果很好 您只需要检索和计算 255 个字符的宽度 但当您
  • 在 Java 中对多语言环境字符串进行排序

    我正在尝试按字符串字段 国家 地区 对对象列表进行排序 每个国家 地区都使用其母语 阿根廷 澳大利亚 奥地利 例如 我想要做的是让 出现在 A 国家之后 因为字母 对应于拉丁语 B 我正在尝试使用默认的 Collat er 但非拉丁名称仍然
  • 有人能给我一个 1 到 5 之间数字的正则表达式吗

    有人能给我一个 1 到 5 之间的单个数字的正则表达式吗 例如输入必须是 1 到 5 之间的数字 55 或 23 不匹配 尝试使用anchors http www regular expressions info anchors html
  • egrep 和 grep 之间的区别

    我有一个问题grep and egrep in unix 由于我最近正在学习shell commands in unix 我想知道grep和egrep有什么区别 我发现我们可以将 grep 和egrep 与正则表达式一起使用 但是 我发现这
  • 删除emacs中多余的空行

    M x flush lines 删除缓冲区中的所有空白行 但是我只想删除多余的空白行 也就是说 如果有n个连续的空白行我想删除n 1并保留一个 我知道删除空白行可以完成该点下的空白行的工作 但是我想要一个适用于整个缓冲区的简单解决方案 有什
  • 线性空白到底是什么? (LWS/LWSP)

    我看到提到了这个术语 还有 CRLF CR LF CTL 控制字符 和 SP 空格 如果它不是常规的内联空格 那么它是什么字符 From STD68 语法规范的增强 BNF ABNF http www rfc editor org std
  • 如何在 iPhone 应用程序中使用正则表达式以 , (逗号)分隔字符串

    我必须读取包含三列的 csv 文件 在解析 csv 文件时 我得到了这种格式的字符串克里斯托弗 巴斯 为心爱的国家哭泣 期末论文 电子邮件受保护 cdn cgi l email protection 我想将三列的值存储在一个数组中 所以我使

随机推荐

  • 如何反映可编码/可编码密钥协议的设计?

    我正在尝试实现类似于 Swift 如何利用CodableKeys在实现的类中定义的枚举上设置的协议Codable 就我而言 班级是CommandHandler枚举是CommandIds并且它不需要编译器的代码生成 因为枚举将始终被显式指定
  • 如何使用 HTML 敏捷包

    我该如何使用HTML 敏捷包 http html agility pack net z codeplex 我的 XHTML 文档不完全有效 这就是我想使用它的原因 我如何在我的项目中使用它 我的项目是用 C 编写的 首先 安装HTML敏捷包
  • 如何将多个 HTML 文件解析为单个 PDF?

    我想使用 iText 将一系列 html 文件转换为 PDF 例如 如果有这些文件 第1页 html page2 html page3 html 现在我想创建一个 PDF 文件 其中 page1 html 是第一页 page2 html 是
  • CSS - 悬停穿过元素以激活被覆盖元素上的悬停

    我的页面布局涉及大量绝对位置和 z 索引 因此有很多元素彼此重叠 其中一个元素仅包含文本 它悬停在许多其他内容之上 在该元素下方有几个应用了 CSS 悬停伪类的元素 当鼠标经过包含文本的元素时 我希望下面的元素以某种方式响应鼠标的存在并激活
  • Symfony2 Doctrine 实体未水合

    我得到一个实体Member从实体管理器中 做了一个 var dump 除了与的 ManyToOne 关系之外 一切正常Family 所以我尝试了var dump member gt getFamily 令人惊讶的是 唯一正确的值是家庭的 I
  • Pandas:FutureWarning:将列表喜欢传递给 .loc 或 [] [重复]

    这个问题在这里已经有答案了 当我运行脚本时 Pandas 给出以下内容 未来警告 FutureWarning Passing list likes to loc or with any missing label will raise Ke
  • 如何在没有小部件工厂的情况下为 Yii2 中的 GridView 设置默认配置?

    这是 Yii2 中 gridview 的样子 我想稍微改变我的网格 所以我添加了这一行 tableOptions gt class gt table table condensed 这很好用 但是 我希望这是我所有
  • 如何抓取foursquare签到数据?

    是否可以通过贪心的方式从foursquare中爬取签到数据 即使我与所有用户没有友谊 就像抓取公开的 Twitter 消息一样 如果您有什么经验或建议 请分享 谢谢 如果您有包含 foursquare 链接的公开推文 您可以通过发出 HEA
  • 测试嵌套结构中的 nil 值

    我在 go 中有一个深度嵌套的结构 它们是由 json 解组器构造的 然而 这个结构中的相当多的字段是 omitifempty 所以我用一个在不同地方可以有空的结构来结束操作 示例 真实的嵌套更深 而且很大 400 行结构 package
  • 视图主体中的 swiftui 三元运算符

    在 swiftyui 主体内部 基于 news urlToImage 值 我需要能够加载另一个视图 LOadRemoteImageView 这只是另一个接受可选 url 字符串来加载远程图像的视图 或者显示文本字符串 没有图像网址 按照下面
  • 原始类型是否被视为 JSON?

    大多数情况下 JSON 的格式如下 color red value f00 Or color red value f00 color red value f00 我想问 string bool int 等原始类型也是 JSON 吗 我找到了
  • Swagger-Net 显示控制器名称而不是端点方法

    我一直试图找出为什么 Swagger Net 不显示控制器中的端点方法 C 项目使用基于 Net Framework 4 6 1 的 Web API 模板 当我使用 SwashBuckler 时 我得到了相同的结果 所以这不是 Swagge
  • 当 HashMap 或 HashSet 达到最大容量时会发生什么?

    就在几分钟前 我回答了一个关于 Java中HashMap的最大可能大小 正如我一直读到的那样 HashMap 是一种可增长的数据结构 它的大小仅受 JVM 内存大小的限制 因此我认为它的大小没有硬性限制并做出了相应的回答 这同样适用于 Ha
  • 检查无向图中的奇数循环

    我带着另一个类似的问题回来了 我目前正在开发一个 Java 程序 该程序将检查图是否可 2 色 即它是否不包含奇数循环 奇数长度的循环 整个算法应该在 O V E 时间内运行 V 是图中的所有顶点 E 是图中的所有边 我当前的算法执行深度优
  • 根据 mongodb 中的正则表达式值从文档中查找匹配的项目

    我必须选择匹配的casts item m credits cast 使用正则表达式值从电影集合中获取 电影模态 var mongoose require mongoose var movieSchema new mongoose Schem
  • 如何通过电子邮件发送 HTML5 画布图像

    首先 我尝试使用 Pear 的 Mail mime 来完成此操作 但我无法从共享主机提供商和 cpanel 加载该类 接下来我按照指示这个帖子 https stackoverflow com questions 6150880 email
  • 调用 WebRequest GetSystemWebProxy()

    在 PowerShell 2 0 下 我知道您可以通过执行以下操作来设置您想要使用的代理 而无需知道确切的代理设置 proxy System Net WebRequest GetSystemWebproxy proxy Credential
  • 解析 JSON 以配置 Android 应用程序

    在我的 Android 应用程序中 我必须使用服务器中的 JSON 在应用程序中进行特定调整 我试图实现的目标是读取此 json 并将所有值存储到局部变量中以在应用程序内执行操作 来自服务器的 JSON sett glHdr sm scle
  • 如何获取 .wav 文件格式的 numpy 数组输出

    我是 Python 新手 我正在尝试训练我的音频语音识别模型 我想读取 wav 文件并将该 wav 文件的输出放入 Numpy 数组中 我怎样才能做到这一点 根据 Marco 的评论 您可以查看 Scipy 库 特别是scipy io fr
  • PHP:删除unicode文本中少于3个字符的单词

    我使用这些正则表达式来删除少于 3 个字符的单词 str preg replace b w 1 3 b str and rdu b b 1 2 b str preg replace rdu str 但在 unicode 文本中返回我 有没有