如何使用 Swift 5.7 的 RegexBuilder 捕获 10 多个事物？

2024-02-13

假设我有一个存储有关人员信息的文件，其中一行如下所示：

Sweeper 30 1992-09-22 China/Beijing - 0 2020-07-07 Mary/Linda - Pizza/Lemon

从左到右依次是姓名、年龄、出生日期、出生国家、出生城市、孩子数量、结婚日期（可选）、妻子姓名（可选）、前妻姓名（可选）、最喜欢的食物、最不喜欢的食物。

我想要得到all使用 Swift 5.7 RegexBuilder 模块的行中的信息，我尝试过：

let regex = Regex {
    /([a-zA-Z ]+)/ // Name
    " "
    TryCapture { OneOrMore(.digit) } transform: { Int($0) } // Age
    " "
    Capture(.iso8601Date(timeZone: .gmt)) // Date of Birth
    " "
    /([a-zA-Z ]+)/ // Country of Birth
    "/"
    /([a-zA-Z ]+)/ // City of Birth
    " - "
    TryCapture { OneOrMore(.digit) } transform: { Int($0) } // Children Count
    Optionally {
        " "
        Capture(.iso8601Date(timeZone: .gmt)) // Date of Marriage
        Optionally {
            " "
            /([a-zA-Z ]+)/ // Wife
            Optionally {
                "/"
                /([a-zA-Z ]+)/ // Ex-wife
            }
        }
    }
    " - "
    /([a-zA-Z ]+)/ // Favourite food
    "/"
    /([a-zA-Z ]+)/ // Least Favourite Food
}

然而，Swift 表示它无法在合理的时间内对此进行类型检查。

我知道发生这种情况的原因是因为RegexComponentBuilder https://developer.apple.com/documentation/regexbuilder/regexcomponentbuilder（正则表达式组件的结果生成器）最多只有 10 个“C”或类似的重载（不太确定细节）：

static func buildPartialBlock<W0, W1, C1, C2, C3, C4, C5, C6, C7, C8, C9, C10, R0, R1>(
    accumulated: R0,
    next: R1) -> Regex<(Substring, C1, C2, C3, C4, C5, C6, C7, C8, C9, C10)> where R0 : RegexComponent, R1 : RegexComponent, R0.RegexOutput == (W0, C1, C2, C3), R1.RegexOutput == (W1, C4, C5, C6, C7, C8, C9, C10
)

如果我做了所有的Optionally parts required，错误消息变得更加明显。

“buildPartialBlock(accumulated:next:)”的使用不明确

SwiftUI 也有类似的问题，视图生成器中的视图数量不能超过 10，在这种情况下，您只需使用Group使某些观点成为single看法。你能在 RegexBuilder 中做类似的事情吗？将一些捕获设为单个捕获？好像有什么关系AnyRegexOutput，但我不知道如何使用它。

如何解决这个编译器错误？

为了避免 XY 问题：

我有一个数据文件，其中数据的格式非常随意，即根本不像 CSV 或 JSON 那样机器可读。线条以各种格式书写。随机分隔符用在随机的地方。

然后文件中的另一行将具有相同的信息，但格式不同。

我想要做的是将这个格式奇怪的文件转换为易于使用的格式，例如 CSV。我决定使用 Swift 5.7 RegexBuilder API 来完成此操作。我会在文件中找到一行，编写一个与该行匹配的正则表达式，将文件中与该正则表达式匹配的所有行转换为 CSV，然后冲洗并重复。

因此，我想避免使用多个正则表达式来解析单行，因为这意味着我将编写一个lot更多正则表达式。

我不确定像 ANTLR4 这样的解析器是否可以解决我的问题。考虑到文件格式的随机性，我需要更改解析器lot，导致文件一次又一次地生成。我认为这不会像使用 RegexBuilder 那样方便。

作为黑客，您可以创建一个广义的 CustomConsumingRegexComponent实施纳入

any RegexComponent由建造者建造，建造者总是有(Substring, A, B, C ...)元组作为输出
将该元组转换为类型的转换T我们渴望的

我们基本上可以创建一个正则表达式组件，它接受一些正则表达式并输出任何类型T我们想要的，本质上是“分组”捕获。

也有可能不进行转换，最终会得到嵌套的元组，但我不喜欢这样。

struct Group<RegexOutput, Component: RegexComponent>: CustomConsumingRegexComponent {

    let component: () -> Component
    
    let transform: (Component.RegexOutput) -> RegexOutput
    
    init(@RegexComponentBuilder _ regexBuilder: @escaping () -> Component, transform: @escaping (Component.RegexOutput) -> RegexOutput) {
        component = regexBuilder
        self.transform = transform
    }
    
    func consuming(_ input: String, startingAt index: String.Index, in bounds: Range<String.Index>) throws -> (upperBound: String.Index, output: RegexOutput)? {
        let innerRegex = Regex(component)
        guard let match = input[index...].prefixMatch(of: innerRegex) else { return nil }
        let upperBound = match.range.upperBound
        let output = match.output
        let transformedOutput = transform(output)
        return (upperBound, transformedOutput)
    }
}

这只是一个 hack 的原因是因为里面的正则表达式Group实际上并不了解外界的事情Group，所以里面的量词Group不会回溯去尝试匹配之外的东西Group.

例如，要修复问题中的代码，我可以将所有与婚姻相关的信息放入Group，但我必须在其中添加一个前瞻Group:

struct Marriage {
    let marriageDate: Date
    let wife: Substring?
    let exWife: Substring?
}

let r = Regex {
    /([a-zA-Z ]+)/ // Name
    " "
    TryCapture { OneOrMore(.digit) } transform: { Int($0) } // Age
    " "
    Capture(.iso8601Date(timeZone: .gmt)) // Date of Birth
    " "
    /([a-zA-Z ]+)/ // Country of Birth
    "/"
    /([a-zA-Z ]+)/ // City of Birth
    " - "
    TryCapture { OneOrMore(.digit) } transform: { Int($0) } // Children Count

    Optionally {
        " "
        Capture(Group {
            Capture(.iso8601Date(timeZone: .gmt)) // Date of Marriage
            Optionally {
                " "
                /([a-zA-Z ]+)/ // Wife
                Optionally {
                    "/"
                    /([a-zA-Z ]+)/ // Ex-wife
                }
            }
            Lookahead(" - ")
        } transform: { (_, date, wife, exWife) in
            Marriage(marriageDate: date, wife: wife, exWife: exWife as? Substring) // unwrap the double optional
        })
    }
    " - "
    /([a-zA-Z ]+)/ // Favourite food
    "/"
    /([a-zA-Z ]+)/ // Least Favourite Food
}

如果没有前瞻，就会发生以下情况：

最里面的[a-zA-Z ]+会匹配Linda，以及它后面的空格，导致" - "不匹配。通常，这会导致回溯，但由于内部的东西Group不知道外界的事情Group，这里不发生回溯，整个匹配失败。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 Swift 5.7 的 RegexBuilder 捕获 10 多个事物？的相关文章

iOS8 CoreData“使用未实现的初始化程序”

我尝试运行我的应用程序时收到以下错误致命错误对类 rcresttest CatalogItem 使用未实现的初始化程序 init entity insertIntoManagedObjectContext 我可以通过将数据模型中的实体类
由 Xcode 机器人运行时，在文本视图中键入文本时 UI 测试失败

我有以下 XCTest UI 测试将文本键入文本视图 let textView app textViews elementBoundByIndex 0 textView tap textView typeText Hello world
如何使用正则表达式匹配模式的最后一次出现

我有一个像这样的字符串 token1 token2 我要匹配 token2 使用正则表达式它应该匹配的其他可能的情况是 token1 应该匹配最后一个 token1 应该匹配最后一个 token1 token2应该匹配 token2
检查定位服务是否开启

我一直在对 CoreLocation 进行一些研究最近我遇到了一个在其他地方但在 Objective C 和 iOS 8 中已经讨论过的问题我觉得问这个问题有点傻但是如何在 iOS 9 上使用 swift 检查是否启用了位置服务
.htaccess 异常导致主目录出现问题

这是我的目录结构 localhost or livehost app bootstrap public vendor code demo 这是我的 htaccess
正则表达式 '?' 的类似物（前一项可选）在T-SQL中像什么？

我想知道是否可以翻译包含的正则表达式前面的项目可选在 T SQL LIKE 模式中 DB 端无需任何操作例如 31 4 我可以将其分成几个子句但如果正则表达式包含很多这不太方便 LIKE不使用正则表达式并且它使用的模式语言没
Swift Generics 在使用继承时不会实例化泛型

我有课Alpha and Berry class Alpha class Berry Alpha 我有一个使用继承及其泛型的函数 func myFunc
正则表达式匹配整个单词[重复]

这个问题在这里已经有答案了我在 stackoverflow 上看到了很多关于使用正则表达式进行全词匹配的例子我有以下情况我想用 www xyz com 替换 www abc com string RetVal I am going t
没有特殊字符的密码验证器

我是 RegEx 的新手已经进行了大量搜索但没有找到任何具体内容我正在编写一个验证密码字符串的正则表达式可接受的字符串必须至少具有 4 种字符类型中的 3 种数字小写字母大写字母特殊字符我对包含有一个想法也就是说如果这
如何使用 Swift 使用 TouchID？

Apple 为 iOS 8 的 TouchID 实现提供的文档采用 Objective C 语言有 Swift 版本吗 Objective C IBAction touchIDAvailable UIButton touchIDAvail
JavaScript RegEx：不同的结果：使用字符串和使用正则表达式“文字”构建模式？

使用 RegExp 文字与字符串之间有什么区别吗 http jsfiddle net yMMrk http jsfiddle net yMMrk String prototype lastIndexOf function pattern p
减少 CoreData 的调试输出？

我正在开发一个使用 CoreData 的 iOS macOS 项目它工作正常但它会向控制台输出大量调试信息这使得控制台无法使用因为我的打印语句隐藏在所有与 CoreData 相关的内容中我有一个非常简单的 CoreData 设置
如何让按钮闪烁？

我试图在扫描正确时将按钮的颜色只是闪烁闪烁更改为绿色在出现问题时将按钮的颜色更改为红色我可以用这样的视图来做到这一点 func flashBG UIView animateWithDuration 0 7 animations s
根据 iOS 版本使用不同的类实现？

iOS 11 最近添加了一个我想使用的新功能但我仍然需要支持旧版本的 iOS 有没有一种方法可以将同一个类编写两次并让较新版本的 iOS 使用该类的一个版本而旧版本的 iOS 使用另一个版本注最初我用的是if available
如何使用 XPath 正则表达式匹配 URL

需要 XPath 方面的帮助我有这样一个XML
如何使用 CNContacts 快速获取手机号码？

我有一些代码可以检索用户联系人中的所有电话号码但只想过滤掉手机号码目前我只是通过将第一个数字为或第二个数字为 7 的数字添加到数组中来实现此目的如下所示 func findContacts gt CNContact let key
如何在 iOS 13 中将 UISegmentedControl 的背景颜色设置为白色

iOS 13 对 UISegmentedControl 进行了一些更改包括切换所选片段时的非常漂亮的动画但是我注意到它没有显示backgroundColor属性正确它似乎总是有一点色彩我见过回答如何设置的问题selectedSegm
我的 UICollectionView 无法使用 Swift 平滑滚动

我有一个CollectionView它使单元出队取决于message类型例如文本图像我遇到的问题是当我向上向下滚动时滚动确实很不稳定因此用户体验不是很好这仅在第一次加载单元格时发生之后滚动就会平滑我有什么想法可以解决这个问
在 Objective-C 中的 Swift 类上调用 NSStringFromClass 返回模块损坏的名称

我知道这个问题 https stackoverflow com questions 24107658 get a user readable version of the class name in swift in objc nsstri
致命错误：在 Swift 中解包可选值时意外发现 nil

所以我试图获取 Swift 中输入字段的文本这就是我得到的 class ViewController UIViewController IBOutlet var passwordField UITextField IBOutlet var

随机推荐

合并多个 BatchEncoding 或从 BatchEncoding 对象列表创建张量流数据集

在标记标记任务中我使用转换器标记生成器它输出 BatchEncoding 类的对象我分别对每个文本进行标记因为我需要从文本中提取标签并在标记后重新排列它们由于子标记但是我找不到一种方法可以从 BatchEncoding 对象列
如何通知其他应用程序我的应用程序是 Windows 桌面的一部分？

我想在 C 中为 Windows 创建一个工具栏并希望将其放置在 Windows 桌面的顶部空间我希望其他 Windows 程序无法覆盖我的应用程序我还希望其他应用程序将我的窗口视为桌面的一部分以便当它们最大化时您仍然可以看到我
Matlab调试：跳过下一行而不执行

问题问题的完整描述如下有人对如何欺骗 Matlab 跳过一行或多行代码有建议吗 mex java 重写一些内部Matlab功能有谁知道在哪里db 代码文件可能位于如果存在 Matlab 中有几个函数可以在调试运行程序时进行流量控制
将所有提交导出到 ZIP 文件或目录中

如何将所有提交导出到 ZIP 文件包含全部文件不仅仅是补丁差异 myproject commit1 67d91ab zip myproject commit2 9283acd zip myproject commit3 c57daa6
子集参数在 pandas.io.formats.style.Styler.format 中起什么作用？

的公共文档pandas io formats style Styler format https pandas pydata org pandas docs stable reference api pandas io formats st
实际上撤消 git stash pop

这个问题 https stackoverflow com questions 20038056 undo git stash pop有相同的标题但它是NOT同样的问题这个问题实际上是在问丢弃 git stash pop 的结果这个问
互联网是否需要身份验证才能实际连接才能下载？

我的应用程序需要使用互联网连接从链接下载一些文件我有一个使用代理并需要身份验证的互联网连接不知何故当我尝试连接到互联网时它从不要求进行此身份验证因此无法下载文件我想问的是有什么方法可以检测用户的互联网连接是否需要身份验证才能从
如何启用枚举继承

我正在编写一个库其中有一组预定义的枚举值比方说我的枚举如下所示 public enum EnumClass FIRST first SECOND second THIRD third private String httpMethod
urlencode 形式的泽西乔达时间 ISO 8601 参数

我正在使用 Jersey 1 17 1 并定义了接受 application x www form urlencoded 的 REST 服务我想接受 ISO 8601 格式的参数 b 并让 Jersey 将其映射到 Joda DateTi
Iphone 中的多语言应用

如何在应用程序中更改应用程序的默认语言我正在尝试将应用程序语言更改为阿拉伯语但我不知道如何完成此操作有一种方法首先创建一个不同的文件夹命名为ar lproj并把localizable String 希望以下示例代码对您有所帮助您
如何删除字符串第一次出现之前和最后一次出现之后的所有行？

猫抢 txt My Dashboard Fnfjfjf random test 00 50 1 01 56 My Notes No data found Change Language English Submit Estimation o
为什么 @DisplayName 在 JUnit 5 中不能为我工作？

出于某种原因我真的很难让显示名称在带有 Kotlin 的 JUnit 5 中得到真正的尊重这是我出于示例目的创建的测试文件 import org assertj core api Assertions import org junit
jQuery 添加一个类 - 我尝试过的所有方法都会在单击时删除该类

我正在使用一个 3D 旋转按钮其中每个面都有不同的短语但两者都是指向同一 URL 的链接我最初使用普通的旧 css hover 旋转立方体按钮但我注意到当您单击该按钮时它会重置仅当鼠标不再位于按钮上时它才应旋转回起始位置我创建
uiwebkit 错误 101

我有一个搜索框它接受希伯来语和英语的关键字并在维基百科中搜索相应的关键字如果我输入英语它运行良好但当我输入希伯来语时它会显示此错误当我输入希伯来语关键字 url 时看起来像 u05db u05db u05db u05db 当我
在 WPF 中的数据绑定组合框中禁用分隔符选择

我有一个数据绑定的组合框在此列表中我需要一个分隔符由于这是数据绑定我做了一些非常类似的事情这个帖子 http www japf fr 2008 12 how insert separator in a databound combo
tcl：如何使用变量的值创建新变量

这是我正在尝试做的一个例子 set t SNS set t top commands that return value 想要获取存储在 t top 的信息 puts t top SNS top really want the data s
Django runserver 卡在执行系统检查上

我正在运行 python manage py runserver 或 migrate 在这两个命令中它都卡在执行系统检查上您能帮我了解问题是什么以及如何解决它吗 Admins MacBook Pro driveu backend gat
检测未连接图中的循环

尽管关于这个主题有一些问题但我需要一些更具体的建议我正在开发一些项目我必须重命名一个实体这意味着保存一个包含实体的旧名称和新名称的新对象这就是软件的工作原理现在我要做的是检查当有人尝试重命名对象时是否尝试循环依赖例如 A g
在 Windows 上的 ruby 1.9.2 上更新到 rubygems 1.5.0 后，GemCutter rake 构建现在会抛出“#

我刚刚将 Windows 2008 Server x64 盒子更新为 ruby gems 1 5 0 现在我无法使用 rake 任务构建 gem rake clobber build 由 Gemcutter 提供我收到以下错误 rake

如何使用 Swift 5.7 的 RegexBuilder 捕获 10 多个事物？

假设我有一个存储有关人员信息的文件其中一行如下所示 Sweeper 30 1992 09 22 China Beijing 0 2020 07 07 Mary Linda Pizza Lemon 从左到右依次是姓名年龄出生日期出生国

如何使用 Swift 5.7 的 RegexBuilder 捕获 10 多个事物？

如何使用 Swift 5.7 的 RegexBuilder 捕获 10 多个事物？ 的相关文章

随机推荐

热门标签

如何使用 Swift 5.7 的 RegexBuilder 捕获 10 多个事物？的相关文章