如何在 Elixir 中截断字符串？

2024-05-15

我正在使用长生不老药的鼻涕虫，想法是：我有一个字符串[a-zA-Z0-9]用连字符分隔的单词。喜欢：

string = "another-long-string-to-be-truncated-and-much-text-here"

我想确保最大字符串长度等于 30，但我也想确保单词在达到最大长度时不会被削减一半。所以前 30 个符号string are another-long-string-to-be-trun但我想要another-long-string-to-be用词truncated被完全删除。我怎样才能做到这一点？

首先，如果你根本不关心性能，您可以将所有工作转发给正则表达式：

~r/\A(.{0,30})(?:-|\Z)/

我认为这将是最短的解决方案，但效率不高：

iex(28)> string
"another-long-string-to-be-truncated-and-much-text-here"
iex(29)> string2
"another-long-string-to-be-cool-about-that"

iex(30)> Regex.run(~r/\A(.{0,30})(?:-|\Z)/, string) |> List.last() 
"another-long-string-to-be"

iex(31)> Regex.run(~r/\A(.{0,30})(?:-|\Z)/, string2) |> List.last()
"another-long-string-to-be-cool"

高效的解决方案

但如果您确实关心性能和内存，那么我建议：

defmodule CoolSlugHelper do
  def slug(input, length \\ 30) do
    length_minus_1 = length - 1

    case input do
      # if the substring ends with "-"
      # i. e. "abc-def-ghi", 8 or "abc-def-", 8 -> "abc-def"
      <<result::binary-size(length_minus_1), "-", _::binary>> -> result

      # if the next char after the substring is "-"
      # i. e. "abc-def-ghi", 7 or "abc-def-", 7 -> "abc-def"
      <<result::binary-size(length), "-", _::binary>> -> result

      # if it is the exact string. i. e. "abc-def", 7 -> "abc-def"
      <<_::binary-size(length)>> -> input

      # return an empty string if we reached the beginnig of the string
      _ when length <= 1 -> ""

      # otherwise look into shorter substring
      _ -> slug(input, length_minus_1)
    end
  end
end

它不会逐个字符地收集结果字符串。相反，它会从所需长度开始一直到 1 查找正确的子字符串。这就是它在内存和速度方面变得高效的方式。

我们需要这个length_minus_1变量，因为我们不能在binary-size二进制模式匹配。

以下是截至 2018 年 12 月 22 日所有提议解决方案的基准：

（简单的正则表达式是~r/\A(.{0,30})(?:-|\Z)/上面的正则表达式）

Name                     ips        average  deviation         median         99th %
CoolSlugHelper      352.14 K        2.84 μs  ±1184.93%           2 μs           8 μs
SlugHelper           70.98 K       14.09 μs   ±170.20%          10 μs          87 μs
Simple Regex         33.14 K       30.17 μs   ±942.90%          21 μs         126 μs
Truncation           11.56 K       86.51 μs    ±84.81%          62 μs         299 μs

Comparison: 
CoolSlugHelper      352.14 K
SlugHelper           70.98 K - 4.96x slower
Simple Regex         33.14 K - 10.63x slower
Truncation           11.56 K - 30.46x slower

Memory usage statistics:

Name              Memory usage
CoolSlugHelper         2.30 KB
SlugHelper            12.94 KB - 5.61x memory usage
Simple Regex          20.16 KB - 8.75x memory usage
Truncation            35.36 KB - 15.34x memory usage

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

elixir

如何在 Elixir 中截断字符串？的相关文章

Ecto 与某种情况的关联

假设我有两个模型 Post and Comment评论模型可以是两种类型中的一种 normal and fancy由列定义type in the comments table 现在我想在我的上添加 2 个关联Post模型其中一个指的是花哨
在 Erlang 中删除字符串的子字符串/字符串模式

我有一个 xml 字符串例如 S b a a b b 我想删除结束标签 b S2 b a a b 我怎样才能实现这个目标如果您只想删除特定的字符串文字 b 然后获取子列表就可以了 S b a a b b lists sublist S
查找 Elixir/Erlang 内存文件的长度？

在 Elixir 或 Erlang 中如果我有一个内存文件如何找到它的字节长度 ok fd file open ram read write file write fd hello 不确定是否有更好的方法但这就是我所做的 def ge
基于结构类型更改的分块列表

我有一个列表我想根据从结构类型 B 到 A 的转换来分块例如我有以下内容 iex 1 gt defmodule A do defstruct module A iex 2 gt defmodule B do defstruct mod
在 Elixir 中部署时更改后端/模块？

如何实现一个可替换的后端或基本上任何部分或模块以便可以在 Elixir 中的配置部署时进行替换我的具体情况是一个简单的网络应用程序在本例中使用 Phoenix 但我猜这个问题也适用于其他情况我有一个非常简单的后端使用Agent
Ecto迁移中如何动态更新字段值？

我有一个用户表例如 email username email protected cdn cgi l email protection email protected cdn cgi l email protection email pr
Ecto 构建多个关联

目前正在使用 Ecto Postgres 从事 Phoenix 项目创建评论时作为评论belongs to用户和文章有没有一种方法可以构建多个关联来生成一个变更集像这样的伪代码 comment changeset build ass
如何调试eex模板和@变量？

我有这个模板 div class alert alert danger p Oops something went wrong Please check the errors below p div 如何在 IEx 控制台中显示 chang
当您在地图上进行操作时，Elixir 中是否会保留键和值的顺序？

假设我在 Elixir 中有一张地图 m a gt 1 b gt 2 c gt 3 如果我打电话Map values m 我能保证返回值永远是 1 2 3 按这个顺序而不是说 3 1 2 这是我从文档中不清楚的一件事经过一些初步测试我认
Elixir GenServer 并行handle_call

Phoenix框架上有一个应用程序需要 GenServer 它将检查一些值这些值的验证从控制器开始来自客户端的请求 GenServer 值检查客户端接收响应一旦handle call是同步的那么当10个客户端同时调用10个han
可以用宏获取评论吗？

我试图解析一些代码并重新格式化它们但似乎引用只会忽略注释有什么办法可以实现这一点吗我想我必须深入 erlang 方面不您无法在宏内获取代码注释它们永远不会成为 AST 的一部分并且仍然被丢弃在 Elixir 的标记器中
Ecto 和 Elixir 的默认日期时间

我今天刚刚开始使用 Elixir 和 Phoenix 我正在尝试添加 Ecto 作为映射器但我在使用时间时遇到了一些问题这是我的模型 schema users do field name string field email strin
Dialyzer 无法识别使用多态类型的函数中的错误

背景我正在尝试使用透析器进行多态打字作为一个例子我正在使用著名的Option类型又名 Maybe Monad 现在在许多其他语言中都很流行 defmodule Test do type option t some t nothing
Ecto - 验证关联模型的存在

如何验证 Ecto 中是否存在关联模型 schema foo do has many bar Bar timestamps end required fields w bar invalid 有办法这样做吗并验证这些字段的最小最大数量
如何在 Elixir 或 Phoenix 框架中安排代码每隔几个小时运行一次？

假设我想每 4 小时发送一堆电子邮件或重新创建站点地图或其他任何内容我该如何在 Phoenix 或仅使用 Elixir 做到这一点有一个简单的替代方案不需要任何外部依赖项 defmodule MyApp Periodically do
使用 Ansible 将二进制文件添加到 PATH

我正在尝试安装Kiex https github com taylor kiex版本管理器Elixir http elixir lang org install html使用 Ansible 的编程语言这些是我为此使用的戏剧 name K
Elixir Ecto：模式中的多个belongs_to关系

我有以下架构 defmodule Message do use Ecto Schema schema messages do belongs to user FPL Club foreign key user to id belongs t
Elixir Jason 使用元组对结构进行编码

我有一个已经有的结构 derive Jason Encoder但该结构中的某些字段是元组因此无法对结构进行编码我该如何解决这个问题 UPDATE 我使用了下面提到的方法来实现协议关于这种方法需要注意的一件重要事情是它将改变整个项目的
Elixir：模式匹配对于元组和映射的工作方式不同

在 Elixir 中如果我尝试模式匹配以下两个元组 a 1 2 我收到匹配错误但如果我对两张地图做同样的事情 x a x 1 y 2 它工作正常并且a绑定到 1 我可以明白为什么匹配两个元组会出错但为什么匹配映射不会出错在第一个示
Elixir 中的斜线符号是什么意思？

在 Elixir 文档中他们继续使用带有斜杠的奇怪符号例如 is boolean 1 IO puts 1 String length 1 is function 2 2 我只是猜测但我认为它指的是数量但如果是这样的话为什么文档中没

随机推荐

colorForth /mod 算法如何工作？

我一直在看查克摩尔 https en wikipedia org wiki Charles H Moore s 彩色前 https en wikipedia org wiki ColorForth最近我发现了这段代码以传统语法呈现 m
在 mac 终端中加载库时出错

有谁请帮忙我该如何修复以下错误 dyld Library not loaded usr local lib libgdbm 4 dylib Referenced from usr local bin zsh Reason image no
AWS SNS 端点自行禁用

我已将 Android 和 iOS 应用程序设置为能够通过 SNS 接收通知设置工作正常设备确实收到了通知但后来通知开始失败我已经启用了成功和失败场景的日志记录根据日志我不断收到以下形式的错误端点已禁用 arn aws sn
php无法在docker-compose中连接到mysql

这是我的 docker compose version 2 services nginx image nginx 1 11 8 alpine ports 8081 80 volumes code usr share nginx html h
在 Serverless Framework 1.0 中使用路径参数

我想使用路径参数 customer customerId of a GET请求以使用 AWS Lambda 查询客户 functions createCustomer handler handler createCustomer event
如何在spring mvc框架中运行后台进程

我有一个网络应用程序使用 spring mvc 框架它使得以下内容用户将文件上传到服务器立即进入成功页面使用该文件运行后台进程那么我如何使用 spring mvc 框架来做到这一点呢先感谢您使用异步标记方法你在这里有例子
这个 SQL 查询有什么问题？

在过去的一个小时里我一直在尝试此查询的不同变体但我在用户名处收到错误并且用户名只是一个普通字符串其中的用户名是我从不包含特殊字符或任何内容的 xml 文件中获取的我正在使用 SLQ 紧凑型 3 5 P S 我尝试使用而不是 us
getElementsByClassName & IE8：对象不支持此属性或方法[重复]

这个问题在这里已经有答案了 I know getElementsByClassName 不支持IE8 你知道我可以用什么来代替吗我因错误而变得烦人对象不支持此属性或方法 HTML 代码是 function sumar var elems
如何保证对象只有一个线程

我有以下代码 class Service public void start creates thread which creates window and goes to message loop void stop sends WM C
我如何理解这个 C 类型声明？

double bar int double double double double 在查看讲座幻灯片时我发现了留给学生的练习用简单的英语来说什么是类型bar在这个 C 声明中 Please帮助我解决这个问题我什至不知道从哪里开始
使用 pandas 将字符串对象转换为 int/float

import pandas as pd path1 home supertramp Desktop 100 life 180 data csv mydf pd read csv path1 numcigar Never 0 1 5 Ciga
Android：canvas.drawBitmap() 方法无法正常工作

我已经发布了两个与此相关的问题请参考此自定义饼图 1 https stackoverflow com questions 28343600 customize pie chart in quarter shape at the botto
如何仅从 Firestore 获取最新更新的数据？

在 Firestore 上发现任何更改时始终获取整个文档如何只获取最近更新的数据这是我的数据我需要在第一次加载时在聊天中按对象顺序例如 2018 09 17 30 40 msg和sendby 并且如果数据更新则仅获取新的msg和se
何时使用 =default 使析构函数默认？

尽管对构造函数使用 default 对我来说很清楚即强制编译器在其他构造函数存在时创建默认构造函数但我仍然无法理解这两种类型的析构函数之间的区别那些使用 default 的那些没有显式定义并由编译器自动生成的我唯一想到的是 gro
Watir 更改 Mozilla Firefox 首选项

我正在使用 Watir 运行 Ruby 脚本来自动执行一些操作我正在尝试自动将一些文件保存到某个目录因此在我的 Mozilla 设置中我将默认下载目录设置为桌面并选择自动保存文件然而当我开始运行脚本时这些更改并未反映出来似乎
Vue Draggable - 如何仅替换所选项目以防止移动网格上的所有其他项目？

这是一个要测试的示例 https codesandbox io s j4vn761455 file src App vue 112 116 https codesandbox io s j4vn761455 file src App vue
FileStream 构造函数和默认缓冲区大小

我们有一个使用 NET 4 用 C 编写的日志记录类我想添加一个构造函数参数该参数可以选择设置文件选项 WriteThrough http msdn microsoft com en us library system io fileo
SVG 中三角形的圆角

我正在尝试制作一个具有圆角的三角形三角形将如下所示左下角是唯一看起来相当容易制作的角主要是因为这是一个 90 度的转弯该转弯是使用QSVG 中的命令具有以下参数 Q x y height x y height RADIUS从我正在
带有 backstack Resume 的嵌套片段

在我的应用程序中有几个fragments in an activity我正在维护一个backStack对于这些fragment 一切都很好但其中有一个嵌套的片段当我把它放入backStack然后再次按后退按钮恢复该片段看起来与先前的内
如何在 Elixir 中截断字符串？

我正在使用长生不老药的鼻涕虫想法是我有一个字符串 a zA Z0 9 用连字符分隔的单词喜欢 string another long string to be truncated and much text here 我想确保最大字符

如何在 Elixir 中截断字符串？

高效的解决方案

如何在 Elixir 中截断字符串？ 的相关文章

随机推荐

热门标签

如何在 Elixir 中截断字符串？的相关文章