“功能性”Rust 对性能有哪些影响？

2024-05-15

我正在关注 Rust 轨道运动.io https://exercism.io/。我有相当多的 C/C++ 经验。我喜欢 Rust 的“功能”元素，但我担心相对性能。

我解决了“行程编码”问题 https://exercism.io/tracks/rust/exercises/run-length-encoding/:

pub fn encode(source: &str) -> String {
    let mut retval = String::new();
    let firstchar = source.chars().next();
    let mut currentchar = match firstchar {
        Some(x) => x,
        None => return retval,
    };
    let mut currentcharcount: u32 = 0;
    for c in source.chars() {
        if c == currentchar {
            currentcharcount += 1;
        } else {
            if currentcharcount > 1 {
                retval.push_str(&currentcharcount.to_string());
            }
            retval.push(currentchar);
            currentchar = c;
            currentcharcount = 1;
        }
    }
    if currentcharcount > 1 {
        retval.push_str(&currentcharcount.to_string());
    }
    retval.push(currentchar);
    retval
}

我注意到评分最高的答案之一看起来更像是这样的：

extern crate itertools;

use itertools::Itertools;

pub fn encode(data: &str) -> String {
    data.chars()
        .group_by(|&c| c)
        .into_iter()
        .map(|(c, group)| match group.count() {
            1 => c.to_string(),
            n => format!("{}{}", n, c),
        })
        .collect()
}

我喜欢评价最高的解决方案；它简单、实用、优雅。这就是他们向我承诺 Rust 的全部内容。另一方面，我的则很恶心并且充满了可变变量。你可以看出我已经习惯了 C++。

我的问题是函数式风格对性能有显着的影响。我使用相同的 4MB 随机数据编码 1000 次来测试这两个版本。我的命令式解决方案只用了不到 10 秒；功能解决方案大约需要 2 分 30 秒。

为什么函数式风格比命令式风格慢这么多？
功能实现是否存在导致如此巨大的减速的问题？
如果我想编写高性能代码，我应该吗？ever使用这种功能风格？

TL;DR

功能实现can在某些情况下，比原来的程序实现更快。

为什么函数式风格比命令式风格慢这么多？功能实现是否存在导致如此巨大的减速的问题？

As Matthieu M. 已经指出 https://stackoverflow.com/a/55675389/155423，需要注意的重要一点是算法很重要。该算法的表达方式（过程式、命令式、面向对象、函数式、声明式）通常并不重要。

我发现功能代码有两个主要问题：

一遍又一遍地分配大量字符串的效率很低。在最初的功能实现中，这是通过以下方式完成的to_string and format!.
有使用的开销group_by，它的存在是为了给出一个嵌套的iterator，您不需要只是为了获得计数。

Using more迭代器工具（batching https://docs.rs/itertools/0.8.0/itertools/trait.Itertools.html#method.batching, take_while_ref https://docs.rs/itertools/0.8.0/itertools/trait.Itertools.html#method.take_while_ref, format_with https://docs.rs/itertools/0.8.0/itertools/trait.Itertools.html#method.format_with) 使两个实现更加接近：

pub fn encode_slim(data: &str) -> String {
    data.chars()
        .batching(|it| {
            it.next()
                .map(|v| (v, it.take_while_ref(|&v2| v2 == v).count() + 1))
        })
        .format_with("", |(c, count), f| match count {
            1 => f(&c),
            n => f(&format_args!("{}{}", n, c)),
        })
        .to_string()
}

4MiB 随机字母数字数据的基准，编译为RUSTFLAGS='-C target-cpu=native':

encode (procedural)     time:   [21.082 ms 21.620 ms 22.211 ms]

encode (fast)           time:   [26.457 ms 27.104 ms 27.882 ms]
Found 7 outliers among 100 measurements (7.00%)
  4 (4.00%) high mild
  3 (3.00%) high severe

如果您有兴趣创建自己的迭代器，您可以将过程代码与更多功能代码混合搭配：

struct RunLength<I> {
    iter: I,
    saved: Option<char>,
}

impl<I> RunLength<I>
where
    I: Iterator<Item = char>,
{
    fn new(mut iter: I) -> Self {
        let saved = iter.next(); // See footnote 1
        Self { iter, saved }
    }
}

impl<I> Iterator for RunLength<I>
where
    I: Iterator<Item = char>,
{
    type Item = (char, usize);

    fn next(&mut self) -> Option<Self::Item> {
        let c = self.saved.take().or_else(|| self.iter.next())?;

        let mut count = 1;
        while let Some(n) = self.iter.next() {
            if n == c {
                count += 1
            } else {
                self.saved = Some(n);
                break;
            }
        }

        Some((c, count))
    }
}

pub fn encode_tiny(data: &str) -> String {
    use std::fmt::Write;

    RunLength::new(data.chars()).fold(String::new(), |mut s, (c, count)| {
        match count {
            1 => s.push(c),
            n => write!(&mut s, "{}{}", n, c).unwrap(),
        }
        s
    })
}

1- 谢谢Stargateur 指出 https://chat.stackoverflow.com/transcript/message/45932591#45932591急切地获取第一个值有助于分支预测。

4MiB 随机字母数字数据的基准，编译为RUSTFLAGS='-C target-cpu=native':

encode (procedural)     time:   [19.888 ms 20.301 ms 20.794 ms]
Found 4 outliers among 100 measurements (4.00%)
  3 (3.00%) high mild
  1 (1.00%) high severe

encode (tiny)           time:   [19.150 ms 19.262 ms 19.399 ms]
Found 11 outliers among 100 measurements (11.00%)
  5 (5.00%) high mild
  6 (6.00%) high severe

我相信这更清楚地表明了主要基本的两种实现之间的区别：基于迭代器的解决方案是可恢复的。每次我们打电话next，我们需要查看是否有我们读过的前一个字符（self.saved）。这会向程序代码中不存在的代码添加一个分支。

另一方面，基于迭代器的解决方案更加灵活——我们现在可以对数据进行各种转换，或者直接写入文件而不是写入文件String等等。自定义迭代器可以扩展为对泛型类型进行操作，而不是char以及，使其very灵活的。

也可以看看：

如何向迭代器添加新方法？ https://stackoverflow.com/q/30540766/155423

如果我想编写高性能代码，我应该使用这种函数式风格吗？

我会的，直到基准测试表明这是瓶颈。然后评估why这是瓶颈。

支持代码

总是要展示你的作品，对吧？

基准测试.rs

use criterion::{criterion_group, criterion_main, Criterion}; // 0.2.11
use rle::*;

fn criterion_benchmark(c: &mut Criterion) {
    let data = rand_data(4 * 1024 * 1024);

    c.bench_function("encode (procedural)", {
        let data = data.clone();
        move |b| b.iter(|| encode_proc(&data))
    });

    c.bench_function("encode (functional)", {
        let data = data.clone();
        move |b| b.iter(|| encode_iter(&data))
    });

    c.bench_function("encode (fast)", {
        let data = data.clone();
        move |b| b.iter(|| encode_slim(&data))
    });

    c.bench_function("encode (tiny)", {
        let data = data.clone();
        move |b| b.iter(|| encode_tiny(&data))
    });
}

criterion_group!(benches, criterion_benchmark);
criterion_main!(benches);

lib.rs

use itertools::Itertools; // 0.8.0
use rand; // 0.6.5

pub fn rand_data(len: usize) -> String {
    use rand::distributions::{Alphanumeric, Distribution};
    let mut rng = rand::thread_rng();
    Alphanumeric.sample_iter(&mut rng).take(len).collect()
}

pub fn encode_proc(source: &str) -> String {
    let mut retval = String::new();
    let firstchar = source.chars().next();
    let mut currentchar = match firstchar {
        Some(x) => x,
        None => return retval,
    };
    let mut currentcharcount: u32 = 0;
    for c in source.chars() {
        if c == currentchar {
            currentcharcount += 1;
        } else {
            if currentcharcount > 1 {
                retval.push_str(&currentcharcount.to_string());
            }
            retval.push(currentchar);
            currentchar = c;
            currentcharcount = 1;
        }
    }
    if currentcharcount > 1 {
        retval.push_str(&currentcharcount.to_string());
    }
    retval.push(currentchar);
    retval
}

pub fn encode_iter(data: &str) -> String {
    data.chars()
        .group_by(|&c| c)
        .into_iter()
        .map(|(c, group)| match group.count() {
            1 => c.to_string(),
            n => format!("{}{}", n, c),
        })
        .collect()
}

pub fn encode_slim(data: &str) -> String {
    data.chars()
        .batching(|it| {
            it.next()
                .map(|v| (v, it.take_while_ref(|&v2| v2 == v).count() + 1))
        })
        .format_with("", |(c, count), f| match count {
            1 => f(&c),
            n => f(&format_args!("{}{}", n, c)),
        })
        .to_string()
}

struct RunLength<I> {
    iter: I,
    saved: Option<char>,
}

impl<I> RunLength<I>
where
    I: Iterator<Item = char>,
{
    fn new(mut iter: I) -> Self {
        let saved = iter.next();
        Self { iter, saved }
    }
}

impl<I> Iterator for RunLength<I>
where
    I: Iterator<Item = char>,
{
    type Item = (char, usize);

    fn next(&mut self) -> Option<Self::Item> {
        let c = self.saved.take().or_else(|| self.iter.next())?;

        let mut count = 1;
        while let Some(n) = self.iter.next() {
            if n == c {
                count += 1
            } else {
                self.saved = Some(n);
                break;
            }
        }

        Some((c, count))
    }
}

pub fn encode_tiny(data: &str) -> String {
    use std::fmt::Write;

    RunLength::new(data.chars()).fold(String::new(), |mut s, (c, count)| {
        match count {
            1 => s.push(c),
            n => write!(&mut s, "{}{}", n, c).unwrap(),
        }
        s
    })
}

#[cfg(test)]
mod test {
    use super::*;

    #[test]
    fn all_the_same() {
        let data = rand_data(1024);

        let a = encode_proc(&data);
        let b = encode_iter(&data);
        let c = encode_slim(&data);
        let d = encode_tiny(&data);

        assert_eq!(a, b);
        assert_eq!(a, c);
        assert_eq!(a, d);
    }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

“功能性”Rust 对性能有哪些影响？的相关文章

Rust ABI 对枚举紧凑性做出了哪些保证？

据我所知 Rust ABI 并不稳定然而 Rust 编译器目前执行一些优化将字段压缩为标签 use std mem size of enum Node N1 1 is good bool stuff u32 N1 2 is good b
将 char 解析为 u32

正如问题所述我如何实现这一目标如果我有这样的代码 let a 29 for c in a chars println c as u32 我得到的是 2 和 9 的 unicode 代码点 50 57 我想要的是将这些字符解析为实际的数字
解析 Rust FFI 中的联合结构

我在解析 c union 结构 XEvent 时遇到问题我正在 Rust 中试验 Xlib 和 X Record Extension 我生成 ffi 绑定Rust 绑定根 https github com crabtw rust bind
为什么在闭包参数中使用“&&”？

我有两个问题这个例子 https doc rust lang org std iter trait Iterator html method find let a 1 2 3 assert eq a iter find x x 2 Some
如何让 Visual Studio Code 重置 Rust 的 IntelliSense 引擎？

我正在开发两个项目一个是一个库另一个是使用该库的程序当我对库进行更改时其他窗口程序看不到这些更改因此我没有获得更新的 IntelliSense 关闭使用该库的程序并重新打开它确实会强制更新但我真的不想走那么远直接回答标题
在编译时检查指针大小

我发现类似的问题编译时泛型类型大小检查 https stackoverflow com questions 30330519 compile time generic type size check 但没有收到任何答复问题是通过FFI u
由于递归结构中存在冲突的要求，无法推断适当的生命周期

当我尝试编译这段代码时 pub struct Context lt a gt pub outer Option lt a mut Context lt a gt gt impl lt a gt Context lt a gt pub fn
在没有 std 的情况下将 *mut u8 转换为 &[u8]

我正在为 WebAssembly 编写 Rust 代码来处理来自 JavaScript 的字符串由于 WebAssembly 没有真正的字符串类型因此我尝试传递一个指向 WebAssembly 内存对象的指针该对象指向 UTF 8 编
有条件地迭代几个可能的迭代器之一

我正在尝试根据Option输入到函数这个想法是根据是否给定的进行迭代Option存在这是一个最小的如果愚蠢的话示例 use std iter fn main let x Option
如何将函数转换为点自由形式？

假设我有一个 JavaScript 函数 function f x return a b x c x 我如何将其转换为无点函数通过组合函数还有关于这方面的更多信息的资源吗一般来说当您将函数转变为无点风格时没有简单的规则可遵循要么
为什么 String 不实现 From<&String>？

背景我知道 Rust 人们更喜欢 str而不是 String 但在某些情况下我们只得到 String 一个例子是当你打电话时std iter Iterator peekable 返回值是一个Peekable i 将原始迭代器包装到其中并为
如何使用 time::PrimitiveDateTime 类型将当前时间分配给新变量？

我在用着time PrimitiveDateTime我想用当前时间创建一个新的变量但我找不到如何做是不是有类似的东西now 关于什么Instant now Example pub struct Player updated at Opt
有条件地从 flat_map 返回空迭代器

鉴于这个定义foo let foo vec vec 1 2 3 vec 4 5 6 vec 7 8 9 我希望能够编写这样的代码 let result Vec lt gt foo iter enumerate flat map i row
如何对另一个数字进行模运算而不溢出？

我正在尝试为 Rust 实现快速素性测试u32 and u64数据类型作为其中的一部分我需要计算 n n d where n and d are u32 or u64 分别虽然结果可以很容易地适合数据类型但我不知道如何计算它据我所
为什么我要使用发散函数？

读 Rust 书时我发现一个有趣的话题发散函数 https doc rust lang org stable book first edition functions html diverging functions Rust 有一些特
如何关闭某个代码区域而不是单个项目的 rustfmt？

rustfmt skip 允许您在格式化时跳过代码块 https github com rust lang rustfmt issues 1322 但这需要把skip在各个而不是 Clang 风格on off 考虑这段代码 fn add
如何在 Rust 中从文字创建格式化字符串？

我将根据给定的参数返回一个字符串 fn hello world name Option
如何在不进行尾调用优化的情况下用函数式编程替代方案替换 while 循环？

我正在 JavaScript 中尝试一种更实用的风格因此我用诸如map和reduce之类的实用函数替换了for循环然而我还没有找到 while 循环的功能替代品因为尾部调用优化通常不适用于 JavaScript 据我了解 ES6
返回数组大小的关联常量[重复]

这个问题在这里已经有答案了考虑以下trait pub trait Representable const SIZE usize fn get self gt u8 SIZE fn set mut self value u8 SIZE 我想
为什么我不能使用 PineMap 来存储引用 cons 列表？即使在主程序结束后也出现“仍然借用”错误[重复]

这个问题在这里已经有答案了为什么这段代码 derive Eq PartialEq Ord PartialOrd enum List lt a gt Cons isize a List lt a gt Nil fn main use Lis

随机推荐

没有脚手架的 DefaultTabController？

我正在尝试使用DefaultTabController在一些小部件的中间所以我的TabBar不能在AppBar并且必须关闭一些小部件所以我的问题是当我使用时TabBarView它崩溃了这是一个 Flutter 示例的示例但没有找到如
Xcode 4 调试器代码完成

首先很高兴他们尝试在 Xcode 4 中的 gdb 命令提示符上完成代码但在当前状态下它使得使用命令提示符来调查目标 c 对象几乎不可能当我打字时它自动将单词补全为我不想要的内容并且如果不手动选择文本并将其删除然后重新开始则
Monodroid 示例/带有源代码的小部件

我是一名 NET 开发人员我对用 C 开发 Android 应用程序感兴趣并且我得到了 monodroid 是否有任何来源可以让我获得 monodroid 示例应用程序带有源代码这将帮助我在 monodroid 中开发应用程序或者
有没有办法在 Next.js 的 getStaticProps 中使用 redux 工具包？

我使用时获取数据useEffect代替getStaticProps 但在getStaticProps它表明钩子只能在功能组件中使用 import Head from next head import Image from next imag
使用 jQuery 将光标位置处的文本插入到 CKEditor

我正在尝试使用 jQuery 将一段文本添加到现有的 CKEditor 单击链接时需要完成此操作我尝试了这个解决方案它适用于常规文本区域但不适用于 CKEditor jQuery fn extend insertAtCaret fun
如何向 Android Studio 中的现有项目添加新活动？

在 Eclipse 中您只需单击新建按钮并选择 Android 活动即可添加新活动但 Android Studio 有点不同我无法找到如何向项目添加新活动要添加一个Activity使用 Android Studio 此步骤与添加
“此应用程序已请求运行时以异常方式终止它”的原因是什么？

Visual C 运行时抛出一个常见错误此应用程序已请求运行时以异常方式终止它请联系应用程序的支持团队以获取更多信息该错误消息实际上是什么意思mean 让我用一个比喻来准确地解释我的问题如果我看到一条消息异常访问冲突 0xc00
C++0x 可变参数模板按引用传递

我想为我的应用程序使用可变参数模板功能但我不希望对象按值传递因为在我的情况下对象非常复杂我想通过引用传递它们而不是作为指针 void func template
在 MATLAB 中模拟 C++ 模板

我试图找出创建 C 模板或 Java 通用对象的替代方案的最佳方法出于多种不同的原因我过去曾多次想这样做但现在我想做的是为几个相关的类创建 saveobj 和 loadobj 函数我的想法是我想要一组通用的例程来创建默认结构然后
谷歌电子表格中的“MMMM yy”日期

我有一个谷歌电子表格其中我想要一个仅包含月份和年份名称的日期例如September 2011 而且我还希望月份和年份能够轻松更改有没有办法获得自定义日期格式来做到这一点我发现我可以这样做 TEXT 40295 MMMM yy 但是日
确定比特币钱包地址是否“有效”

我知道可以使用正则表达式验证比特币钱包地址 13 a km zA HJ NP Z0 9 26 33 但这并不是 100 准确并且允许将无效地址检测为有效地址是否有公开的 C 算法可以验证比特币钱包地址我一直在谷歌搜索但找不到任何东西
Cordova + android：无法从应用程序打开拨号盘或邮件意图

我有一个奇怪的问题我无法从应用程序中打开带有预定义号码或邮件意图的拨号盘我正在使用 netbeans 8 0 1 创建 cordova 应用程序我的 Cordova 版本是 4 0 0 我按照步骤创建了一个应用程序并选择了 Hell
java inputstream 打印控制台内容

sock new Socket www google com 80 out new BufferedOutputStream sock getOutputStream in new BufferedInputStream sock getI
RecyclerView 在聊天屏幕中的 notificationDataSetChanged 上滚动到顶部

我正在尝试使用 recyclerView 创建消息传递类型的屏幕该屏幕将从底部开始并在用户到达聊天顶端时加载更多数据但我面临着这个奇怪的问题我的 recyclerView 在调用 notificationDataSetChanged
1分30秒倒计时器javascript

我有代码但它适用于 2 分钟计时器我需要将其修改为 1 分 30 秒计时器我已经尝试过但未能从 1 30 开始计时器因为我是这一行的初学者并且想学习如何做到这一点这是代码 div div
FastAPI - 在 swagger 中添加路径参数的描述

想象一下有一个这样的应用程序 from fastapi import FastAPI app FastAPI app get items item id async def read item item id int return item
ASP.NET Core 授权权限访问文件夹与Identity Server

在我的 ASP NET Core 项目中我与 Identity Server 集成因此用户必须登录 Identity Server 然后才能访问该应用程序设计部门给了我一些 HTML5 静态页面来发布但只有经过身份验证的人或具有特
如何在 VSCode 中创建自定义对话框？

我正在开发 VSCode 的扩展我想显示一个自定义对话框来帮助用户配置 ini 文件是否可以创建带有标签和输入的自定义对话框您无法创建新的 UI 元素但如果您想从用户那里获取输入您可以使用如下代码 let options Inpu
Relay/ICommand 与 DelegateCommand——差异

据我所知下面的代码可以从 Relay ICommand 命令更改为 Delegate 命令并且仍然以相同的方式绑定命令如果我错了它们的区别和用途是什么 private DelegateCommand something public
“功能性”Rust 对性能有哪些影响？

我正在关注 Rust 轨道运动 io https exercism io 我有相当多的 C C 经验我喜欢 Rust 的功能元素但我担心相对性能我解决了行程编码问题 https exercism io tracks rust

“功能性”Rust 对性能有哪些影响？

支持代码

“功能性”Rust 对性能有哪些影响？ 的相关文章

随机推荐

热门标签

“功能性”Rust 对性能有哪些影响？的相关文章