Rust 编程竞赛中最快的惯用 I/O 例程？

2024-05-18

我的问题已部分得到解答，因此我根据从评论和其他实验中学到的知识对其进行了修改。

总之，我想要一个用于编程竞赛的快速 I/O 例程，其中使用单个文件解决问题，无需外部包。它应该从一个以空格分隔的标记序列中读取BufRead（标准输入或文件）。标记可以是整数、浮点数或 ASCII 单词，用空格和换行符分隔，所以看来我应该支持FromStr一般类型。一小部分问题是交互式的，这意味着最初并非所有输入都可用，但它总是完整的行。

对于上下文，这里是导致我在这里发帖的讨论 https://codeforces.com/blog/entry/67391?#comment-515711。有人编写了非常快速的自定义代码来直接从&[u8]的输出BufRead::fill_buf()，但它不是通用的FromStr.

这是我的迄今为止最好的解决方案 https://codeforces.com/contest/1151/submission/55185471（强调Scanner结构）：

use std::io::{self, prelude::*};

fn solve<B: BufRead, W: Write>(mut scan: Scanner<B>, mut w: W) {
    let n = scan.token();
    let mut a = Vec::with_capacity(n);
    let mut b = Vec::with_capacity(n);
    for _ in 0..n {
        a.push(scan.token::<i64>());
        b.push(scan.token::<i64>());
    }
    let mut order: Vec<_> = (0..n).collect();
    order.sort_by_key(|&i| b[i] - a[i]);
    let ans: i64 = order
        .into_iter()
        .enumerate()
        .map(|(i, x)| a[x] * i as i64 + b[x] * (n - 1 - i) as i64)
        .sum();
    writeln!(w, "{}", ans);
}

fn main() {
    let stdin = io::stdin();
    let stdout = io::stdout();
    let reader = Scanner::new(stdin.lock());
    let writer = io::BufWriter::new(stdout.lock());
    solve(reader, writer);
}

pub struct Scanner<B> {
    reader: B,
    buf_str: String,
    buf_iter: std::str::SplitWhitespace<'static>,
}
impl<B: BufRead> Scanner<B> {
    pub fn new(reader: B) -> Self {
        Self {
            reader,
            buf_str: String::new(),
            buf_iter: "".split_whitespace(),
        }
    }
    pub fn token<T: std::str::FromStr>(&mut self) -> T {
        loop {
            if let Some(token) = self.buf_iter.next() {
                return token.parse().ok().expect("Failed parse");
            }
            self.buf_str.clear();
            self.reader
                .read_line(&mut self.buf_str)
                .expect("Failed read");
            self.buf_iter = unsafe { std::mem::transmute(self.buf_str.split_whitespace()) };
        }
    }
}

通过避免不必要的分配，这Scanner是相当快的。如果我们不关心不安全性，则可以通过以下方式加快速度，而不是这样做read_line() into a String, doing read_until(b'\n') into a Vec<u8>，其次是str::from_utf8_unchecked().

不过我也想知道最快的是什么safe解决方案。有没有一种聪明的方法来告诉 Rust 我的Scanner实施确实是安全的，消除了mem::transmute？直觉上，我们似乎应该想到SplitWhitespace对象为owning缓冲区直到它返回后被有效删除None.

在其他条件相同的情况下，我想要一个“不错的”惯用标准库解决方案，因为我试图向其他参加编程竞赛的人展示 Rust。

我很高兴你问这个问题，因为我在 LibCodeJam rust 实现中解决了这个问题。具体来说，从 a 中读取原始令牌BufRead是由处理TokensReader type https://github.com/Lucretiel/LibCodeJam/blob/fcd6201e693082d3db334ad53116d2cc00ae1a17/rust/src/tokens.rs#L185-L227以及一些相关的小帮手。

这是相关摘录。这里的基本思想是扫描BufRead::fill_buf缓冲区的空白，并将非空白字符复制到本地缓冲区，该缓冲区在令牌调用之间重用。一旦找到空白字符，或者流结束，本地缓冲区将被解释为 UTF-8 并作为&str.

#[derive(Debug)]
pub enum LoadError {
    Io(io::Error),
    Utf8Error(Utf8Error),
    OutOfTokens,
}

/// TokenBuffer is a resuable buffer into which tokens are
/// read into, one-by-one. It is cleared but not deallocated
/// between each token.
#[derive(Debug)]
struct TokenBuffer(Vec<u8>);

impl TokenBuffer {
    /// Clear the buffer and start reading a new token
    fn lock(&mut self) -> TokenBufferLock {
        self.0.clear();
        TokenBufferLock(&mut self.0)
    }
}

/// TokenBufferLock is a helper type that helps manage the lifecycle
/// of reading a new token, then interpreting it as UTF-8.
#[derive(Debug, Default)]
struct TokenBufferLock<'a>(&'a mut Vec<u8>);

impl<'a> TokenBufferLock<'a> {
    /// Add some bytes to a token
    fn extend(&mut self, chunk: &[u8]) {
        self.0.extend(chunk)
    }

    /// Complete the token and attempt to interpret it as UTF-8
    fn complete(self) -> Result<&'a str, LoadError> {
        from_utf8(self.0).map_err(LoadError::Utf8Error)
    }
}

pub struct TokensReader<R: io::BufRead> {
    reader: R,
    token: TokenBuffer,
}

impl<R: io::BufRead> Tokens for TokensReader<R> {
    fn next_raw(&mut self) -> Result<&str, LoadError> {
        use std::io::ErrorKind::Interrupted;

        // Clear leading whitespace
        loop {
            match self.reader.fill_buf() {
                Err(ref err) if err.kind() == Interrupted => continue,
                Err(err) => return Err(LoadError::Io(err)),
                Ok([]) => return Err(LoadError::OutOfTokens),
                // Got some content; scan for the next non-whitespace character
                Ok(buf) => match buf.iter().position(|byte| !byte.is_ascii_whitespace()) {
                    Some(i) => {
                        self.reader.consume(i);
                        break;
                    }
                    None => self.reader.consume(buf.len()),
                },
            };
        }

        // If we reach this point, there is definitely a non-empty token ready to be read.
        let mut token_buf = self.token.lock();

        loop {
            match self.reader.fill_buf() {
                Err(ref err) if err.kind() == Interrupted => continue,
                Err(err) => return Err(LoadError::Io(err)),
                Ok([]) => return token_buf.complete(),
                // Got some content; scan for the next whitespace character
                Ok(buf) => match buf.iter().position(u8::is_ascii_whitespace) {
                    Some(i) => {
                        token_buf.extend(&buf[..i]);
                        self.reader.consume(i + 1);
                        return token_buf.complete();
                    }
                    None => {
                        token_buf.extend(buf);
                        self.reader.consume(buf.len());
                    }
                },
            }
        }
    }
}

本次实施doesn't处理将字符串解析为FromStr类型（单独处理），但它确实正确处理累积字节，将它们分隔成空格分隔的标记，并将这些标记解释为 UTF-8。它确实假设仅使用 ASCII 空格来分隔令牌。

值得注意的是FromStr不能直接用于fill_buf缓冲区，因为不能保证令牌不会跨越两个之间的边界fill_buf调用，并且没有办法强制BufRead读取更多字节，直到现有缓冲区被完全消耗。我假设很明显，一旦你有了Ok(&str)，你可以执行FromStr闲暇时就可以使用它。

此实现不是 0 复制，而是（摊销）0 分配，并且它最大限度地减少了不必要的复制或缓冲。它使用单个持久缓冲区，仅当它对于单个令牌来说太小时才调整大小，并且它在令牌之间重用该缓冲区。字节直接从输入复制到该缓冲区中BufRead缓冲区，无需额外的中间复制。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Rust 编程竞赛中最快的惯用 I/O 例程？的相关文章

将 XML 从网站解析到 Android 设备

我正在启动一个 Android 应用程序它将解析来自网络的 XML 我创建了一些 Android 应用程序但它们从未涉及解析 XML 我想知道是否有人对最佳方法有任何建议这是一个例子 try URL url new URL your
将整数转换为特定格式的十六进制字符串

我是 python 新手有以下问题我需要将整数转换为 6 个字节的十六进制字符串例如 281473900746245 gt xFF xFF xBF xDE x16 x05 十六进制字符串的格式很重要 int 值的长度是可变的格式 0
有没有一种方法可以设计一个特征，允许任何类型实现它，即使实现者既不拥有该类型也不拥有该特征？

一般情况下假设 C1 C2 C3 不同则不可能在包 C1 中实现包 C3 中定义的类型的 C2 中定义的特征但是有没有什么技巧可以故意设计一个特征以便允许这样的实现呢自 Rust 1 41 以来 Rust 的孤儿规则似乎更加宽松
如何初始化一个大多数值相同但某些值不同的静态数组？

我想使用静态或常量数组但使用除 T N 句法我需要定义特定元素但所有其他值都可以默认为 0 或其他值在 C 中您可以执行以下操作 byte ARRAY 256 0x1F 1 lt lt 4 Or even simply just
捕获按键以过滤元素

我正在创建一个
将字节数组编码解码为字符串而不丢失数据

我尝试将 byte 转换为字符串如下所示 Map
使用 JSON 解析问题警告

我正在尝试从网站读取 JSON 数据我在 Windows 10 上使用 Dev C 和 mingw 编译器这是我尝试在静态项目中运行的教程中的 JSON 解析器 define CURL STATICLIB include
PHP中特殊字符的转换

我已经尝试了很多功能但我根本无法弄清楚这一点无论如何正确的方法在称为描述的表单字段中我可以期待各种字符在将它们提交到数据库之前需要将它们格式化为 HTML 实体现在我的代码 formdesc htmlentities PO
对结构方法中的借用错误感到困惑

我正在尝试为游戏中的实体系统编写一些代码但出现此错误因此我将代码浓缩为执行相同操作的代码在实际代码中出现相同的错误我不明白为什么编译器告诉我对self my list当函数超出范围时baz完成我的 Rust 版本是rustc 1
正则表达式提取美国邮政编码，但不提取假代码

使用 XML 包和 XPath 从网站上抓取地址有时我只能得到一个嵌入了我想要的邮政编码的字符串提取邮政编码很简单但有时会显示其他五位数字的字符串以下是 df 中问题的一些变体 zips lt data frame id seq 1
Notepad++:: 通过正则表达式完全删除包含问号的行

嗯我想这就是我的标题这对于我将要实现的目标来说是不言自明的这是我当前的文本文件的示例 Diva was the winning song of the Eurovision Song Contest 1998 Who will win
有没有好的方法来解析用户代理字符串？

我有一个Java接收模块User Agent来自最终用户浏览器的字符串的行为需要略有不同具体取决于浏览器类型浏览器版本甚至操作系统例如 FireFox 7 0 Win7 Safari 3 2 iOS9 我明白了User Agent由于
在python中将文本文件解析为列表

我对 Python 完全陌生我正在尝试读取包含单词和数字组合的 txt 文件我可以很好地读取 txt 文件但我正在努力将字符串转换为我可以使用的格式 import matplotlib pyplot as plt import num
C++11 内部 std::string 表示形式 (libstdc++)

std string 在 c 11 libstdc 中如何内部表示在深入研究实现时我发现 A string looks like this Rep M length basic string
将代码保存在 L1 缓存中

我一直在阅读维基百科关于 K 编程语言的文章 http en wikipedia org wiki K programming language Performance characteristics这就是我所看到的解释器的小尺寸和语言的
从java中的字符串数组中删除空值

java中如何从字符串数组中删除空值 String firstArray test1 test2 test4 我需要像这样没有 null 空值的 firstArray String firstArray test1 test2 test4
如何指定 AsRef 的生命周期？

我正在尝试编写一个函数来连接两个可迭代对象其项目可以转换为OsStr引用并且在尝试指定引用的生命周期时遇到了巨大的困难 use std convert AsRef use std ffi OsStr use std marker Pha
JavaScript 中的小数点分隔符是什么？

当我正在编写一段处理一些浮点值的 JavaScript 代码时我突然想到了一个想法 JavaScript 中的小数点符号是什么是不是总是或者它是特定于文化的那么呢 toFixed and parseFloat 如果我正在处理用户输入
获取单个方程的脚本

在文本文件中输入 a 2 8 b 3 9 c 4 8 d 5 9 e a b f c d g 0 6 h 1 7 i e g j f h output i j 期望的输出输出 2 8 3 9 0 6 4 8 5 9 1 7 如果输入文件名
使用 VB.NET 覆盖文本文件中的特定行

我需要执行以下操作更改文本文件中的行 Path c this certain path 用这条线 Path c that other newer path 这些路径的长度肯定会不同因此我需要替换引号中的内容或者完全擦除该行并输入一个新

随机推荐

Data.Sequence 中的 inits 和 tails 如何工作？

Louis Wasserman 编写了当前的实现inits and tails in Data Sequence 他表示它们非常高效事实上只要查看代码我就可以看到无论它们在做什么它们都是以干净自上而下的方式进行的这往往会给惰性
GIT：以下未跟踪的工作树文件将被签出覆盖

我有两个分支一个称为 master 另一个称为 dev 我目前位于 master 分支我想转到 dev 分支将文件移动到开发服务器但是当我执行 git checkout dev 我收到消息以下未跟踪的工作树文件将被覆盖查看 pag
如何恢复消耗品应用内购买？

我正在开发一款 iOS 游戏用户可以通过应用内消耗品购买一定数量的内部货币比如 1000 金币如果用户想将余额从一台设备转移到另一台设备如何恢复消耗品购买在苹果的文档中它说我们必须使用我们自己的服务器但是如何获取用户的Appl
无法创建任何应用程序请求

我想用 facebook app graph 发送请求有时成功有时失败并返回值 error message 2 Failed to create any app request type OAuthException code 2 请帮
进入前台后刷新数据

更改默认设置后我想在AppDelegate中进入前台时刷新myViewController的数据我所做的是 AppDelegate m void applicationDidFinishLaunching UIApplication a
模板化 ostream 重载歧义错误：basic_ostream 与 const char[]

我正在尝试理解 ostream 重载考虑一下这个 include
如何让Gmail像加载进度条一样

我想在页面的中心和顶部创建一个像 Gmail 一样的加载进度条并适用于所有浏览器这是基本代码
URL.setURLStreamHandlerFactory

我正在使用带有嵌入式 Jetty 的可执行 jar 开发一个 Web 应用程序我的jar包含一个依赖jar jar in jar 我参考了JarRsrcLoader and RsrcURLStreamHandlerFactory由 Ecl
AWS lambda 是否保证将函数更新到新版本时不会出现停机？

默认情况下 AWS 使用LATEST更新了最新 lambda 版本的别名我假设执行以下步骤 Now LATEST别名点版本 5 用户部署新版本的 lambda 在部署新版本时 LATEST别名仍然指向版本 5 部署完成后 Lambda 只
CSS 无法从带有 php“includes”的相对路径工作

文件夹结构 index php includes header html css style css 我的主项目文件夹中有 2 个子文件夹一个是名为 includes 的文件夹另一个名为 css 我有我的 index php主文件夹中的
有没有办法替换 Google Docs API 中文本的 URL 链接？

我开始用 Python 探索 Google Docs API 它几乎可以完成我想要它做的所有事情除了一件事我可以替换文档的文本但无法更改超链接的值意思是如果链接看起来像这样 a link http www example com 我
Ajax - 限制列表的加载，然后在滚动上加载其余部分

我有一家商店在一个页面上显示某个类别的所有产品这是店主喜欢的方式因此不能选择分页为了缩短某些重类别的加载时间我希望实现一个可以加载许多产品的脚本 li s然后在页面滚动上加载另一组页面就是用这个结构生成的 div ul clas
以编程方式触发iOS摇动事件

如何以编程方式触发 iOS 中的摇动事件我尝试过以下方法但它总是崩溃 void shake NSLog TEST UIMotionEventProxy m NSClassFromString UIMotionEvent alloc in
Android中如何检测WIFI连接何时建立？

我需要检测何时通过 WIFI 建立网络连接发送什么广播来确定已建立有效的网络连接我需要验证是否存在有效的 HTTP 网络连接我应该监听什么以及需要进行哪些额外测试才能知道是否存在有效连接您可以注册一个BroadcastReceive
错误：更改核心数据模型后架构armv7的重复符号

我有一个使用核心数据框架的应用程序我工作得很好我刚刚更改了数据模型向一个实体添加一个属性当我尝试构建它时出现错误 duplicate symbol OBJC METACLASS AccountFolder in Users XXX
如何扩展字符串文字类型？

Given export type Foo foo bar 如何扩展类型Foo 在另一个模块中也允许 x y 尽可能的价值如果我在其他地方写 export type Foo x y Typescript 抱怨重复的标识符Foo 您无法覆
Entity Framework 6（代码优先）实体版本控制和审计

我正在考虑将 Entity Framework 6 1 1 与 SQL Server 2008 R2 一起使用目前我正在使用代码优先的 EF 功能创建模型和数据库我的基本用例是创建一个特定实体的所有更改的日志 ID是关键栏以帮助审核
解决 Java Checkstyle 错误：名称 'logger' 必须匹配模式 '^[A-Z][A-Z0-9]*(_[A-Z0-9]+)*$'

使用 Eclipse Checkstyle 插件我看到以下错误名称 logger 必须匹配模式 A Z A Z0 9 A Z0 9 我通过更改解决了此错误 private static final Logger logger Logger
是否可以获取 ADL 函数的地址？

是否可以获取通过 ADL 找到的函数的地址例如 template
Rust 编程竞赛中最快的惯用 I/O 例程？

我的问题已部分得到解答因此我根据从评论和其他实验中学到的知识对其进行了修改总之我想要一个用于编程竞赛的快速 I O 例程其中使用单个文件解决问题无需外部包它应该从一个以空格分隔的标记序列中读取BufRead 标准输入或文件标记

Rust 编程竞赛中最快的惯用 I/O 例程？

Rust 编程竞赛中最快的惯用 I/O 例程？ 的相关文章

随机推荐

热门标签

Rust 编程竞赛中最快的惯用 I/O 例程？的相关文章