Haskell 在计算字母方面能打败 C 吗？

2024-01-09

剧透：是的。见下文。

尝试优化字母计数器以匹配 C。我已经与它斗争到了 2 倍的赤字。

letterCount :: B.ByteString -> V.Vector Int
letterCount bs =
    V.accumulate
        (\a _ -> a + 1)
        (V.replicate 256 0)
        letters1
  where
    len = B.length bs
    letters1 = V.generate len (\i -> (fromIntegral $! B.index bs i, ()))

一些注意事项：

真的很慢直到我改变Data.Vector to Data.Vector.Unboxed。这是为什么？
我以为大部分时间都会花在accumulate。我错了。
70%的时间花在generate.
Haskell 代码不得不毫无意义地将 Word8 转换为 Int；还有，无用的军队()实际上可能会或可能不会被创建。

完整清单：

import qualified Data.ByteString as B
import qualified Data.Vector.Unboxed as V
import System.Environment
import Text.Printf

letterCount :: B.ByteString -> V.Vector Int
letterCount bs =
    V.accumulate
        (\a _ -> a + 1)
        (V.replicate 256 0)
        letters1
  where
    len = B.length bs
    letters1 = V.generate len (\i -> (fromIntegral $! B.index bs i, ()))

printCounts :: V.Vector Int -> IO ()
printCounts cs =
    mapM_
        (uncurry $ printf "%c: %d\n")
        (zip (map toEnum [0..255] :: String) (V.toList cs))

main :: IO ()
main = do
    filename <- fmap head getArgs
    f <- B.readFile filename
    let counts = letterCount f
    printCounts counts

竞争C代码：

    #include <assert.h>
    #include <stdio.h>
    #include <string.h>
    #include <sys/stat.h>
    #include <stdlib.h>

    int letcnt [256];

    int* letter_count(unsigned char *s, unsigned int len)
    {
        int i;
        memset(letcnt, 0, 256 * sizeof(int));
        for(i = 0; i < len; i++){
            letcnt[*(s + i)]++;
        }
        return (letcnt);
    }

    void print_counts() {
        int i;
        for(i = 0; i < 256; i++) {
            printf("'%c': %d\n", (unsigned char) i, letcnt[i]);
        }
    }
    // st_size
    int main(int argc, char **argv)
    {
        assert(argc == 2);
        FILE* f = fopen(argv[1], "r");
        struct stat st;
        stat(argv[1], &st);
        off_t len = st.st_size;
        unsigned char* contents = calloc(len, 1);
        fread(contents, len, 1, f);
        fclose(f);
        letter_count(contents, len);
        print_counts();
        return 0;
    }

Timings;

$ time ./a.out /usr/share/dict/words > /dev/null

real  0m0.012s
user  0m0.005s
sys 0m0.005s

$ time ./lettercount /usr/share/dict/words > /dev/null

real  0m0.017s
user  0m0.009s
sys 0m0.007s

Update

我认为性能上限归因于这个错误：runST 不是免费的 https://ghc.haskell.org/trac/ghc/ticket/5916。并不是说我认为不可能进一步优化，但只要 runST 施加一些开销，就不太可能接近 C。

此外，还根据@Zeta 的评论修复了 C 代码。

第 1 点。装箱向量是指向可能未计算的表达式的指针数组，这些表达式产生Int。未装箱的向量只是一个整数数组。这绝对是严格的，这意味着更少的内存分配/垃圾收集，并且它可能具有更好的 CPU 缓存行为。这就是为什么首先提供无盒版本的原因！

第 4 点。我的理解是，整数类型之间的转换在运行时是无操作的。基本上Int and Word8存储方式相同；唯一的区别在于如何(+)和类似的实施。

另外，据我了解，无效构造函数如()（并且True, False, Nothing, ...) 在所有实例之间共享。所以你并不是在“创造”一支军队() values.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Haskell

Haskell 在计算字母方面能打败 C 吗？的相关文章

为什么Haskell没有split函数？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案在许多语言中都有一个函数可以使用指定的分隔符将字符串分成几部分它经常被称为split 您可以在 Python C Java JavaScri
在 win32/cygwin 上编译 haskell 模块网络

我正在尝试编译 Network HTTP http hackage haskell org package network http hackage haskell org package network 在 win32 cygwin 上
仪器化状态单子

我正在努力给予Monad and MonadState的实例State 计算的数量 gt gt return get and put运营 data Counts Counts binds Int returns Int gets Int p
在 Haskell 中等待然后检测按键的简单方法是什么？

我对 Haskell 还很陌生所以我正在寻找一种简单的方法来检测按键而不是使用getLine 如果有人知道任何库或者知道一些这样做的技巧那就太好了如果有更好的地方可以问这个问题请直接告诉我我将不胜感激如果您不想阻止可以使用
Haskell 单例：我们可以通过 SNat 获得什么

我正在尝试使用 Haskell 单例在论文中使用单例进行依赖类型编程 http cs brynmawr edu rae papers 2012 singletons paper pdf并在他的博客文章中单例 v0 9 发布 https t
为什么 GeneralizedNewtypeDeriving 没有安全的 Haskell？

来自 GHC 手册第安全语言 http www haskell org ghc docs 7 6 2 html users guide safe haskell html safe language 模块边界控制使用安全语言编译的 Ha
算法 - 如何有效删除列表中的重复元素？

有一个list L 它包含以下元素任意类型each 如何有效删除此类列表中的所有重复元素必须保留订单只需要一个算法因此不允许导入任何外部库相关问题在Python中从列表中删除重复项以使所有元素都是唯一的最快算法是什么在维持秩序的
如何找到仅是 2、3 和 5 的幂的倍数的所有数字的列表？ [复制]

这个问题在这里已经有答案了 I am trying to generate a list of all multiples which can be represented by the form where a b and c are w
将 Either 列表转换为其中包含列表的 Either 列表

我是 Haskell 的初学者我正在编写一些使用 Haskell 的代码Either https hackage haskell org package base 4 9 0 0 docs Data Either html用于错误处理 E
存在函数依赖关系时类型推断如何工作

考虑下面的代码 LANGUAGE MultiParamTypeClasses FlexibleInstances FunctionalDependencies UndecidableInstances FlexibleContexts cl
我应该使用什么递归方案来重复有效的操作，直到其结果符合某些标准？

也就是说我要问的是一个循环 effectful Int gt IO Int effectful n do putStrLn Effect show n return n condition 3 final Int gt IO final
为什么 exceptT 没有 MonadMask 实例？

爱德华克梅特例外情况图书馆不提供单子掩码 https www stackage org haddock lts 7 18 exceptions 0 8 3 Control Monad Catch html t MonadMask实例为Ex
有没有办法在 Emacs 中使用 Djinn 自动生成 Haskell 代码？

标题几乎说明了一切我正在寻找这样的东西 f Int gt Bool gt Int f body Djinn 可以使用定理证明来通过证明该类型存在来生成此类函数的代码我想知道是否有现有的方法可以从 Emacs 中获取此功能因此我不需
管道中缺少 ResourceT 实例

我在尝试使用时遇到奇怪的错误ResourceT http hackage haskell org package conduit 1 0 9 1 docs Data Conduit html t 3aResourceT来自管道 1 0 9
如何处理在组合下发生变化的类型？

我最近读了一篇非常有趣的论文单调性类型 https infoscience epfl ch record 231867 files monotonicity types pdf其中描述了一种新的 HM 语言该语言可以跟踪操作之间的单调性
使用 Haskell 将函数注入到 Java .class 文件中

我使用 Haskell 编写了一个 Java 字节码解析器它工作得很好然而下一步让我完全难住了我的 Haskell 程序需要修改 class 文件以便在执行时 Java 程序打印输入此处的方法名称在执行方法之前并且退出此
简单的秒差距示例会产生类型错误

我正在尝试编译这个简单的秒差距代码 import Text Parsec simple letter 但我不断收到此错误 No instance for Stream s0 m0 Char arising from a use of let
Haskell：GHC 无法推断类型。由类型签名错误绑定的刚性类型变量

我看过几篇主题相似的帖子但它们并不能真正帮助我解决我的问题所以我才敢重复现在我有一个带有签名的函数 run Expr query gt RethinkDBHandle gt query gt IO JSON 这是一个数据库查询运行函数
Haskell cabal：我刚刚安装了软件包，但现在找不到软件包

在这里 http haskell org haskellwiki Cabal Install I just installed packages 2C but now the packages are not found这是我可以找到我正在
Haskell 中的多态函数作为参数

我有一个带有两个构造函数的 ADT 一个包裹着一个Double和一个包裹着Integer 我想创建一个函数它采用一元函数Numtypeclass 并返回一个函数该函数将该一元函数应用于我的 ADT 的内容我试过这个 data X Y

随机推荐

以编程方式创建具有轮廓样式的 MaterialButton

我想以编程方式创建一个按照设计指南中定义的按钮 https material io design components buttons html outlined button https material io design compon
有没有办法在不使用 distplot 的情况下以绘图方式绘制高斯曲线（缩放到 y 轴而不对其进行标准化）？

I have been trying to plot a histogram fitted with a gaussian the mean along with 1 sigma standard deviation errors Usin
如何在 TextFormField 中添加额外标签？

有没有办法将忘记密码标签放置在 TextFormField 内在示例图片上输入忘记密码就在输入里面 new TextFormField decoration InputDecoration labelText Password la
HTTPS 请求导致使用 Python 3 的 Windows 中重置连接

当我在 cygwin 中将以下函数与 Python 3 2 3 包一起使用时它会挂起对任何 https 主机的任何请求它将抛出以下错误 60 秒后 Errno 104 连接被对等方重置更新我认为这仅限于 cygwin 但这也发生在带
为什么 Jenkins“扩展电子邮件”不包含扩展信息？

我们安装了电子邮件分机 https wiki jenkins ci org display JENKINS Email ext plugin2 24 1 变为詹金斯 1 447 我们将扩展电子邮件通知默认内容设置为 PROJECT N
用于 MVC 不显眼的远程验证的事件挂钩

在将数据提交到远程方法之前以及从远程方法返回结果之后是否有一种方法可以在客户端上挂钩 MVC3 不显眼的远程验证我试图告诉远程验证器仅在单击提交按钮时才执行验证正常的行为是验证多次例如在按键模糊等过程中这是不好的因为相关的验证
Perl DBD::Oracle 模块安装

有人可以指导我如何安装 PerlDBD Oracle module 这是我到目前为止所做的平台 RHEL 5 8 64 位安装 Perl DBI 包安装了适用于 Linux 64 位的 Oracle Instant 客户端即时客户端
HttpUrlConnection 是否会审查某些标头，尤其是 Origin？

我正在尝试为实现 CORS 的 Web 服务创建一些测试所以我需要发送 Origin 标头当我打电话时addRequestProperty origin origin 原始标头似乎没有出现在服务器上我说似乎我有一个 servle
字符串生成器与字符串连接[重复]

这个问题在这里已经有答案了与纯字符串连接相比使用字符串生成器有什么好处和权衡 new StringBuilder 32 append str1 append test append val append is changed toStr
如何手动上传我的源代码到哨兵？

我的应用程序是用 expo 构建的哨兵仪表板显示了 2 个错误丢弃无效参数类型 and 找不到 app crna entry bundle 的源代码平台 ios dev true minify false hot false ass
Javascript - 在继续之前等待事件

我正在尝试创建一个可以执行以下操作的 JavaScript 函数 onclick 浮动div中的表单弹出这部分没问题然后脚本如何等待数据输入到表单中然后再返回表单中的值你可以说我正在尝试创建我自己的 javascript 提示版本
类成员函数的函数模板特化

include
存储过程的字符串参数的最大长度是多少？

我有一个长度为 1 44 000 的字符串必须将其作为参数传递给存储过程该存储过程是表上的选择查询当给定这是在查询中在 c 中时它工作正常但是当我将它作为参数传递给存储过程时它不起作用这是我的存储过程其中我已将此参数声明
如何创建自己的域名后缀？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案 Like bit ly goo gl is gd j mp migre me等使用自己的域名扩展 ly gl gd mp me等等我如何创建自己的个
ElasticSearch Spring - 使用 @Mapping 注释仅对一组字段禁用 date_detection，而不是对整个索引

我正在尝试禁用索引中一组字段的 date detection 下面是映射 my index mappings properties class type text fields keyword type keyword ignore abo
Android YouTube 播放器 api 发生大量崩溃

我正在使用 1 2 1 版本尝试过最新版本 1 2 2 android s youtube player api 它在大多数设备上运行良好然而我时不时地会在 crashlytics 上遇到崩溃我遇到以下崩溃 Fatal Except
Java 中的 try、catch、finally 中的 return 是如何工作的？

我不明白到底如何return工作于try catch 如果我有try and finally没有catch 我可以把return在的里面try block 如果我有try catch finally 我不能放return in the t
如何获得 PHP 数组中下一个值和上一个值之间的减法[重复]

这个问题在这里已经有答案了我有这样的数据数组 array 0 0 0 19 0 5 0 75 1 0 1 25 1 5 1 75 2 0 2 25 我想要得到的是下一个值和上一个值之间的绝对减值数组 0 0 0 19 0 19 0 5 0
使用 AWS 负载均衡器的 A（主机）记录

我有关于 AWS 负载均衡器的问题我可以指点我的CNAMEwww 完美地连接到我的负载均衡器的 DNS 我知道它将始终有效但我还需要将记录指向负载均衡器以便人们可以访问mysite com代替www mysite com并点击负载均
Haskell 在计算字母方面能打败 C 吗？

剧透是的见下文尝试优化字母计数器以匹配 C 我已经与它斗争到了 2 倍的赤字 letterCount B ByteString gt V Vector Int letterCount bs V accumulate a gt a 1

Haskell 在计算字母方面能打败 C 吗？

Update

Haskell 在计算字母方面能打败 C 吗？ 的相关文章

随机推荐

热门标签

Haskell 在计算字母方面能打败 C 吗？的相关文章