xtensor 类型与 NumPy 简单归约的性能对比

2023-12-30

我正在尝试xtensor-python https://github.com/QuantStack/xtensor-python并开始编写一个非常简单的求和函数，之后使用千篇一律的设置 https://github.com/QuantStack/xtensor-python-cookiecutter并启用 SIMD 内在函数xsimd https://github.com/QuantStack/xsimd.

inline double sum_pytensor(xt::pytensor<double, 1> &m)
{
  return xt::sum(m)();
}
inline double sum_pyarray(xt::pyarray<double> &m)
{
  return xt::sum(m)();
}

Used setup.py构建我的 Python 模块，然后在由以下代码构建的 NumPy 数组上测试求和函数np.random.randn不同尺寸，比较np.sum.

import timeit

def time_each(func_names, sizes):
    setup = f'''
import numpy; import xtensor_basics
arr = numpy.random.randn({sizes})
    '''
    tim = lambda func: min(timeit.Timer(f'{func}(arr)',
                                        setup=setup).repeat(7, 100))
    return [tim(func) for func in func_names]

from functools import partial

sizes = [10 ** i for i in range(9)]
funcs = ['numpy.sum',
         'xtensor_basics.sum_pyarray',
         'xtensor_basics.sum_pytensor']
sum_timer = partial(time_each, funcs)
times = list(map(sum_timer, sizes))

这个（可能有缺陷的）基准测试似乎表明，与 NumPy 相比，对于较大的数组，该基本函数的 xtensor 的性能会下降。

           numpy.sum  xtensor_basics.sum_pyarray  xtensor_basics.sum_pytensor
1           0.000268                    0.000039                     0.000039
10          0.000258                    0.000040                     0.000039
100         0.000247                    0.000048                     0.000049
1000        0.000288                    0.000167                     0.000164
10000       0.000568                    0.001353                     0.001341
100000      0.003087                    0.013033                     0.013038
1000000     0.045171                    0.132150                     0.132174
10000000    0.434112                    1.313274                     1.313434
100000000   4.180580                   13.129517                    13.129058

知道为什么我会看到这个吗？我猜这是 NumPy 使用的东西，而 xtensor 还没有，但我不确定它可以用于像这样简单的减少。我挖通了xmath.hpp https://github.com/QuantStack/xtensor/blob/master/include/xtensor/xmath.hpp但没有看到任何明显的东西，并且文档中没有引用任何类似的内容。

Versions

numpy                          1.13.3
openblas                       0.2.20
python                         3.6.3
xtensor                        0.12.1
xtensor-python                 0.14.0

哇，这真是巧合！我正在努力实现这个加速！

xtensor 的 sum 是一个惰性操作——它不使用最高效的迭代顺序进行（自动）向量化。然而，我们刚刚添加了一个evaluation_strategy减少（以及即将到来的累积）的参数，允许您选择immediate and lazy减少。

立即减少立即执行减少（而不是惰性），并且可以使用针对矢量化减少优化的迭代顺序。

您可以在此 PR 中找到此功能：https://github.com/QuantStack/xtensor/pull/550 https://github.com/QuantStack/xtensor/pull/550

在我的基准测试中，这应该至少与 numpy 一样快或更快。我希望今天能把它合并起来。

顺便提一句。请随时访问我们的 gitter 频道并发布问题链接，我们需要更好地监控 StackOverflow：https://gitter.im/QuantStack/大厅 https://gitter.im/QuantStack/Lobby

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

xtensor 类型与 NumPy 简单归约的性能对比的相关文章

使用 C# 中的 CsvHelper 将不同文化的 csv 解析为十进制

C 中 CsvHelper 解析小数的问题我创建了一个从 byte 而不是文件获取 csv 文件的类并且它工作正常 public static List
如何获取 EF 中与组合（键/值）列表匹配的记录？

我有一个数据库表其中包含每个用户年份组合的记录如何使用 EF 和用户 ID 年份组合列表从数据库获取数据组合示例 UserId Year 1 2015 1 2016 1 2018 12 2016 12 2019 3 2015 91
C# - 当代表执行异步任务时，我仍然需要 System.Threading 吗？

由于我可以使用委托执行异步操作我怀疑在我的应用程序中使用 System Threading 的机会很小是否存在我无法避免 System Threading 的基本情况只是我正处于学习阶段例子 class Program public
如何定义一个可结构化绑定的对象的概念？

我想定义一个concept可以检测类型是否T can be 结构化绑定 or not template
x:将 ViewModel 方法绑定到 DataTemplate 内的事件

我基本上问同样的问题这个人 https stackoverflow com questions 10752448 binding to viewmodels property from a template 但在较新的背景下x Bind V
循环中断打破tqdm

下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
C# xml序列化必填字段

我需要将一些字段标记为需要写入 XML 文件但没有成功我有一个包含约 30 个属性的配置类这就是为什么我不能像这样封装所有属性 public string SomeProp get return someProp set if som
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
有没有办法让 doxygen 自动处理未记录的 C 代码？

通常它会忽略未记录的 C 文件但我想测试 Callgraph 功能例如您知道在不更改 C 文件的情况下解决此问题的方法吗设置变量EXTRACT ALL YES在你的 Doxyfile 中
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
为什么 std::uint32_t 与 uint32_t 不同？

我对 C 有点陌生我有一个编码作业很多文件已经完成但我注意到 VS2012 似乎有以下语句的问题 typedef std uint32 t identifier 不过似乎将其更改为 typedef uint32 t identifi
DotNetZip：如何提取文件，但忽略zip文件中的路径？

尝试将文件提取到给定文件夹忽略 zip 文件中的路径但似乎没有办法考虑到其中实现的所有其他好东西这似乎是一个相当基本的要求我缺少什么代码是 using Ionic Zip ZipFile zf Ionic Zip ZipFile
在OpenGL中，我可以在坐标(5, 5)处精确地绘制一个像素吗？

我所说的 5 5 正是指第五行第五列我发现使用屏幕坐标来绘制东西非常困难 OpenGL 中的所有坐标都是相对的通常范围从 1 0 到 1 0 为什么阻止程序员使用屏幕坐标窗口坐标如此严重最简单的方法可能是通过以下方式设置投影以匹配渲
类型或命名空间“MyNamespace”不存在等

我有通常的类型或命名空间名称不存在错误除了我引用了程序集 using 语句没有显示为不正确并且我引用的类是公共的事实上我在不同的解决方案中引用并使用相同的程序集来执行相同的操作并且效果很好顺便说一句这是VS2010 有人有什么
Mono 应用程序在非阻塞套接字发送时冻结

我在 debian 9 上的 mono 下运行一个服务器应用程序大约有 1000 2000 个客户端连接并且应用程序经常冻结 CPU 使用率达到 100 我执行 kill QUIT pid 来获取线程堆栈转储但它总是卡在这个位置
如何确定 CultureInfo 实例是否支持拉丁字符

是否可以确定是否CultureInfo http msdn microsoft com en us library system globalization cultureinfo aspx我正在使用的实例是否基于拉丁字符集我相信你可以使

随机推荐

mongo dbname --eval 'db.collection.find()' 不起作用

为什么这有效 mongo dbname MongoDB shell version 1 8 3 connecting to nextmuni staging gt db collection find foo bar gt bye 虽然这不
--disable-web-security 在 Chrome 中工作吗？

我正在尝试做一个简单的测试而不更改任何涉及的服务器端代码跨域 https developer mozilla org en US docs Web HTTP CORS AJAX调用 https www w3schools com xml
如何使用cached_network_image预加载图像？

我刚刚实现了 Flutter包cached network image我想知道如何预加载图像以便稍后可以立即使用它们我从我们的服务器检索稍后将使用的所有图像网址我已经定义了自定义缓存管理器 getter class LocalCach
如何在 Linux 中针对分段错误生成核心转储？

我的 Linux 中有一个进程出现分段错误我怎样才能告诉它在失败时生成核心转储这取决于您使用的 shell 如果您使用的是 bash 则 ulimit 命令控制与程序执行相关的多个设置例如是否应该转储核心如果您输入 ulimit c
仅当属性为 null 时，如何从 lombok 构建器中排除该属性

我有一个用户模型类如下所示 JsonSerialize Getter Setter FieldDefaults level AccessLevel PRIVATE Builder public class User Default Str
基于 Python 中较小的数据集生成较大的综合数据集

我有一个包含 21000 行数据样本和 102 列特征的数据集我希望根据当前数据集生成一个更大的合成数据集例如 100000 行这样我就可以将其用于机器学习目的我在这篇文章中提到了 Prashant 的答案https sta
替换“/”之前的任何字符串，PHP

我想替换之前的任何字符串无论字符串长度如何谢谢让一种方式假设您想更改第一个之前的字符串 str anystring the rest blah s explode str s 0 new string print r impl
谷歌浏览器本地存储保存在哪里？

某些网站显示正在使用本地存储在 Google Chrome 中 CTRL I 资源选项卡本地存储例如 StackOverflow 有一个 login prefs 键和我的默认登录提供程序所以据我所知它是一个 json 对象这些数据
Spring embeddeb 数据库表已存在错误

我正在尝试使用嵌入式数据库运行 Spring Boot 应用程序在 bean 初始化期间由于某种原因我的表创建脚本被调用两次第二次调用失败并出现表已存在错误下面是我的代码可能是什么问题 Configuration publ
MatLab - 将函数应用于矩阵中的每一行

我有一个矩阵行数为 4 个整数列数未指定取决于文本文件我想独立地将函数应用于矩阵的每一行该函数有 4 个输入和 2 个输出我尝试使用 arrayfun 函数来执行此操作但每当我调用该函数时都会收到一条错误消息输入参数不足
如何在木偶上使用参数化正则表达式（例如/${user}/）进行测试？

我需要获取用户的主目录我决定通过解析 getent passwd 字符串来获取它这是一个自定义事实构建为内容的串联 etc passwd 并借助正则表达式提取相关信息当我测试 getent带有固定字符串 adam 提取工程 if g
如何在C#中使用Either类型？

佐兰霍瓦特 https www pluralsight com authors zoran horvat提议使用Either类型以避免空检查和不要忘记处理问题在执行操作期间 Either在函数式编程中很常见为了说明其用法 Zoran 展
如何对“新风格”Django 中间件进行单元测试

我正在学习如何对 Django 中间件进行单元测试在旧式中间件中使用以下命令加载中间件非常容易process request 测试结果例如 def test session self request self factory ge
衍生品警告没有意义

我收到以下形式的警告 DerivativesWarning Constraints or objectives traj linkages stage 1 grav turn alpha final coast 1 alpha initia
错误显示：dyld_sim 与加载的进程不兼容

我有一个 iPhone 中运行的应用程序的源代码适用于 iOS 7 及之前的操作系统但 iOS 8 0 及更高版本不支持该应用程序当我尝试编译代码时它可以正常执行所有文件但会引发体系结构不匹配错误在控制台中 dyld dyld
如何更改查询以仅保留叶节点

我有包含以下数据的表 id parent id short name 6 5 cpu 7 5 ram 14 9 tier a 15 9 rfc1918 16 9 tolerant 17 9 nononymous 13 12 cloudsta
HTTPServletRequest getParameterMap() 与 getParameterNames

HTTPServletRequestreq 有一个方法getParameterMap 但是这些值返回一个String 代替String 对于发布数据为姓名玛丽姓氏约翰年龄 20 我在帖子数据中看到它不是一个数组但是getPar
AngularJS 根据用户输入切换样式表

如何根据用户单击的按钮来切换切换 AngularJS 页面的样式表您实际上可以在 html 级别放置一个控制器并修改link标签的href Demo http plnkr co edit jBtP6FfmeRzOYUCnHg3t p p
如何检测通知/系统栏何时打开

我需要知道系统通知栏何时在我的应用程序中打开但我找不到任何真正的解决方案所以我将一些东西组合在一起看起来效果很好在详细介绍实现之前我将简要解释一下我的非常老套的逻辑当某个 Activity 由于任何原因不再对用户可见时将
xtensor 类型与 NumPy 简单归约的性能对比

我正在尝试xtensor python https github com QuantStack xtensor python并开始编写一个非常简单的求和函数之后使用千篇一律的设置 https github com QuantStack x

xtensor 类型与 NumPy 简单归约的性能对比

xtensor 类型与 NumPy 简单归约的性能对比 的相关文章

随机推荐

热门标签

xtensor 类型与 NumPy 简单归约的性能对比的相关文章