加快 WMA（加权移动平均线）计算速度

2024-03-13

我正在尝试计算 15 天柱的指数移动平均线，但希望查看每个（结束）日/柱的 15 天柱 EMA 的“演变”。所以，这意味着我有 15 天的柱线。当每天出现新数据时，我想使用新信息重新计算 EMA。实际上，我有 15 天的柱形图，然后，每天之后，我的新 15 天的柱形图开始增长，并且出现的每个新的柱形图都应该与之前完整的 15 天的柱形图一起用于 EMA 计算。

假设我们从 2012 年 1 月 1 日开始（本例中我们有每个日历日的数据），在 2012 年 1 月 15 日结束时我们有第一个完整的 15 天柱。在 2012 年 3 月 1 日完成 4 个完整的 15 天柱后，我们可以开始计算 4 个柱 EMA (EMA(x, n=4))。在 2012 年 3 月 2 日结束时，我们使用目前掌握的信息并计算 2012 年 3 月 2 日的 EMA，假装 2012 年 3 月 2 日的 OHLC 是正在进行的 15 天柱。因此，我们采用 4 个完整的柱和 2012 年 3 月 2 日的柱并计算 EMA(x, n=4)。然后我们再等一天，看看新的 15 天柱发生了什么（有关详细信息，请参阅下面的 to.period.cumulative 函数）并计算 EMA 的新值...因此对于接下来的 15 天开始...请参阅函数 EMA.cumulative 下面的详细信息...

请在下面找到我到目前为止所能想到的。性能对我来说是不可接受的，而且以我有限的 R 知识，我无法让它变得更快。

library(quantmod)

do.call.rbind <- function(lst) {
    while(length(lst) > 1) {
        idxlst <- seq(from=1, to=length(lst), by=2)

        lst <- lapply(idxlst, function(i) {
                    if(i==length(lst)) { return(lst[[i]]) }

                    return(rbind(lst[[i]], lst[[i+1]]))
                })
    }
    lst[[1]]
}

to.period.cumulative <- function(x, name=NULL, period="days", numPeriods=15) {
    if(is.null(name))
        name <- deparse(substitute(x))

    cnames <- c("Open", "High", "Low", "Close")
    if (has.Vo(x)) 
        cnames <- c(cnames, "Volume")

    cnames <- paste(name, cnames, sep=".") 

    if (quantmod:::is.OHLCV(x)) {
        x <- OHLCV(x)
        out <- do.call.rbind( 
                lapply(split(x, f=period, k=numPeriods), 
                        function(x) cbind(rep(first(x[,1]), NROW(x[,1])), 
                                cummax(x[,2]), cummin(x[,3]), x[,4], cumsum(x[,5]))))
    } else if (quantmod:::is.OHLC(x)) {
        x <- OHLC(x)
        out <- do.call.rbind( 
                lapply(split(x, f=period, k=numPeriods), 
                        function(x) cbind(rep(first(x[,1]), NROW(x[,1])), 
                                cummax(x[,2]), cummin(x[,3]), x[,4])))
    } else {
        stop("Object does not have OHLC(V).")
    }

    colnames(out) <- cnames

    return(out)
}

EMA.cumulative<-function(cumulativeBars, nEMA = 4, period="days", numPeriods=15) {
    barsEndptCl <- Cl(cumulativeBars[endpoints(cumulativeBars, on=period,     k=numPeriods)])

    # TODO: This is sloooooooooooooooooow... 
    outEMA <- do.call.rbind(
            lapply(split(Cl(cumulativeBars), period), 
                    function(x) {
                        previousFullBars <- barsEndptCl[index(barsEndptCl) < last(index(x)), ]
                        if (NROW(previousFullBars) >= (nEMA - 1)) {
                                last(EMA(last(rbind(previousFullBars, x), n=(nEMA + 1)), n=nEMA))
                        } else {
                            xts(NA, order.by=index(x))
                        }
                    }))

    colnames(outEMA) <- paste("EMA", nEMA, sep="")

    return(outEMA)
}

getSymbols("SPY", from="2010-01-01")

SPY.cumulative <- to.period.cumulative(SPY, , name="SPY")

system.time(
        SPY.EMA <- EMA.cumulative(SPY.cumulative)
)

在我的系统上需要

   user  system elapsed 
  4.708   0.000   4.410

可接受的执行时间将少于一秒...是否可以使用纯 R 来实现这一点？

这篇文章链接到优化移动平均线计算 - 有可能吗？ https://stackoverflow.com/questions/8076376/optimize-moving-averages-calculation-is-it-possible我没有收到任何答复。我现在能够创建一个可重现的示例，并更详细地解释我想要加速的内容。我希望这个问题现在更有意义了。

任何有关如何加快速度的想法都将受到高度赞赏。

我没有使用 R 为我的问题找到令人满意的解决方案。所以我使用了旧工具 C 语言，结果比我预期的要好。感谢您“推动”我使用 Rcpp、内联等这些出色的工具。太棒了。我想，以后每当我有性能要求，而使用 R 无法满足时，我就会在 R 中添加 C，性能就在那里。因此，请参阅下面我的代码和性能问题的解决方案。

# How to speedup cumulative EMA calculation
# 
###############################################################################

library(quantmod)
library(Rcpp)
library(inline)
library(rbenchmark)

do.call.rbind <- function(lst) {
    while(length(lst) > 1) {
        idxlst <- seq(from=1, to=length(lst), by=2)

        lst <- lapply(idxlst, function(i) {
                    if(i==length(lst)) { return(lst[[i]]) }

                    return(rbind(lst[[i]], lst[[i+1]]))
                })
    }
    lst[[1]]
}

to.period.cumulative <- function(x, name=NULL, period="days", numPeriods=15) {
    if(is.null(name))
        name <- deparse(substitute(x))

    cnames <- c("Open", "High", "Low", "Close")
    if (has.Vo(x)) 
        cnames <- c(cnames, "Volume")

    cnames <- paste(name, cnames, sep=".") 

    if (quantmod:::is.OHLCV(x)) {
        x <- quantmod:::OHLCV(x)
        out <- do.call.rbind( 
                lapply(split(x, f=period, k=numPeriods), 
                        function(x) cbind(rep(first(x[,1]), NROW(x[,1])), 
                                cummax(x[,2]), cummin(x[,3]), x[,4], cumsum(x[,5]))))
    } else if (quantmod:::is.OHLC(x)) {
        x <- OHLC(x)
        out <- do.call.rbind( 
                lapply(split(x, f=period, k=numPeriods), 
                        function(x) cbind(rep(first(x[,1]), NROW(x[,1])), 
                                cummax(x[,2]), cummin(x[,3]), x[,4])))
    } else {
        stop("Object does not have OHLC(V).")
    }

    colnames(out) <- cnames

    return(out)
}

EMA.cumulative<-function(cumulativeBars, nEMA = 4, period="days", numPeriods=15) {
    barsEndptCl <- Cl(cumulativeBars[endpoints(cumulativeBars, on=period, k=numPeriods)])

    # TODO: This is sloooooooooooooooooow... 
    outEMA <- do.call.rbind(
            lapply(split(Cl(cumulativeBars), period), 
                    function(x) {
                        previousFullBars <- barsEndptCl[index(barsEndptCl) < last(index(x)), ]
                        if (NROW(previousFullBars) >= (nEMA - 1)) {
                                last(EMA(last(rbind(previousFullBars, x), n=(nEMA + 1)), n=nEMA))
                        } else {
                            xts(NA, order.by=index(x))
                        }
                    }))

    colnames(outEMA) <- paste("EMA", nEMA, sep="")

    return(outEMA)
}

EMA.c.c.code <- '
    /* Initalize loop and PROTECT counters */
    int i, P=0;

    /* ensure that cumbars and fullbarsrep is double */
    if(TYPEOF(cumbars) != REALSXP) {
      PROTECT(cumbars = coerceVector(cumbars, REALSXP)); P++;
    }

    /* Pointers to function arguments */
    double *d_cumbars = REAL(cumbars);
    int i_nper = asInteger(nperiod);
    int i_n = asInteger(n);
    double d_ratio = asReal(ratio);

    /* Input object length */
    int nr = nrows(cumbars);

    /* Initalize result R object */
    SEXP result;
    PROTECT(result = allocVector(REALSXP,nr)); P++;
    double *d_result = REAL(result);

    /* Find first non-NA input value */
    int beg = i_n*i_nper - 1;
    d_result[beg] = 0;
    for(i = 0; i <= beg; i++) {
        /* Account for leading NAs in input */
        if(ISNA(d_cumbars[i])) {
            d_result[i] = NA_REAL;
            beg++;
            d_result[beg] = 0;
            continue;
        }
        /* Set leading NAs in output */
        if(i < beg) {
            d_result[i] = NA_REAL;
        }
        /* Raw mean to start EMA - but only on full bars*/
        if ((i != 0) && (i%i_nper == (i_nper - 1))) {
            d_result[beg] += d_cumbars[i] / i_n;
        }
    }

    /* Loop over non-NA input values */
    int i_lookback = 0;
    for(i = beg+1; i < nr; i++) {
        i_lookback = i%i_nper;

        if (i_lookback == 0) {
            i_lookback = 1;
        } 
        /*Previous result should be based only on full bars*/
        d_result[i] = d_cumbars[i] * d_ratio + d_result[i-i_lookback] * (1-d_ratio);
    }

    /* UNPROTECT R objects and return result */
    UNPROTECT(P);
    return(result);
'

EMA.c.c <- cfunction(signature(cumbars="numeric", nperiod="numeric", n="numeric",     ratio="numeric"), EMA.c.c.code)

EMA.cumulative.c<-function(cumulativeBars, nEMA = 4, period="days", numPeriods=15) {
    ratio <- 2/(nEMA+1)

    outEMA <- EMA.c.c(cumbars=Cl(cumulativeBars), nperiod=numPeriods, n=nEMA, ratio=ratio)  

    outEMA <- reclass(outEMA, Cl(cumulativeBars))

    colnames(outEMA) <- paste("EMA", nEMA, sep="")

    return(outEMA)
}

getSymbols("SPY", from="2010-01-01")

SPY.cumulative <- to.period.cumulative(SPY, name="SPY")

system.time(
        SPY.EMA <- EMA.cumulative(SPY.cumulative)
)

system.time(
        SPY.EMA.c <- EMA.cumulative.c(SPY.cumulative)
)


res <- benchmark(EMA.cumulative(SPY.cumulative), EMA.cumulative.c(SPY.cumulative),
        columns=c("test", "replications", "elapsed", "relative", "user.self", "sys.self"),
        order="relative",
        replications=10)

print(res)

编辑：为了表明我的繁琐的性能改进（我确信它可以做得更好，因为实际上我已经创建了双for循环）R这里是一个打印输出：

> print(res)
                              test replications elapsed relative user.self
2 EMA.cumulative.c(SPY.cumulative)           10   0.026    1.000     0.024
1   EMA.cumulative(SPY.cumulative)           10  57.732 2220.462    56.755

所以，按照我的标准，SF 类型的改进......

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

finance

加快 WMA（加权移动平均线）计算速度的相关文章

长变量名在 dplyr 中失败

长度超过 39 个字符的字符串在 dplyr 中失败返回错误错误索引超出范围我错过了什么还是这是一个错误 40 个字符不起作用 library dplyr names iris 5 lt vvv 5vvv10vvv15vvv20vv
使用 ggplot2 修改点子集的形状

我正在尝试绘制一个沿大量维度变化的大型散点图这是我的起始情节 p lt ggplot mtcars aes wt mpg shape cyl colour gear size carb geom point 使用mtcars数据集我只是
R 中的 NA 替换函数

我正在尝试替换矩阵中的 NA mat 零我在用着mat is na mat lt 0 当我有 18946 个变量的 94531 个观察值或更小的矩阵时效果很好但我在 22752 个变量的 112039 个观察值的矩阵上尝试它 R 显示
分离并重新附加“tools:rstudio”

又名玩火以下不起作用 rstd obj lt as environment tools rstudio detach tools rstudio attach rstd obj name tools rstudio 好吧它似乎有效但随
在 mac (iMac OSX ) 终端中远程运行脚本（r 脚本）到其他计算机

我有一个小示例脚本 script p r 如下所示打算在终端中运行 usr bin Rscript sink output capture txt mn lt mean 1 10 and so on much longer list of
如何让R使用所有处理器？

我有一台运行 Windows XP 的四核笔记本电脑但查看任务管理器 R 似乎一次只使用一个处理器如何让 R 使用全部四个处理器并加速我的 R 程序我有一个基本系统我使用它在 for 循环上并行化我的程序一旦您了解需要做什么此方
使用 R 的 flextable 包时，有没有办法将传递给 add_header_lines() 的字符串部分加粗

我正在使用我喜欢的 flextable 包为 Word 文档创建几个表格但是我在将表格标题中的部分文本加粗时遇到了一些麻烦例如我希望标题为 Table 1 我的表格标题的其余部分而不是表 1 我的表格标题的其余部分 I 找到这个
将列表中的列转换为 R 中的数据框

我有使用 R 创建的以下列表 set seed 326581 X1 rnorm 10 0 1 Y1 rnorm 10 0 2 data data frame X1 Y1 lst lt replicate 100 df smpl lt dat
R 中的发散积分可在 Wolfram 中求解

我知道我以前问过同样的问题但由于我是新来的这个问题问得不好而且不可重现因此我在这里尝试做得更好如果我只编辑旧的可能没有人会读它我有一个想要积分的二重积分 ff lt function g t exp 16 g exp 8 t t
从 R 环境中删除对象

我正在阅读 Hadley 的 Advanced R 在第 8 章中他说我们可以使用以下方法从环境中删除对象 rm 但是移除该物体后我仍然可以看到该物体这是我的代码 e lt new env e a lt 1 e b lt 2 e a
逻辑回归/二项式的 glmnet 误差

当尝试将 glmnet 与 family binomial 配合以进行逻辑回归拟合时出现此错误 gt data lt read csv DAFMM HE16 matrix csv header F gt x lt as data fram
仅保留百分比的尾随零

给出以下示例 library pander tableAbs lt Titanic 1 1 tablePct lt round prop table tableAbs 100 2 table lt cbind tableAbs tableP
fread 将空导入为 NA

我正在尝试导入带有空白的 csv 读取为不幸的是他们都读作 NA now 为了更好地演示问题我还展示了如何NA NA and 都映射到同一事物除了最底部的示例这将妨碍简单的解决方法dt is na dt lt gt write cs
使用 R 进行项目组织 [重复]

这个问题在这里已经有答案了可能的重复统计分析和报告撰写的工作流程 https stackoverflow com questions 1429907 workflow for statistical analysis and repor
表单提交时出现 rvest 错误

我想从以下网页中抓取数据 https swgoh gg u zozo collection 180 emperor palpatine https swgoh gg u zozo collection 180 emperor palpati
ggplot散点图中的图例问题

我想使用 ggplot 创建显示方法比较数据的散点图绘图应包含原始数据理想线和带误差的拟合线图例应显示理想线和拟合线的线型线宽线颜色我可以获得大部分我想要的东西但是图例存在以下问题图例显示每种线型有 2 条线为什么如何解
如何在R中同时对三个字段进行网络分析

如何在 R 中同时对三个字段进行网络分析下面是示例数据以及desired output在最后一栏中 df lt data frame stringsAsFactors FALSE id 1 c ABC ABC BCD CDE DEF EF
如何匹配 R 中的所有匹配项？

我有 1000 个名字的列表说A 我还有另外 5 个名字的清单说B 我想找出这5个名字出现在1000个号码列表中的第几行例如 Amy 在 A 中可以出现 25 次 B 里有艾米我想知道 Amy 出现在 A 中的哪些行我以前使用过
替换字符串/文本中“从第 n 次到最后一次”出现的单词

这个问题以前曾被问过但尚未得到令提问者满意的答案 https stackoverflow com questions 36368712 how to use stringrs replace all function to replace
如何将 ggrough 图表另存为 .png

说我正在使用R包裹ggrough https xvrdm github io ggrough https xvrdm github io ggrough 我有这个代码取自该网页 library ggplot2 library ggroug

随机推荐

如何更改此 R 图中的字体系列？ [复制]

这个问题在这里已经有答案了我正在尝试将轴和图例的字体更改为衬线但添加family serif 没有为传奇工作我该怎么做呢 plot sort n cdf pch 3 cex 0 5 xlab Order ylab Cn family s
pandas 中 groupby 中的排名

我有一个典型的面板数据在计量经济学术语中不是 pandas 面板对象数据框有一个Date列和一个ID列以及包含某些值的其他列对于每个日期我需要根据 V1 对 ID 进行横断面排名分为 10 组十分位数并创建一个名为的新列
Python：定义特定类型对象的列表

我想继承一个列表来生成myList类仅接受一种特定类型的对象例如整数我相信装饰者可以优雅地做到这一点使用怎么样arrays http docs python org library array html 该模块定义了一个对象类型它
XLib：获取光标图像

有没有办法使用 Xlib 检索当前光标位图我检查过X光标人 http www xfree86 org 4 3 0 Xcursor 3 html但我没有看到任何方法可以做到这一点使用 GetCursorImage SelectCursor
matlab中的支持向量机

您能否举一个在 matlab 中使用支持向量机 SVM 进行 4 类分类的示例例如 atribute 1 atribute 2 atribute 3 atribute 4 class 1 2 3 4 0 1 2 3 5 0 0 2 6 4
如何在 Android 中使用文本视图显示颠倒的文本？

如何在 Android 中使用文本视图显示颠倒的文本就我而言我有一个 2 人游戏他们彼此面对面玩我想向第二个面向他们的玩家展示测试这是我在 AaronMs 建议后实施的解决方案执行重写的类 bab foo UpsideDownT
Firebase 服务器时间戳将 iOS 翻倍

ServerValue timestamp 回报 AnyHashable Any 如何将其转换为Double 这样我就可以创建一个带有时间戳的日期这并不是 Firebase 时间戳的工作原理它实际上所做的是将时间戳写入节点但在写入之后
如何验证 ZF2 中的复选框

我已经阅读了许多针对 Zend Framework 缺乏默认复选框验证的解决方法我最近开始使用 ZF2 但文档有点缺乏有人可以演示如何使用 Zend 表单和验证机制验证复选框以确保其被选中吗我正在为我的表单使用数组配置使用 ZF 网
安全组出口规则仅允许 ECR 请求

当使用 ECR 存储用于 ECS 的容器映像时 EC2 实例或 Fargate 服务必须具有允许通过公共互联网访问特定于账户的存储库 URI 的安全组许多组织都有严格的 IP 白名单规则通常不允许为所有 IP 启用出站端口 44
从命令行在 Hadoop 中检测压缩编解码器

有没有简单的方法可以找出 Hadoop 中用于压缩文件的编解码器我是否需要编写 Java 程序或者将文件添加到 Hive 以便我可以使用describe formatted table 一种方法是在本地下载文件使用hdfs dfs g
具有接口的枚举类成员无法在内部找到方法

我遇到了一个奇怪的问题我不确定这是编译器问题还是我对接口枚举的理解我正在使用 IntelliJ IDEA 12 构建一个 Android 项目并且我有一个这样的类 public class ClassWithEnum private
Azure 服务总线序列化类型

随着我们转向面向服务的体系结构我们已开始研究使用 Windows Azure 服务总线来替代当前的队列大部分文档都很清楚但是我很难确定哪种类型的序列化BrokeredMessage当提供主体时使用例如假设我实例化了一个Broker
React：formik 表单，如何在回调函数内提交后使用状态

我在用formik插件reactjs我想要useState表单提交后的变量 Both this and setState未定义我无法实现它有人可以帮我完成这件事吗 See screenshot below In JavaScript 默
android 延迟加载未在手机上显示图像或显示速度很慢

我正在使用 JSON 来解析在线 xml 文档以及两种延迟图像加载的方法以下是我的源代码解释和我的问题解释方法一使用AsyncTask和线imageLoader DisplayImage String jsonImageText
安装chatterBot时出错

每当我尝试使用命令安装 ChatterBot 时pip install ChatterBot它给出了这个错误 Retrying Retry total 0 connect None read None redirect None after
扩展点或从 Liquid 模板访问 OpenApiDocument

We have 规范扩展 https github com OAI OpenAPI Specification blob master versions 3 0 2 md specification extensions i e x isP
Git 子模块工作流程建议

所以几天前我开始使用 Git 聚会已经很晚了别骂真正开始熟悉基本命令想法和工作流程然而子模块确实让我大吃一惊我正在尝试贡献代码FuelPHP http fuelphp com s GitHub https github com
Symfony2 中数据库测试的实践？如何隔离？

目前测试与 Symfony2 数据库交互的最佳实践是什么我有一个简单的 CRUD 设置我想确保我的测试没问题现在我有 4 个测试每一个测试都确保创建更新删除和列出操作正常发生我的测试用例有两个神奇的方法 construct
错误代码：1093。您无法在 FROM 子句中指定更新的目标表

假设我有一个产品表并且只有 2 个字段 id 和购买日期我想删除 2019 年购买的最后一件产品我尝试使用以下查询来做到这一点 DELETE FROM products WHERE id SELECT id FROM products
加快 WMA（加权移动平均线）计算速度

我正在尝试计算 15 天柱的指数移动平均线但希望查看每个结束日柱的 15 天柱 EMA 的演变所以这意味着我有 15 天的柱线当每天出现新数据时我想使用新信息重新计算 EMA 实际上我有 15 天的柱形图然后每天之后

加快 WMA（加权移动平均线）计算速度

加快 WMA（加权移动平均线）计算速度 的相关文章

随机推荐

热门标签

加快 WMA（加权移动平均线）计算速度的相关文章