如何在不并行的情况下提高反向传播 ANN 的性能

2024-01-01

After 剖析我的反向传播算法，我了解到它占用了我 60% 的计算时间。在开始研究并行替代方案之前，我想看看是否还有什么可以做的。

The activate(const double input[])函数被分析为只花费约 5% 的时间。这gradient(const double input)函数实现如下：

inline double gradient(const double input) { return (1 - (input * input)); }

有问题的训练函数：

void train(const vector<double>& data, const vector<double>& desired, const double learn_rate, const double momentum) {
        this->activate(data);
        this->calculate_error(desired);

        // adjust weights for layers
        const auto n_layers = this->config.size();
        const auto adjustment = (1 - momentum) * learn_rate;

        for (size_t i = 1; i < n_layers; ++i) {
            const auto& inputs = i - 1 > 0 ? this->outputs[i - 1] : data;
            const auto n_inputs = this->config[i - 1];
            const auto n_neurons = this->config[i];

            for (auto j = 0; j < n_neurons; ++j) {
                const auto adjusted_error = adjustment * this->errors[i][j];

                for (auto k = 0; k < n_inputs; ++k) {
                    const auto delta = adjusted_error * inputs[k] + (momentum * this->deltas[i][j][k]);

                    this->deltas[i][j][k] = delta;
                    this->weights[i][j][k] += delta;
                }

                const auto delta = adjusted_error * this->bias + (momentum * this->deltas[i][j][n_inputs]);

                this->deltas[i][j][n_inputs] = delta;
                this->weights[i][j][n_inputs] += delta;
            }
        }
    }
}

这个问题可能更适合https://codereview.stackexchange.com/ https://codereview.stackexchange.com/.

如果你想训练/使用神经网络，你就无法避免 O(n^2) 算法。但它非常适合矢量运算。例如，通过巧妙地使用 SSE 或 AVX，您可以以 4 或 8 个块的形式处理神经元，并使用乘加而不是两个单独的指令。

如果您使用现代编译器并仔细重新制定算法并使用正确的开关，您甚至可以让编译器为您自动向量化循环，但您的里程可能会有所不同。

对于 gcc，使用 -O3 或 -ftree-vectorize 激活自动矢量化。当然，您需要一个支持向量的 cpu，例如 -march=core2 -mssse4.1 或类似的，具体取决于目标 cpu。如果您使用 -ftree-vectorizer-verbose=2 您会得到详细的解释，循环未矢量化的原因和位置。看一下http://gcc.gnu.org/projects/tree-ssa/vectorization.html http://gcc.gnu.org/projects/tree-ssa/vectorization.html .

当然更好的是直接使用编译器内在函数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在不并行的情况下提高反向传播 ANN 的性能的相关文章

如何将 std::string& 转换为 C# 引用字符串

我正在尝试将 C 函数转换为std string参考C 我的 API 如下所示 void GetStringDemo std string str 理想情况下我希望在 C 中看到类似的东西 void GetStringDemoWrap r
在 xaml 中编写嵌套类型时出现设计时错误

我创建了一个用户控件它接受枚举类型并将该枚举的值分配给该用户控件中的 ComboBox 控件很简单我在数据模板中使用此用户控件当出现嵌套类型时问题就来了我使用这个符号来指定 EnumType x Type myNamespace
在一个数据访问层中处理多个连接字符串

我有一个有趣的困境我目前有一个数据访问层它必须与多个域一起使用并且每个域都有多个数据库存储库具体取决于所调用的存储过程目前我只需使用 SWITCH 语句来确定应用程序正在运行的计算机并从 Web config 返回适当的连接字
如何在 Cassandra 中存储无符号整数？

我通过 Datastax 驱动程序在 Cassandra 中存储一些数据并且需要存储无符号 16 位和 32 位整数对于无符号 16 位整数我可以轻松地将它们存储为有符号 32 位整数并根据需要进行转换然而对于无符号 64 位整
随着时间的推移，添加到 List 变得非常慢

我正在解析一个大约有 1000 行的 html 表我从一个字符串中添加 10 个字符串 td 每行到一个list td
C++ 多行字符串原始文字[重复]

这个问题在这里已经有答案了我们可以像这样定义一个多行字符串 const char text1 part 1 part 2 part 3 part 4 const char text2 part 1 part 2 part 3 part 4
访问外部窗口句柄

我当前正在处理的程序有问题这是由于 vista Windows 7 中增强的安全性引起的特别是 UIPI 它阻止完整性级别较低的窗口与较高完整性级别的窗口对话就我而言我想告诉具有高完整性级别的窗口进入我们的应用程序它在 XP 或
两个类可以使用 C++ 互相查看吗？

所以我有一个 A 类我想在其中调用一些 B 类函数所以我包括 b h 但是在 B 类中我想调用 A 类函数如果我包含 a h 它最终会陷入无限循环对吗我能做什么呢仅将成员函数声明放在头文件 h 中并将成员函数定义放在实现文
为什么使用小于 32 位的整数？

我总是喜欢使用最小尺寸的变量这样效果就很好但是如果我使用短字节整数而不是整数并且内存是 32 位字可寻址这真的会给我带来好处吗编译器是否会做一些事情来增强内存使用对于局部变量它可能没有多大意义但是在具有数千甚至数百万项的结构
复制目录下所有文件

如何将一个目录中的所有内容复制到另一个目录而不循环遍历每个文件你不能两者都不Directory http msdn microsoft com en us library system io directory aspx nor Dir
如何在 Linq to SQL 中使用distinct 和 group by

我正在尝试将以下 sql 转换为 Linq 2 SQL select groupId count distinct userId from processroundissueinstance group by groupId 这是我的代码
如何在 Android 中使用 C# 生成的 RSA 公钥？

我想在无法假定 HTTPS 可用的情况下确保 Android 应用程序和 C ASP NET 服务器之间的消息隐私我想使用 RSA 来加密 Android 设备首次联系服务器时传输的对称密钥 RSA密钥对已在服务器上生成私钥保存在服务器
使用特定参数从 SQL 数据库填充组合框

我在使用参数从 sql server 获取特定值时遇到问题任何人都可以解释一下为什么它在 winfom 上工作但在 wpf 上不起作用以及我如何修复它我的代码 private void UpdateItems COMBOBOX1 Ite
对于某些 PDF 文件，LoadIFilter() 返回 -2147467259

我正在尝试使用 Adob e IFilter 搜索 PDF 文件我的代码是用 C 编写的我使用 p invoke 来获取 IFilter 的实例 DllImport query dll SetLastError true CharSet
C++ 中的 include 和 using 命名空间

用于使用cout 我需要指定两者 include
C# 中最小化字符串长度

我想减少字符串的长度喜欢这串 string foo Lorem ipsum dolor sit amet consectetur adipiscing elit Aenean in vehicula nulla Phasellus li
现代编译器是否优化乘以 1 和 -1

如果我写 template
从 mvc 控制器使用 Web api 控制器操作

我有两个控制器一个mvc控制器和一个api控制器它们都在同一个项目中 HomeController Controller DataController ApiController 如果我想从 HomeController 中使用 Dat
如何确定 CultureInfo 实例是否支持拉丁字符

是否可以确定是否CultureInfo http msdn microsoft com en us library system globalization cultureinfo aspx我正在使用的实例是否基于拉丁字符集我相信你可以使
使用 WGL 创建现代 OpenGL 上下文？

我正在尝试使用 Windows 函数创建 OpenGL 上下文现代版本基本上代码就是创建窗口类注册班级创建一个窗口 choose PIXELFORMATDESCRIPTOR并设置它创建旧版 OpenGL 上下文使上下文成为当前

随机推荐

如何在 IDLE 中删除多行制表符缩进？

如果您想在 Python IDLE 中缩进多行只需标记这些行并按 Tab 键即可但是如果您想删除多行中的缩进怎么办 Shift Tab 在 IDLE 中不起作用如果您使用 IDLE 则可以使用Ctrl 缩进和Ctrl 取消缩进
在 Perl 中，如何检查给定函数是从哪个模块导入的？

我有一个调用该函数的代码但我不知道这个函数属于哪个模块我需要它来修改这个功能我怎样才能检查它 The Devel Peek http search cpan org perldoc Devel Peek模块可以非常方便地获取有关变量的
我可以使用 SQL 将存储为 CSV（逗号分隔值）的表列的内容拆分为新表中的各个行吗？

我看到有几个相关的问题和答案但不完全是我需要的所以我会问一个新问题我有一个包含数千行商店库存数据的 CSV 文件我想将其导入 MS SQL Server 数据库并使用 SQL 来处理它们导入 CSV 文件后 SQL 表将具有包含
带空格的 Shell 变量，引用单个命令行选项

Autoconf 脚本在处理带有空格的文件名或路径名时遇到问题例如 configure CPPFLAGS I path with space 结果 config log configure 3012 gcc I path with sp
从字符串中删除最后三个字符

我想从字符串中删除最后三个字符 string myString abcdxxx 请注意该字符串是动态数据从字符串中读取最后 3 个字符最初提出的问题您可以使用字符串子字符串 http msdn microsoft com en u
Docker 容器上的 Vue.js 应用程序具有热重载功能

在 docker 实例上运行 vue js 应用程序时出现明显的延迟和高 CPU 使用率这是我的码头设置 docker compose yml version 2 services app build context dockerfil
INSERT 查询产生“警告：mysqli_num_rows() 期望参数 1 为 mysqli_result，给定布尔值”

我很困惑为什么会收到以下消息 mysqli num rows 期望参数 1 为 mysqli result 给定布尔值这个问题和之前的问题不一样因为我的查询实际上正确执行值确实已输入数据库所以我希望 MySQL 返回一个结果集而不是
为什么 Qt 信号的参数不能用 typedef 类型定义？

对于 Qt5 c 11 项目我使用 QMediaPlayer 对象名为 audio player 及其positionChanged 信号这段代码没问题 connect this gt audio player SIGNAL posi
如何替换geom_text指南的图例“项目符号”（图例）

我想替换图例指南中的项目符号 geom text 现在是倾斜的a 但我想要一个大的胖圆或正方形或任何其他会强调颜色的形状更多 library ggplot2 majdf lt data frame lvl rep c A B eac
powershell 如何从输出中删除“{}@”。有没有特殊的命令可以做到这一点？

我进入了gwmi win32 product select property name select first 1并输出到文件我的结果是 name Google Talk Plugin 我怎样才能摆脱和名字我只想让它显示Google
在 Firebase 数据库中按降序排序[重复]

这个问题在这里已经有答案了 Firebase 实时数据库中有以下书籍列表 title Don t Make Me Think upvotes 110 title The Mythical Man Month upvotes 111 titl
限制对 Web 服务的访问，仅允许移动客户端

我目前正在构建一个移动应用程序首先是 iOS 它需要后端 Web 服务进行通信由于此服务将公开我只想由移动客户端访问的数据因此我想限制对该服务的访问然而我对如何实施这一点有点怀疑由于我的应用程序不需要身份验证因此我不能仅使用这
从 matplotlib 导入样式 ImportError：无法导入名称“style”

我收到以下错误消息 ImportError cannot import name style 当我跑步时 from matplotlib import style 我正在使用 ubuntu 并尝试使用 python3 和 python 运行
如何使用 POST/form leaf 模板传递数据？

我对vapor leaf html 的理解存在一些主要差距我正在使用使用 Vapor 的 beta 分支创建的 todo 示例进行工作首先我制作了自己的流畅模型据我所知没有问题 import FluentSQLite import
java中二进制字符串的异或

我正在使用以下代码来异或 2 个字符串 String lseq 0011111111101111111111111100101101111100110000001011111000010100 String tseq 00111111111
javascript mouseover/out 与点击行为相结合

我是编程新手请多多指教下面是我的代码 function document getElementById custom link addEventListener mouseover function document getElemen
由于旧的 ipv6 配置，Python 总是返回 Network is unreachable

目前我使用 python 发出的任何请求都出现网络无法访问错误无论我使用 urllib 库还是 requests 库经过更多研究后这很可能是由于 ipv6 隧道设置不正确造成的该隧道似乎仍然处于活动状态 ip 6 addr s
获取最后创建的目录批处理命令

如何获取目录中最新的子文件夹我需要它在MKLINK D命令 Thanks FOR F delims i IN dir b ad h t c od DO SET a i echo Most recent subfolder a i对于 Wi
Sass 中的这个错误是什么意思？ “非法嵌套：只有属性可以嵌套在属性之下。”

这是我的代码 html body width 100 height 100 padding 0 margin 0 body font family Open Sans navigation padding 0 margin 0 backgr
如何在不并行的情况下提高反向传播 ANN 的性能

After 剖析我的反向传播算法我了解到它占用了我 60 的计算时间在开始研究并行替代方案之前我想看看是否还有什么可以做的 The activate const double input 函数被分析为只花费约 5 的时间这gradi

如何在不并行的情况下提高反向传播 ANN 的性能

如何在不并行的情况下提高反向传播 ANN 的性能 的相关文章

随机推荐

热门标签

如何在不并行的情况下提高反向传播 ANN 的性能的相关文章