随机森林回归中的样本大小

2024-03-23

如果理解正确，当计算随机森林估计量时，通常会应用引导法，这意味着仅使用来自样本（i）的数据构建树（i），并通过替换选择。我想知道sklearn的样本大小是多少随机森林回归器 http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestRegressor.html uses.

我唯一看到的是接近的：

bootstrap : boolean, optional (default=True)
    Whether bootstrap samples are used when building trees.

但没有办法指定样本量的大小或比例，也没有告诉我默认的样本量。

我觉得应该有办法至少知道默认样本大小是多少，我错过了什么？

呃，我同意你的观点，很奇怪的是我们无法指定子样本/引导程序大小RandomForestRegressor算法。也许一个潜在的解决方法是使用BaggingRegressor反而。http://scikit-learn.org/stable/modules/ generated/sklearn.ensemble.BaggingRegressor.html#sklearn.ensemble.BaggingRegressor http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.BaggingRegressor.html#sklearn.ensemble.BaggingRegressor

RandomForestRegressor只是一个特例BaggingRegressor（使用引导程序来减少一组低偏差高方差估计量的方差）。在RandomForestRegressor，基本估计量被迫为DeceisionTree，而在BaggingRegressor，您可以自由选择base_estimator。更重要的是，您可以设置自定义的子样本大小，例如max_samples=0.5将抽取大小等于整个训练集一半的随机子样本。此外，您可以通过设置仅选择功能的子集max_features and bootstrap_features.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

随机森林回归中的样本大小的相关文章

无法“安装”plpython3u - postgresql

我正在尝试在 postgresql 中使用 python 语言像这样的事情 create or replace function test a integer returns integer as if a 2 0 return even
使用 psycopg2 在 python 中执行查询时出现“编程错误：语法错误位于或附近”

我正在运行 Python v 2 7 和 psycopg2 v 2 5 我有一个 postgresql 数据库函数它将 SQL 查询作为文本字段返回我使用以下代码来调用该函数并从文本字段中提取查询 cur2 execute SELECT
Python 的键盘中断不会中止 Rust 函数 (PyO3)

我有一个使用 PyO3 用 Rust 编写的 Python 库它涉及一些昂贵的计算单个函数调用最多需要 10 分钟从 Python 调用时如何中止执行 Ctrl C 好像只有执行结束后才会处理所以本质上没什么用最小可重现示例 Ca
将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
使 django 服务器可以在 LAN 中访问

我已经安装了Django服务器可以如下访问 http localhost 8000 get sms http 127 0 0 1 8000 get sms 假设我的IP是x x x x 当我这样做时从同一网络下的另一台电脑 my ip
OpenCV Python cv2.mixChannels()

我试图将其从 C 转换为 Python 但它给出了不同的色调结果 In C Transform it to HSV cvtColor src hsv CV BGR2HSV Use only the Hue value hue create
为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
OpenCV 无法从 MacBook Pro iSight 捕获

几天后我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗示例代码
AWS EMR Spark Python 日志记录

我正在 AWS EMR 上运行一个非常简单的 Spark 作业但似乎无法从我的脚本中获取任何日志输出我尝试过打印到 stderr from pyspark import SparkContext import sys if name m
python获取上传/下载速度

我想在我的计算机上监控上传和下载速度一个名为 conky 的程序已经在 conky conf 中执行了以下操作 Connection quality alignr wireless link qual perc wlan0 downspe
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

如何将 Windows Update 设置为从不使用 PowerShell 检查更新？

我正在寻找使用 PowerShell Windows Server 2008 R2 编写脚本的帮助因此 Windows 更新设置为从不检查更新我找到了一些接近的答案但我仍然无法做我想做的事目前我必须通过单击 Windows 更新
JQuery 对话框作为输入

我不太习惯使用 jquery 对话框之类的东西所以这是一个新手问题此时我正在使用提示来获取 SharePoint 中用户的回复 var answer dialog Type the text you want to display i
使用 Spring RestTemplate 将嵌套 JSON 对象映射到 Java 类

我知道这可能很简单但是我就是无法让它发挥作用所以我尝试使用 Spring RestTemplate 来映射我的 JSON 数据我有以下来自休息调用的 JSON 响应 message ok status ok data Name Yo
熊猫合并 101

我怎样才能执行 INNER LEFT RIGHT FULL OUTER JOIN和熊猫合并后如何为缺失的行添加 NaN 合并后如何摆脱 NaN 我可以合并索引吗如何合并多个 DataFrame 与 pandas 交叉连接 merge j
动画 UIProgressView 的变化

是否可以动画化 a 的变化UIProgressView以便显示能够平滑地移动到新值有点像 NSProgressIndicator 那样如果您对此感兴趣请填写错误报告 Duplicate 5883058 Title UIProgress
在 Ember.JS ember-cli 应用程序中包含引导库的推荐方法

我正在尝试在当前的 ember cli 项目中正确安装 Twitter Bootstrap 我确实用 Bower 安装了 bootstrap bower install save bootstrap 现在库已下载到 vendor boots
如何使用AES解密使用openssl命令加密的Java文件？

我需要使用以下命令在 JAVA 中解密在 UNIX 中加密的文件 openssl aes 256 cbc a salt in password txt out password txt enc mypass mypass 我必须在 java
如何从 JavaScript 中的字符串中删除单词数组？

我有一个可以从字符串中删除单词的函数这是 var removeFromString function oldStr fullStr return fullStr split oldStr join 我这样使用它 console log r
Maven 部署：即使工件已经存在也强制部署

我正在构建一个项目它由几个有时不相关的模块和一些更多的非标准 java 模块使用 ANT 构建组成每个 Maven 模块在完成后都会部署到发布存储库如果构建在中间失败我可能已经部署了一些模块因此如果我尝试重建新的部署尝试
退出和退出有什么区别！在红宝石中？

退出和退出有什么区别在红宝石中几件事退出处理程序以 exit 形式运行但不是 exit 这意味着分配给清理的任何代码都不会使用退出来运行退出中的退出状态默认设置为 false 形式而在退出形式中则为真退出状态
使用 xlrd 时读取包含公式的单元格值会返回 0.0

我尝试读取单元格值例如 Excel 工作表中的 E5 和 E5 包含一个公式 A29 A2 我使用以下代码它返回 0 00 而不是实际值1 440408 有办法解决这个问题吗我想打印正确的值请在这件事上给予我帮助谢谢 book x
jQuery 在 Chrome 和 Mac OS 上停止运行

看看这个小提琴 http jsfiddle net mattball nWWSa http jsfiddle net mattball nWWSa var lis ul innerfade gt li function fadeThemOu
适用于商品 Linux 存储场的最佳分布式文件系统 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我有很多闲置的英特尔 Linux 服务器数百台并且希望将它们用于 Web 托管和文件共享环境中的分布式文件系统这不适用于 HPC 应用程序
如何按顺序获取int中的每个数字？

我有一个整数 int iNums 12476 我想从中获取每个数字作为整数就像是 foreach iNum in iNums printf i iNum 所以输出将是 1 2 4 7 6 但我需要每个数字作为int not as char
在类中找不到 main(String[]) 方法

我收到以下错误在类中找不到 main String 方法 import java util class Coor int x y w Coor int x int y int w this x x this y y this w w cl
gtkmm 的 CMake 错误

我正在使用 Debian 8 并安装了 libgtkmm 3 0 以及 dev 现在我有一个使用 gtkmm 的非常简单的程序基本上是一个 Hello World 主要 cpp include include BrowserWindow
如何用许多随机数填充 MySQL 表？

我要问一个已经被问过的问题very https stackoverflow com questions 9505930 populate mysql table with random data in python抽象的terms http
无法从“字符串”转换为“System.IFormatProvider”

这段代码给了我这个错误 var n 9 7 2014 8 22 35 AM var m n ToString yyyy MM dd T HH mm ssZ 但这段代码可以正常工作并以正确的格式返回日期 var n DateTime Now
如何正确使用实时优先级

我的问题可能并不是真正关于实时处理但话又说回来它可能是我的应用程序有几个比 GUI 重要得多的线程但是我确实希望 GUI 至少可用我不希望它始终锁定并且我确实想根据我正在执行的处理结果更新屏幕目前我的所有必需项目都隔离在单
随机森林回归中的样本大小

如果理解正确当计算随机森林估计量时通常会应用引导法这意味着仅使用来自样本 i 的数据构建树 i 并通过替换选择我想知道sklearn的样本大小是多少随机森林回归器 http scikit learn org stable modul

随机森林回归中的样本大小

随机森林回归中的样本大小 的相关文章

随机推荐

热门标签

随机森林回归中的样本大小的相关文章