决定倒塌这棵树的截止的算法？

2023-12-21

我有一个Newick http://en.wikipedia.org/wiki/Newick_format通过比较 4-9 bp 长 DNA 序列的假定 DNA 调控基序的位置权重矩阵（PWM 或 PSSM）的相似性（欧几里德距离）而构建的树。

iTol 上有该树的交互式版本（），您可以随意使用 - 设置参数后只需按“更新树”：

我的具体目标：如果它们到最近亲本进化枝的平均距离 ETE2 Python 包）。这在生物学上是很有趣的，因为一些基因调控 DNA 基序可能彼此同源（旁系同源物或直向同源物）。这种折叠可以通过上面链接的 iTol GUI 来完成，例如如果您选择 X = 0.001，则某些图案会折叠成三角形（图案族）。

我的问题：有人能提出一种算法，可以输出或帮助可视化哪个 X 值适合“最大化折叠主题的生物学或统计相关性”吗？理想情况下，当针对 X 绘制时，树的某些属性会出现一些明显的阶跃变化，这向算法表明了一个合理的 X。是否有任何已知的算法/脚本/包？也许代码会根据 X 的值绘制一些统计数据？我尝试绘制 X 与平均簇大小（绘图库 http://matplotlib.org/）但我没有看到明显的“步长增加”来告诉我要使用哪个 X 值：

我的代码和数据：我的 Python 脚本的链接是 [here][8]，我对其进行了大量评论，它将生成树数据并为您绘制上面的图（使用参数 d_from、d_to 和 d_step 来探索距离截止值 X）。如果您有 easy-install 和 Python，则只需执行这两个 bash 命令即可安装 ete2：

apt-get install python-setuptools python-numpy python-qt4 python-scipy python-mysqldb python-lxml

easy_install -U ete2

您可以尝试使用类似于 @Jeff 提到的树协调的方法。但标准树协调实际上会失败。

协调首先涉及添加代表整个目标树中进化特征“丢失”的分支。然后指出进化特征发生“重复”的节点。损失和重复的加权和提供了优化的成本函数。

但就您而言，您想要解决的问题是“将这棵超级树分解为适当大小的同源子树”。这意味着您并不想像重复一样遭受损失。您需要一种对树进行评分的方法，以便揭示有多少同源子树合并到您的超级树中。因此，您可以尝试以下评分方法：

取一棵超级树，计算重复物种的数量 S1。
折叠所有属于旁系同源物的顶生叶，并计算重复物种的新数量 S2。
S1 和 S2 之间的差异揭示了超级树中大约有多少个子树。
为了纠正由不同大小的超级树引起的任何偏差，除以超级树 N 中代表的独特物种的数量。

如果我们将此分数称为“子树因子”，那么它等于：

S1 - S2 / N

推论：

如果 S1 - S2 = S1 那么这意味着你的超级树中大约有一个真正的子树，所有多个物种的出现都只是由于最近的旁系同源物造成的。
如果 S1 - S2 = 0 那么这意味着你的超级树中有大约 S1 个真正的子树。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

决定倒塌这棵树的截止的算法？的相关文章

SQLAlchemy 通过关联对象声明式多对多自连接

我有一个用户表和一个朋友表它将用户映射到其他用户因为每个用户可以有很多朋友这个关系显然是对称的如果用户A是用户B的朋友那么用户B也是用户A的朋友我只存储这个关系一次除了两个用户 ID 之外 Friends 表还有其他字段因此
将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
使 django 服务器可以在 LAN 中访问

我已经安装了Django服务器可以如下访问 http localhost 8000 get sms http 127 0 0 1 8000 get sms 假设我的IP是x x x x 当我这样做时从同一网络下的另一台电脑 my ip
为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
使用 matplotlib 绘制时间序列数据并仅在年初显示年份

rcParams date autoformatter month b n Y 我正在使用 matpltolib 来绘制时间序列如果我按上述方式设置 rcParams 则生成的图会在每个刻度处标记月份名称和年份我怎样才能将其设置为仅在每
使用 on_bad_lines 将 pandas.read_csv 中的无效行写入文件

我有一个 CSV 文件我正在使用 Python 来解析该文件我发现文件中的某些行具有不同的列数 001 Snow Jon 19801201 002 Crom Jake 19920103 003 Wise Frank 19880303 l
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
Python 函数可以从作用域之外赋予新属性吗？

我不知道你可以这样做 def tom print tom s locals locals def dick z print z name z name z guest Harry print z guest z guest print di
AWS EMR Spark Python 日志记录

我正在 AWS EMR 上运行一个非常简单的 Spark 作业但似乎无法从我的脚本中获取任何日志输出我尝试过打印到 stderr from pyspark import SparkContext import sys if name m
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
如何在ipywidget按钮中显示全文？

我正在创建一个ipywidget带有一些文本的按钮但按钮中未显示全文我使用的代码如下 import ipywidgets as widgets from IPython display import display button wid
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
如何使用Python创建历史时间线

So I ve seen a few answers on here that helped a bit but my dataset is larger than the ones that have been answered prev
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
给定协方差矩阵，在Matlab中生成高斯随机变量

Given a M x M期望的协方差 R 以及所需数量的样本向量 N计算一个N x M高斯随机向量 X在普通 MATLAB 中即不能使用r mvnrnd MU SIGMA cases 不太确定如何解决这个问题通常你需要一个协方差并且意
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
Fabric env.roledefs 未按预期运行

On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O

随机推荐

将 UISearchBar 中的 BookmarkButton 替换为 Activityindicator

我使用 UISearchBar 输入地址来建立网络连接建立连接后我想显示活动指示器而不是搜索栏右侧的小书签按钮据我所知没有公开声明的属性可以让我访问搜索栏的正确子视图我已经看到这样做了有什么想法吗在搜索或连接正在进行时将左
如何在视图中嵌入时间选择器

我已经集成了TimePicker在我的申请中成功现在我想知道是否有一种方法可以在视图中嵌入时间选择器而不是将其显示为对话框提前致谢我建议你使用fragment是个好习惯如果你使用DialogFragment google提供使用对
使用 LEFT JOIN 仅选择一个连接行

我正在尝试 LEFT JOIN 两个表以获取 TABLE 1 中所有行的列表和 TABLE 2 中一个相关行的列表我已经尝试过 LEFT JOIN 和 GROUP BY c id 但是我不希望 TABLE 2 中的相关行按 isHead
我们真的需要在java RMI中创建Stub吗？

我正在阅读一些RMI文档所有书籍都说我们需要为客户端创建Stub才能与服务器通信然而我试图不创建存根事情就像一个魅力我已将客户端程序放在一台机器上将服务器程序放在另一台机器上一切运行良好那么创建 Stub 的实际目的是什么
如何使用POI从java中基于某些唯一值的excel读取特定行？

我试图根据一些独特的价值来获取记录例子如果有一个包含 emp 名称 emp id emp 地址的值表我想根据 emp id 获取记录这是我尝试过的代码该代码也不是从文件开始读取数据 package org xlsx read im
Powershell命令处理（传入变量）

我正在创建一个 Powershell 脚本来部署一些代码该过程的一部分是调用名为 RAR EXE 的命令行压缩工具来备份一些文件夹我试图动态构建参数然后让 powershell 使用变量调用命令但我遇到了麻烦它不起作用运行以下脚
如何解决这个问题（Pytorch RuntimeError：需要 1D 目标张量，不支持多目标）

我是 pytorch 和深度学习的新手我的数据集 53502 x 58 我的代码有问题 model nn Sequential nn Linear 58 64 nn ReLU nn Linear 64 32 nn ReLU nn Line
在 Rails 4 中保存嵌套模型

对于 Rails 来说有点新在某个地方其中一个模型在 has many belongs to 关联中依赖于另一个模型基本上在我的应用程序上创建帖子时用户还可以附加图像理想情况下这是两个独立的模型当用户选择一张照片时一
如何将 SFSafariViewController 与像该用户一样的深色主题一起使用？

我在 StackOverflow 问题的屏幕截图中看到用户呈现了一个变暗的 SafariViewController https stackoverflow com a 36099965 998117 https stackoverflo
实时数据库中的 .set Value 不会调用 OnCompleteListener

我目前正在尝试将数据保存到 Firebase 实时数据库我只是想保存数据 databaseReference child someChild setValue someObject Thread sleep 1000 这很好用该对象出现
未找到 Grails 独立插件

我正在尝试使用grails 独立插件 http grails org plugin standalone有了一个新的 grails 项目但我无法让它工作我已将其添加为我的插件依赖项BuildConfig groovy file plug
如何在需要时仅提交隐藏/显示字段数据之一 - Laravel

一个表单包含多个字段其中一个字段是是否下拉列表选择是后会出现另一个下拉菜单当没有选择时会出现一个文本输入字段根据是否下拉列表字段的数据之一应提交到数据库但是这两个字段的数据都会发送到数据库但数据库需要一个字符
Nest SuggestCompletion 用法，抛出“不是完成建议字段”异常

我是elasticsearch的完全初学者我一直在尝试使用elasticsearch的完成建议器使用Nest对属性进行自动完成这是我的映射如上所述here https github com Mpdreamz NEST blob ma
Numpy sum() 函数 + 推导式：int32 还是 in64？

为什么当输入是 int 列表时 numpy sum 和 numpy prod 函数返回 int32 如果输入是同一列表的生成器则返回 int64 在列表上操作时强制他们使用 int64 的最佳方法是什么 E g sum x for x i
将 AdobeMobileLibrary（适用于 iOS）与 cocoapods 一起使用？

我们将使用适用于 iOS 的 Omniture Tracking 它是 Adob eMobileLibrary 的一部分 AdobeAdobeMobileLibrary 无法通过 cocoapods repo 仅旧版本的 Omniture
python对象的查询语言[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个库可以让我在 python 对象数据库上运行类似 SQL 的查询对于对象数据库我
*** 检测到 glibc *** free()：下一个大小无效（正常）：0x0a03c978 *** [重复]

这个问题在这里已经有答案了我正在编写一个套接字程序来下载图像问题是当我在 gif 这样的小图片上测试我的代码时它工作得很好但是当我用 JPG 图片大于 GIF 运行它时我收到错误消息 glibc detected home u
将 API 密钥放在标头或 URL 中

我正在为我公司的数据设计一个公共 API 我们希望应用程序开发人员注册 API 密钥以便我们可以监控使用情况和过度使用情况由于 API 是 REST 我最初的想法是将此密钥放在自定义标头中我看到谷歌亚马逊和雅虎就是这样做的另一方面
Fortran 技术查询[重复]

这个问题在这里已经有答案了我在 Fortran 中有以下函数签名我是 Fortran 语言的新手是什么意思0 在下面的函数中 ANTY IAN NA 0 0 符号0 带小数点表示浮点数而0不带小数点表示整数对于 FORTRAN 的
决定倒塌这棵树的截止的算法？

我有一个Newick http en wikipedia org wiki Newick format通过比较 4 9 bp 长 DNA 序列的假定 DNA 调控基序的位置权重矩阵 PWM 或 PSSM 的相似性欧几里德距离而构建的树

决定倒塌这棵树的截止的算法？

决定倒塌这棵树的截止的算法？ 的相关文章

随机推荐

热门标签

决定倒塌这棵树的截止的算法？的相关文章