衡量基因相对表达量的RPKM、FPKM、TPM详解

2023-10-27

衡量基因相对表达量的RPKM和FPKM、及TPM

1.RPKM(Reads Per Kilobase per Million)和FPKM(Fragments Per Kilobase per Million)

1.引入“每一千碱基(per kilobase)”的原因在于,不同的RNA可能有不同长度,长度越长,对应的reads就越多。当每个RNA都除以自身长度(以1000碱基,即kb为单位)时,就可以比较同一个样本中不同基因的相对表达量了。
2.引入“每一百万reads”的原因是,不同的样本可能测序的深度不一样,深度越深,当然对应的reads就越多了。如果结果除以各自库的数量(以一百万reads为单位),那么我们就能很好地衡量两个不同样本中同一个基因的相对表达量。

计算方法

第一步先将测序深度标准化,计算方法很简单,先分别计算出每个样本的总reads数,然后将表中数据分别除以总reads数即可,这样就得到了reads per million。

第二步是基因长度的标准化。将第一步的read per million直接除以基因长度即可。

FPKM和RPKM的定义是相同的,唯一的区别是FPKM适用于双端测序文库,而RPKM适用于单端测序文库。是衡量基因相对表达量的一个公式,

RPKM是将Map到基因的Reads数除以Map到Genome的所有Read数(以Million为单位)与RNA的长度(以KB为单位),是衡量基因相对表达量的一个公式,适用于单端测序

FPKM是将Map到基因的Fragments数除以Map到Genome的所有Read数(以Million为单位)与RNA的长度(以KB为单位)。适用于单端和双端测序。
它们2者的不同:
在single-end(单端测序)测序中,FPKM将read当做fragment计算,此时FPKM和RPKM是相同的。
而在pair-end(双端测序)测序 中, 若一堆paired-read 都比对上了,当做一个fragment。
在这里插入图片描述
TPM:Transcripts Per Kilobase per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts):它先对每个基因的read数用基因的长度进行校正,之后再用校正后的这个基因read数(nr/Lr)与校正后的这个样本的所有校正后的read数(sum( nr/Lr+………+ nm/Lm ))求商,是衡量基因相对表达量的一个手段
TPM的出现:
TPM的不同在于它的处理顺序是不同的。即先考虑基因长度,再考虑测序深度。
它的好处是,上边FPKM:
FPKM = (10^6 * nf) / (L * N)
其中:
nf 代表比对至目标基因的fragment数量;
L代表目标基因的外显子长度之和除以1000,单位是Kb;
N是总的有效比对至基因组的fragment数量。
FPKM中N同样会受到各个转录基因长度(distribution of transcript lengths)的影响,也就是说:FPKM/RPKM是不准确的。而TPM在一个样本中一个基因的TPM:先对每个基因的read数用基因的长度进行校正,之后再用校正后的这个基因read数(nr/Lr)与校正后的这个样本的所有校正后的read数(sum( nr/Lr+………+ nm/Lm ))求商。TPM除以经过基因长度归一化后的有效比对的read总数,即归一化后的测序深度。
————————————————

杨梦磊
20211024

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

衡量基因相对表达量的RPKM、FPKM、TPM详解 的相关文章

随机推荐

  • Invalid content was found starting with element ‘{“http://maven.apache.org/POM/4.0.0“:dependency}‘.

    在maven项目中运行时出现如下错误 点击上面的项目名 点击链接进入到报错的文件中 一般这种报错就是你的 Invalid content was found starting with element http maven apache o
  • java web项目中连接mysql数据库,javaweb之eclipse工程连接mysql数据库

    javaweb之eclipse工程连接mysql数据库 准备工作 1 在mysql官网下载mysqlconnection的jar包 输入网址 mysql com 点击DOWNLOADS 下拉选择MySQL Community GPL Dow
  • 入坑爬虫(六)某招聘网站信息采集

    前面的章节中 我们说到了如何发送发送 对应的 回顾之前的爬虫流程 在发送完请求之后 能够获取响应 这个时候就需要从响应中提取数据了 1 爬虫中数据的分类 在爬虫爬取到的数据中有很多不同类型的数据 我们需要了解数据的不同类型来规律的提取和解析
  • ADB简介

    Google官方网页 https developer android com studio command line adb html hl zh cn 对ADB的介绍在国内经常打不开 为了便于查看 这里从此网页中摘录了些经常使用到的内容
  • 2021杭电多校第三场-Road Discount-wqs二分+最小生成树

    Description There are n cities in Byteland labeled by 1 to n The Transport Construction Authority of Byteland is plannin
  • getLocation:fail Coordinate address resolution failed -1501

    这表示在获取位置信息时出现错误 具体原因可能是坐标地址解析失败 错误代码 1501 表示这种情况 你可以尝试重新请求位置信息 或者检查你的设备是否能够访问位置信息 例如 确保位置服务已打开
  • java swing实现文件浏览器功能小程序

    闲来无事学习了一下java的桌面应用开发组件Swing 做了个小程序 文件浏览器 只能查看信息不能进行过多操作 文件功能 查看指定文件路径下的所有文件夹和文件 可查看文件夹和文件的详细信息 切换不同排列方式等 基本逻辑 设置列表布局 添加数
  • Android 13 - Media框架(3)- MediaPlayer生命周期

    上一节了解了MediaPlayer api的使用 这一节就我们将会了解MediaPlayer的生命周期与api使用细节 1 MediaPlayer生命周期 MediaPlayer java 一开始有对生命周期的描述 这里对这些内容进行翻译
  • 服务器e4系列,Intel Xeon E系列服务器处理器

    一 Intel Xeon E系列CPU 命名规则 首先 Intel E3 E5 E7代表了3个不同档次的至强CPU 这种命名方式类似桌面上的Core i3 i5 i7 分别对应好 更好 最好 其次 以E3 1220为例 E3 1220中的这
  • RAR Extractor Mac:可以提取所有大多数格式的压缩文件

    RAR Extractor是mac上的解压缩软件 可以提取所有大多数格式 超过50种格式 的压缩文件 支持RAR winmAIl dat ZIP 7z tbz sti tar xar lha lzh hqx bin bz2 bzip2 bz
  • 保存登录的用户名

    自动测试服务器中用到用户的登录问题 在servlet中写上 String username request getParameter username 创建一个session对象 HttpSession session request ge
  • java 新手入门电子书_java从入门到精通第6版电子书 PDF高清版

    java从入门到精通第6版电子书 PDF高清版由软吧下载编辑精心整理 java从入门到精通第6版pdf是在之前的版本上更加详细的书籍 对于想要快速了解java的的话 欢迎下载java从入门到精通第6版pdf哦 欢迎下载使用 如果您觉得本站还
  • Java 初始化 List 的几种方法

    最常见的初始化 List 方法为 List
  • Flink,HDFS,YARN,Zookeeper之中的概念

    无论如何都要看一手资料 能看官方文档就不要看别的博客 有些地方很误导人 Hadoop内部子项目 HDFS YARN都是内部集成的 Hadoop Common The common utilities that support the oth
  • Java线程池中的线程发生OOM会如何?

    环境 JDK1 8 线程池中如果发生OOM后会如何 线程池ThreadPoolExecutor当有线程发生了OOM 线程池会停止工作吗 public static void main String args ThreadPoolExecut
  • React中组件间过渡动画如何实现?

    一 是什么 在日常开发中 页面切换时的转场动画是比较基础的一个场景 当一个组件在显示与消失过程中存在过渡动画 可以很好的增加用户的体验 在react中实现过渡动画效果会有很多种选择 如react transition group react
  • 已解决:ORA-01114(临时表满了)

    记录 ORA 01114 将块写入文件 201 时出现 IO 错误 解决方法 创建一个中转的临时表空间TEMP2重新建立临时表TEMP 1 查询该用户下的默认临时表空间 SQL gt SELECT bytes 1024 1024 1024
  • 【面试系列】划分字母区间

    题意 原题链接 思路 由于每个字母只能被划分在一个区间内 所以我们可以考虑这个字母的区间范围 这样就得到了至多 26 26 26个字母的区间范围 所以有区间范围重叠的字母必须都被分到一个区间内 因此这个问题就转换为合并区间问题 排序后贪心合
  • 从零开始构建SSD网络实现目标识别项目

    前言 由于此项目全过程过于繁杂 我前后做了三四个月 无法把所有内容融入这一篇文章之中 所以本文以逻辑串联为主 记录了我从零开始 构建vgg 300网络 gt 构建 SSD模型 gt 数据标注 gt 训练以及训练模型保存 gt 恢复模型进行预
  • 衡量基因相对表达量的RPKM、FPKM、TPM详解

    衡量基因相对表达量的RPKM和FPKM 及TPM 1 RPKM Reads Per Kilobase per Million 和FPKM Fragments Per Kilobase per Million 1 引入 每一千碱基 per k