RNAmod:一站式在线mRNA修饰注释平台

动态、可逆的 mRNA 修饰对 mRNA 的剪切、输出、稳定和转译起着重要的调节作用,mRNA 修饰的错误调控会导致了多组织发育缺陷和癌症的发生。mRNA 的修饰并不是随机分布的,而是发生在 mRNA 的特定位置的特定序列基序上的。例如,N6-腺甘酸甲基化(m6A)是 mRNA 中最丰富的修饰形式,它主要位于翻译起始位点和翻译终止位点附近。而 N1-甲基腺甘酸甲基化(m1A)在 mRNA 的 5’UTR 处高频率出现。此外,在 mRNA 上发现了越来越多新的修饰位点,如胞嘧啶核苷 N4-乙酰化和 m7G 内修饰。mRNA 修饰的位置与其分子功能相关,因此,确定在 mRNA 中修饰位点的分布并对修饰后的基因靶标进行注释对于研究 mRNA 修饰的功能至关重要
 
在这里,我将介绍一款非常方便的一站式在线平台 RNAmod,可以用于对多达 21 种物种(包括人类,小鼠,大鼠,斑马鱼,果蝇,酵母和拟南芥等)的 mRNA 修饰自动进行荟萃分析、功能注释和可视化。RNAmod 提供直观的界面来显示输出,包括 RNA 修饰的分布,不同基因特征的修饰范围,修饰的 mRNA 的功能注释以及不同组或特定基因集之间的比较。此外,已知的 RNA 修饰位点以及数百种 RNA 结合蛋白(RBP)的结合位点数据已整合到 RNAmod 中,以帮助用户将其修饰数据与已知修饰进行比较,并探索与已知 RBP 结合位点的关系。此外,用户可以使用一键式链接下载所有输出结果
图1 (图片来源:RNAmod官网)
 
RNAmod 的整体工作流程包括:RNAmod 首先从参考基因组注释中提取基因特征,然后将提交的修饰位点映射到不同的 RNA 特征上,然后执行各种覆盖率计算,元基因分析以及针对 mRNA 的注释。其注释流程包括:(i)不同基因特征和基因生物类型之间的位点分布,(ii)RNA 特征之间的覆盖率分析,(iii)转录起始/终止位点附近的位点分布,(iv)翻译起始/终止位点附近的位点分布,(v)剪接连接位点周围的位点分布,(vi)修饰基因与其他基因之间的基因特征比较,(vii)翻译起始/终止位点和转录起始/终止位点周围的修饰位点热图,(viii)mRNA的元基因分析,(ix)修饰基序富集分析和(x)功能富集分析。
 
1. 新建 RNAmod 任务
为了方便具有不同分析要求的用户,RNAmod 的 Web 服务器提供了三个功能模块,包括单个分析,组分析和基因分析。
 
单个分析模块允许用户注释单个样品的 RNA 修饰。组分析模块允许用户注释和比较两个样本甚至更多分组之间的 RNA 修饰分布。此外,RNAmod 考虑到用户需要了解特定基因或一组基因(例如翻译下调基因,细胞周期基因或神经发育基因)的修饰位点分布和修饰基因特征的情况,可以使用基因分析模块通过允许用户输入特定的基因组来实现此目标。
图2 (图片来源:RNAmod官网)
 
RNAmod 使用常用的 BED 格式 mRNA 修饰的染色体位置信息作为输入,可以使用常用的峰值查找(peak-calling)工具(如 MACS、exomepeak 和 MetaTeak)生成,也可以很容易地从其他文本格式转换过来。
 
图3 BED格式(图片来源:RNAmod官网)
 
RNAmod 还为用户提供几个自定义参数来细化 mRNA 的特征查找。(1)邻近区域长度(上游和下游),可用于定义转录位点/末端位点的基因组区域以及翻译起始/终止位点和剪接位点的转录本区域。(2)可划分基于基因特征进行覆盖图和 mRNA 元基因分析的区域数(箱)。(3)控制基因表达曲线形状的参数。(4)GO 富集基序识别中基序的长度。此外,RNAmod 允许用户提交一组基因来定义用于进行功能注释的修饰基因子集。在组分析模块下,RNAmod 还将提供一个附加参数来控制是否在注释中使用每个组中的交集或并集。
图4(图片来源:RNAmod官网)
 
为了加快上传速度,建议用户以.gz 或.zip 格式提交压缩的 BED 文件。提交数据后,数据分析系统为用户提供一个由 16 个随机字符组成的 ID 以用于检索结果。组分析模块支持以下两种类型的输入:BED 格式文件或单个分析的任务 ID。在基因分析模块中,要求用户输入单个分析或组分析任务 ID 以及基因列表
 
图5(图片来源:RNAmod官网)
 
2. 输出结果
RNAmod 的输出结果包括:
(1)不同基因特征的修饰位点箱分布的总体统计数据,包括启动子,5’UTR(UTR5),CDS,3’UTR(UTR3),终止密码子,内含子和基因间区域。Y 轴表示峰/位点的频率,而 X 轴表示不同的基因特征。柱状条上的数字表示根据基因特征分布的峰/位点数量。可以三种不同的形式显示图:普通柱状图,倒置柱状图和极坐标图,并且可以 PNG,JPEG,PDF 和 SVG格式导出图片。
 
图6(图片来源:RNAmod官网)
 
(2)不同基因生物型(biotypes)如蛋白质编码基因、lncRNA、假基因、rRNA 和 miRNA的 RNA 修饰位点分布的总体统计结果。Y 轴表示峰/位点的频率,而 X 轴表示不同的基因生物型。条上的数字表示根据基因生物型分布的峰/位点的数量。该图可以三种不同形式显示:普通柱状图,倒置柱状图和饼形。
 
图7(图片来源:RNAmod官网)
 
(3)覆盖不同 mRNA 特征的修饰位点箱的覆盖图。将每个特征基因分成大小相等的箱(bin,默认为 100)。长度阈值的值等于箱数目。计算在每个箱中分布的站点箱的数量,然后计算所有相应特征之间的平均覆盖率。X 轴表示箱(5’→3’方向),而 Y 轴表示平均覆盖率。在图中,色带代表平均覆盖率,而色带厚度显示 95%置信区间(±标准误差的 1.96 倍)。
 
图8(图片来源:RNAmod官网)
 
(4)转录起始位点和翻译终止位点周围修饰位点箱的覆盖图。每个位置的站点箱值数在邻近区域(上游和下游,默认为 1000 bp)周围进行计数。然后针对所有基因计算该位置的平均覆盖深度。X 轴表示位点周围的核苷酸位置(5’→3’方向),而 Y 轴表示平均覆盖深度。在图中,色带代表平均覆盖率,而色带厚度显示 95%置信区间(±标准误差×1.96)。
图9(图片来源:RNAmod官网)
 
(5)翻译起始站点(TSS)和翻译终止站点(TES)周围修饰位点箱的覆盖图。在转录物上 TSS / TES 的侧翼区域(上游和下游)周围对每个核苷酸位置的位点的箱进行计数。然后计算所有基因的平均覆盖深度。X 轴表示位点周围的核苷酸位置(5’→3’方向),而 Y 轴表示平均覆盖深度。在图中,色带代表平均覆盖率,而色带厚度显示 95%置信区间(±标准误差×1.96)。

图10(图片来源:RNAmod官网)
 
(6)5’拼接(splice)位点和3’拼接位点周围修饰位点箱的覆盖图。为分析拼接站点周围的覆盖范围,计算了每个位点的站点箱值数。然后,针对所有基因计算特定位点的平均深度覆盖率。X 轴表示剪接位点周围的核苷酸位置(5’→3’方向),而 Y 轴表示平均覆盖深度。在图中,色带代表平均覆盖率,而色带厚度显示 95%置信区间(±标准误差×1.96)。

图11(图片来源:RNAmod官网)
 
(7)mRNA 元基因(metagene)图。在排除具有比特定长度短的任何 mRNA 特征(5’UTR,CDS 和3’UTR)的基因后,将每个 mRNA 特征分成大小相等的条带(默认为 100 条)。长度阈值的值等于箱数。计算每个箱中分布的站点箱值数。然后,计算所有基因之间每个箱中的平均覆盖率。绿色,黄色和蓝色的矩形分别代表 5’UTR,CDS 和 3’UTR。Y 轴表示覆盖率的密度分布。

图12(图片来源:RNAmod官网)
 
(8)具有 mRNA 修饰的基因和其他背景基因之间的特征统计。在三个图中(从左到右)的 Y 轴分别表示长度,GC 含量和最小自由能(MFE)。蓝色条和黑色条分别代表修饰的基因和其他背景基因。

图13(图片来源:RNAmod官网)
 
(9)通过 Homer 软件检测到 RNA 修饰位点富集的基序。显示了富集基序的 seqLogo 图(默认为前 5 个),其中徽标使用字母表示比对列,每个堆叠列的高度与该位点的序列保守性成比例。

图14(图片来源:RNAmod官网)
 
(10)转录起始/终止位点(基因组区域)周围修饰位点箱的热图。X 轴代表位点周围的核苷酸位置(5′→3′方向),而 Y 轴代表所有修饰的基因,其按每个基因中修饰的数目排序。

图15(图片来源:RNAmod官网)
 
(11)翻译起始/终止位点(转录区域)之间的修饰位点的热图。X 轴代表位点周围的核苷酸位置(5′→3′方向),而 Y 轴代表所有修饰的基因,其按每个基因中修饰的数目排序。

图16(图片来源:RNAmod官网)
 
(12)基因本体(GO)功能富集的修饰基因。条形图中显示了前 12 个富集的术语。条形图中的 Y 轴表示 GO 术语中的基因数量。色阶表示富集 p 值。一张表中包含三个 GO 域中所有富集的术语(生物学过程,细胞成分和分子功能)。图片空白则表示该 GO 域没有明显富集的术语。

图17(图片来源:RNAmod官网)
 
(13)修饰基因的功能途径富集,检索了包括 KEGG,Reactome 途径,疾病本体论,癌症基因网络,DisGeNET 疾病基因库和 MSigDB 功能基因库中的癌症模块基因库,致癌特征基因和免疫特征基因库等权威数据库。条形图中显示了最丰富的 12 条途径。条形图中的 Y 轴表示相应途径类别中的基因数。色阶表示富集 p 值。所有途径中的所有富集途径都包含在一张表中。

图18(图片来源:RNAmod官网)
 
(14)包含修饰位点基因的详细列表。基因信息包括转录本 ID,基因符号和基因生物型(gene_type)。点击 JBrowse 图标可以将这些基因中的修饰与 JBrowse 中的已知修饰和 RBP 结合位点进行比较,然后单击 transcript_ID 以在 Ensembl 数据库中显示详细的基因信息。

图19(图片来源:RNAmod官网)
 
(15)修饰位点箱的详细注释列表。基因信息包括转录本 ID,基因符号,基因生物型(gene_type)和在相应基因上的位置。

图20(图片来源:RNAmod官网)
 
(16)Jbrowse 显示已知的修饰位点和 RBP 结合位点,并可用于分析和比较 RNA 修饰。JBrowse 集成了已知 RNA 修饰和超过 500 个 RBP 的结合位点的上下游(context)中 RNA 修饰的可视化结果,显示包括基本基因组信息,RNA 修饰位点和 RBP 结合位点的信息。

图21(图片来源:RNAmod官网)
 
RNAmod 功能那么强大而且丰富,快去试试吧!
 
RNAmod 官网:https://bioinformatics.sc.cn/RNAmod
 
参考文献:Qi Liu, Richard I Gregory, RNAmod: an integrated system for the annotation of mRNA modifications, Nucleic Acids Research (IF=11), Volume 47, Issue W1, 02 July 2019, Pages W548–W555, https://doi.org/10.1093/nar/gkz479
工具介绍

4miRs:航母级miRNA数据库

2020-8-28 5:12:24

工具介绍

SurvivalMeth:研究甲基化预后的利器

2020-8-30 0:03:01

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索