玩转qPCR系列:完备的基因信息是必要的

       前面两期详细讨论了反转录反应,事实上,这是整个RT-qPCR反应中最大的不确定因素,况且,它的variation是可以传递到下游的qPCR中的。所以,对这一步再怎么小心谨慎都不为过。

       本期介绍基因信息的提供,这往往是qPCRer最轻视的地方,也包括曾经的我在内。但,如果想让投出的文章更快的接收,或者自己的实验能被后来者更好的重复,那么,是时候改观了。

 

基因本身的信息

       同人一样,基因也有自己的名字和“身份证号”,比如我们常用的人的内参基因β-actin,但事实上这并不是正规的叫法,而是写作ACTB或者actin beta,这在NCBI上可以查询的到(Fig 1中绿框所示)。qPCR技术需要规范化统一化的写法或者叫法,比如早先的Ct值应改为Cq值,在含义上也更容易理解(Cycle of quantification)。基因的“身份证号”也是基因唯一的标识,但在不同数据库中表示方式是不一样的,常用的是Entrez Gene ID和GeneBank Accession Number。前者是一个具体的数字,比如ACTB是60(Fig 1红框所示);后者一般是2个大写字母再加6个数字,小数点后面是信息更新后的版本号,比如ACTB是NC_000007.14。备注基因信息时通常两者都是可以使用的。

Figure 1. NCBI中人的ACTB基因信息

      上面论述是以DNA为例,如果要做常规的基因表达,那么靶标就是转录物,如mRNA等,它们同样也有对应的“身份证号”。值得注意的是,同一基因可能对应不同的转录物,这是由于RNA前体经过可变性剪接才会变成成熟RNA,也是生物多样性的重要来源。这时如果存在可变性剪接,那么要注明靶标是其中哪一种剪接体。

扩增子信息

       基因信息只是提供了一个大概的分析范围,但具体的设计还需要扩增子信息。扩增子的长度信息是必须要提供的,其在靶标中的位置信息是建议提供的。之前讲过qPCR的扩增子长度一般在100-200 bp为宜,这是可能的引物二聚体和扩增效率之间的一个权衡。如果靶标是DNA,那么位置的可选余地就相对比较大,主要考虑避开容易发生非特异性扩增的区段即可,下面会讲到。如果靶标是RNA,就要根据反转录引物策略来决定(上一期讲过)。同时,之前讲引物探针设计时也提到,尽可能采用扩增子跨内含子区段的方式来设计位置,可以最大程度避免gDNA的干扰。

       最后,无论是DNA还是RNA,扩增子都要避开高级结构的位置,否则反转录和qPCR的效率都会大大降低。因此,核酸序列的高级结构分析也是一个重要工作。有很多网站提供在线分析,其算法都大同小异,如RNAfold Webserver等。

特异性分析

       这个工作做得好,会极大的节省后面验证工作的时间和精力。特异性分析就是评估你选择的扩增子区段在其他位置会不会也有有高度相似的序列,比如假基因、反转假基因等,这些丧失功能(目前是这样认知的)的区段都会造成分析的特异性下降,因此需要将其找出来并避开。这个工作在NCBI提供的BLAST模块就可以完成,当然使用软件也是可行的。这些教程网上很多,在此不再赘述。

 

       本期涉及的工作相对少一点,绝大部分都可以通过生物信息学分析来完成。我比较遗憾的就是之前上学时没有重视生物信息学,觉得掌握生物学的基础理论就行。Sequenceblast、assembly、alignment等,连半吊子都算不上,所以现在NGS数据分析学起来就很吃力。这也算是给大家的一个小忠告吧。

       下一期介绍引物和探针信息的相关内容,敬请期待!

基础实验

方法论:新冠大流行 Sherlock技术能否依旧神勇

2020-8-14 22:22:01

基础实验

玩转qPCR系列:引物与探针信息

2020-8-14 22:22:38

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索