玩转qPCR系列:数据分析第二关

       上一期介绍了数据分析软件及outlier data的处理,本期介绍的内容是内参基因和normalization方法的选择。

 

内参基因的选择及数量

       首先要提醒大家,这是大部分人做qPCR最容易忽视和犯错的环节之一(Tm优化是另外的之一)!从业的这几年,交流时很少听人说起“我筛了几个稳定的内参来做我的实验”,很多人是不会筛,更多的人是不知道要筛。聊起来他们的理由无非是“我师兄师姐都是这么做的”“文献里都是这么用的”,殊不知可能已“时过境迁”了。事实上,很多本应该“成功”的实验,就耽误在内参的不稳定上,当然也有本不应该“成功”的实验结果“歪打正着”。接下来着重回答两个问题:怎么筛选和用多少。

       首先,得有10个以上候选者基因。当然数量越多,拿到稳定表达内参的可能性就越大,初次试验10-15个是比较合适的数量。这里面可以囊括常用的GAPDH、β-actin等基因,其他的候选者尽量从不同的生物学途径中挑,比如糖酵解途径、三羧酸循环及脂肪酸合成等,这样做的目的就是“广撒网”,毕竟谁也无法预知处理因素到底会影响哪些途径。比如研究的是某个肿瘤组织的基因表达情况,那Table1就是可能的候选者列表之一。

       其次,对照组和实验组均有10个以上代表性样本。数量太少则很难反映群体的平均表达量,可能会导致后续计算出现偏差。比如研究小鼠肝组织的基因表达,可以各选取10只小鼠分别作为对照和实验组,同时每只小鼠不同部位的肝组织各取一次样,这相当于一共40个sample。要注意的是,尽可能使得每次取样量保持一致,比如都取10 mg组织进行核酸提取。虽然这对后续计算过程影响不大,但还是应该尽量避免引物不必要的变异。

       最后,你会拿到一大堆Cq值,40 samples x 10 candidates=400 data points,接下来要以每个基因内的最大表达量的样本为参照,计算其他样本的相对表达量RE。目前,能做内参基因筛选的软件有很多,常用的第三方软件比如GeNorm、BestKeeper和NormFinder,Bio-Rad提供的厂家软件CFX Maestro也可以实现此功能。数据分析的原理都是计算成对变异系数paired SD及稳定系数M[1]M值越小表示内参越稳定。Figure 1是以5 samples x 5 candidates为例展示的计算过程。

Figure 1. 5 x 5数据阵的M值计算方法

        一般而言,M值小于0.5就认为是比较稳定的,可以任意选择一个作为内参;介于0.5到1.0之间则不太稳定,但是如果没有更合适的可选,那么选择三个同时作为内参基因也是可以接受的;大于1.0则认为是表达不稳定的,不能作为内参。表达是否稳定仅针对特定实验,因此如果实验条件或者处理因素发生了变化,就需要重新筛选。

       说一点题外话,计算M值来判断表达是否稳定,其设计原理在数学上并非是“无懈可击”的,它基于的假设前提是所有基因候选者的变化趋势是随机的,也就是有些基因表达上调了,有些维持不变,有些则下调,且上调或者下调的幅度也是随机的。如果出现一种“极端情况”,只有一个基因前后表达是稳定的,但其他的基因都是表达上调,且上调程度都保持一致,那么表达稳定的基因其M值反而是最大的。但不管怎样,作为一种robust and reasonable的方法,M值仍然是应用最广泛的。    

Normalization

       在之前的推送文章“玩转qPCR系列 | 定量:绝对的还是相对的?(二)”中,对不同的normalization方法有过介绍,详细的汇总见Figure 2。文章中要对使用的normalization方法进行详细描述。

Figure 2. 不同Normalization Method及其适用条件

 

  下一期推送我们将讨论生物学重复和技术学重复。

 

参考文献

1.    Vandesompele, Jo, et al. “Accuratenormalization of real-time quantitative RT-PCR data by geometric averaging ofmultiple internal control genes.” Genome biology 3.7 (2002):research0034-1.

基础实验

玩转qPCR系列:数据分析第一关

2020-8-14 22:26:56

基础实验

细胞划痕实验经验总结

2020-8-14 23:05:44

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索