2021-09-17 10:23:00

R语言中如何采用Pearson法筛选DEGs?

假如样本分为两组:实验组1234(n=4),对照组5678(n=4);数据为基因芯片数据,已进行normalized。那么,我应该对一个基因A的实验组和对照组进行Pearson corelation analysis,如果得到的PCC>0.9,则此基因为DEG。问题1:以上思路是否有误?问题2:实验室和对照组各有4个样本,我应该选择哪两个样本进行pearson分析?问题3:用R语言,应该用哪个package?是否有专门用于基因芯片的pearson分析的R包?还是直接用cor.test(a,b,method="pearson")就可以?求大神解答,如果能分享一下R代码就更好了!谢谢大神!


回答 0 评论
您已邀请来回答问题
生物信息学×

5个回答

问题1: 为什么不直接用t-test? PCC>0.9 说明基因A在实验组和对照组的表达很相近,怎么会是DEG呢?

问题2:选择两个样本进行pearson,是要看样本之间整体的基因表达相似度吗?问题3:cor.test就可以extra confusion about your questions.


2021-09-17 11:03:51

根据你提供的文献描述,是先进行了差异表达分析,然后进行了Co-expression network 分析。既然你已经做了差异表达了,下面用差异基因做共表达就可以了,用所有涉及的样本。


2021-09-17 11:09:26

  1. 使用cor.test就可以,

  2. 要用这个,你要知道向量的概念,用 all selected samples 构建每个DEG的向量,然后两两求相关。



2021-09-17 11:11:45

  1. 从你提供的这部分文字中可以看到,Gene co-expression network analysis was performed by ....

  2. 假设是筛选DEG,那就是为了去除样本间波动较大的DEG,如果实验组和对照组不是paired samples, 这样做意义不大。



2021-09-17 11:11:48

统计分析后,一般得到的是差异表达基因。我觉得作者这里用的是基因共表达分析,这个是在找Module的,不是找差异基因的吧?

2021-09-17 11:17:37

你的回答