2024-02-19 01:27:33

芯片affyPLM质控,是不是不可以同时对存在批间差的几组样本进行操作?

近日在做一个将3个GEO中的数据集(都是同一平台,affymatrix的)进行合并及后续分析的操作。我懂得批间差的概念,预备用Combat函数去批间差。然而经历了预先的尝试的分析,发现有的芯片质量似乎有偏差,看了文献也发现需要做“质控”,于是我就打算用affyPLM做质控。那么问题来了:质控中NUSE图如下,有些样本似乎是在排除的范畴的。但是我看了下比方说最右侧的一群偏离的样本,发现他们是来源于同一个数据集的,那么是不是说不能对存在批间差的样本同时进行affyPLM的质控,而应分每批次进行质控的考量?

image2.png

回答 0 评论
您已邀请来回答问题
生物信息学×

2个回答

不建议这么做。我相信你硬要一起标准化,总是可以使表达量可比的。但是,试考虑:1.不同GEO的实验设计必然不完全相同(处理条件、试剂、剂量,均不尽相同)。整合之后,仍是两组之间检验,合并分析意义何在?2.即使是NC组合并,不同GEO的NC组中细胞条件也不相同,合并会引进系统误差。如果硬要使用多个GEO,可以尝试:1.取分析结果进行比较(取overlap,还是找差异,都可以);2.meta分析。

2024-02-19 01:47:14

看文献,离散比较多的batch(对应的GEO号)会单独的说明,但是分析的时候可以放一起分析。不知你最后是怎么做的呢?其实我也想知道相同平台下,不同批次样本是不是应该先各自质控之后再汇总,还是汇总之后combat去除batch effects?


2024-02-19 01:55:23

你的回答