Chip-seq分析流程
卖萌控的博客
点击这里进入电脑版页面!体验更好
Chip-seq分析流程
2022-11-19 萌小白


1618908485779046259.png




流程的一些关键点分析:




1. 质控 (quality control)



首先要看一下ChIP-seq数据的质量,数据的信号最好比background要强很很多。一般要有control,这样call peaks更准确可信, control主要有Input DNA 和 IgG两种,前一种更常用。



检测质量的一些方式:




analysis_2021-04-19_08-49-01.png



2. 序列比对 (mapping of fastq)



序列比对一般用BWA或者Bowtie2,两者效果差不多。我们一般采用Bowtie2,对reads进行基因组进行回帖。



3. 去除重复 (remove duplicates)



由于PCR实验存在不可避免的实验误差,所以会存在重复 (duplicates)。我们一般在Chip-seq中会进行去除。



理论上来讲,不同的序列在进行PCR扩增时,扩增的倍数应该是相同的。但是由于聚合酶的偏好性,PCR扩增次数过多的情况下,会导致一些序列持续扩增,而另一些序列扩增到一定程度后便不再进行,也就是我们常说的PCR偏好性。



这种情况对于定量分析(如ChIP-seq),会造成严重的影响。此外,PCR扩增循环数过多,会出现一些扩增偏差,进而影响后续分析结果的置信度。



4. peak calling



peaks是reads信号比较强的区域,也就是我们找到的转录因子或者组蛋白修饰最有可能结合的地方。call peaks仍然有不少软件,比较常用的是MACS2和Hotspot2。



5. 下游分析 (downstream analysis)



分析完之后下游可以做的事情很多,视情况而定。
可分析Peak的临近注释基因,分布类型情况,及功能注释情况;
或者Homer等工具注释peaks,看不同转录因子/组蛋白修饰之间的关系,或者分析TF的target gene。
或者同时分析RNA-seq、ATAC-seq等数据,看转录因子与染色质开放区的关系;



发表评论:
昵称

邮件地址 (选填)

个人主页 (选填)

内容