ATAC-Seq剖析教程系列
ATAC-Seq剖析教程:ATAC-seq的布景介绍以及与ChIP-Seq的异同
ATAC-Seq剖析教程:原始数据的质控、比对和过滤
ATAC-Seq剖析教程:用MACS2软件call peaks
ATAC-Seq剖析教程:对ATAC-Seq/ChIP-seq的质量评价(一)phantompeakqualtools
ATAC-Seq剖析教程:对ATAC-Seq/ChIP-seq的质量评价(二)ChIPQC
ATAC-Seq剖析教程:重复样本的处理-IDR
ATAC-Seq剖析教程:用ChIPseeker对peaks进行注释和可视化
ATAC-Seq剖析教程:用网页版工具做功能剖析和motif剖析
ATAC-Seq剖析教程:差异peaks剖析——DiffBind
ATAC-Seq剖析教程:ATAC-Seq、ChIP-Seq、RNA-Seq整合剖析
ENCODE评价数据质量采用多种目标,如前面已经评论过的链相关的目标NSC和RSC。这一节将会评论评价信号散布的其他目标。
NOTE:这里给出的评价目标仅仅反映数据质量的好坏,契合阈值的并不意味着试验是成功的,不契合阈值的也不一定意味着失利。
SSD值是对富集作用的评价。SSD值依赖于全基因组的pile-up信号强度,对实在的ChIP富集和搅扰的强信号区域都很灵敏。SSD值越大标明富集越好。
“It
provides a measure of pileup across the genome and is computed by
looking at the standard deviation of signal pile-up along the genome
normalised to the total number of reads. ”
FRiP表示的是peaks中的reads与总reads的份额。它是另一个反映样本富集作用或IP好坏的评价目标。能够理解为是“信噪比”即文库中结合位点片段占布景reads的份额。一个典型质量好的TF富集FRiP值约5%或许更高,polII的FRiP值约为30%或许更高,也有一些质量好的数据FRiP值<1%(如RNAPIII)
REGI是对peaks在不同基因组特征位点散布的计算。
过滤人工形成的高信号区域非常重要,如ENCIDE和modENCODE提供的DAC
Blacklisted Regions
track。这些区域经常在特定的重复序列处出现,如着丝粒、端粒、卫星重复序列等,经过简单的比对过滤是不能去除的。来自blacklisted
regions的信号会形成call peak 和片段长度评价的混淆。
RiBL值能够表示布景信号或input的信号水平,与input sample的SSD值以及input和ChIP sample的读长掩盖值相关。这些区域通常是基因组的0.5%,或许更高的份额(10%)。
ChIPQC是一个Bioconductor包,输入文件包含BAM和peak文件,能够主动计算一些质量评价值,并发生质量陈述。
~/ngs_course/chipseq/results/bowtie2
移动到自己的目录文件夹data/bams
~/ngs_course/chipseq/results/macs2
移动到自己目录下data/peakcalls
source(\"http://bioconductor.org/biocLite.R\")
biocLite(\"ChIPQC\")
ChIPQC只需求三步就能够完成质量评价和陈述生成。
## Load libraries
library(ChIPQC)
## Load sample data
samples <- read.csv(\'meta/samplesheet_chr12.csv\')
View(samples)
## Create ChIPQC object
chipObj <- ChIPQC(samples, annotation=\"hg19\")
## Create ChIPQC report
ChIPQCreport(chipObj, reportName=\"ChIP QC report: Nanog and Pou5f1\", reportFolder=\"ChIPQCreport\")
ChIPQC生成的成果包含一个网页陈述和陈述中含有的一切图片。
网页陈述有三部分:QC Summary ;QC Results;QC files and versions
Total Dup%-Percentage of all mapped reads which are marked as duplicates.
Pass MapQ Filter%-Percentage of all mapped reads whichpass MapQ quality filter
Pass MapQ Filter and Dup%-Percentage of all reads which pass MapQ filter and are marked asduplicates.
Figure 1展示了reads在blacklists中的份额,
Figure 2是用基因组注释出现了reads在基因组特征方位如启动子的散布。这幅图里显现在启动子区域富集最显着。