coloc_batch_gwas.RdGWAS数据(非QTLs数据),结合疾病GWAS数据,可一次性批量完成多个GWAS和疾病GWAS的共定位分析。 注意,用于批量共定位分析的GWAS数据的研究性状需保持一致,如连续性性状,且对应的样本数量应保持一致。 如不能满足该条件,建议重复执行该代码。
coloc_batch_gwas(
gwas_path1 = NULL,
trait1 = NULL,
gwas_path2 = NULL,
trait2 = NULL,
exp_p = 5e-08,
up_num = 50000,
down_num = 50000,
clump = T,
clump_kb = 10000,
clump_r2 = 0.001,
chrompos = NULL,
prepare_method = 1,
type1 = "quant",
SS1 = 0,
NC1 = 0,
type2 = "quant",
SS2 = 0,
NC2 = 0,
snp_deduplication_by = "maf",
run_coloc_susie = F,
plink_exe = get_plink_exe(),
bfile = "",
coloc_plot = T,
coloc_plot_pph4 = 0.6,
coloc_plot_genome = "hg37",
coloc_plot_snp = "common_top_snp",
coloc_plot_width = NULL,
coloc_plot_height = NULL,
coloc_plot_dpi = 500,
out_path = "./"
)分析中用到的GWAS文件,为经过处理的MR分析标准输入文件。可以是一个,或者多个输入文件。
gwas1作图性状名,如有多个gwas文件需要一一对应
指定疾病或者其他性状GWAS数据的文件地址,该文件必须是经过处理的MR分析输入标准文件
gwas2作图性状名
与第一个GWAS研究被参考,选择与GWAS显著相关的snp,默认为p<5e-8。
指定top snp的上游碱基范围,一般默认是top snp上下游50kb(50000)碱基范围。
指定top snp的下游碱基范围,一般默认是top snp上下游50kb(50000)碱基范围。
是否进行clump处理,选择独立显著的snp,默认为T。
当clump = T,默认clump_kb = 10000。
当clump = T,默认clump_r2 = 0.001。
如指定共定位区域,不在进行自动选择共定位区域。提取数据的特定区域SNPs数据,如2:26496839-28523684
用于准备coloc分析和coloc作图数据的方法,1或者2,默认1。 方法1是按照染色体区域进行选择SNP,需要满足GWAS1与GWAS2的参考基因组版本均为hg19或者hg38; 方法2是按照SNP的rsid选择SNP,以GWAS1的染色体坐标为参考,不使用GWAS2的chr和pos信息。
GWAS1研究的数据类型,可以是数量性状"quant",也可以是二分类性状"cc"。
GWAS1研究中的样本总数。SS是sample size的缩写.
如果GWAS1研究是二分类性状,需要提供病例的数量。NC是ncase的缩写。
GWAS2研究的数据类型,数量性状"quant"或二分类性状"cc",默认为“cc”。
GWAS2研究中的样本总数。SS是sample size的缩写。
如果GWAS2研究是二分类性状,需要提供病例的数量。NC是ncase的缩写。
如果snp的rsid存在重复,按照"pval"或者"maf"去重。 如果按照"pval"去重,则保留pval最小的一个;按照"maf"去重,则保留maf最大的一个。默认按照"maf"去重。
是否进行coloc.susie共定位分析,默认F。
plink默认内置最新plink即可。
如果run_coloc_susie=T,需要提供bfile文件,如z:/data/G1000/1kg.v3/1kg.v3/EUR
是否绘制coloc共定位的图,包括coloc_plot_locuscompare和coloc_plot_stack_assoc,默认为T。
当coloc_plot = T的时候,共定位分析中pph4达到多少的时候可绘制coloc共定位图,默认是0.6。
当coloc_plot = T的时候,提取坐标轴信息的参考基因组信息,默认是hg37。可以是hg37(或37)或者hg38(或38)。
当coloc_plot = T的时候,绘图时标注的snp,默认是'common_top_snp',即在两个绘图gwas文件中,满足p值相加最小的一个,即min(p1+p2)对应的rsid。 可以是'common_top_snp',或'top_snp'。'top_snp'指的是,在两个gwas数据中,分别是p值最小的top snp。
当coloc_plot = T的时候,绘图图片的宽度,单位是mm。如果未指定(NULL),默认是A4纸的宽度,210mm。
当coloc_plot = T的时候,绘图图片的宽度,单位是mm。如果未指定(NULL),默认是:60+60*GWAS数量。
绘图图片的像素点,默认是500。一般大于300即可。
指定输出文件的目录
输出共定位分析结果文件
coloc_batch_gwas(
gwas_path1 = c("./data_clean/GCST90200392_buildGRCh38.txt",
"./data_clean/GCST90199989_buildGRCh38.txt.gz",
"./data_clean/GCST90200343_buildGRCh38.txt",
"./data_clean/GCST90199735_buildGRCh38.txt.gz"),
gwas_path2 = "./data_clean/30598549-GCST006979-EFO_0009270.h.txt",
bfile = "./1kg.v3/EUR",
type1 = "quant",
SS1 = 8128,
type2 = "quant",
NC2 = 426824)