hyprcoloc_batch.Rd一种高效的确定性贝叶斯算法,利用GWAS摘要统计数据,可以同时检测大量特征之间的共定位(例如,大约1秒内可以联合分析100种特征)。 代码来源:https://github.com/cnfoley/hyprcoloc
hyprcoloc_batch(
file_paths,
traits = NULL,
chrompos,
binary.outcomes,
snpscores = T,
coloc_plot = T,
posterior_prob = 0.6,
coloc_plot_genome = "hg38",
bfile = "",
plink_exe = get_plink_exe(),
coloc_plot_snp = "common_top_snp",
coloc_plot_width = NULL,
coloc_plot_height = NULL,
coloc_plot_dpi = 500,
out_path = "./",
out_prefix = "hyprcoloc"
)用于共定位分析的输入文件地址,需要是MR的标准输入文件。
gwas文件别名,默认为文件名。如填写,必须与与file_paths一一对应。
染色体区域,一个或多个,形式如:"2:26496839-28523684"
输入GWAS文件对应的性状,如果是二分类记为1,反之则记为0。多个性状需要分开写,如c(1,1,0)。
是否计算snpscores,默认为T。
是否绘图,默认为T。
当进行绘图的时候,需要满足的条件,默认posterior_prob = 0.6,即满足后验概率>0.6,则绘图。
当 coloc_plot = T的时候,提取坐标轴信息的参考基因组信息,默认是hg38。可以是hg37(或37)或者hg38(或38)。
提供bfile文件,在作图过程中计算R2。
plink默认内置最新plink即可。
当 coloc_plot = T的时候,绘图时标注的snp,默认是'common_top_snp',即在两个绘图gwas文件中,满足p值相加最小的一个,即min(p1+p2)对应的rsid。
当 coloc_plot = T的时候,绘图图片的高度,单位是mm。如果未指定(NULL),默认是A4纸的宽度,210mm。
当 coloc_plot = T的时候,绘图图片的宽度,单位是mm。如果未指定(NULL),默认是:60+60*GWAS数量。
绘图图片的像素点,默认是500。一般大于300即可。
输出文件路径
输出文件前缀
data <- hyprcoloc_batch(
file_paths = c(
"hg19_avsnp151_腹主动脉瘤meta-AAAgen-final-sumstat.txt",
"冠心病GCST90132315.h.txt",
"心肌梗死GCST011364.h.txt"
),
traits = c("AAA", "CAD", "MI"),
binary.outcomes = c(1, 1, 1),
chrompos = c("1:55005647-56005647", "10:90502927-91502927"),
coloc_plot = T,
bfile = "E:/data/1kg.v3/EUR",
out_path = "./test/hyprcoloc"
)