一种高效的确定性贝叶斯算法,利用GWAS摘要统计数据,可以同时检测大量特征之间的共定位(例如,大约1秒内可以联合分析100种特征)。 代码来源:https://github.com/cnfoley/hyprcoloc

Usage,
hyprcoloc_batch(
  file_paths,
  traits = NULL,
  chrompos,
  binary.outcomes,
  snpscores = T,
  coloc_plot = T,
  posterior_prob = 0.6,
  coloc_plot_genome = "hg38",
  bfile = "",
  plink_exe = get_plink_exe(),
  coloc_plot_snp = "common_top_snp",
  coloc_plot_width = NULL,
  coloc_plot_height = NULL,
  coloc_plot_dpi = 500,
  out_path = "./",
  out_prefix = "hyprcoloc"
)

参数

file_paths

用于共定位分析的输入文件地址,需要是MR的标准输入文件。

traits

gwas文件别名,默认为文件名。如填写,必须与与file_paths一一对应。

chrompos

染色体区域,一个或多个,形式如:"2:26496839-28523684"

binary.outcomes

输入GWAS文件对应的性状,如果是二分类记为1,反之则记为0。多个性状需要分开写,如c(1,1,0)。

snpscores

是否计算snpscores,默认为T。

coloc_plot

是否绘图,默认为T。

posterior_prob

当进行绘图的时候,需要满足的条件,默认posterior_prob = 0.6,即满足后验概率>0.6,则绘图。

coloc_plot_genome

当 coloc_plot = T的时候,提取坐标轴信息的参考基因组信息,默认是hg38。可以是hg37(或37)或者hg38(或38)。

bfile

提供bfile文件,在作图过程中计算R2。

plink_exe

plink默认内置最新plink即可。

coloc_plot_snp

当 coloc_plot = T的时候,绘图时标注的snp,默认是'common_top_snp',即在两个绘图gwas文件中,满足p值相加最小的一个,即min(p1+p2)对应的rsid。

coloc_plot_width

当 coloc_plot = T的时候,绘图图片的高度,单位是mm。如果未指定(NULL),默认是A4纸的宽度,210mm。

coloc_plot_height

当 coloc_plot = T的时候,绘图图片的宽度,单位是mm。如果未指定(NULL),默认是:60+60*GWAS数量。

coloc_plot_dpi

绘图图片的像素点,默认是500。一般大于300即可。

out_path

输出文件路径

out_prefix

输出文件前缀

Examples

data <- hyprcoloc_batch(
  file_paths = c(
    "hg19_avsnp151_腹主动脉瘤meta-AAAgen-final-sumstat.txt",
    "冠心病GCST90132315.h.txt",
    "心肌梗死GCST011364.h.txt"
  ),
  traits = c("AAA", "CAD", "MI"),
  binary.outcomes = c(1, 1, 1),
  chrompos = c("1:55005647-56005647", "10:90502927-91502927"),
  coloc_plot = T,
  bfile = "E:/data/1kg.v3/EUR",
  out_path = "./test/hyprcoloc"
)