寻找代理snp,基于1000基因组项目数据

Usage,
get_proxy_snp_from_g1000(
  search_snps = "",
  plink_exe = get_plink_exe(),
  bfile = NULL,
  ld_r2 = 0.8,
  ld_kb = 1000,
  ld_nsnp = 5000,
  ld_maf = 0.01,
  out_path = "./",
  out_prefix = "proxy_snp"
)

参数

search_snps

需要寻找代理snp的rsid,如"rs10947332"

plink_exe

plink,默认内置最新plink工具。

bfile

bfile指定参考文件的位置

ld_r2

代理snp与缺失snp的r2满足的条件,默认是0.8。

ld_kb

指定寻找代理snp的染色体范围,用以找代理snp,默认是1000kb。 默认值参考https://www.cog-genomics.org/plink/1.9/ld#r,默认值为1Mb, 只对距离在1Mb之内的SNP位点进行分析。

ld_nsnp

ld_nsnp默认值为5000,这个参数限定了一个SNP位点最多和5000个其他的SNP位点进行LD分析。 默认值是参考gwasvcf::query_gwas进行设定。

ld_maf

代理snp的maf满足的条件,默认是0.01。

out_path

输出文件的路径,默认是当前工作路径"./"。

out_prefix

输出文件的前缀,默认是"proxy_snp"。

代理snp数据文件

Examples

get_proxy_snp_from_g1000(search_snps = c("rs10947332","rs17211657"),
                         bfile =  "./data/1kg.v3/1kg.v3/EUR",
                         out_path = "./",
                         out_prefix = "proxy_snp")