coloc共定位分析的QTLs数据准备,ukb-ppp2023来源

Usage,
coloc_prepare_ukbppp(
  file_path = "",
  snp_annotation_path = "",
  pos_col = "POS19",
  gene_chr = 1,
  gene_start = 0,
  gene_end = 0,
  up_num = 1e+06,
  down_num = 1e+06,
  out_path = "./",
  out_prefix = "ukbppp"
)

参数

file_path

ukb-ppp的蛋白中,用于进行共定位分析的蛋白数据,需要指定基因所在染色体的数据,如discovery_chr19_A1BG_P04217_OID30771_v1_Inflammation_II.gz

snp_annotation_path

ukb-ppp的snp注释数据,这里是txt,需要指定基因所在染色体的数据,如olink_rsid_map_mac5_info03_b0_7_chr19.txt.gz

pos_col

ukb-ppp的snp注释数据中,提供了POS38和POS19,默认为POS19

gene_chr

用于共定位分析的蛋白,其编码基因所在的染色体

gene_start

用于共定位分析的蛋白,其编码基因所在的染色体的碱基起始位置

gene_end

用于共定位分析的蛋白,其编码基因所在的染色体的碱基结束位置

up_num

指定基因起始位置的上游碱基数量

down_num

指定基因结束位置的下游碱基数量

out_path

指定输出文件的目录

out_prefix

指定输出文件的前缀,默认为ukbppp

输出共定位分析标准文件

Examples

temp <-Ensembl_GRCh37[Ensembl_GRCh37$gene_name =="A1BG",]

coloc_prepare_ukbppp(
 file_path = "./data/discovery_chr1_A1BG_P04217_OID30771_v1_Inflammation_II.gz",
 snp_annotation_path = "./data/ukbppp_rsid_maps/olink_rsid_map_mac5_info03_b0_7_chr1_patched_v2.tsv.gz",
 gene_chr = temp$seqnames,
 gene_start = temp$start,
 gene_end = temp$end,
 pos_col = "POS19"
)