coloc_prepare_ukbppp.Rdcoloc共定位分析的QTLs数据准备,ukb-ppp2023来源
coloc_prepare_ukbppp(
file_path = "",
snp_annotation_path = "",
pos_col = "POS19",
gene_chr = 1,
gene_start = 0,
gene_end = 0,
up_num = 1e+06,
down_num = 1e+06,
out_path = "./",
out_prefix = "ukbppp"
)ukb-ppp的蛋白中,用于进行共定位分析的蛋白数据,需要指定基因所在染色体的数据,如discovery_chr19_A1BG_P04217_OID30771_v1_Inflammation_II.gz
ukb-ppp的snp注释数据,这里是txt,需要指定基因所在染色体的数据,如olink_rsid_map_mac5_info03_b0_7_chr19.txt.gz
ukb-ppp的snp注释数据中,提供了POS38和POS19,默认为POS19
用于共定位分析的蛋白,其编码基因所在的染色体
用于共定位分析的蛋白,其编码基因所在的染色体的碱基起始位置
用于共定位分析的蛋白,其编码基因所在的染色体的碱基结束位置
指定基因起始位置的上游碱基数量
指定基因结束位置的下游碱基数量
指定输出文件的目录
指定输出文件的前缀,默认为ukbppp
输出共定位分析标准文件
temp <-Ensembl_GRCh37[Ensembl_GRCh37$gene_name =="A1BG",]
coloc_prepare_ukbppp(
file_path = "./data/discovery_chr1_A1BG_P04217_OID30771_v1_Inflammation_II.gz",
snp_annotation_path = "./data/ukbppp_rsid_maps/olink_rsid_map_mac5_info03_b0_7_chr1_patched_v2.tsv.gz",
gene_chr = temp$seqnames,
gene_start = temp$start,
gene_end = temp$end,
pos_col = "POS19"
)