上篇重点讲述了0基础使用R程序包clusterProfiler对数据库中的疾病相关基因进行富集分析,本篇主要带领大家一起学习,找到重要基因之后,如何进行TagSNP筛选。
技术路线
从上篇可以获得重要通路中富集的基因列表,通过基因列表,可以从千人基因组计划的网站下载汉族人群的SNP基因型数据,也可以从NCBI获取基因的物理位置信息,然后在ENSEMBL的VCFtoPED工具下载汉族人群Phase3的基因型数据。这里介绍第2种方法。
基因SNP中国人群数据
1.NCBI获取目的基因物理位置信息登录NCBI网站(