UKB-PPP pQTL数据的下载与分析

360影视 2024-12-27 00:06 4

摘要:最近有很多粉丝问题到如何下载UKB-PPP pQTL数据、如何分析?现在来看看这个问题,首先我们可以百度一下UKB-PPP pQTL找到下载的网址,具体如下:http://www.synapse.org/Synapse:syn51364943/wiki/622

最近有很多粉丝问题到如何下载UKB-PPP pQTL数据、如何分析?现在来看看这个问题,首先我们可以百度一下UKB-PPP pQTL找到下载的网址,具体如下:http://www.synapse.org/Synapse:syn51364943/wiki/622119

需要用邮箱注册一个账号,然后登录进去,点击Files就可以进入如下的界面就可以找到了下载的地方:

自己可以下载自己需要的pqtl数据,也可以全部下载来,不过全部下载下来是比较困难的,因为这里有2940个文件,搞下来就高达2T数据,没有稳定的、高速的网络根本行不通。

UKB-PPP pQTL数据非常不友好,下载下来是不能直接分析的,因为数据按照染色体分开存放的,更惨的就是没有提供rs开头的SNP ID,根本没有办法分析。

既然下载好的数据是分开的,又没有SNP ID,想进行数据分析必须进行数据合并和SNP ID转换,这个就麻烦了,因为这些操作需要大量的硬盘空间、强大的CPU、内存,普通电脑根本无从下手。

UKB-PPP pQTL数据的缺点和难点:处理成本比较高:1、至少要5T以上的硬盘(普通电脑根本没有这么大的硬盘,需要购买移动机械大硬盘)2、对CPU、内存要求高(普通笔记本吃不消)3、需要服务器、Mac Studio、顶配台式机2940个文件转换ID的时间计算:需要一定的编程能力,同时对电脑配置要求比较高普通电脑:直接冒烟好一点的电脑:转好一个文件(2小时),一共需要5880小时(245天)高端电脑:转好一个文件(1小时),一共需要2490小时(122.45天)大型服务器:转好一个文件(半小时),一共需要1445小时(60.20天)2940个文件的合并、提取cis-pqtl、过滤数据的时间:需要一定的编程能力,同时对电脑配置要求比较高普通电脑:直接冒烟高端电脑或者大型服务器:需要10天左右

最好的就是有专业人士用大型服务器下载和处理好

UKB-PPP pqtl 批量分析UKB-PPP pqtl数据挖掘的应用单纯的MR基本发不了联合其他pqtl、eqtl、批量共定位数据挖掘验证药靶基因的结果作为生信分析或者基础实验的辅助验证国自然课题设计、博士论文课题设计的前期基础

本文只分享下载地址和数据处理思路,剩下的细节问题需要自己进行摸索!

来源:小林看科技

相关推荐