开启辅助访问 购买速递币 快速注册 找回密码 切换风格

科研速递论坛

876

主题

1

好友

2

积分

登堂入室

Rank: 2

科研币
9
速递币
4174
娱乐币
7307
文献值
23
资源值
0
贡献值
0
跳转到指定楼层
楼主
发表于 2014-11-14 10:41:15 |只看该作者 |倒序浏览
近日,Google正式推出了Google Genomics,这一产品可以让科学家把基因组数据存储在云端,并对DNA序列进行研究和共享。

其实从18个月前,Google就开始着手Google Genomics的建立了,包括会见科学家,以及搭建界面和应用程序接口。凭借这些,Google可以将DNA数据存储在自己的服务器集群上,并利用这些数据进行实验。其中用到的数据库技术与Google索引和用户追踪技术相同。

随着实验室不断引进速度更快的新设备来解码DNA,数据量正在经历一种爆发式的增长。例如马萨诸塞州一家研究所在10月份时,每32分钟就能解析出约等于一个人的基因组的数据,相当于200TB的原始数据。不过,这点数据量和这些互联网公司每天处理的数据相比,还是要小得多——YouTube一天的上传量就相当于该研究所2个月的数据量。

这些超出任何个人的处理能力的海量数据必须要有一个数据中心。美国国家癌症研究所就表示,将斥资1900万美元,把约2.6PB(1PB=1024TB)的癌症基因组图谱上传至Google Genomics和亚马逊的数据中心。这样做的目的在于打造一个“癌症基因组云数据库”,科学家可以借助这一平台,像使用网页搜索一样快捷便利地分享信息和进行模拟实验。

目前,Google Genomics上已经存储了至少3500个来自公共项目的基因组。在Google Genomics存储一个基因组的价格为25美元/年,如果需要对数据进行计算还将额外收取费用。一个人的基因组原始数据大小约为100GB,而经过压缩后将不到1GB,也就是说只需要25美分。

这项技术使得今后医学或将依赖于某种“全球DNA网络”,医生将可以在这个网络中搜索他需要的内容。比如对癌症患者,医生就能对他进行基因测序,然后将他正常细胞和肿瘤细胞的基因组与数据库中的5000万个基因组进行匹配,然后给出最合适的药物。
您需要登录后才可以回帖 登录 | 快速注册

发布主题 !fastreply! 返回列表 官方QQ群

QQ|Translate Forum into English|QQ群:821993|Archiver|手机版|申请友链| 科研速递论坛

GMT+8, 2024-11-30 05:23 , Processed in 0.058482 second(s), 25 queries .

© 2012-2099 www.expaper.cn

!fastreply! 回顶部 !return_list!