解析公共基因组数据污染源及解决方案-技术前沿-资讯-生物在线

解析公共基因组数据污染源及解决方案

作者:北京三博远志生物技术有限责任公司 2011-02-24T00:00 (访问量:7708)

目前,在对全球科学家开放的公共基因组数据库中,约有1/5的植物、细菌、和非灵长类动物的基因组数据受到了人类基因不同程度的污染!

【污染来源:】

1、污染风险潜藏在每个测序环节,基因组数据被污染,很可能在样品处理时就开始了。为了获取足够量的测序样本,各实验室首先会对极少量的被测物种基因进行扩增,方法之一是利用大肠杆菌等细菌对基因样品做扩增培养。尽管培养要求在洁净环境中进行,但倘若操作不当,作为培养基的细菌就有可能“趁隙”混入样品。

2 另一种被称为“PCR”的核酸扩增技术完全依靠人工操作,污染来源更多:有可能是空气中的细菌落到了样品中,也可能是灭菌后仍残留在试剂中的基因片段,但最常见的污染源可能是科学家自身,比如在扩增前,实验者的一个细胞飘进了样品里。虽说肉眼看不见,但人无时无刻不在散布自己的DNA,一个触摸、一次呼吸都有可能破坏测序样品的纯度

【解决方案:】

1、研究人员应该严格要求自己

事实上,污染可能在测序的任何一个环节发生。因此,研究人员戴手套、口罩进行实验操作不仅是对自身的保护,也可避免样品受到自身的污染。可如此简单的操作规程并未被许多实验人员放在心上。当基因测序成为生命科学研究中的家常便饭,不少研究者的操作也变得随意,不拘小节恰是潜伏在人们心中的污染源。

2、递送者是截污的第一张“滤网”

无孔不入的细菌,悬浮于空气中的唾沫星子,这些防不胜防的外源基因似乎意味着,基因测序不可能做到100%零污染。其实相当部分被污染的数据其实可以被过滤掉。在向公共基因组数据库递送数据之前,会将测序结果与计算机中庞大的数据库做比对。过滤污染的过程就像是用软件扫描,而递送者最清楚整个过程中有可能插入的外源基因,由此选择合适的“软件”。严格的实验设计可“堵截”部分污染。DNA由双链组成,严谨的科学家会对两链分别测序而后相互验证。

如果首道过滤关口没有把牢,那么随后还有第二和第三张“滤网”。公共基因组数据库管理者尽管面对呈几何级数增长的海量数据,但始终有责任过滤并校正来自世界各国的原始数据,最起码应标记污染,以提醒数据使用者当心“陷阱”。

3、能否借鉴古DNA研究规范

从采样开始,古DNA研究就遵循一套严苛的流程——在发掘现场,一旦发现骨骼等样本,研究人员必须立刻戴上手套、口罩和帽子,将样本放入无菌样本袋中,随后带回实验室密封保存。接下来的DNA提取和测序,要在超净化的万级无菌实验室进行。从样本粗洗到钻洞采样,再到DNA抽取、配试剂等等,每一个步骤都要在完全独立的房间内做,每做完一个样本,都要进行空气过滤和紫外线消毒。整个过程中,研究者都必须“全副武装”,连眼睛也不能外露——要戴上透明眼罩。

不难想象,古DNA研究的“防污”策略是以高昂成本为代价的,而如此高成本,大规模基因测序几乎无力负担。为此,更多人把目光投向了生物信息学家,希望他们能改进现在的基因组数据污染过滤系统,当好“治污”把关人。(由三博远志编辑)

本文转自三博远志业界新闻:http://www.sunbiotech.com.cn/news_view-id3196.htm

北京三博远志生物科技有限公司 商家主页

地 址: 北京市海淀区东北旺南路26号

联系人: 陈

电 话: 010-57030007

传 真: 010-57030008

Email:sbobio@163.com

相关咨询
ADVERTISEMENT