对于微生物高通量测序组测序研究,生物学重复应该如何设计

原标题:【问答集锦】轻松入门微生物组学看这一篇就够了!

近年来,随着DNA/RNA、蛋白质以及代谢物检测分析技术的迅速发展以及计算能力的飞速提升,聚焦于微生物组嘚研究正以指数级的速度迅猛增长作为目前当红的研究热点,微生物组学可谓“集万千宠爱于一身”已广泛应用于人体/动物、自然/工業等各种环境体系的微生物群落研究中。

微生物组、微生物群、宏基因组、代谢组……面对一长串令人眼花缭乱的概念术语、研究技术、汾析方法您是不是也会感到困惑,不知从何入手呢本期的微生物组问答集锦,就将为您答疑解惑精准把握核心知识点,避免混淆和誤解助您快速入门微生物组!

1、微生物组和微生物群,傻傻分不清楚

微生物组(Microbiome),指生态群落中的全体微生物(细菌、古细菌、低等或高等真核生物和病毒等各种生命体形式)的基因组(基因集合)及其在所处生境内所产生的全部物质信息。这个定义是基于Biome(生物群落)而形成的囊括了生态环境中的所有生物和非生物因素。

与Microbiome相对的是Microbiota常用来指代“微生物群”,指的是特定环境中存在的微生物群体的集合早期有研究使用Microflora来表述“微生物群”的概念,但这一词汇已经不适用于微生物组研究领域被时代淘汰了。

2、微生物组研究主要使用哪些高通量测序技术

目前普遍采用二代Illumina和三代PacBio测序技术开展微生物组研究。其中二代Illumina测序技术根据通量、读长等技术指标,囿MiSeq、NovaSeq等测序系统采用的是双末端(Paired-end,PE)测序即在待测DNA片段的正反两条链上,各自从5’端开始测定相同碱基数的序列,目前常见的双末端测序模式有PE150、PE250和PE300(也可表示成2×150、2×250和2×300150/250/300是指双末端各自测定的碱基数);而三代PacBio测序则通过单分子实时测序技术(Single molecule real-time sequencing,SMRT)对DNA序列實现单分子级别的超长读长测序,并通过环形一致性测序模式(Circular-consensus sequenceCCS),极大地提高单碱基测序的准确率因而具有无需PCR扩增富集、超长读長、碱基检测无偏好性和系统性偏差、一致性准确率高、原位实时直接检测DNA修饰等优势。

目前二代Illumina测序技术可用于多样性组成谱测序(鉯PE250/PE300测序模式为主)和宏基因组/宏转录组测序(以PE150测序模式为主),而三代PacBio测序技术主要应用于多样性组成谱测序(通量不及二代Illumina测序但能测定目标基因的全长信息,因而对于优势物种的注释而言更为精准)

3、什么是16S rRNA基因?ITS序列又是什么

16S rRNA基因指原核微生物(细菌和古菌)染色体上编码核糖体(Ribosome)RNA的16S(S是沉降系数)小亚基(Subunit)的基因序列。该基因存在于所有原核微生物的基因组中相当于一个“分子时钟”,序列会随着物种的多样化而发生进化它既含有高度保守的序列区域,又有中度保守和高度可变的序列区域利用保守区序列设计引粅,从而能够将16S rRNA基因片段进行PCR扩增并测序这样就能根据可变区序列的差异,对不同种属的微生物进行物种鉴定和分类

细菌/古菌16S rRNA基因常鼡测序引物及其对应区域

三代PacBio平台和二代Illumina平台的测序模式示意图

ITS序列全称为Internal transcribed spacer,即内转录间隔区序列是真核生物核糖体RNA(rRNA)基因非转录区嘚一部分,常用于真菌类群的物种鉴定和群落组成分析用于真菌物种鉴定的ITS包括ITS1和ITS2两个区域。其中ITS1位于真核生物18S rRNA基因和/articles/d214-9)

study,即全微生粅组关联分析对于微生物组研究,除了通过测序和差异统计分析来筛选各组样本中的微生物标志物种或基因(Biomarker)的信息外我们还需要將其它各种检测手段获得的数据,比如代谢组、蛋白组、或检测获得的理化指标、临床指标等各类数据与微生物组的海量数据进行关联汾析,以期找出与各类指标变化相关联的具体微生物物种及其基因这种研究思路,统称为全微生物组关联分析

以上就是我们精心整理嘚微生物组学问答集锦,希望能够成为大家开启微生物组研究的敲门砖!我们后续还将带来更多知识的梳理和分享敬请期待哦!任何疑問,都欢迎反馈至我们一定知无不言,言无不尽哦!

为了确保分析结果的准确性老師通常会设置3个生物学重复,这样就可能出现生物学重复中某个样品相关性不好的情况影响后续差异分析结果的准确性。通常可将该处悝组中相关性不好的样品剔除再进行差异分析。后期可通过RT-qPCR等试验手段弥补生物学重复的不足不会影响文章的发表。

原标题:经典综述告诉你微生粅组研究你要避开哪些误区?

中文题目:微生物组研究中优化方法与规避误区

  • 本文提出了微生物组优化实验设计和规避误区的建议综述叻实验设计的最佳方法;介绍了动物研究中常见的影响因素,对几种样本类型提供了最佳储存方法;
  • 讨论了应结合实验样本的阳性和阴性對照进行设计和分析;介绍了可用作阳性对照的非生物DNA序列;
  • 低微生物量的样品研究中仔细分析阴性和阳性对照尤其重要,因为污染可能导致部分或全部样本组成发生改变;
  • 总结了通过严格多重比较控制以及比较发现队列和验证队列来提高实验稳健性的方法

近年来,微苼物群落—微生物组的研究变得非常流行通过高通量测序方法,我们可以获得不同来源的微生物群落的组成并通过比较来揭示微生物群的相关模式。在实验和分析中所有的分析方法都有可能产生偏差。例如16S rRNA基因片段分析时,基因区域的选择会影响细菌类型如果样夲中微生物DNA量很少,文库准备和测序方法通常会得到来自污染的序列污染序列可能来源于试剂、灰尘、样品间或其他来源的交叉污染。

夲综述旨在帮助微生物组研究人员解决这些问题我们主要集中在微生物组分析实验室工作上,并只简要介绍计算和统计方法我们按照實验顺序来呈现各部分内容:实验设计,样本收集处理和数据分析

我们必须认真设计实验以确保所进行的实验能够回答所提出的问题。從一开始就要设计研究所涉及的统计分析方法如果可能的话,可以进行功效分析

抗生素治疗会对肠道菌群产生影响[5,40-42];使用质子泵抑淛剂会改变下消化道微生物菌群的组成增加艰难梭菌感染的风险。

微生物群落结构和基因表达会在短期内发生变化以响应饮食中的极端短期变化[57]。长期的饮食模式与某些特定菌属主导的肠道菌群有关:高蛋白和动物脂肪的饮食与高丰度拟杆菌属相关而高碳水化合物的飲食与高丰度的普雷沃氏菌属有关[55]。

通常情况下人类3岁左右的肠道菌群采用稳定的厌氧模式,但在早期生命中有所不同[58-60]老年人通常会擁有高丰度的变形菌门[61]。因此使用年龄匹配的对照进行微生物菌群比较研究是至关重要的。

研究表明狗主人和狗会具有相似的皮肤菌群[69]。

早期接触微生物能够提高雄性小鼠体内的睾酮水平对1型糖尿病具有保护作用。将受保护的雄性小鼠的微生物菌群移植到年轻雌性小鼠时对1型糖尿病的保护作用是相同的[63]。小鼠体内的微生物昼夜节律在不同性别之间存在差异[65]值得注意的是,男性的性偏好也与肠道菌群的差异有关[67]这可能是肠道菌群和HIV感染研究中的一个混杂因素。

每一个因素如何影响给定的微生物组研究主要取决于提出的问题和研究組间差异程度在实验设计期间列举可能的影响因素并进行量化,统计分析中将它们作为独立变量处理

纵向不稳定性(时间梯度)

随着時间的推移,健康成人的肠道菌群组成基本上是稳定的[70-72]而菌群失调与炎症性肠道疾病等疾病有关[1,573]。肠道菌群在每天也表现出昼夜节律行为[6579,80]然而人体其他部位,如阴道菌群可以在短期内发生极大变化[74-78]因此,研究一种新的样本类型了解它的菌群纵向变化以筛选能解决问题的样本是至关重要的。

不同批次的DNA提取试剂盒可能是纵向研究的重要变异来源[2381]。明智的做法是在研究开始时购买所有需要的提取试剂盒或者同时存储样品和提取所有样品,从而将此变量的影响降至最低

笼子效应会影响小鼠的微生物菌群研究,对其他动物也哃样重要同一笼子里的小鼠由于食粪性而共享相似的肠道菌群[82]。研究发现老鼠品系可以解释肠道菌群19%的变异而笼子效应可以解释31%[83]。研究人员必须为每个研究组设置多个笼子并在统计分析中将笼子作为一个变量。根据笼子变量的检测效果来确定不同组间的微生物群落是否存在差异为了降低成本,每笼可以饲养两到三只老鼠[84-86]

小鼠抗生素干预期间真菌种群的纵向研究发现,抗生素治疗与治疗组中真菌定植的增加有关(图1)检测到的真菌在每个笼子内基本一致,但在每个处理组和未处理对照组中各笼子之间的真菌检测结果也有所不同。检測到的真菌类型在纵向上有所变化但在笼内是一致的。

二、样品采集和处理过程中注意事项

微生物组样本保存过程中最重要的是减少从樣本采集到处理过程中原始微生物菌群的变化且所有样本的保存条件保持一致。

通过比较?80°C下立即冷冻、冰上保存24小时或冰上保存48小時后提取和分析的人类粪便样本发现与不同个体间的差异相比,储存方法的差异并不显著[88]

我们收集了三名健康受试者的口腔拭子样本,并将其保存在不同条件下(在?20°C冷冻、4°C冷藏或在20°C的环境温度下保存0、24、48、72或96小时)然后在?80°C冷冻。PCoA分析结果表明(图2)受试者差异几乎占一半的总体差异(R^2=0.47 , P< 0.001), 3天内储存条件对口腔菌群组成没有显著性影响(R^2=0.17 , P= 0.2)。

Lauber等人检测了温度和储存时间对土壤、人体皮肤和人类粪便样本Φ细菌群落相对类群丰度的影响结果发现细菌群落的总体组成和多数优势类群的相对丰度并未因不同条件而改变(P>0.1)[99]。皮肤和粪便的生物学偅复样本是因宿主聚类而不是温度或储存时间尽管短期内处理样本可以优先考虑便利性,但我们建议样品在采集后立即冷冻或者使用鈳替代的储存方法[89]。

低微生物量样本-处理环境污染

与微生物群落丰富的样品(如健康人的粪便)相比试剂和实验室污染在低微生物量样品中總微生物负荷占比更大。低起始量模板可能被样品处理中的试剂或仪器中的残留的微量DNA所污染因此部分或全部微生物序列可能来自环境汙染。所以在研究细菌水平较低的身体部位(如人类肺部和皮肤)或正常情况下根本不含任何微生物的部位(如各种健康组织)的微生物菌群时,考虑潜在的污染显得尤为重要[1719,22]

Salter等人证明细菌培养物的连续稀释会产生更多的污染序列,随着稀释次数增加会产生更少的“真实”序列,直到污染序列占总序列的大部分[23]对于低生物量样本,20个PCR扩增循环太低但40个循环恢复了污染和真实的低水平序列 [23]。Kennedy报道了起始模板浓度是测序结果差异的主要影响因素[104]即使在没有PCR扩增步骤的宏基因组样本中,也能检测到少量微生物DNA的样本也会存在类似的污染[23]

鈈同试剂盒之间会有差异,甚至在同一试剂盒的不同批次间也会有所不同[2023]。因此最好使用相同批次的试剂同时处理所有样品。记录每個样本使用的试剂盒以及批次是至关重要的如果使用多个试剂盒,应将试剂盒批次作为统计分析中的一个因素

对于低微生物量样本,峩们建议使用专为将污染降至最低而设计的DNA分离试剂盒(如QIAamp UCP(UltraClean Production)病原体迷你试剂盒(QIAGEN))。因此如果一个项目同时包含低微生物量样本和高微生物量样本,要为所有样本提供一种试剂盒类型以避免试剂盒导致的差异。

在分析方面已经开发了几种方法来过滤可疑的污染分类群。Bittinger等囚提出了一种利用真菌总DNA浓度来确定真菌类群来自污染源比例的方法[18]该方法与使用PicoGreen的DNA浓度相似。Lazarevic等人提出了一种结合qPCR计算总DNA浓度的方法这是一种更准确但更耗费资源的方法[106]。Jervis-Bardy表明随着总DNA浓度的增加,受污染的分类群相对丰度往往会明显下降并将此作为另一种去除受汙染分类群的方法的依据[21]。我们可以使用SourceTracker对各个污染源进行建模使用贝叶斯方法来估计来自每个污染源序列数的相对比例[107]。

Lauder从6名人类受試者的胎盘中提取了DNA并将其与几种类型的空白拭子和只含有试剂的阴性对照一起进行了研究。实时荧光定量PCR定量分析胎盘样本、对照样夲和唾液样本(取自同一受试者)的16S rRNA基因拷贝总数并用两种DNA提取试剂盒进行纯化。无论使用哪种试剂盒胎盘样本和对照的拷贝数都很低,與阴性对照难以区分而微生物量较高的唾液样品对两种试剂盒均显示相似的物种组成(图3)。在胎盘和对照样本中发现的几个共同物种昰DNA提取试剂盒的已知污染物由此推断,试剂盒在胎盘样本中提供了主要的微生物特征[22]未来的研究是否能明确区分胎盘样本和阴性对照,还有待观察

收集阴性对照样本,对污染背景进行评估是十分必要的我们通常在每个16S rRNA测序反应中设置三种类型的阴性对照样本(图4)。在“空白拭子”样本中从包装中打开一根无菌棉签,并对其实施完整的测序方案在“空白提取”样本中,DNA提取和所有后续步骤都是在没囿额外加入材料的情况下进行的在“空白文库”样本中,不实施提取方案;DNA-free water被用在该方案的提取后面步骤中从文库构建开始,以表征丅游步骤中的污染

如果微生物量低,可以加入额外的阴性对照样本以检测样本采集过程中引入的污染DNA。肺部微生物菌群的研究中在支气管镜检前用灌洗盐水样本冲洗支气管镜可以产生极好的阴性对照[19]。阴性对照样本测序序列平均数量通常比来自粪便等样本的平均数量低5个对数(图4A)阴性对照样本中发现的细菌类群属于已有文献中报道的污染类群,包括丛毛单胞菌科Comamonadaceae、劳尔氏菌属Ralstonia

阳性对照样品可以验证样品制备和测序过程是否顺利进行当样品在多孔板上纯化时,样品会在板上特定位置进行一致排列这使得在测序结果中能够跟踪检测到任何样品的混淆。理想情况下正负对照样品会不对称地放置在提取板上,从而确定板的方向

大量研究证明,培养的微生物混合物(“模擬群落”)[2396,111]或已知的游离DNA的混合物(“模拟DNA”样本)[88112,113]都是有效的阳性对照测序结果在同一个方法和实验室环境中是可重现的,但是不哃方法和实验室可能产生不同误差[23]

我们合成了八个古菌物种的16S rRNA基因区域,这些区域在实验数据中通常不会被检测到因为古菌V1-V2区域的扩增引物结合位点的序列与细菌V1-V2引物序列不匹配。我们对古菌样本进行了11次独立测序反应发现这些序列的相对丰度是基本一致的(图5B)。

图5c显礻了来自一次测序反应的代表性结果在96孔板上,对照古菌类群的丰度并没有因临近阳性对照样品而增加(P=0.6)这表明制备过程中的溢出并不昰样品间混杂的主要来源。然而在多个分散的样本中可以检测到低水平的这些序列(图5C,蓝色正方形)这可能是由于在Illumina测序过程中barcodes的误读戓相邻簇中DNA分子的杂交[114]。避免这种情况发生的一种手段是在扩增子两端使用barcodes并且要求在质量过滤中两端都精确匹配[115]。

gene block是在文库制备和测序过程中保证实验样品适当扩增、跟踪混淆样品和检测样品交叉污染的简单方法但是,合成的阳性对照是无法用于基准分析和统计方法嘚由于序列的自然变异和低丰度类群导致为真实群落开发的分析方法通常在模拟群落上表现不佳,反之亦然

许多研究者使用能同时靶姠细菌和古菌16S区域的引物,例如地球微生物组项目使用的515fB/806rB引物[116117]。因此在gene block中使用古生菌序列没有优势,因为在实验样本中可能检测到古苼菌尽管如此,研究人员可以使用人工改变的DNA序列来构建gene block这些DNA序列有足够可变性,可以很好地与基因组序列区分开来但又足够保守,可以与分析流程兼容

鸟枪法宏基因组测序中的污染

鸟枪法宏基因组测序中也可以检测到由试剂引入的微生物DNA。而扩增子测序在微生粅生物量较低的样品中污染尤为明显。这在微生物量普遍较低的样品(如皮肤拭子)和以非微生物DNA为主的样本(如组织活检)中都可以看到

Pathogen,QiagenValencia,CAUSA)提取的组织DNA进行了鸟枪法宏基因组测序(未发表的数据)。对阴性对照样本进行测序时我们观察到两种试剂盒检测的菌群不同(图6A)。这两種试剂盒中发现的菌群在低微生物量组织样本中也存在很可能是来自试剂污染。在实验和对照样本中发现的菌群包括丙酸杆菌属、棒状杆菌和Bradyrhyzobium(常见的土壤细菌)也被其他研究组鉴定为污染物[23,118]

这表明,尽管一些试剂污染是不可避免的但使用低污染试剂盒减少了污染物引起的的总测序量。此外它还强调了测序和分析对照样本的重要性,如果没有它们就不可能从真正微生物菌群里鉴定试剂污染。

檢测污染的一个极端例子来自病毒分析使用了多重置换扩增技术来扩增样本。对空白的病毒样本(未发表的数据)进行鸟枪法宏基因组测序并与噬菌体phi29比对,发现比对结果仅与phi29聚合酶基因一致(图6B)

与其他样品一样,检测阴性对照样品的组成是必要的即使文库产率低或检测鈈到,也要对阴性对照进行测序使用堆叠条形图或热图来展示其组成。不要认为只要在阴性对照中去掉污染物种污染问题就已经解决。我们没有理由认为污染的物种是完全被抽检的而且环境物种可能确实存在于样本中,并且具有重要的功能

多重比较控制显著性和假陽性率

高通量测序实验通常会产生来自数百个分类群的测序序列。研究者要想知道哪些分类群可能与表型差异有关就必须进行多重比较,每次都要检验分类群的丰度没有差异的零假设如果检验的可接受假阳性率被设置在某个水平(如5%),则这些重复比较将增加获得高于该水岼的假阳性的机会想要将假阳性率重新调整回要求水平,必须使用多重检验进行校正

一种保守的方法是使用Bonferroni校正[120]来确保在指定的概率內没有任何假设被错误地拒绝。但这种方法已经被证明是不可接受的会导致太多的假阴性。另一种更流行的方法是控制预先指定的错误發现速率(即对零假设的错误拒绝)Benjamini和Hochberg提出了一种在一系列独立检验中控制错误发现率的方法[121],这是QIIME[122]和Mothur[123]等微生物组分析软件中使用的方法峩们强烈建议在进行多重比较时要进行多重检验校正。

发现队列和验证队列双重检验提高结果可信度

微生物组研究中首先在发现队列中進行实验,使用特定的检验方法筛选分类群或基因型然后对验证队列进行分析来检验仅在发现队列中显著的结果。这样验证队列中的檢验总数就大大减少了。

一些微生物组研究已经使用独立的发现和验证队列来筛选与疾病状态相关的生物标志物Sabino等人在一个发现队列中鑒定了三个与原发性硬化胆管炎相关的菌属,并在独立验证队列中将75%的受试者进行了正确分类[125]Forslund等人使用独立的队列来重复在二甲双胍治療的2型糖尿病患者中发现的分类群改变的结果[126]。在一组受试者中开发了与炎症性肠病(IBD)相关的粪便细菌分类群丰度的综合指数[73]然后在一项獨立的随访研究中发现,该指数可以将IBD与健康对照组区分开来[127]Kelsen 等人应用发现—验证队列设计来确定克罗恩病儿童和健康对照组之间龈下微生物菌群的差异[128]。此外他们能够将与抗生素使用相关的分类群与仅与疾病相关的分类群区分开来。

我们对微生物组研究的实验设计和汾析提出以下几点建议:

  • 需要考虑多个混杂因素包括抗生素的使用、年龄、性别、饮食、地理和宠物饲养。
  • 在多个笼子中设置要研究的條件是十分重要的这样可以隔离和解释笼子变量的效应。
  • 虽然我们建议在采集后立即将样品(特别是粪便样品)保存在?80°C以获得最准确的結果但现场研究的替代存储方法也会导致相对较小的偏差。对于新的样品类型特定的存储条件最好要检测存储过程中的菌群变化。
  • 在橫断面研究中了解取样的时间点是否具有代表性是至关重要的。例如健康成人的肠道菌群在短期内不会发生根本性的变化,但阴道菌群有时会发生变化因此,评估可能的纵向变化与所提问题之间的关系是很重要的
  • 要认真地设置和分析阴性对照:DNA提取试剂盒通常带有汙染物,不同试剂盒甚至同一试剂盒不同批次间的污染也可能会有所不同
  • 每批样品设置阳性对照。模拟群落是非常有用的我们给出了鈳用于阳性对照的DNA合成序列列表。在纯化板上不对称地设置对照样品通过DNA纯化和文库制备程序来验证对样品的跟踪是否准确。
  • 低微生物量样品面临众多挑战进行低微生物量样本研究时,我们可以采用qPCR来量化样本中的微生物负荷以了解实验困难的程度。在这种实验中先从所有序列数据只反映存在污染的零假设开始,然后询问在数据的统计分析中是否可以拒绝这个假设
  • 对“数据挖掘”要实事求是,对哆重比较要严格控制
  • 条件允许的话,最好通过发现和验证队列进行双重检验来提高实验的稳健性

毫无疑问,人类微生物菌群对健康和疾病至关重要通过应对上述挑战,我们可以获得高质量的数据从而促进微生物组研究领域的快速发展。

如果您想了解更多关于微生物組研究的知识和前沿进展可以扫描下方二维码申请加入欧易-微生物测序交流 QQ 群( 群号:), 群内会推荐微生物组研究领域最新文献举辦微生物组研究系列讲座。

转载请注明本文转自欧易生物

我要回帖

更多关于 微生物高通量测序 的文章

 

随机推荐