Ensuring metagenomic data integrity
マイクロバイオーム

未知を明らかにする

ワークフロー全体の概要を見る
マイクロバイオーム研究を全体的にカバーするワークフローについて確認する

メタゲノムデータインテグリティを確保

メタゲノム解析は、従来の解析法(PCR、qPCRなど)と同様のプロセスとワークフローを採用しています。いずれの場合も、最初の手順として核酸サンプル – ゲノム解析用にDNA、トランスクリプトーム解析用にRNA – の取得、分離、および精製を行います。次にサンプルを増幅して、(次世代シークエンシングの場合はさらに配列を決定して)専用の装置で最終産物の読取と測定を行います。最後に、得られた生データを、ソフトウェアを使用して処理、編集、および解析を行います。

メタゲノミクスワークフローを設計する際は、増幅産物が可能な限り正確に元のサンプルを再現するように配慮しなければなりません。
 

メタゲノミクスが従来の手法と異なる点は規模です。メタゲノミクスワークフローを設計および実行する際は、増幅前後の核酸収量を最適化する方法だけでなく、増幅後の産物が元のサンプルを可能な限り正確に再現するように配慮しなければなりません。これにより、メタゲノミクスサンプルに存在する可能性があるサンプル内の数千もの微生物間で、遺伝子発現の規模と比率が影響をうけます。それぞれの生物は独自の遺伝子プロファイルをもっています。したがって、従来の単一微生物の研究と比較して、メタゲノミクス研究は難易度が高いのです。


バイアスとは? どのようにして生じるのでしょうか?

残念なことに、バイアス ― 元のサンプルの真の値からの測定データの値の体系的なずれ ― はすべての実験過程である程度生じます。メタゲノミクスも例外ではありません。サンプル取得からシークエンシングやリードアセンブリに至るまで、一般的なメタゲノミクスワークフローのどの段階でもバイアスが生じる可能性があります(1)。まず、サンプルがその属する広いコミュニティを本当に再現しているかは、サンプルの採取位置と頻度によって決まります。たとえば、腸内のマイクロバイオーム研究する場合、糞便サンプルは腸粘膜サンプルと異なる微生物叢を示します。また、サンプルの保存方法やラボまでの輸送方法によって、サンプル組成にバイアスが生じる可能性があります。

サンプル取得からシークエンシングやリードアセンブリに至るまで、一般的なメタゲノムワークフローのどの段階でもバイアスが生じる可能性があります。
 

一般にメタゲノム研究用の核酸を抽出するには、最初に細胞封入体から核酸を遊離させる必要があります。細胞膜と細胞壁を、化学的、酵素的、または機械的手段によって分解させます。ただし、微生物によって溶解性は異なることから、核酸の収率も大幅に異なります。抽出法を変更すると、同一のサンプル中の所定の分類群で測定される収率が10倍も異なる可能性があります(2)。したがって、研究者は選択した抽出プロトコールおよび(または)試薬によってもたらされる内在的なバイアスについても理解し、補正することが重要です(3)。


ショットガンシークエンシングにおけるバイアスの原因

同様に、各種シークエンシング法でもバイアスが生じます。プライマー構築、増幅プロトコール、ゲノムサイズ、さらには核酸サンプルが一本鎖であるか、二本鎖であるかに至るまで、すべてがバイアスの原因になることが特定されています(3-5)。たとえば、ショットガンシークエンシングはその後のリード生成のためにランダムな断片を作成されますが、ランダムであることから必ずしも均一性はなく、一部のゲノム領域やトランスクリプトミクス領域が他よりも優先的に増幅される可能性があります。また、16Sシークエンシングは、マイクロバイオームの構成を決めるための系統マーカーとして16SリボソームRNA(rRNA)に依存しています(3)。


16S rRNAシークエンシングにおけるバイアスの原因

16S rRNAシークエンシングは、細菌の16S rRNA遺伝子の超可変領域を囲む保存領域をターゲットにしており、広く使われる手法です。数十年もの間にわたり、16S rRNA遺伝子の解析はシークエンス法による細菌解析の主流でした(7)。ITS(内部転写スペーサー)領域の解析により、真菌ゲノムのプロファイリングが可能になります(8)。


検出できることが対策につながる

バイアスは累積的に増加します。サンプル調製中に生じたずれがシークエンシング中に増幅され、解析時に浮き彫りになります。したがって、研究者がバイアスの原因について理解し、それを補正するための徹底した一連のコントロールを考案することが重要となります。ポジティブコントロールとネガティブコントロールを使用して、同じプロトコールとサンプルを使用する実験間のばらつきを特定できます。その一方で、Microbiome Quality Controlプロジェクトなどのデータベースは、プロトコールを変えることで、どのように最終結果が異なるのかを知る上で役立ちます。最後に、研究者は目的の生命体(病原体など)を検出しようとして他の多くの生命体の存在に気付かず、偏ったmicrobial communityが得られる可能性を認識しておく必要があります(1)。バイアスを完全に除去することは不可能ですが、メタゲノミクスを臨床診断ツールとして活用するなら、バイアスについて理解して軽減することが不可欠です(1, 6)。

参考文献:
  1. McLaren, M. R. et al. (2019) Consistent and correctable bias in metagenomic sequencing measurements. BioRxiv.
  2. Costea, P.I. et al. (2017) Towards standards for human fecal sample processing in metagenomic studies. Nat. Biotechnol. 35(11), 1069–1076.
  3. Brooks, J. P. et al. (2015)The truth about metagenomics: quantifying and counteracting bias in 16S rRNA studies. BMC Microbiol. 15, 66.
  4. Brinkman, N. E., et al. (2018) Reducing inherent biases introduced during DNA viral metagenome analyses of municipal wastewater. PLoS One 13(4), e0195350.
  5. Beszteri, B. et al. (2010) Average genome size: a potential source of bias in comparative metagenomics. ISME J. 4(8), 1075–1077.
  6. Amrane, S. and Lagier, J. -C. (2018) Metagenomic and clinical microbiology. Hum. Microbiome J. 9,1–6.
  7. Johnson, J.S., Spakowicz, D.J., Hong, B. et al. (2019) Evaluation of 16S rRNA gene sequencing for species and strain-level microbiome analysis. Nat. Commun. 10, 5029. 
  8. Peay K.G. Kennedy P.G., Bruns, T.D. (2008) Fungal Community Ecology: A Hybrid Beast with a Molecular Master. Bioscience. 58:9. 799-810