AWS記事_Background
一文要約
NanoporeベースコールはFAST5ファイル(電気信号)-> FASTQを行う
原文
code:txt
Background
In recent years significant technological advancements in Oxford Nanopore’s sequencers have made them a viable tool for sequencing DNA and RNA molecules. Oxford Nanopore offers various benefits compared to other sequencing technologies such as much longer read lengths (up to hundreds of kilobases), extracting information on methylation status, and real-time sequencing. Longer reads allow for characterization of relevant genetic features relatively inaccessible for short-read technologies (such as structural variants). Methylation is a biochemical modification within the DNA that turns genes on or off. Detecting methylation requires additional sequencing on other platforms. Real-time sequencing reduces the turnaround time in clinical applications.
Basecalling is the conversion of the raw electrical signal generated by the sequencer, stored in FAST5 files, into character-based sequences and associated metadata (for example sample identifier and sequences quality) stored in the standard FASTQ format. Basecalling Oxford Nanopore data is computationally intensive and requires GPUs. Therefore, enabling and optimizing the basecalling step is critical to deploy bioinformatic pipelines for the analysis of Oxford Nanopore data in the cloud.
G42 Healthcare offers Oxford Nanopore sequencing as part of its Omics as a Service, which also includes short-read technologies Illumina and MGI. G42 Healthcare has built one of the world’s most advanced high-throughput sequencing laboratories in Abu Dhabi, United Arab Emirates as part of the The Emirati Genome Programme. Today G42 Healthcare has the capacity to deliver approximately 50,000 whole genome sequences (WGS) per month across all three technologies.
These services address the demand from healthcare regulators, research organizations and industry for ‘omics sequencing and analysis at population scale. G42 Healthcare’s offerings enable customers to quickly scale up large genome programs without the need for a capital intense and time-consuming setup of genome laboratories. Furthermore, G42 Healthcare delivers complete population health programs starting from outreach and sample collection to biobanking and sequencing as well as bioinformatics, interpretation, knowledge transfer and personnel training.
翻訳
code:txt
背景
近年、オックスフォード・ナノポアのシーケンサーは技術的に大きく進歩し、DNAおよびRNA分子のシーケンシングに有効なツールとなりました。オックスフォード・ナノポアは、他のシーケンス技術と比較して、リード長が非常に長く(最大数百キロベース)、メチル化の状態に関する情報を抽出し、リアルタイムシーケンスを行うなど、様々な利点を提供します。リードが長いため、ショートリード技術では比較的アクセスしにくい遺伝的特徴(構造バリアントなど)を特徴付けることができます。メチル化は、遺伝子のオン/オフを切り替えるDNA内の生化学的修飾である。メチル化を検出するには、他のプラットフォームでの追加シーケンスが必要です。リアルタイムシーケンスにより、臨床アプリケーションのターンアラウンドタイムが短縮されます。
ベースコールとは、FAST5ファイルに格納されたシーケンサーによって生成された生の電気信号を、標準的なFASTQフォーマットに格納された文字ベースの配列および関連するメタデータ(サンプル識別子や配列の品質など)に変換することです。Oxford Nanoporeデータのベースコールは計算集約的であり、GPUが必要です。そのため、ベースコール・ステップを有効化し最適化することは、クラウド上でOxford Nanoporeデータを解析するためのバイオインフォマティック・パイプラインを展開する上で非常に重要です。
G42 Healthcareは、Omics as a Serviceの一部としてOxford Nanoporeシーケンスを提供しており、これにはショートリード技術のIlluminaとMGIも含まれています。G42 Healthcareは、The Emirati Genome Programmeの一環として、アラブ首長国連邦のアブダビに世界最先端のハイスループットシーケンス研究所の1つを建設しました。現在、G42 Healthcareは、3つの技術すべてにおいて、1カ月あたり約50,000の全ゲノムシーケンス(WGS)を提供する能力を有しています。
これらのサービスは、医療規制当局、研究機関、産業界からの集団規模での'omics'シーケンスと解析の需要に対応しています。G42ヘルスケアの提供するサービスにより、顧客は、ゲノムラボの資本集約的で時間のかかるセットアップを必要とせずに、大規模なゲノムプログラムを迅速にスケールアップすることができます。さらに、G42ヘルスケアは、アウトリーチやサンプル収集から始まり、バイオバンキングやシーケンシング、さらにバイオインフォマティクス、解釈、知識移転、人材トレーニングに至るまで、完全な集団健康プログラムを提供します。
メモ
Nanoporeシーケンサーの特徴
リード長が長い
メチル化状態を検出
ベースコールとは
変換:FAST5ファイル(電気信号)-> FASTQ
NanoporeベースコールはGPUが必要
抱合関係
組織:G42 Healthcare > サービス:Omics as a Service > サービス:Nanoporeシーケンス