Untitled_2
生物多様性条約の第14回締約国会議において、決定14/20、パラグラフ11 (b) から (e) に従って、遺伝資源のデジタル配列情報に関する四つの研究が要請された。この研究は、要求された最初のものである:「遺伝資源のデジタル配列情報の概念と範囲、および遺伝資源のデジタル配列情報が現在どのように使用されているかについての科学に基づいた査読済みの事実調査研究で、既存のレアードとウィンバーグ事実調査および範囲調査研究を基にしている」。 (DSI)「デジタルシーケンス情報」はプレースホルダー用語として広く認識されているが、これに代わるものや正確な定義は今日まで存在しない。本研究は,まず,DSIを構成すると理解できる異なるタイプの情報を説明し,この情報がどのように生成され,使用されるかについての文脈を提供することにより,DSIの概念を考慮するための十分な技術的基礎を確保することを求めた。遺伝資源に由来する情報の流れを図1に示すが、これは本研究の技術的根拠を理解するための重要な参考資料である。それは(すなわち、DNAがRNAに転写され、RNAがタンパク質に翻訳される過程)という分子生物学のセントラルドグマに基づいて構築されており、遺伝資源のDNAが天然源から得られたものであろうと人工的に開発されたものであろうと、生物学的にどのようにして代謝産物に加工され、我々が生命であると理解している生物内の仕事と過程を遂行するのかを説明している。また、ゲノム、トランスクリプトミクス、メタボロミクス、エピゲノムおよびメタデータを含む、遺伝資源およびその誘導体と関連し得る異なるタイプのデータを描く。
また、環境試料から単一細胞のゲノムや生態系全体の配列決定を容易にする次世代技術につながるDNA配列決定の技術的改善とコスト削減についても検討します。これらの進歩の結果、大規模なオープンアクセスデータベース(まとめてDSI)に蓄積されるDNA配列および関連情報は、前例のないペースで増加している。いったんゲノムの塩基配列が決定されて蓄積されると、その遺伝子は他の何百もの遺伝子と類似点や相違点を比較することができ、その機能や重要性を理解するのに役立つ。このように、DSIの力は、単一のDNA配列ではなく、集められたデータにある。これらの能力は遺伝子編集や合成生物学のような応用の背後にある原動力である。
ゲノム学におけるこの革命は、生命の樹、遺伝子の機能、遺伝子が関係する代謝過程の理解を深めることにつながった。たとえば、エピジェネティクスはDNAの塩基配列を変えずに遺伝的変化についての洞察を与える。トランスクリプトミクスは、生物と生物の群集においてどの遺伝子が活性化されているかを明らかにし、生物間の相互作用の理解を深める。プロテオミクスはどのタンパク質が発現し、どのように修飾されるかを示す。メタボロミクスは生物における小分子の補足を示し,生物の代謝活性と健康状態の有用なプロフィールを提供する。生物学的試料および環境試料中の遺伝子(ゲノミクス)、mRNA(トランスクリプトミクス)、タンパク質(プロテオミクス)および代謝産物(メタボロミクス)の検出を主目的とするこれらの 「オミクス」 技術は、図1に示すように、基礎となる遺伝資源に関連する膨大な量の情報をもたらす。タンパク質構造決定、コドン最適化、および遺伝子編集などの追加技術は、発現、機能または活性を最適化するために、DNA、RNA、およびタンパク質配列の修飾を可能にするために、この情報に依存する。
DSIによって可能となる技術は,ライフサイエンス関連の研究や産業においてユビキタスになりつつある。DSIの概念を明確にするには、さまざまなタイプの情報がどのように生成され、使用されているかを理解することが不可欠であるため、ここでは、分類学と保存学に焦点を当てて、以下の分野を選択した。;農業・食糧安全保障;工業・合成生物学;医療への応用と医薬品の発見。各セクターについて、そのセクターの概要を簡単に説明するとともに、そのセクターにおけるDSIによって可能になった技術技術の応用例を紹介する。我々は、これらの分野のそれぞれが、DSI、DSIによって可能となる技術/技術の破壊的性質、及びいくつかの分野の重要な経済的フットプリントに依存していることを示す。生命科学の他の多くの分野についても同様であり、これらの要素は、DSIの範囲に関する議論や、DSIの主題事項からの特定の種類の情報の包含/除外から生じる影響を評価する際に考慮されるべきである。
技術的根拠を確立した上で、本研究では、DSIの概念の評価を支援するために新たな論理グループを提案し、特定の種類の情報をDSIの主題事項に含めるべきか除外すべきかを決定するのに役立つ優先事項を特定することによって、DSIに関連する主題事項の範囲と用語を明確にしようとしている。CBDと名古屋議定書の締約国は、2017~2018年の中間期に、DSIの概念を明確にするために多くの措置を講じたが、 「DSI」 という用語の妥当性やその意味するところについてコンセンサスが得られなかった。これらの課題は、CBDとその名古屋議定書に特有のものではなく、他の様々な国連プロセスでも同様の議論が行われていることからも明らかである。DSIの概念を明確にするために、図1に示すように、遺伝資源の利用から得られる情報の流れを考えると、各段階で得られるデータ/情報は、もとの遺伝資源から徐々に取り除かれることが明らかである。基礎となる遺伝資源および各段階に関連する情報へのこの近接性は、DSIを構成する可能性のある情報をグループ化するための論理的基礎を提供し、DSIの範囲を定義するために提案された4つの代替グループは、以下のように要約される。
グループ1-狭い:DNAとRNA
グループ2-中間体:(DNAとRNA)+タンパク質
グループ3-中間体:(DNA、RNA、タンパク質)+代謝物
グループ4-広範:(DNA、RNA、タンパク質、代謝産物)+伝統的知識、生態学的相互作用など。
グループ1は、狭い範囲または遺伝資源に近接しており、転写に関連するヌクレオチド配列データに限定される。グループ2は、中間的な範囲または遺伝資源に近接しており、タンパク質配列にまで及ぶため、転写および翻訳に関連する情報を含む。このグループの範囲については、2つの解釈が可能である。すなわち、主題事項がヌクレオチドおよびタンパク質配列データに厳密に限定されているか、または転写および翻訳に関連する情報、例えば、遺伝子の機能的注釈、遺伝子発現情報、エピジェネティックなデータ、およびタンパク質の分子構造を含むかのいずれかである。グループ3は、より広い中間的な範囲または遺伝資源に近接しており、代謝産物および生化学的経路にまで及び、したがって、転写、翻訳および生合成に関連する情報を含む。グループ4は、基礎となる遺伝資源に最も広い範囲または最も弱い近接性を有し、行動データ、生態学的関係に関する情報および伝統的知識にまで及び、したがって転写、翻訳および生合成に関連する情報ならびに下流の副次的情報を含む。
我々は、DSIを構成する可能性のある主題事項の広範なリストを評価するために、以下の4つのグループを使用する。
遺伝資源のデジタル配列情報に関する特別専門家グループ(エーティーエー)によって2018年に提案された。著者らはまた,表4に示すように,DSIを置き換えるために提案された用語の範囲を評価するためにこれらのグループを使用する。///表4は,読者が本研究においてDSIの概念を評価するために提案された異なるグループを理解するための重要な参考資料である。これらの評価から、グループ1で提案されているように、DSIを狭い主題で記述するための用語が容易に利用可能であることは明らかである。
これらの用語は,遺伝資源シーケンスデータ(グリス)を含む。;遺伝子配列(ジーエス);遺伝
シーケンスデータ/情報(GSD/GSI);およびヌクレオチドシーケンスデータ(NSD))。その結果、デジタルシーケンスデータ(デジタル署名)、遺伝資源シーケンスデータ(グリス)または遺伝資源という用語
シーケンスデータおよび情報(グリ)は、採用された解釈に依存して、グループ2で提案された中間範囲の主題事項を記述するために使用され得る。これまでに提案された用語のいずれも、グループ3で提案されたような遺伝資源の付加的な生合成に関連する情報を含む中間的な範囲を適切に捉えていないようである。最後に、用語は、以下で提案されているように、広い範囲の主題事項を記述するために容易に利用可能である。
グループ4。全体として、本研究で提案された四つの論理グループは、2018年のAHTEGリストのニュアンスのある代替案を提供しており、DSIの概念と範囲を明確にする上でより役立つであろうが、特に中間グループについては、適切な用語を評価する必要がある。
基礎となる遺伝資源への情報の近接性は、それが由来する情報源を正確に同定または推測できるかどうかを決定する。これはRNAとタンパク質の配列の場合には程度の差はあるが、生合成の情報でははるかに困難になり、補助的な情報では不可能になる。したがって、データ/情報の近接性は、特定の遺伝資源へのトレーサビリティや、遺伝資源の利用によって生成されたものか、独立して生成されたものかなどの情報源の同定にも重要な意味をもつ。DSIのトレーサビリティが重要なシステムでは、DSIの主題事項の狭い範囲の方が、出所の特定や推測の技術的困難さを考えるとより適しているように思われるが、トレーサビリティが重要でない場合には、より広い範囲の主題事項に対応できる可能性がある。
本研究では,DSIの概念を明らかにするために優先的に考慮し解決すべき可能性のある解決策とともに,いくつかの重要な問題を特定した。///最初の2つの問題は,1) 遺伝資源からDNA,RNA,蛋白質配列および代謝物 「DSI」 への流れに沿って,どれだけの距離を延長できるかである。;2) DSIにデータと情報の両方が含まれているかどうか、データが情報と見なされる前にどの程度処理されたか。いずれの問題も、DSIの対象範囲を明確にするために、明確に定義された4つの提案グループのいずれかを採用することで解決できる。第三の問題は、ある長さ以下の配列、非コードDNA、エピジェネティックな遺伝因子および修飾されたDNA/RNA/タンパク質を含む特定の配列情報をDSIの主題事項の範囲から除外すべきかどうかである。30ヌクレオチド未満の配列は、ユニークでなくてもよく、これは、配列長に対するより低いカットオフを提供し得る。非コードDNA、エピジェネティックな遺伝因子、および天然に修飾されたDNA/RNA/タンパク質はすべて機能を有しており、これらをDSIの主題に含めることを考慮することが論理的であると考えられる。逆に、合成的に修飾されたDNA、RNAまたはタンパク質は、天然の機能的役割を有するとは言えず、したがって、この基礎は、基礎となる遺伝資源の固有の部分ではないと考えられる。本研究で提案された論理グループが採用されるかどうかに関係なく、本研究で特定された優先課題、および生命科学の様々な分野にわたるDSIの程度のより大きな評価が、生物多様性条約の第14回締約国会議において決定14/20に従って委託された研究を検討する遺伝資源のデジタル配列情報に関する新たなアドホック技術専門家グループ(エーティーエー)による審議および勧告に役立つことが期待される。