並列タイトル等チョウサ ヒコード RNA ノ ニジ コウゾウ ヘンイ ガ モタラス ハツガン カテイ ノ システムテキ カイセキ
Chōsa hikōdo RNA no niji kōzō hen'i ga motarasu hatsugan katei no shisutemuteki kaiseki
Systematic analysis of structural changes of long non-coding RNAs in cancer genomes
一般注記type:text
RNAは配列依存的に塩基対を組むことによって安定した二次構造を形成する。RNA二次構造は遺伝子発現の制御などのRNAの機能と相関があることが知られているため, 一塩基変異に伴ってRNAの二次構造が変化すると機能を失い, がんなどの様々な疾患につながると考えられる。一方, シークエンシング技術の発展に伴い, がんゲノムに蓄積した体細胞変異の情報を網羅的に取得することが可能となった。がんゲノムには, 様々な原因によって生じた変異が混合した状態にあるが, 特定の原因とその原因によって生じた変異のパターンには相関があることが知られている。そのため, ある腫瘍のがんゲノムに含まれる特徴的な変異のパターンやそれらの複合体として定義される変異シグネチャーを見出すことにより, 変異の原因を推察することや未知の変異原を特定することにつながると考えられている。しかし, 同一の変異パターンであっても必ずしも構造変化を起こすとは限らないため, 先行研究で行われている配列に基づく変異解析では, 二次構造変化に関する特徴を取り出すことができなかった。本研究では, RNA二次構造変化を変異パターンのように用いることでがん細胞における構造変化のシグネチャーを特定する手法開発を目的とする。
本研究では, Genomic Data Commons(GDC)のデータポータルから取得したがんゲノムに生じた変異のデータを用いて, 一塩基変異に起因して二次構造が変化するエレメントであるRiboSNitchの検出を行なった。先行研究で行われている変異解析に則った方法で解析するためには構造変化パターンを離散化する必要がある。そのため, 検出したRiboSNitchに対し,クラスタリングすることによって二次構造変化を構造変化パターンに分類した。決定された構造変化パターンを既存の変異解析で用いられている変異パターンの代わりに用い, 構造変化シグネチャーを特定した。
An RNA sequence forms a stable secondary structure by base pairing in a sequence-dependent manner. Since RNA secondary structures are known to be correlated with their functions such as regulation of gene expression, the change of RNA secondary structure caused by a single base variation, so-called RiboSNitch, is considered to lead loss of their functions, resulting in disease such as cancer. On the other hand, with the development of sequencing technology, it became possible to comprehensively acquire information on somatic mutations accumulated in the cancer genome. The cancer genome is the mixture of mutations caused by various reasons. It is known that there is a correlation between the specific causes of the mutations and the mutation patterns in the cancer genome. Therefore, the analysis of the mutational signature that characterizes the mutation patterns enables us to infer the cause of mutations and identify unknown mutagens. However, we cannot analyze RiboSNitch that might be a cause of cancer by the traditional mutational signature that is based only on the sequence analysis. The aim of this project is to develop an algorithm for analyzing the mutational signature that causes the change of RNA secondary structures.
We downloaded single nucleotide variations occurred in various cancer genomes from Genomic Data Commons (GDC). Then, RiboSNitches, sequences that change their secondary structures caused by the single nucleotide variations, were identified. We performed the cluster analysis on all secondary structures of identified RiboSNitches. We constructed the observation matrix by classifying all RiboSNitches into the clusters. Finally, as do in the traditional mutational signature analysis, the non-negative matrix factorization (NMF) factorized the observation matrix into the structural change patterns and their occurrence matrix.
一次資料へのリンクURLhttps://koara.lib.keio.ac.jp/xoonips/modules/xoonips/download.php?koara_id=2017000001-20170084
連携機関・データベース国立情報学研究所 : 学術機関リポジトリデータベース(IRDB)(機関リポジトリ)