ロングリードシークエンサー

鈴木 穣
東京大学大学院新領域創成科学研究科メディカル情報生命科学専攻

 いわゆるロングリードシークエンサーが初めて登場したのは,意外に古い。本格的には十年ほど前で,PacBioシークエンサーがRSシークエンサーを上市して始まったものである。以来,近年のナノポアシークエンサーの登場など,その方法論は多様化している。国内外では,さらに新しいタイプのシークエンス技術も開発中であるという。特に近年の技術開発では,1度の解析で取得できる塩基配列のデータ量,またデータ量あたりの価格は飛躍的に向上した。個々の塩基配列の読み取り精度の向上も日進月歩である。開発当初,「確かに長いが,こんなに精度の悪い塩基配列で何がわかるのか」とも揶揄されたシークエンサーであるが,鋳型調整法あるいは情報解析手法を工夫することで,実に幅広い用途に用いることができるようになった。
 この急速な技術革新を背景に,近年,特にその用途が急速な広がりを見せている。基礎医学分野においては,がんの構造多型が検出できるようになり,これまでの1塩基の変異解析では見出せなかったようながんゲノム構造変異が見出されはじめた。それを新たながんの病因病態の解明あるいはよりよい患者治療戦略に指標をつなげるべく多くの解析が始まっている。遺伝性疾患の解析においても,いわゆる反復配列が精密に解析できるようになった。また重要な要素として,多くの遺伝性疾患解明の鍵となるハプロタイプの全ゲノムレベルでの解析の実践も議論されるようになっている。ゲノムに限らず,トランスクリプトーム解析の分野においては,mRNAの全長配列の解析が可能になったことにより,いわゆる全長アイソフォームとして多様なスプライスバリアントの解析が可能となった。ヒトを離れても,例えば非モデル生物においてはde novo のアセンブルが飛躍的に容易になり,以前には考えられなかったような大規模で複雑なゲノムの全ゲノム解読が行われている。ロングリードアセンブル技術をメタゲノム解析に応用することにより,細菌叢を構成する個々の細菌についてもそれぞれに全長ゲノム配列が再構築できるようになれば,従来の18SrRNAを指標とした解析よりもはるかに詳細なデータの取得が可能となる。実際,最近の学術誌では,ロングリードシークエンサーを用いて,従来のシークエンサーでわからなかったような多くの事象が発見された,と報じる論文がますます増加傾向にある。
 本特集号では,それぞれの分野の一線で活躍される研究者の方に,これらの最新のトピックについて総説いただいた。特にロングリードシークエンサーから出力される塩基配列データは,機器により,また解析手法によって特有の属性を有しており,その情報解析は大きな鍵となる。執筆者の先生には,特にこの部分についてできるだけ具体的な記載をお願いした。本特集が,読者の皆様にとって,これまでのシークエンス解析にさらに多様な解析軸を加えていくような新たな展開を構想する契機になればと思う。