北海道システム・サイエンス
検索方法
  HOME   製品・サービス情報   ご注文   サポート・お問合せ   学会出展情報   会社案内   HSS便り   English
製品・サービス情報
概要・原理 アプリケーション データ解析 サンプル必要量
ヒト検体核酸抽出 セミナー 次世代シーケンス会員 ご依頼方法
注文方法 注意事項 お問い合わせ  


  キャンペーン開催中!  

HSS・NGS解析DVDシリーズはこちら
 
■ SeqNova データ解析サービス
■ シーケンス Raw データ
■ De novo ゲノムシーケンス解析
■ ゲノムリシーケンス解析
■ mRNA 発現頻度解析
■ De novo トランスクリプトーム解析
■ small RNA シーケンス解析
■ 16S rRNA 細菌叢解析
■ アンプリコンシーケンス解析
■ ChIP シーケンス解析
SeqNova™ データ解析サービス
  HSSでは独自の「SeqNova™データ解析 System」を構築し、次世代シーケンスデータをより有効にご活用頂ける解析サービスを併せてご提供しております。
実験系のご提案からその後の詳細なデータ処理までトータルサポートいたします。新規性の高い技術となりますので、ご希望の解析内容、実験目的などから最適な解析内容をご提案いたします。
ご遠慮なくご相談ください。
■ SeqNova™ LS(Large memory Server)
ゲノムサイズの大きな生物種のゲノム解析、自然環境のメタゲノム解析やメタトランスクリプトーム解析などでお困りではないですか?HSSでは次世代シーケンス解析のために大容量メモリを搭載した高機能サーバーを導入し、解析をお手伝いいたします。
次世代シーケンサーは、遺伝子発現解析、SNPなどの変異解析を行う上で非常に有効な解析ツールです。
しかし、ゲノム情報のない生物種のゲノム解析を行う場合、次世代シーケンサーから出力された短いリード配列を用いてゲノム配列の再構築をする必要があります(de novo アセンブル)。
de novo アセンブルはマッピングに比べて計算量が大きく、計算時間が長い上に大量のメモリを必要とします。
それは、de novo アセンブルを行うには全てのリード同士の組み合わせを網羅的に比較する必要があるためです。そのため、アセンブルの計算量は断片数と断片長に依存して増大していくため、ゲノムサイズの大きな生物種や多種生物ゲノムが混じった環境サンプルなどでは凄まじい計算量を要することになります。
弊社ではヒトサイズゲノム生物のde novo アセンブルを行うことが可能な国内最大級の解析サーバーをご用意して皆様のご利用をお待ちしております。
下記「○」を提供しております。
  ゲノム
シーケンス
ChIP
シーケンス
mRNA
シーケンス
small RNA
シーケンス
マッピング
SNP候補検索      
変異解析      
頻度解析  
de novoアセンブル    
アノテーション付加
検体間比較
二次構造予測      
専用ビューアー向けデータ加工
■ シーケンス Raw データ
Illumina HiSeq / MiSeq
Illumina HiSeq/MiSeqシーケンサーでは、Sequence by Synthesis
により、蛍光シグナルの画像データを取得します。
ベースコールを行い、シグナルを塩基配列とクオリティ値に変換し、
FASTQ形式のファイルとして出力します。
Rawデータ取得までのご依頼では、FASTQ形式リードデータを納品
いたします。

※ データ解析までご依頼いただいた場合にも、
  上記、Rawデータのファイルを併せて収録しております。
PacBio RS II
PacBio RS IIシーケンサーでは、SMRT cell毎に、HDF5形式と呼ばれる
Rawデータのファイルと、各種パラメータ情報が記載されたXML形式
ファイルが出力されます。
Rawデータ取得までのご依頼では、上記HDF5形式ファイル、および、
SMRT Analysis(PacBio社より提供されているソフトウェア)にて一次
フィルタリングを行い出力したサブリードの配列データを納品いたします。

※ データ解析までご依頼いただいた場合にも、
  上記、Rawデータのファイルを併せて収録しております。
■ De novo ゲノムシーケンス解析
De novo アセンブル
解析概要
Illuminaリードデータを使用したアセンブル
※ 上記は、Illuminaリードを用いたアセンブル解析の例
Illumina HiSeq/MiSeqのペアエンドリードを用いたde novoアセンブルでは、リードから切り出された断片配列(hash)の繋ぎ合わせによるコンティグの作成と、ペアエンド情報を使用したスキャフォールディングを行います。

PacBio ロングリードデータを使用した
アセンブル
PacBio 1 SMRT cellあたりのスループットは300 Mb〜1 Gbあり、リード長が数Kbと長いため、バクテリア等、ゲノムサイズの小さい生物種を対象としたゲノムアセンブル解析に適しています。

ショートリード・ロングリードの混合アセンブル
ショートリードデータで構築したドラフトゲノム配列に対して、PacBioリードデータを用いたギャップクローズを行います。
納品データ
スキャフォールド配列(FASTA形式) → @
アセンブル結果の統計情報(Excel 形式) → A
アノテーション(遺伝子予測・BLAST解析)
解析概要
アセンブルで構築したゲノム配列を対象として、in silicoのORF領域予測を行います。
予測ORF領域について、遺伝子配列データベースに対するBLAST検索を行い、
アノテーション情報を付与します。
納品データ
○ ORF予測結果(FASTA/GFF形式)
○ BLAST検索結果(Excel 形式)
【 RNA-Seqを使用したアノテーション 】
真核生物では、別途RNA-Seq解析を行い、リードのマッピング結果から転写領域を推定することも可能です。
原核生物では、遺伝子が密に存在し、発現情報から個々の遺伝子領域を単離することが難しいため、RNA-Seqデータを用いた遺伝子予測解析は推奨しておりません。
DDBJ登録用データ作成
解析概要
ゲノム配列・アノテーション情報をDDBJに登録する際には、大規模登録システムMSS(Mass Submission System)を利用したデータの登録が必要です。
MSSの要求するアノテーションファイル規定様式に従い、アノテーションファイルの編集を行います。

納品データ
○DDBJ登録用配列ファイル(TXT形式)
○DDBJ登録用アノテーションファイル(TXT形式)
バクテリアゲノム環状図作成
解析概要
  バクテリアゲノムの環状図を作成します。
GC%、tRNA・rRNA領域、ORFのstrand情報等を示します。

納品データ
○環状図(PNG形式)

 
バクテリア全ゲノム相同性比較解析
解析概要
バクテリア2種間の全ゲノム配列の相同性を算出します。3検体以上の解析では、全通りの2検体間相同性比較結果を用い、系統樹を描画することも可能です。

納品データ
○全ゲノム相同性比較結果(HTML/TXT形式)
○系統樹描画用データ(NEXUS形式)
リピートモチーフ(STR / SSR)探索
解析概要
* マイクロサテライトマーカーの候補が得られ、前後配列
  を使用したプライマー設計を行うことが可能です。
リード配列や、アセンブルにより構築したコンティグ配列に存在する、数塩基の繰り返し配列を探索します。
STR / SSR領域はゲノム上に高頻度で存在するため、ゲノム配列が決定していない生物種でも、少ないデータ量で解析を行うことが可能です。

納品データ
○リピートモチーフの頻度集計結果(Excel 形式)
○リピート探索結果(TXT/Excel 形式)
■ ゲノムリシーケンス解析
マッピング・SNP候補検索
[ 主な使用プログラム : BWA_MEM / samtools / bcftools ]
解析概要
リードを参照ゲノム配列にマッピングし、参照ゲノム配列と異なる塩基(SNP、short indel)を検出します。変異候補箇所について、サンプル毎にリードカバレッジ、genotype、変異頻度等をまとめたテーブルを作成します。
納品データ
○変異抽出データ(VCF/TXT/Excel 形式) → @
○アライメントデータ(BAM形式)
【 コントロール検体について 】
参照ゲノム配列との比較に基づく変異検索では、特に高等生物の場合、個体間の多型に起因する膨大な変異候補箇所が検出されます。コントロール検体(germline mutation解析では親等の近縁個体、somatic mutation解析では同一個体の正常組織等)のデータも併せて取得することで、表現型と関連が低い多型について、変異比較テーブル上でフィルタリングすることができます。
【 RNA-Seqデータを用いた変異解析 】
RNA-Seqデータのマッピング結果を使用して変異検索を行うことも可能ですが、RNA-Seqのマッピング結果では、@ 遺伝子の発現量によりカバレッジが不均一になる、 A イントロンを考慮したマッピングを行うため、偽陽性が多くなる、といった傾向があります。
そのようなバイアスが無い変異探索を目的とされる場合は、DNA-Seq解析を推奨しております。
カスタム変異テーブル作成
別個に解析を行った変異解析結果の統合や、変異テーブルへのアノテーション情報の追加(例:人種や疾患に関連する既知のSNP情報等)を行います。
テーブルへの付与をご希望される情報に関して、データを電子ファイルにてご提供いただくか、
あるいは、データの取得先URL等の情報のご提供をお願いいたします。
構造変異検索
● SV検索
マッピング結果に基づき、ペアリードがゲノム上で異常な方向性・インサートサイズでマッピングされる場合や、リードの前半と後半がゲノム上の離れた位置にマッピングされる場合に、該当領域を構造変異(欠失、挿入、逆位、転座)のbreak point箇所として検出します。
● CNV検索
マッピング結果に基づき、ゲノム上にカバレッジ情報をプロットし、コピー数が変動している領域を検索します。
その他のリシーケンス解析
● QTL-Seq
野生株(親株)と、ある形質を示す株(変異株)を交配して得られた子孫の中で、該当形質を示すバルク個体のゲノムDNAをシーケンスし、親株のゲノム配列と比較します。
検出されたSNPの箇所や頻度をゲノム上にプロットし、原因遺伝子候補を探索します。
■QTL-Seqについては、こちらをご参照ください
● RAD-Seq
制限酵素処理で得られたゲノム断片をシーケンスし、得られたリードの相同配列を集計し、SNPを検出します。
参照ゲノム配列の無い生物でも、ゲノムワイドなSNP検索を行うことができます。
参照ゲノム配列の有る生物では、リードを参照ゲノム配列にマッピングしてSNP検索を行うことが可能です。全ゲノム解析に比べてターゲット領域が限定されるため、比較的少ないデータ量で解析を行うことができます。
■ mRNA発現頻度解析
◆ mRNA解析フローチャート
  RNA-Seq解析では、参照ゲノム配列や遺伝子領域情報の有無により、下記の解析系が選択できます。

マッピング+発現頻度解析(既知遺伝子のみ)
[ 主な使用プログラム : TopHat / Cufflinks ]
解析概要
リードをリファレンス配列にマッピングし、既知の遺伝子領域情報に基づき遺伝子発現量を算出します。
複数検体の解析では検体間の発現比較情報、
レプリケートが有る場合は群間の発現比較情報
も併せて算出します。
納品データ
○遺伝子発現量テーブル(TXT/Excel 形式) → @
○アライメントデータ(BAM形式)
※納品時に、アライメントビューアソフト「IGV」のご利用方法をご案内しております。

※ 新規遺伝子予測を行った場合、遺伝子名は全て機械的に付与されたIDとなります。
マッピング+発現頻度解析(新規遺伝子予測含む)
[ 主な使用プログラム : TopHat / Cufflinks ]
解析概要
  リードをリファレンス配列にマッピングし、マッピング結果から、ゲノム配列上の転写領域を推定します。
既知遺伝子情報が有る場合には、予測転写領域について既知遺伝子情報との関連付け(既知遺伝子と重複している等)を行います。
発現量の算出は新規転写領域に対して行うため、
既知遺伝子の明確な発現量は出力されません。

納品データ
○遺伝子予測結果(FASTA/GTF形式)
○遺伝子発現量テーブル(TXT/Excel 形式) → @
○アライメントデータ(BAM形式)

※ 新規遺伝子予測を行った場合、遺伝子名は全て機械的に付与されたIDとなります。
融合遺伝子探索
[ 主な使用プログラム : TopHat-Fusion]
解析概要
  マッピング結果に基づき、ペアリードが異なる遺伝子上にアライメントされる領域や、リードの前半と後半が異なる遺伝子上にアライメントされる領域を検索し、融合遺伝子の候補として抽出します。
納品データ
○融合遺伝子検索結果(TXT/HTML形式)
SNP候補検索
[主な使用プログラム : TopHat / samtools / bcftools]
解析概要
  マッピング結果から、リファレンス配列と異なる塩基(SNP、short indel)を検出します。
DNA-Seq解析に比べ、偽陽性の変異候補が多く検出される傾向がありますが、ゲノムサイズの
大きい生物種でも、発現量の高い遺伝子については、比較的少ないデータ量で変異候補箇所を
検出することができます。

納品データ
○変異抽出データ(VCF/TXT/Excel 形式)
RNA-Seqデータを用いた変異解析 もあわせてご参照ください。
【 発現量の単位(FPKM値) 】
各遺伝子にアライメントされたリード数を、「該当遺伝子領域の長さ」と「全マッピングリード数」で正規化した値(FPKM値:Fragments Per Kilobase of exon per Million mapped fragments)が各遺伝子の発現量の単位となり、遺伝子間や検体間で比較可能な値です。
【 GSEA解析について 】
発現比較解析により得られた発現変動遺伝子について、Webで公開されているGSEA ツール「DAVID」を使用し、有意に多く含まれる遺伝子のGO解析・パスウェイ解析を簡易的に行うことができます。(対応できない生物種もございます。)
■ De novo トランスクリプトーム解析
De novo アセンブル
[ 主な使用プログラム : Trinity ]
解析概要
  RNA-Seqで得られたリードをアセンブルし、トランスクリプト配列を構築します。
複数検体の発現比較解析を行う予定のある場合、それらの検体のリードデータを混合してアセンブルし、共通のトランスクリプト配列を作成することで、発現解析のリファレンス配列として使用することも可能です。
納品データ
○トランスクリプト配列(FASTA形式) → @
○アセンブル結果の統計情報(Excel 形式) → A
【 PacBio Iso-Seq解析 】
PacBioを使用したIso-Seq解析では、mRNAを断片化せずにライブラリ化し、トランスクリプト配列の全長をシーケンスすることで、網羅的なisoformの配列決定を行います。 得られたisoform配列について、5’、3’末端配列構造を指標として、完全長mRNAを判別します。
なお、PacBioシーケンサーではライブラリの塩基長によりシーケンス量にバイアスが生じるため、
遺伝子発現量を算出することはできません。
マッピング+発現頻度解析
[ 主な使用プログラム : RSEM ]
解析概要
  トランスクリプト配列に対して、元のリードをマッピングし、発現量を算出します。
複数検体の解析では検体間の発現比較情報、レプリケートが有る場合は群間の発現比較情報も併せて算出します。

納品データ
○遺伝子発現量テーブル(TXT/Excel 形式)→ B
○アライメントデータ(BAM形式)
BLAST検索
解析概要
  トランスクリプト配列を対象として、遺伝子配列データベースを参照したBLAST検索を
行い、アノテーション 情報を付与します。

納品データ
○BLAST検索結果(TXT/Excel 形式)→ C
※発現解析もご依頼いただいた場合には、発現情報と併せたテーブルも作成します。
■ small RNA シーケンス解析
リードカウント
解析概要
  Illumina HiSeq 100bpのシーケンスリードで
small RNAの全長配列を決定することができます。
同一配列のカウントを行い、各small RNAの
相対的な存在量を算出します。

納品データ
○small RNA配列データ(FASTA形式)
○small RNAのサイズ分布(Excel 形式)
○リードカウント結果(Excel 形式) → @
miRBase BLAST 検索
解析概要
  得られたsmall RNA配列を対象として、miRBaseを参照したBLAST検索を行います。

納品データ
○miRBase BLAST検索結果(Excel 形式) → A
ゲノムマッピング解析
解析概要
  得られたsmall RNA配列を対象として、参照ゲノム配列に対するマッピングを行います。

納品データ
○マッピング結果(BAM形式/Excel 形式) → B
※ゲノムマッピングの結果から、ゲノム上のアライメント領域近傍の配列を抽出し、
  二次構造の予測〜新規miRNA候補を探索することも可能です。
■ 16S rRNA 細菌叢解析
16S rRNA 細菌叢解析
[ 主な使用プログラム : Qiime ]
解析概要
  比較対象の全検体のリードデータからOTU を作成し、16S rRNA配列データベースを参照してtaxonomy情報を付与します。各OTUのtaxonomy情報と、帰属するリード数を基に、各検体の菌叢構成を算出します。
複数検体を纏めたグループ毎の菌叢構成グラフ を作成することも可能です。
OTU(Operational Taxonomic Unit): 一定以上の相同性に基づきクラスタリングした 配列で、各OTUを一つの菌種と仮定して解析に用いる。

納品データ
○OTU代表配列データ(FASTA形式)
○群集解析データ(Excel/HTML形式) → @
○α多様性データ(Excel/HTML形式) → A
ヒートマップ作成
解析概要
菌叢解析結果をヒートマップで表示します。

納品データ
  ○ヒートマップ(HTML形式) → B

 
β多様性解析
解析概要
検体間の菌叢構成を比較するβ多様性データを
作成します。

納品データ
  ○PCoA Plot(HTML形式) → C
○検体間のクラスタリング(TREE/PDF形式) → C
■ アンプリコンシーケンス解析
完全一致配列のリードカウント
解析概要
〜500bpのアンプリコン全長をシーケンスし、同一配列のリードカウントを行います。
ゲノム編集を行ったターゲット・オフターゲット領域や、細胞・ウイルス集団内の多型領域を対象として、配列多型の種類と存在割合を調べる解析に適しています。

納品データ
  ○同一配列集計後の配列データ(FASTA形式)
○リードカウント結果(Excel 形式) → @
 
代表配列のリードカウント
解析概要
  rRNAやCOI等、マーカー遺伝子のアンプリコンを用いた群集解析では、アンプリコン配列をクラスタ リングし、得られた代表配列(OTU)のリードカウントを行います。
■16S rRNA細菌叢解析については、こちらをご参照ください

納品データ
  ○代表配列データ(FASTA形式)
○リードカウント結果(Excel 形式) → A

BLAST検索
解析概要
アンプリコン配列を対象として、遺伝子配列データベースを参照したBLAST検索により、
アノテーションを付与します。

納品データ
  ○BLAST検索結果(Excel/TXT形式) → B
■ ChIPシーケンス解析
マッピング+ピーク検出
[ 主な使用プログラム : Bowtie1 / MACS2 ]
解析概要
リードをリファレンス配列にマッピングし、カバレッジのピークが存在する領域を検出します。
納品データ
○ピーク検出結果(TXT/Excel 形式) → @
○ビューア用データ(BAM / WIG / BED形式) → A
[ アライメント/カバレッジ/ピーク領域データ]
モチーフ検索
[ 主な使用プログラム : MEME-ChIP ]
解析概要
ピーク領域に出現するモチーフ配列を抽出します。
納品データ
○モチーフ検索結果(TXT/HTML形式) → B
【 コントロールサンプルについて 】
● input DNA
input DNAがある場合は、そのマッピング結果を バックグラウンドとして、IPサンプルのピーク検出を行います。

● 検体間比較
ピーク領域を比較したい検体がある場合には、2検体間のピーク領域を比較できるテーブルを作成します。
Copyright ©  Hokkaido System Science Co.,Ltd. All rights reserved.