ライフサイエンス企業情報プラットフォーム

ヒューマン・メタボローム・テクノロジーズ株式会社

革新的な分析技術であるCE-MS技術をコアとし、受託解析/バイオマーカー探索の2つの事業を柱に、メタボロミクスビジネスを展開する研究開発型ベンチャーです。

会社カテゴリー:ラボ用測定・分析、分析、試験受託サービス、その他受託サービス、研究関連資材

主サービス提供地域:日本、中華人民共和国、大韓民国、台湾、インドネシア、マレーシア、フィリピン、シンガポール、タイ、ベトナム、インド

製品・サービス詳細

マルチバイオマーカー探索サービス メタボロインデックス™

サービスカテゴリー:分析、再生医療

HMTではこれまで、メタボロームデータを主な対象としてオミクス解析を多数実施してきました。そこで培った経験や解析技術をもとに、様々な用途におけるお客様のバイオマーカー探索を支援いたします。
メタボロミクスデータなどのオミクスデータに対して、ランダムフォレストによる機械学習を活用したマルチマーカー解析により、判別モデルの作成と関連する代謝物質などの情報を提供するサービスです。

サービス概要

本サービスは、機械学習の一手法であるランダムフォレストを用いることにより、対照群と比較群の違い(疾患の有無など)を判別するための複数のバイオマーカー(マルチバイオマーカー)を高い精度で探索することが可能となるサービスです。
網羅的な代謝物質解析であるメタボロミクスと機械学習を用いたマルチバイオマーカー解析を組み合わせることで、複数のバイオマーカーから見出される特徴を活かした精度の高い判別法の提供を可能とします。

サービス仕様

サービス名称 メタボロインデックス™
実施内容 臨床研究等において取得されたメタボロミクスデータなどのオミクスデータに対して、ランダムフォレストによる機械学習を活用したマルチマーカー解析により、判別モデルの作成と関連する代謝物質などの情報を提供する
実施可能検体 血漿、血清、尿などの生体由来試料
実施可能試験 2群比較、検体数は50検体以上

サービスの流れ(一例)

本サービスの基本仕様は上記の通りですが、用いるデータの種類や値、物質数や検体数などに応じて、実施する解析が少しずつ異なってくる場合がございます。ここでは、サービスの流れの一例として、ある疾患を判別する代謝物質マーカーの探索例をご紹介します。

(データ取得)

本サービスはデータの解析のみを行うサービスですので、まだメタボロミクスデータをお持ちでないお客様におかれましては、弊社のメタボロミクス受託サービスをご利用いただきデータを取得していただく必要がございます(他社・他機関で取得されたデータでも解析可能な場合がございます)。

事前打ち合わせ

お客様と弊社研究員とで事前打ち合わせを行い、試験目的やデータの特性、考慮すべき事項などをお伺いします。

解析の実施 

本例では、検出された全物質を用いてランダムフォレスト解析を行ったところ、訓練データでは良好な値(AUC=1)が得られたものの、クロスバリデーション時のAUC値が0.5175と低かったことから、オーバーフィッティングしている可能性が高いと考えられました。
AUC(クロスバリデーション)= 0.5175

最適な代謝物質数の検討 

代謝物質の数を絞った場合にAUC値が改善することが考えられたため、疾患群と対照群で単変量解析(Mann-WhitneyのU検定)を行い、p値が小さいk(k=1, …, 200)物質でAUC値がどのように変動するかを確認しました。
その結果、右図の矢印部分、9物質を用いた際のAUC値が最も高いことがわかりました。

代謝物質の数を絞ったランダムフォレスト解析の実施

9物質のみを用いたランダムフォレスト解析を実施したところ、クロスバリデーションにおけるAUC値が0.9411となり、高い精度を得ることができました。
AUC(クロスバリデーション)= 0.9411

ハイパーパラメーターのチューニング

計算に必要な各種パラメーターの設定も検討し、最も良い判別モデルを作れるようなパラメーターを探索します。

解析結果の納品

実施した解析について、データを納品いたします。

※本サービスはバイオマーカー探索を保証するものではございません。

用語解説

バイオマーカー

生体内に含まれる遺伝子やタンパク質、代謝物質などの物質のうち、病気の変化や治療に対する反応など、生体情報に相関して変動し、反応指標として客観的な評価が可能な項目・物質を「バイオマーカー」といいます。
例えば疾患の初期に現れるバイオマーカーを探索することができれば、疾患の早期発見・早期治療などにつながると期待されます。

ランダムフォレスト

データから学習をすることでパターンを発見し、さらに学習したモデルを用いて予測を行う「機械学習」の一手法で、複数のモデルを統合するアンサンブル学習の一つです。
決定木と呼ばれる計算手法を複数実行し、それらの結果をもとにした多数決によって最終的な予測結果を出力します。近年はメタボロミクスデータの解析でも多く用いられるようになっています。

ROC曲線 / AUC

Receiver Operating Characteristic(ROC)曲線は、陽性/陰性を判別する閾値を設定した際に、縦軸に敏感度(真に陽性となる割合)、横軸に偽陽性率(陰性者を陽性と判定してしまう割合)をプロットしたものです。
ROC曲線の下部の面積をArea Under the Curve(AUC)と呼び、AUCが0.5に近い値(下図左側)となるほど陽性/陰性の判別がうまくいっておらず、AUCが1に近い値(下図右側)となるほど有効な閾値が設定されていると言えます。
AUCの値を一つの指標とすることで、有用なバイオマーカー・閾値の探索が可能となります。