多変量解析(主成分分析)を活用したクロマトデータ解析

LCtalk82号TEC

製品開発において競合品との差異を解析する場合, あるいは,品質管理においてクレーム品と良品との違 いを調査する場合,クロマトグラム上のピーク数が多 くなると,定性・定量という従来からの解析手法だけ では,両者の差異を明確に知ることは困難です。こう した問題を解決する手法のひとつとして,多変量解析 があります。ここでは,多変量解析の中でもよく知ら れている主成分分析(PCA:Principal Component Analysis)について,基本的な考え方と作業の流れに ついてご紹介します。

主成分分析とは

  におい識別装置FF-2020による香りの測定を例にして,主成分分析を考えてみましょう。 FF-2020は特性の異なる10個のガスセンサーを内蔵しており,ひとつの試料に対して10個の測定値を収集することから,複数の変数を持っている(=多変量である)といえます。
  例えば,4 つの試料を測定すると,測定値の数は合計で40 個になりますが,主成分分析では,そのひとつひとつの測定値を独立して解析するのではなく,全ての測定値を総合的に取り扱い,その中にある違いを視覚化します。測定値は10 個の変量からなり,10 次元空間の1 点になるため,こうした多次元空間を表現することは,数学的には可能であっても視覚的には不可能です。そこで主成分分析では,違いを大きく表すための重み付けをして合成することにより,視覚的に読み取れる2 次元(または3 次元)に投影します。
  図1には,FF-2020でお茶の香りを測定した主成分分析の結果を示しています。測定対象試料として,玉露,高級煎茶,中級煎茶,安い煎茶の計4種類を分析しました。主成分分析では,プロット位置が近いものは類似していると評価できることから,似たものをグループ化したり,目的試料に近いもの(あるいは違いが大きなもの)をみつけることができます。
図1 お茶の香りに対する主成分分析
  このように,主成分とは,対象試料の中に含まれる主要成分を指すのではなく,比較対象との違いを最も良く示す特徴(座標軸)のことを意味します。

クロマトデータに対する主成分分析

  クロマトデータに対する主成分分析の一般的な作業手順をSTEP1 ~ 3 として図2 に示します。
ここでは,対象商品として,
(a)通常のビール
(b)発泡酒
(c)第3 のビール
(d)ノンアルコールビール

 

について,それらに含まれている有機酸に注目し,差 異を解析した例を挙げています。また,多変量解析用 ソフトウェアとしてSIMCA-P+を使用しました(注1)

(注1) SIMCA-P+ は,Umetrics 社の米国およびその他の国に おける商標または登録商標です。

図2 クロマトデータに対する多変量解析

 

  《STEP1:クロマトデータの採取》
分析データは,液体クロマトグラフ質量分析計LCMS-2020を使用して,(a)~(d)のいずれもn=3 で分析しました。なお,ピークの同定に関し,(1)ピーク同定した後,多変量解析にかける。(2) 未同定のまま多変量解析にかけ,特徴的な違いがあるピークを見つけ出した後,これを同定する。
という2つのアプローチ方法があります。本例では,理解を容易にするため(1)を採用していますが,未知の化合物を網羅的に調べるには(2)が適しています。
  《STEP2:クロマトデータから表を作成》
こ のステップでは,クロマトデータから表を作成します。この表は,次のステップにおいて,SIMCA-P+ に読み込んで多変量解析するためのものです。ここでは,Profiling Solution(プロファイリング・ソルーション)が表の作成を担っています。この表の精度は,STEP3 での解析精度に大きな影響を及ぼします。解析精度が低くなると誤った判定を下す恐れがあることから,本ステップの精度は非常に重要です。 Profiling Solution は,独自のアルゴリズムにより高い精度を誇っており,多変量解析に与える誤差を抑制することが可能です。
 
  《STEP3:SIMCA-P+ に表を読み込んで解析》
STEP3 は,多変量解析(主成分分析)した結果であり,この上図はスコアプロットと呼ばれています。計12 個の分析データが4 つのグループに分類できており,(a)~(d)の差が現れています。ここで,PC1 軸から見た場合,(d)ノンアルコールビールが他と大きく異なっていることが理解できます。
  次 に,スコアプロットで視覚化できた差異に対し,試料中に含まれているどの成分が影響を及ぼしているのかをローディングプロットで確認します。酒石酸やフマ ル酸,マレイン酸などは,直交する軸の中心付近に集まっていることから,差異に大きな影響を及ぼしていないことを意味します。一方,大きな差異を生み出し ている成分は,離れたところに位置しているリンゴ酸や乳酸などであることがわかります。

多変量解析を活用したクロマトデータ解析

 

  今回は有機酸を例として取り上げましたが,他の成分や未知のものなどさまざまな化合物を対象とした多変量解析にチャレンジするためには,柔軟対応できるシステムが必要であることから,All-roundLC であるNexera X2が適しています。
  一方,質量分析計に関し,LCMS-2020LCMS-8040は,正負イオン化切替時間が世界最高クラスであることから,フロントエンドLC としてNexera を搭載すれば,多数のピークをシャープに測定することが可能になります。
  メタボロミクスにおける多変量解析のためのデータ抽出,リスト作成には,LCMS-IT-TOFとProfiling Solutionの組み合わせが有効です。
   
  食品(農林・水産物)の品質管理,鑑定やそれらの要因解析における多変量解析のためのデータ抽出,リスト作成には,島津UFMSシリーズとProfiling Solution ver.1.1の組み合わせが有効です。

多変量解析(主成分分析)の詳細につきましては「テクニカルレポートNo.52:多変量解析(主成分分析)を活用したクロマトデータ解析の基礎」をご参照ください。
https://www.an.shimadzu.co.jp/products/liquid-chromatography/prominence/tec/index.html