vol.30 ATR FT-IRと多変量解析(ケモメトリックス)によるセルロース繊維布地の判別

執筆者紹介

vol.30 ATR FT-IRと多変量解析(ケモメトリックス)によるセルロース繊維布地の判別

高柳 正夫 先生

東京農工大学 大学院連合農学研究科 教授
 (ご所属・役職は2018年5月発行時)

1.はじめに

 分光計測で得られたスペクトルに多変量解析(ケモメトリックス)を適用して定性的,定量的に有用な情報を獲得することが一般的になってきた。この解析法は,スペクトルを分子科学的に読み解いて(例えばバンドの帰属や観測される信号の起源の検討などにより)分子や物質の構造や状態の知見を得た上で定性的,定量的な情報を得るという従来からのスペクトル解析法とは大きく異なる手法である。理論的な解釈をすることなしにスペクトルの解析を進めるので,得られた結果の根拠が薄弱となる場合もある。しかし分子科学的にはスペクトルの明確な解釈が困難な状況でも,有用な情報を得ることができる。多変量解析を基本的な要素技術の一つとするビッグデータ解析,ディープラーニングやAIなどが広く用いられるようになってきた昨今,非常に多くの情報を含有する可能性があるスペクトルの解析にも高度な多変量解析を応用して,従来では得ることが困難だった情報を抽出することが重要だと思われる。

 近赤外光の領域では,スペクトルを分子科学的に読み解くことが容易ではないために,従来から多変量解析によるスペクトルの解析が広く行なわれてきた1)。穀物中の水分定量や果実の糖度測定など農作物や食品の分野を中心にスペクトルの多変量解析による分析が広く行われており,実用化されているものも少なくない。最近では,医薬品や工業製品への応用も増えている。一方,紫外可視や中赤外の領域では,従来からスペクトルを分子科学的に解析することが広く行われていたために,多変量解析はまだ一般的と言えるほどには使われていない。

 近年,赤外(中赤外)領域のスペクトル測定ではATR(Attenuated Total Reflection)法が一般的に用いられるようになってきた。ATR法を用いると,多くの試料について測定の前処理がほとんど不要となるので,測定可能な試料の範囲が従来よりも格段に広まった。このことは,赤外分光法を今まで以上に重要な分析手法に変えたように思える。一方で,前処理無しの非破壊測定による複雑な混合物への応用が増えてきた。そのために,測定されたスペクトルのバンドの帰属や,標準スペクトルとの比較などの従来からの手法による解析が困難な場合が多く見られるようになってきた。そのような場合に,多変量解析が威力を発揮する。

 我々は,近赤外分光法と赤外(中赤外)分光法に多変量解析を組み合わせて,衣類などの繊維製品の材質の判別や混用率を定量する手法の開発を行ってきた。ここでは,赤外吸収スペクトルへの判別分析の応用例を紹介する。

2. 布地の赤外吸収スペクトル

 衣類等の繊維製品には,様々な種類の繊維が用いられている。繊維は種類により性質が異なり,用途により使い分けが必要である。また類似した繊維であっても,種類によって価格が大きく異なることがある。したがって,衣類に用いられている繊維の種類や混用率(複数の繊維が用いられている場合の各繊維の重量含有率)は,その衣類の機能や価格を決定する重要な要素である。そのために,市場に流通する衣類については,家庭用品品質表示法2)により,用いられている繊維の種類と混用率をタグに記載することが義務付けられている。誤りや偽装が無いとは言えないので,記載されている情報が正しいかどうかを確かめる繊維鑑別が必要となる。繊維鑑別や混用率測定の方法は,日本工業規格(JIS)3, 4)に多くの手法が規定されている。代表的な手法には,顕微鏡で繊維形状を観察して判別する顕微鏡法,種々の試薬や溶剤への溶け具合を観察する溶解法,燃え方や燃やした時のにおいから判別する燃焼法,KBrディスク法(最近ではATR法も用いられる)で測定した赤外吸収スペクトルを標準スペクトルと比較する方法がある。これらの鑑別手法の大部分は,布地を解舒(かいじょ)して糸または繊維の状態で行う破壊分析手法であり,製品の全品検査には適用できない。また複雑な実験操作を必要とする場合や判定が難しい場合が多く,熟練をしないと安定した分析結果を得ることが困難である。さらに,鑑別に長時間を要するといった欠点もある。分光法により非破壊,迅速,簡便に鑑別ができるようになれば,衣類等の繊維製品の管理に有用である。

 ところで,衣類に一般的に使用される繊維はいくつかの系統に分けることができる。例えば,天然繊維と化学繊維という分類は良く知られている。一方で,構成する化学成分の類似性からセルロース繊維や動物繊維のように分類されることもある。セルロース繊維の主な化学成分はセルロース,動物繊維(羊毛,獣毛,絹など)はたんぱく質である。化学成分が大きく異なる繊維は赤外吸収スペクトルの形状も大きく異なる。図1に,綿,羊毛,ポリエステル,ナイロンの赤外吸収スペクトルを比較して示した。繊維種ごとにスペクトルが大きく異なるので,判別に用いることができる。

 今度はセルロース繊維どうしのスペクトルを比較してみよう。セルロース繊維には,天然繊維として,綿(Cotton),リネン(Linen,亜麻),ラミー(Ramie,苧麻)等があり,再生繊維として,レーヨン(Rayon),キュプラ(Cupra),リヨセル(Lyocell)等が存在する。リネンとラミーはいずれも麻であるが,原料の植物が異なるので特性が異なる。再生繊維は種類ごとに原料や製造方法が異なるので,やはり特性が異なる。

 図2に各セルロース繊維の赤外吸収スペクトルを示す。注意深く見ると,天然繊維と再生横維ではスペクトルの形状が明らかに異なる。したがって,天然繊維と再生繊維をスペクトル形状から目視で判別することは概ね可能である。(後述するように,やや複雑な状況があって完璧な判別は難しい。)しかし天然繊維,再生繊維のそれぞれを更に細かく判別することは,スペクトル形状の違いが小さいために目視では不可能である。そこで,スペクトルデータに多変量解析を適用することによる判別を試みた。

  • 図1

    図1 ATR法で測定した4種類の繊維の布地の赤外吸収スペクトル。比較をしやすくするために,各スペクトルはベースラインをシフトさせて表示してある。

  • 図2

    図2 ATR法で測定した6種類のセルロース繊維布地の赤外吸収スペクトル。水酸化ナトリウム水溶液によるシルケット加工を施していない布地についての測定結果。比較をしやすくするために,各スペクトルはベースラインをシフトさせて表示してある。

     

     

3. セルロース繊維の判別分析

 多変量解析によりスペクトルを数値的,統計的に処理すると,目視では捉えることが難しいスペクトルの微細な特徴を2次元平面上に表すことができる。スペクトルの特徴を取り出す処理法として我々は,主成分分析(PCA,principal component analysis)とフィッシャーの判別分析(FDA,Fisher's discriminant analysis)を用いた。これらの手法により類似したスペクトルのわずかな違いを捉え,その違いを特徴付ける二つの変数を軸にとったスコアプロットを作成することができる。PCAとFDAの大きな違いは,サンプルのクラス情報,すなわちそれぞれのサンプルがどの判別グループに属するのかに関する情報を用いるかどうか(教師無しの学習か,教師有りの学習か)という点である。なお本稿では,スペクトルの前処理や解析に用いた波数領域などの詳細な説明は省いて結果のみを紹介する。

 

3.1 主成分分析(PCA)

 PCAでは,具体的に以下のような手順で計算を行う。それぞれのスペクトルは多次元空間(各スペクトルのデータ点数が次元数となる空間)内の一点として表される。この空間に直交線形変換を行い,データを射影した時に最も大きな分散を示す軸を第1軸とする。次に,第1軸に直交し二番目に大きな分散を示す軸を探して第2軸とする。同様にして,それまでに得られた軸のすべてに直交し最も大きな分散を示す軸を順次探し出していく。このようにして見出された各軸の方向(単位ベクトル)が主成分に対応する。観測されたスペクトルは主成分の線形結合で表すことができる。その時の成分の係数はスコアと呼ばれ,スコアプロットに用いられる。PCA は大きく変動する成分から順次抽出するので,最初のいくつかの主成分に対応するスコアに測定対象の情報が濃縮されることになり,一般には非常に大きな次元数を持つスペクトルをずっと少ない次元のデータで解析することができるようになる。

 図3にスコアプロットの例を示した。多数の綿と麻(リネンとラミー)の布地の赤外吸収スペクトルについてPCAを行い,得られたスコアから作成した主成分スコアプロットである。第一主成分のスコア(PC1)と第二主成分のスコア(PC2)を軸にとってある。スコアプロットでは,同じ成分,あるいは類似した成分のサンプルに対応する点がお互い近い場所にプロットされる。プロット内の楕円(等確率楕円)はそれぞれの繊維種のプロットの95%が入る統計的な分布の広がりを示す。観測されたスペクトルのままでは判別がほぼ不可能であった綿と麻が,概ね分離してプロットされている。しかし両者が重なり合っている部分もあって,完全な判別は難しい。数値的に求めた誤判定の確率は,0.10であった。

 図3では,綿のプロットも麻のプロットもばらついて分布している。その原因は2つある。一つは,綿も麻も天然の植物繊維であるために,品種や産地などにより品質が少しずつ異なることである。もう一つは,天然のセルロース繊維がしばしばアルカリ水溶液によるシルケット加工(マーセル化)と呼ばれる加工を施されることである。シルケット加工には,天然繊維の光沢や強度,染色性を高める効果がある。シルケット加工を施すと,天然繊維は結晶構造を変化させ,そのスペクトルは再生繊維のスペクトルに似たものに変化する。流通している天然繊維は,シルケット加工の有無や加工の程度がさまざまなために,赤外吸収スペクトルを測定して主成分スコアプロットを行うと結果がばらつく傾向を示す。

 そこで我々は,スペクトル測定に先立ち全てのセルロース繊維を特定の濃度の水酸化ナトリウム(NaOH)水溶液により処理するという方法を考案した。この処理を行うことにより,シルケット加工されていない天然繊維のスペクトルも再生繊維に類似した形状となり,目視で天然繊維と再生繊維のスペクトルを判別することは難しくなるが,天然繊維間のシルケット加工の有無やその程度の違いに起因するスペクトルのばらつきが小さくなって繊維種に固有のスペクトルの特徴を多変量解析で見出しやすくなる。図4に,NaOH 処理を施したセルロース繊維のスペクトルを比較して示した。図2のスペクトルと比較すると,天然繊維のスペクトルが再生繊維のスペクトルに近づいていることがわかる。

  • 図3

    図3 NaOH処理を施していない綿布地と麻布地のスペクトルデータの主成分スコアプロット。

  • 図4

    図4 水酸化ナトリウム水溶液による前処理を施した6種類のセルロース繊維布地のATR 赤外吸収スペクトル。比較をしやすくするために,各スペクトルはベースラインをシフトさせて表示してある。

 図5にNaOH処理を施した綿と麻についてのスコアプロットの結果を示した。図3に比べると,綿と麻のプロットがそれぞれ狭い範囲にまとまっていることがわかる。誤判別確率は0.095と計算された。NaOH処理を行うことによりシルケット加工の有無によるスペクトルのばらつきが少し小さくなり,PCAの結果が繊維種によるスペクトルの違いをより強く反映するようになって判別精度が向上したものと考えられる。しかし,まだ完全な判別を行うことはできていない。

 PCAスコアプロットにより,種々の組合せでの判別を試みた。天然繊維と再生繊維は本質的に異なったスペクトルを示すので,それらの判別は比較的容易だった。天然繊維間,再生繊維間の判別については,再生繊維間の判別のほうが容易であることがわかった。工業的に生産される再生繊維は繊維種ごとに品質がそろっているので,容易に判別ができると考えられる。一方,天然繊維は品種や産地等の違いがスペクトルに現れ,同一の繊維種のサンプルであってもスペクトル形状にばらつきが表れる。このばらつきのために,PCAでの天然繊維の種類の判別が難しくなっていると考えられる。そこで,次にFDAの応用を試みた。

図5

図5 NaOH水溶液で処理した綿布地と麻布地のスペクトルデータの主成分スコアプロット。

3.2 フィッシャーの判別分析(FDA)

 PCAでは,各スペクトルがどの種類の繊維のスペクトルであるかというクラス情報を用いずに,大きな変動を示すスペクトル領域のパターンを学習する。そのために,クラス間の違いではなくサンプル間で大きく変動するスペクトル領域のパターンを学習してしまい,得られた判別モデルが目的には十分役立たない場合がある。一方FDAでは判別対象のクラス情報とスペクトルデータを入力し,クラス間で違いが見られるスペクトル領域のパターンを学習する。クラス情報を与えることにより,同じ繊維種のサンプル間のスペクトルのばらつきによる影響を最小限に抑え,繊維種の違いを効率良く捉える判別モデルを作成することができる。

 ところで,変数の数が非常に多いスペクトル(変数の数>>測定数)にFDAを適用すると,モデル作成に用いたサンプル群にのみに過剰に適応した判別モデルが作成されるという過学習を引き起こす。過学習によって作成されたモデルは,モデル作成用以外のサンプルのスペクトルに対する判別性能が低い。この問題を解決するために我々は,カーネル判別分析で用いられる正則化項付のFDA5)を取り入れて,この正則化項と直交分解を組み込んだ新しいFDAの計算手法FDOD(Fisher's Discriminant analysis Orthogonal Decomposition)を開発した6)。この手法の詳細は,別途原著論文として発表する予定である。ここでは,実用例を紹介する。

 図6は,綿と麻のスペクトルデータにFDAを適用することにより得られたスコアプロットである。我々の開発した手法では,FDAでもPCAの場合と同様に測定結果を多次元空間のスコアプロットとして表して判別に用いることができる。図6(a)は,モデル作成に用いたサンプルのデータのスコアプロットである。綿と麻が最も良く判別できるような軸を探し出して,プロットを行っている。両者は横軸(DA1 軸)で判別することができるが,縦軸(DA2軸)の方向にも違いがあることがわかる。2本あるいはそれ以上の軸を用いたプロットを行うことにより,より精密な判別が可能となる。図6(a)のプロットを図2のPCAによるスコアプロットと比べると,綿と麻の分離が大きく改善されていることがわかる。

  • 図6

    図6 綿と麻のスペクトルデータのFDAスコアプロット。(a)はモデル作成に使用したサンプルのみのプロット。(b)には(a)のプロットにテストサンプルのプロットも重ねて示した。

     

     

  • 図6

 FDAでは,過学習によりモデル作成に用いたサンプル群に特化した判別モデルを作成してしまうことがある。そこで,作成したモデルのバリデーション(モデル作成に使用したのとは異なるサンプル群のデータを用いて,作成したモデルが有効に働くかどうかを検証すること)を行って,過学習が起こっていないことを確認する必要がある。図6(b)は,バリデーションの目的で,図6(a)のプロット上にテストサンプルのデータを重ねてプロットしたものである。テストサンプルもこのプロットにより正しく判別することができることがわかる。テストプロットはDA1軸のみでは判別しきれていないことから,二次元のプロットが有効であることもわかる。

 同様に,FDAで得られたスコアプロットにより,麻の仲間であるリネンとラミーの判別や,再生繊維のレーヨン,キュプラ,リヨセルの中からレーヨンのみを判別することや,キュプラとリヨセルを判別することも,良好に行うことができた。これらの判別モデルを順次用いることにより,従来法では非常に困難であった綿,リネン,ラミー,レーヨン,キュプラ,リヨセルというセルロース繊維の正確な判別が可能となった7)

4. まとめ

 ATR測定で得られた赤外吸収スペクトルに多変量解析を用いて,単一のセルロース繊維で構成される布地の材質判別を行う手法開発を行った。PCAで概ね判別ができる場合もあったが,十分判別を行うことができない場合も見られた。一方FDAを用いることにより,非常に近い種類のリネンとラミーや,キュプラとリヨセルなどまでを高い精度で判別することができた。本研究の共同研究先の一般財団法人ニッセンケン品質評価センターでは,本研究で開発したFDAによるリネン,ラミー,キュプラ,リヨセルの判別手法を,「ニッセンケン法」と名付けて実際の繊維鑑別の業務に利用している。

 ここで紹介した多変量解析による判別分析は,布地材質の判別ばかりでなく,種々の対象の分析に応用が可能だと考えられる。今後,様々な対象に応用されることを期待している。

 本研究開発は,一般財団法人ニッセンケン品質評価センターとの共同研究として,吉村季織研究員(東京農工大学),菅野麻奈美研究員(ニッセンケン品質評価センター),および東京農工大学大学院農学府修了生の山形暢氏,齋藤健悟氏が在学時に行ったものである。

参考文献

  • 1) 尾崎幸洋編著,近赤外分光法,講談社(2015).
  • 2) 繊維製品品質表示規程,平成29年3月30日 消費者庁告示第4号.
  • 3) JIS L1030-1,繊維製品の混用率試験方法-第1部:繊維鑑別.
  • 4) JIS L1030-2,繊維製品の混用率試験方法-第2部:繊維混用率.
  • 5) 赤穂昭太郎著,カーネル多変量解析―非線形データ解析の新しい展開,岩波書店(2008).
  • 6) 国際出願PCT/JP2017/019641(一般財団法人ニッセンケン品質評価センター)2017.05.26.
  • 7) 齋藤健悟,山形暢,菅野麻奈美,吉村季織,高柳正夫,照明学会誌,101, 504(2017).

関連データ

関連情報