においセンシングシステムの研究動向(2)

東京工業大学 科学技術創成研究院
教授 中本 高道

4.深層学習によるにおい印象予測

香りがどのような印象を持つかは、”甘い”、”さわやかな”のような記述子で表現され、各記述子のスコアでもって表される。ここでは質量分析器と深層学習を用いて匂い印象を予測する手法を説明する。
図7に示すように質量分析器の出力を深層学習により学習させたニューラルネットワークで匂いの印象空間に写像させる11)。ニューラルネットワークは従来から使用しているが、近年は大規模なニューラルネットワークを比較的簡単に用いることが可能である。

図7.匂い印象予測を行うニューラルネットワークの構成

匂いの印象はDravnieksが作成したデータベースから、121の匂い物質について144の記述子を使用し0-5のスコアで評価したデータを使用した12)。その際、多次元空間から多次元空間への写像を行うので、写像の精度を上げるためには各空間で特徴抽出をすることが有効である。そこで、マススペクトル空間(212次元)と匂いの印象空間(144次元)それぞれに対してオートエンコーダ(5層の多層パーセプトロン)により特徴抽出を行った。
オートエンコーダは砂時計型ニューラルネットワークとも言われ、中間層の中央の層のニューロン数を絞って、そこにデータの特徴が現れるようにする手法である。入力層のデータと同じものを出力層の目標値として与えてニューラルネットワークに与えて学習させる。その結果、教師有り学習にも関わらず、あたかも教師無し学習のように動作して、隠れ中央層のニューロン数を絞ったところに次元圧縮されたデータの特徴が現れるのである。
抽出した特徴の次元はマススペクトル空間は45次元、匂い印象空間は30次元である。そして、抽出した特徴空間の間の写像を5層の多層パーセプトロンで行った。匂い印象の予測ではこれらのニューラルネットワークで必要なところのみを使用するので、9層の多層パーセプトロンを使用することになる。匂い印象の予測を行い、従来の代表的手法であるPLS(Partial Least Squares)法13) と本手法を比較した。PLS法は線形手法であるが、重回帰分析よりも多重共線性に優れた手法として知られている。PLS法における潜在変数の数は45個である。その潜在変数の場合が、最もテストデータに対する誤差が小さかった。

100個のデータを学習に使用し、21個のデータをテストデータに使用した。交差検定の結果を図8に示す。図8には3024(144記述子x21サンプル)のデータがプロットされている。交差検定の結果、本手法を用いた場合の真値と予測値の相関係数が0.76に対してPLS法の場合が0.61となり、本手法の有効性を確認することができた。交差検定とは、学習時に使用したデータとは別のデータを評価時に使用する検定方法で、パターン認識ではよく用いられる方法である。

図8.匂い印象予測結果 11).
(a) 本手法、(b) PLS法 11)

5.におい再現

筆者のグループはいくつかの要素臭の比率を変えることにより多数の香りを近似的に表す手法を開発した。色の場合は3原色だが、香りの場合はいくつの要素臭があれば任意の香りを作成できるのであろうか。かつてAmooreは7原臭説を唱えたが14)、実際はもっと多くの要素臭が必要と考えられる。
人の嗅覚受容体の種類は350-400種類程度と言われている。それと同数程度の要素臭を準備するのは大変であるが、まったく同じ匂いでなくてもある程度類似している匂いでも可とすると要素臭の数は減らせる可能性がある。このように、少ない要素臭で類似した香りを作ることを香りの近似と呼ぶ、香り近似により香りを再現することを考える。映画に香りをつける時は香りの種類を大きく変えないと体験者はなかなか変化がわからないことを考えると、実際にはもっと減らせる余地がある。
この要素臭を探索するには、人間の官能検査から得られた空間上で探索するのが最適であるが、人の嗅覚は順応があるうえにたくさんの香りのデータを得るのには多大な時間がかかる。さらに個人差もあるために信頼性のあるデータをたくさん集めるのは容易ではない。

そこで、ここでは質量分析器によりデータを測定して集めることにした。質量分析器を用いると大量のデータを安定に測定することが可能である。また、データの次元数は200次元以上あり、調合比を求める時に問題となる多重共線性(要素臭の数が増加するにつれてその構成比が安定に求まらなくなる問題)がほとんど問題とならない。さらに質量分析器ではマススペクトルに関して線形重ね合わせが成り立つので数学的取扱いが容易である。
要素臭を求めて、要素臭により近似的に香りを再構成する方法を図9に示す。質量分析器データからは非負値行列因子分解法(Nonnegative Matrix Factorization、以下NMFと略)法で基底ベクトルを抽出する。そして、現存する香りのマススペクトルと非負拘束最小二乗法を用いて基底ベクトルを近似し、その時の基底ベクトルの構成比より要素臭を作成する15)。対象臭を要素臭で近似する時は、要素臭のマススペクトル(近似された基底ベクトル)を用いて対象臭のマススペクトルに対して再度非負拘束最小二乗法を適用し、要素臭の構成比を得る。
特徴的なベクトルを抽出する最もよく知られている方法は、主成分分析法である。しかし、主成分分析法は、各主成分ベクトルに負の要素が含まれたり、主成分ベクトルにかかる係数が負になったりするために、マススペクトルや香りの構成比を表現するのに適していない。そこで、本研究ではNMF法を用いることにした。

図9.香り再現の原理

NMF法を用いるとマススペクトルはほぼ再現できる。しかし、さらに人が匂いを嗅いで評価する官能検査が必要である。そこで、13のブレンド精油に関して、マススペクトルの残差及び対象臭と近似臭の類似性を3点識別法で調べた(表2)。3点識別法とは2つ同じで一つだけ異なる3つのサンプルを被験者に提示して、その異なるサンプルがどれかを被験者にあててもらう方法である。12要素臭の場合、識別率が44-89%なのに対して、30要素臭は33-63%であった。3点識別法では識別率33%で違いが区別できなくなるので、本手法によりある程度本物に近い匂いが近似的に作成できたと言うことができる。

表2.3点識別法による香り再現の評価

6.まとめ

本稿では、最近の匂いセンシングの動向、香り印象予測、香り再現について紹介した。香りに関しては、まだITの中に取り込まれることはなく主観的な要素が強いものと思われているが、今後ITで用いられるようなディジタル嗅覚の研究が盛んになっていくものと考えられる。

謝辞
本研究の一部は日本学術振興会科学研究費JP18H03773の支援を受けた。

参考文献
11) Y.Nozaki,T.Nakamoto, Odor Impression Prediction from Mass Spectra,.PLoS ONE 11(6):e0157030.doi:10.1371/journal.pone.0157030 (オープンアクセス).
12) Dravnieks A. Atlas of odor character profiles. Philadelphia. ASTM. 1985.
13) Geladi P, Kowalski BR. Partial least-squares regression: a tutorial. Analytica Chimica Acta. 1986; 185:1–17.
14) E.アムーア著、原訳、匂い -その分子構造、恒星社厚生閣版、1972.
15) T.Nakamoto, M.Ohno, Y.Nihei, Study of odor approximation by using mass spectrometer, IEEE Sensors Journal, 12 (2012) 3225 – 3231.

【著者略歴】
中本 高道(なかもと たかみち)
東京工業大学 科学技術創成研究院 教授

■略歴
1984年 東京工業大学電気電子工学専攻修士課程了。同年日立製作所(株)入社。
1987年 東京工業大学助手
1993年 同大准教授
2013年 同大精密工学研究所教授、2016年科学技術創成研究院教授、現在に至る。工学博士。
1996-1997年、 米国パシフィックノースウェスト研究所客員研究員。ヒューマン嗅覚インタフェース、知覚情報処理、センサ情報処理の研究に従事。

■著書
電気電子計測入門(実教出版)
においと味を可視化する(共著、フレグランスジャーナル社)
Essentials of machine olfaction and taste (編著書, Wiley)
Human olfactory displays and interfaces (編著書、IGI-Global)
嗅覚ディスプレイ(編著書、フレグランスジャーナル社)
センサ工学(共著、昭晃堂)