データ連携社会とセンシング(1)

森口 誠(もりぐち まこと)
森口 誠

三田典玄 森口誠〔一般社団法人センサイト協議会 理事〕

本文はソフトウエア技術者が主導して進んでいるデジタル社会にむけた取り組みに、いちセンサ技術者が関わるようになり見えてきた課題について整理したものです。 従って、ソフトウエアを専門とされる方から見ると言葉や内容が定義どおりに見えない場合があることあらかじめお断りさせて頂きます。
あえて、デバイスになじみのある方に寄った表現を使っているケースがあります。 また、デジタル社会にむけた取り組みは多岐に渡っていますが、その中でセンサデバイスに関わる側面に焦点をあてています。
厳密な定義や取り組みの全貌はできるだけ参照を記載するので、詳細は参照から確認いただけたければ幸いです。

1 はじめに デジタル社会

昨今、デジタル社会に向けてとかDXを活用などといった言葉を頻繁に耳にする。
デジタル社会の一つの理想像としてあらわしたのが政府の掲げる「Societ5.0」である。
(図1、図2)

画像出典:内閣府「Society5.0」より/図1 情報社会からデジタル社会(Siciety5.0)へ
画像出典:内閣府「Society5.0」より
図1 情報社会からデジタル社会(Siciety5.0)へ
https://www8.cao.go.jp/cstp/society5_0/index.html

図2デジタル変革時代のICTグローバル戦略懇談会(第2回)資料
図2 デジタル変革時代のICTグローバル戦略懇談会(第2回)資料
実世界のデータをサイバー空間で価値化して実世界に返す。
実世界のデータをいかに適切に負荷なく処理できるか。人が介在するようだと追いつかなくなる。
出典:https://www.soumu.go.jp/main_content/000613942.pdf

しかし、デジタル社会とはどんな社会なのだろうか?デジタル社会形成基本法1)によると「デジタル社会」を、「インターネットその他の高度情報通信ネットワークを通じて自由かつ安全に多様な情報又は知識を世界的規模で入手し、共有し、又は発信するとともに、先端的な技術をはじめとする情報通信技術を用いて電磁的記録として記録された多様かつ大量の情報を適正かつ効果的に活用することにより、あらゆる分野における創造的かつ活力ある発展が可能となる社会」と定義する。
一見するとデジタル社会の前段階である情報社会にもそのまま当てはまるように見える。
しかし、「多様かつ大量の情報を適正かつ効果的に活用する」という表現に違いが表現されている。この変化から生まれる価値には大きな差が生じる。(図3)
現在、世界中のあらゆるところにデータは存在する。しかし、どこにどのようなデータを知ることは簡単ではない。さらにそのデータがどのように作成されたのか、データを生成する仕組みがどのような物なのか、データの欠落はどのように処理されているか知ることは困難である。膨大なデータは存在し、その中には活用したいデータも存在しているかもしれない。しかし、そのデータにたどり着けない。つまり、現状では、すでにあるデータを十分活用できていない。またデータを見つけ出せても、誤ったデータだったため、間違った結論を導きだすこともありうる。デジタル社会においては、データ連携基盤や生成されたメタデータ(データそのものではなく、データに付記する付帯情報のこと)にデータ処理するために必要なメタデータを標準化し、データ連携基盤を介して解析の目的にあったデータを見つけ出し、活用できる社会となる。一度構築した仕組みは自動化することも可能であり、人手を介さない仕組みが構築される。
また、誰でもデータ連携基盤を通じてデータを取得することができるようになるようデザインされている。少なくともSociety5.0や欧州委員会ではそのように謳っている。そして、その結果として新たな価値を創造し、新たな事業を起こすような社会になると考えられる。
センサはデータの生成を行うエッジを構成し、エッジで付記されるメタデータはデータ活用においてスムーズなデータ連携や健全なデータ取引のために必要となる。

図3 情報社会とデジタル社会におけるデータ活用者からみたデータの流れ
図3 情報社会とデジタル社会におけるデータ活用者からみたデータの流れ

ここではデータ連携社会においてセンサに求められる要件を3つの観点で整理し、それぞれの現状について整理する。

  • 1)データ連携するためにセンサデータに付与するメタデータの整備、標準化
  • 2)センサデータ取得する仕組み構築を容易にする規格の標準化
  • 3)取得データの多様化に対応し、社会実装を促進するセンサ記述のデジタル化

2 データ連携するためにセンサデータに付与するメタデータの整備、標準化

データが連携する社会にはデータを利用・活用したいユーザ(データ活用者)とそのデータを生成するデータ生成者を結ぶ仕組みが必要になる。 スーパーシティ構想(図4)を例にとるとサービスを提供する業者は必要なデータをデータ連携基盤にアクセスして取得し、解析し、サービスにつなげる必要がある。そのためにはデータ提供者は利用者誰もが同じ理解を得るような語彙で語られる必要がある。

図4 スーパーシティの構成(出典:内閣府「スーパーシティ」構想
図4 スーパーシティの構成(出典:内閣府「スーパーシティ」構想
出典:https://www.chisou.go.jp/tiiki/kokusentoc/supercity/supercity.pdf

データ活用者がデータを探しだして、自分の求めているデータかどうか確認し、データを入手することができる仕組みが必要になる。
そのためにはデータにはデータ以外に様々なメタデータを付帯する必要がある。センサデータもその例外ではない。

具体的にはざっと以下の3種に分類することができる。
データを探し出すための検索用のメタデータ、データ活用者がデータを利用することができるかどうかを判断する品質に関するメタデータ、取引やデータ生成者の権利を保護するための取引に関わるメタデータである。(図5)

図5 メタデータとデータカタログ/データカタログはデータの目録(イベントリ)検索メタデータはデータカタログが規定する語彙で定義することで、データ提供者とデータ活用者の間の齟齬を回避する
図5 メタデータとデータカタログ
データカタログはデータの目録(イベントリ)
検索メタデータはデータカタログが規定する語彙で定義することで、データ提供者とデータ活用者の間の齟齬を回避する

2-1 検索用メタデータ

データを探し出すための検索用のメタデータはデータ活用者と生成者で共通に認識された識別符号のルールにのっとって記載されることが必要である。
これらの語彙や符号はデータカタログと呼ぶ目録で整理される。
同じ語彙でも産業や技術領域により、定義や用法が異なるので、実用上メーカー毎、産業毎などの単位で語彙が定義、整理され使用されてきた。しかし、産業横断的にデータを活用しようとすると標準的な語彙定義を基盤として、その語彙定義に翻訳するなどして、認識を合わせる必要がある。この標準語彙は日本においてIMI (Infrastructure for Multilayer Interoperability:情報共有基盤) 2)において共通語彙基盤3)として制定させ、普及に努めているが,十分に認知され活用されているとは状況である。
さらにこのような語彙をベースにデータカタログが整備され、検索しやすいように記述されている必要がある。
現状ではWebの標準化団体であるW3C (The World Wide Web Consortium)4)がWEBで活用するために策定されたDCAT (Data Catalog Vocabulary)5)が代表的なカタログである。これはよりデータ連携に対応できるよう、拡張が進んできている。日本においてはデータ社会推進協議会 (DSA)6)が世界の動向、特にW3Cの構造をとりいれ、互換性をもたせつつ日本の考えが実装されるようにデータカタログ(図6)の検討と実装を進めている。

図6 データ項目定義のクラス図/データ社会推進協議会 データカタログ作成ガイドラインV3.1 P14より
図6 データ項目定義のクラス図
データ社会推進協議会 データカタログ作成ガイドラインV3.1 P14より
出典:https://data-society-alliance.org/wp-content/uploads/2023/03/230331-D97-DataCatalogGuidelineV31-gl-tecst.pdf

語彙にしろ、データカタログにしろ、標準仕様のものは各業界など個別の領域で使用するには使い勝手が悪い。業界特有の定義や、慣用的な使い方と標準語彙やカタログと乖離があるからである。そのため各領域毎にデータカタログが整備され、活用されるのが普通である。
しかし、従来からの暗黙にルールや慣習に従ってデータカタログを整備すると標準のデータカタログと接続することが困難になる。これは産業間横断でデータ連携するデータ共通基盤につながりにくいことを意味する。
こういった接続性の問題を解消しつつ自らの使用に適したデータカタログの策定ができるように、データ社会推進協議会ではデータカタログの作成についてガイドラインを公開し、接続性の良いデータカタログの普及に努めている。

2-2 品質メタデータ

また実際に探し出したデータが解析や制御に使えるものか、データ品質を確認する必要がある。このデータの品質特性は例えばISO/IEC 250127)(JIS X25012)において「定義されている。
注意すべきはこれはデータ解析を目的とするデータサイエンティストの定義するデータ「品質」であり、センサ技術者の考えるデータ「品質」とが異なることである。
基本的にセンサ技術者にとってはセンサデータが真値に近いデータをどの程度出力できるかという観点で捉えるが、データ解析者にとって重要なのは解析に使えるデータがどの程度届いているかである。具体的にISO/IEC 25012に規定されているデータ品質モデル特性(表1)を考えてみる。

表 1−データ品質モデル特性 ISO/IEC 25012
表 1−データ品質モデル特性 ISO/IEC 25012

例えば「精度Precision」、センサでは精密度(ばらつきの範囲)を表す表現であり、ガウス(正規)分布で収束しているほど良いとのイメージである。

図7 センサ技術者と、ISO/IEC 25012の精度
図7 センサ技術者と、ISO/IEC 25012の精度

一方ISO/IEC 25012では、データの総数のうち、基準を満たす(解析に利用できる)データの割合と定義されている。精度=要求された精度をもつデータ値の数/データ値の総数となる。
また「正確性」はISO/IEC 25012では、意図した概念や事象をどの程度正しく表現できてるかであり、構文や意味的な正確性の二つの局面を持つ。
例として以下のような事例が記載されている。

「詳細記入の欄が構文上正確なレコードの数」/レコードの数

これはあくまでも正しくデータ解析に使用できるかという観点からのデータ品質である。
一方、センサ一般では真値との誤差のことを言う。記述の状態については対象ではない。

さらに「一貫性」の場合、「特定の利用状況において,矛盾がないという属性及び他のデータと、首尾一貫しているという属性をデータがもつ度合い」と定義されている。これはデータの利用に関するデータであり、センサでは、データを生成した瞬間にこのような定義は対象の外にある。

このようにデータサイエンティストの定義するデータ品質はあくまでも解析に使用できる数値の羅列かどうかであって、センサが正しく機能する(ノイズも含めて正しく検知・変換する)ことで真値に近いデータを出力することを目的とするセンサ技術者の考える品質とは差が生じている。
データ連携を目的とするデータ生成においてはセンサデータ品質を客観的に(ある特定の目的のためでなく)伝える必要があり、ISO/IEC 25012では十分表現できない。
例えばカメラによる画像を用いたセンサにおいて、データ活用者の目的が人流センシングであった場合、人流データのみをデータとして挙げていくことになる。しかし、各個人の行動、天候情報、車の通行状態などなど多くの情報が内包されているが捨てることになる。
また圧力センサ・加速度センサなどセンサを複合して、様様な解析を行うような使い方はすでに多くなされているが、そのセンサ出力を違った組み合わせで使いたいニーズも確実に存在する。
画像や複合センサはわかりやすい例だが、加速度センサの振動情報なども同様な情報を持っている。しかし、このようなことを表現できるような整備が必要あるが、現状その解が明確になっていない。

2-3 取引に関するメタデータ

取引に関わるメタデータはデータ連携の仕組みが経済的に成立し、社会に実装できるかどうかという意味で重要である。
この意味で必要なメタデータはデータ連携する仕組み作りの活動の中で検討されている。エッジ側にいるセンサとしては、いかに負荷が少なく、データ生成者の権利を保護し、データ連携に参加できる仕組みに貢献できるかが観点となる。
データの取引を含めたデータ連携する仕組みとしては日本においてはDATA-EX(図7)、ヨーロッパにおいてはGAIA-X8)(図8)の取り組みが代表的である。GAIA-Xは欧州委員会のもと、データ連携に関わる包括的な概念であり、仕組みである。産業横断でデータ活用するためのプラットフォームFIWARE9)やデータ連携するための技術基盤としてのIDSA10)がベースとして単一でシンプルなデータ取引市場を成立させようとしている。DATA-EXとGAIA-Xは協業協定を結んでおり、相互にデータが連携することを目指している。データの連携の仕方やルールは固まっていないようだが、日本側のデータ構造はデータカタログがW3CのDCATを参照するなど、基本的な構造は欧州主体で整備された世界標準を基盤としており、相互連携のハードルは比較的低い状態といえる。

図8 DATA-EXで目指す異業種データ連携コンセプト(出典:DSA)
図8 DATA-EXで目指す異業種データ連携コンセプト(出典:DSA)
出典:https://data-society-alliance.org/about/vision-mission/

図9 GAIA XのX-Model
図9 GAIA XのX-Model
出典:https://gaia-x.eu/gaia-x-framework/

また産業分野におけるデータ連携の取り組みは日本においてはインダストリアルバリューチェーンイニシアティブ (IVI)11)が進めている企業間オープン連携フレームワーク (CIOF: Connected Industries Open Framework)12)が存在する。これは2023年4月から商用ベースでの活動に移行し、定着を目指している。
CIOFが持つ共通辞書を介することにより、誤りのない取引をおこなうこと、データの授受はソフトウエア上でおこない、人が介在しないようにし、権利を保護すること、一方でデータの売買の契約は人が介在しておこなうことを特徴としている。

図10 IVIのデータ連携プラットフォーム CIOFのアーキテクチャー(IVI提供)
図10 IVIのデータ連携プラットフォーム CIOFのアーキテクチャー(IVI提供)
出典:https://monoist.itmedia.co.jp/mn/articles/2103/15/news064.html

CIOFを通じ企業の持つデータを共有することで、ものづくりの革新を目指している。
例えば、数十年故障しないような装置、しかし、これが止まると数か月生産に与える装置の故障データを共有、活用できるようになると、データ購入業者は機械故障予知につながり、装置の停止を最小限にすることができる。この停止期間回避に価値が生まれ、取引価格に反映される。



次回に続く-





【著者紹介】
森口 誠(もりぐち まこと)
○オムロン株式会社
 デバイス&モジュールソリューションカンパニー 技術統括部 要素技術部
 モジュール技術開発グループ
○一般社団法人センサイト協議会 理事

■略歴
・1993年 東京理科大学 理工学部電気工学科卒業
 同年オムロン株式会社入社
 加速度センサデバイス、RF-MEMSスイッチなどの開発に関わる
・1998年より 東北大学未来科学技術共同研究センター研究員として半導体開発・製造プロセス開発に従事。
・2003年より NEDOのMEMS関連の各プロジェクトに参画
・2009年から 新規事業創出担当
・2017年から データ連携をベースとしたエッジ戦略検討
・(一社)センサイト協議会・センシング技術応用研究会・(一社)次世代センサ協議会員
・データ社会推進協議会員
・電子情報通信学会・電気学会員