外挿できる機械学習モデル

概要

従来は困難であった学習データ範囲外(外挿範囲)に対する予測を可能にする当社特許技術です.また、個別の説明変数について外挿予測可能か否かが予測値の算出と同時に判断されます.

外挿困難な従来の機械学習

従来の機械学習は、基本的に学習データが存在する範囲(内挿範囲)に対して予測可能であり、学習データが存在しない範囲(外挿範囲)に関しては予測が困難です.すなわち、経験した範囲内のことしか対応できません.この機械学習の特性は、活用可能なケースを限定してしまいます.

例えば、新製品を開発するときには、その新規性ゆえに、いずれかの説明変数が過去製品データの外挿範囲になりがちです.しかし、このようなケースで、過去製品データから作られた機械学習モデルによる新製品に関する予測は、外挿となるため、信頼性がありません.

「法則」が持つ外挿性

一般に「法則」と呼ばれるものは、それがベースにしている仮定や近似の範囲内においては、本来的に外挿性を有しています.また、あらゆる「法則」がパイナンバーで構成されることがバッキンガムの理論により示されています.それらパイナンバー間の具体的な関係式が現象の支配方程式とみなされます.

従来からある方法で物理現象に対するパイナンバーを得るためには、バッキンガムのパイ定理にもとづいて次元解析を行う、現象に対する支配方程式を記述して無次元化するなどの作業が必要です.いずれの作業においても人による現象に対する詳細な知見と、情報として各変数の単位(次元)が必要です.そのため、現実の複雑な現象を対象にすると、多くの場合、パイナンバーの記述が困難となります.

外挿できる機械学習モデル=「デジタル法則」

当社の外挿性を持つ機械学習モデルは、「法則」が持つ外挿性を利用します.ただし、変数の単位や現象に対する知見は必要とせず、データの値のみからパイナンバーを自動生成すると同時に外挿可能な機械学習モデルを作ります.

当社は、このようなモデルを「現象を支配する法則をデジタル化したもの」という意味で、「デジタル法則」と定義しました.デジタル法則は、構築のために現象に関する理解が不要であるという点と、すべてデータが基準になるので外挿可能範囲と精度がデータの質と量に依存する点において、一般の法則と異なります.

Fig. 1 テスト用物理現象(等分布荷重pを受ける円板の大変形(非線形)含むたわみ現象)のデータ
Fig. 2 外挿予測テスト結果
対象となる現象

現象の理解や物理単位などの情報は必要ありませんので、対象は物理現象に限定されません.データがあればデジタル法則化できる可能性がありますので、通常の機械学習が対象にするデータはデジタル法則化の対象になりえます.

デジタル法則+最適化アルゴリズム=「応用力」

デジタル法則を対象モデルに設定して最適化アルゴリズムを適用すると、学習データの外挿範囲を含む範囲で最適解が探索されます.この能力を人間に例えれば、経験から法則を得て、それを新しい現象に用いる「応用力」に相当します.

当社特許

特許第6999207号

発明の名称: データ解析方法、データ解析装置、及び、データ解析プログラム
登録日: 令和3年12月24日

特許第7039090号

発明の名称: データ解析方法、データ解析装置、及び、データ解析プログラム
登録日: 令和4年3月11日

© 2024 ENJYN