データの前処理

前処理は自動でらくらく!

AIの予測精度を上げるためには、データを適切に前処理する必要があります。Multi-Sigmaにデータをアップロードすると、適切な前処理方法が自動で選択されます。データに欠損値がある場合でもMulti-Sigma上で補完できます。

データの前処理

前処理方法

 
  • Standardization
  • Max-Min
  • Abs-Max
  • None ※前処理済みのデータに対してはNoneを指定する必要あり
 

欠損値の補完方法

 
  • ゼロ値補完
  • 平均値補完
  • 中央値補完
  • 最頻値補完
  • 再帰的多変量補完
  • 欠損データ削除
 

データ要件

 
  • ファイル形式:CSV
  • データ容量上限:1解析あたり3MB
  • 目的変数(アウトプット数)上限:100個
  • 説明変数(インプット数)上限:200個
  • 推奨データ数(件数):ニューラルネットワーク解析は20以上、ベイズ解析は3以上10以下
 

複数の目的変数(アウトプット)に対応

多くのAIツールでは目的変数を1つしか取ることができません。Multi-Sigmaは複数の目的変数に対応しており、「高性能化&コスト削減」のように複数の目的を同時に達成するための条件を知りたい場合に最適です。

ニューラルネットワーク解析

AI学習

ビッグデータ不要!20個のデータから高精度に予測 ☆国際特許取得済

深層学習を使った解析は、学習時の条件(ハイパーパラメータ)を適切にチューニングしなければ高い予測精度を得られません。Multi-Sigmaは独自のオートチューニング機能を搭載しており、小規模な実験データに対しても最適なハイパーパラメータを自動で探索し、過学習に陥ることなく高精度に予測します。オートチューニングの所用時間は約1時間です。

ニューラルネットワーク

オプション設定

 
  • 出力層の活性化関数:linear / sigmoid
  • 出力層以外の活性化関数:relu / sigmoid / tanh
  • 検証データの抽出:Balanced / Random / Last
  • 不均衡データの調整
  • 学習データをファイルに保存
 

AIモデルの詳細表示・ダウンロード

 

各AIモデルのハイパーパラメータの値や各アウトプットに対する相対誤差、予測値と実測値の相関係数等を確認できます。これらの情報とともにAIモデルをダウンロードできます。モデルはH5形式のファイルで、PythonのKeras/Tensorflowのフレームワークで利用できます。

AIモデルの詳細表示・ダウンロード
 

アンサンブルモデル

 

ニューラルネットワーク解析ではアンサンブルモデルを使用できます。複数のAIモデルを組み合わせ、その平均値を用いて解析(予測・要因分析・最適化)を行います。特にデータの数が少ない場合は、アンサンブルモデルを用いることで予測精度の向上が期待できます。

アンサンブルモデル
 

AI予測

AI学習によって作成されたAIモデルを用いて、未知のインプットデータに対するアウトプットデータの予測を行います。

結果の検証・ダウンロード

 

検証用データ(AI学習に使用していないインプット・アウトプットのデータ)を用いて予測を行うと、予測値と実測値の誤差が算出されます。予測結果はCSVファイルとしてダウンロードできます。

結果の検証
 

予測結果の可視化

 

AI予測で生成された結果のデータを散布図で表します。X/Y軸に表示するデータはワンクリックで切り替えできます。

予測結果の可視化
 

2値データの予測結果の可視化

 

アウトプットが2値データの場合は、予測・検証結果をROC曲線や混同行列で表します。

2値データの予測結果の可視化
 

要因分析

作成したAIモデルにおいて、各インプットが各アウトプットにどの程度影響を与えているかを定量的に評価します。要因分析結果はCSVファイルとしてダウンロードできます。

要因分析

最適化(多目的遺伝的アルゴリズム)

複数のアウトプットを同時に最適化

作成したAIモデルと多目的遺伝的アルゴリズムを用いて、最適なアウトプットとなるインプット条件の探索を行います。トレードオフの関係にある複数のアウトプットに対しても最適解の集合を取得できます。

最適化(多目的遺伝的アルゴリズム)

オプション設定

 

アウトプットに対して

  • 最大化 / 最小化 / 目標値 / 非制御

インプットに対して

  • 最大値・最小値
  • 実数 / 整数
  • 制御 / 非制御
  • インプット間の制約条件:「a * A + b * B + c * C = T」のような条件を用いて最適化できます。(赤字部分を設定可能)
    AIによる最適化の解は数値が現実的ではない場合があります。例えば化学実験で材料の最適な配合比率を探索したい時に、材料同士の溶解度により現実的でない組み合わせになってしまったり、コストの問題で示された量の投入が難しいといった場合があります。制約条件を設定することでこれらの問題を回避することができます。
 

最適化結果の可視化

 

最適化結果のデータ(様々なインプット条件での最適解の集合)を散布図で表します。X/Y軸に表示するデータはワンクリックで切り替えできます。

最適化結果の可視化
 

ベイズ解析

実験条件・環境が特殊でデータがなかなか取れないときに!
「次にどんな条件で実験すべきか」を提案

研究の初期に、次に行うべき実験の条件を探索します。データ数3~5程度から解析できます。得られた条件で実験を行い、そのデータを追加してさらに解析するというサイクルを繰り返して精度を高めます。

ベイズ解析

AI学習(ガウス過程回帰)

ガウス過程を仮定して、獲得関数の数値が高い領域を探索します。学習の所要時間は数秒~数十秒です。

オプション設定

 
  • Kernel:RBF / Matern52 / Exponebtial / Linear / Periodic
  • 学習パラメータ(全て自動調整可能):Variance, Lengthscale, Period, Gaussian Noise Variance
 

AI予測・要因分析

ニューラルネットワーク解析と同様です。

最適化(ベイズ最適化)

複数のアウトプットを同時に最適化

作成したAIモデルとベイズ最適化を用いて、最適なアウトプットとなるインプット条件の探索を行います。ベイズ最適化では、データが疎な領域に対して不確実性(分散)を考慮して評価します。

オプション設定

 

アウトプットに対して

  • 最大化 / 最小化 / 目標値 / 非制御

インプットに対して

  • 実数 / 整数
  • 制御 / 非制御
  • インプット間の制約条件:「a * A + b * B + c * C = T」のような条件を用いて最適化できます。(赤字部分を設定可能)
    AIによる最適化の解は数値が現実的ではない場合があります。例えば化学実験で材料の最適な配合比率を探索したい時に、材料同士の溶解度により現実的でない組み合わせになってしまったり、コストの問題で示された量の投入が難しいといった場合があります。制約条件を設定することでこれらの問題を回避することができます。
  • 探索方式:改善期待値(EI) / 改善確率(PI) / 平均(Mean)
 

連鎖解析

世界初!複数工程のAIを組み合わせて解析 ☆特許出願中

複数の工程を経て最終製品が作られるような場面で役立つ機能です。各工程のデータでAIを作成し、それらを組み合わせて解析を行います。これにより、最終製品で目的の性能等を得るために、どの工程をどのような条件で行えばよいのかが分かります。

連鎖解析を行うメリット

  • 中間的なパラメータの解析にも活用可能です。
  • 一部の工程やパラメータが変更されても、その部分のみモデルを更新すればOK! システム全体を作り直す必要はありません。
  • 工程ごとに要因分析を行うことで、システム内部のメカニズムを理解しやすくなります。
連鎖解析

その他

インターフェース

上から順番にボタンを押していくだけ!プログラミング不要で誰にでも使いやすい!

インターフェース
  • 対応言語:日本語 / 英語 / 中国語
  • 表示形式:ライト / ダーク

学習データの統計解析(プロファイリング)

アップロードしたデータの統計解析を行い、結果を図表で表示します。

プロファイリング

実験データ作成

データ数とインプット数、各インプットの値の範囲を指定して、簡易的な実験データを生成します。各インプットの制約下において、各アウトプットが取りうる値の範囲と、それを形成する条件の組み合わせを大まかに把握できます。手持ちのデータのばらつきが大きい場合や、シミュレーションで全体像を把握したい場合に便利な機能です。

page_top_icon