サイトアイコン がんばる開発・設計者 -placeOn公式ブログ-

試験回数を減らそう(実験計画法)

試験回数を減らそう(実験計画法)

試験回数を減らそう(実験計画法)

品質の為の試験や目的の条件抽出のために幾つかの条件を組み合わせて割り出そうとします。通常の考えであれば、総当たり回数分を行えば(試験すれば)確実です。ですが、組み合わせの条件の種類が沢山ある場合や、条件内容が沢山ある場合は指数的に総当たり回数が増えます。(試験回数が増えます)それをできる限り抑えるやり方になります。

実験の回数を総当たりで行うのではなく、確率で表す事・確率で行うことで回数を減らす

総当たりとの違い

例えば、植物の種が発芽する条件で最もよいものを調べたいと思ったとします。とりあえず、条件の種類として、「土の種類」「水の量」。条件の内容として、「土の種類」では「赤土」「黒土」「通常の土」、「水の量」てば「100ml未満」「100ml以上500ml未満」「500ml以上」とした場合の総当たり回数と表(組み合わせパターン)は以下になります。

総当たり回数(試験回数)は3×3=9回になります。

ここで条件の種類を1つ増やすことにします。条件の種類は「温度」で、条件の内容を「10℃未満」「10℃以上20℃未満」「20℃以上」とします。この場合の総当たり回数と表は以下になります。

総当たり回数(試験回数)は3×3×3=27回になります。どんどん乗数で増えます。。。

ですが、実験計画法の考えであれば実験回数は総当たり回数分必要ありません。なにを言ってるの?って思うかもしれません。表で表すと以下になります。

「あれ⁉︎やってないパターンがあるぞ!!」と思ったと思います。実験計画法では分散分析の手法を用いて関連する条件の内容(大きい要素)の割合を出しています。簡単に言うと、関連性を確立で求める手法です。そのため、結果を計算しないといけないです。。。事前にExcel等で作っておけば問題ないです。

メリット:
   試験回数が減る。条件の内容の関連割合が特定できる。
デメリット:
  最良の組み合わせが分かり難い、計算が必要
  (それぞれの条件の内容で強く関わりある項目が分かる)

 

実験計画法を使うことで2つのことが解析することができます。

1.試験回数の削減:題名にもしている内容になります。
2.データの解析:条件の内容がどの程度関わりがあるか確率でわかります。

 

実験計画法の考え方

実験計画法では、先ほど述べた条件の種類は「因子」、条件の内容は「水準」と呼びます。
総当たりで考えていくと因子A,B,Cと水準を1,2,3(A1,A2,A3)を計算式として以下のように書くことができると思います。

こんな単純ではないのですが、簡単に説明します。

・考え方

上記の式の中でも下記のように書き直すと関連する部分(共通部分)があるのがわかると思います。
この関連性を利用して直接試験をしていなくても試験結果が共通部分に現れるので全数を試験しなくても試験として成り立つという方法です。本来は分散(ばらつき方)から考えます。

そのため、組み合わせ方が非常に重要になります。その組み合わせはラテン方格と呼ばれる表から導き出した、直交表を使用します。と呼ばれる組み合わせになります。直交表を使用することで、総当たりで回数しなくても(全パターンの組み合わせなくても)各因子の効果がそれぞれ評価できます。この組み合わせ方が重要になります。

・ラテン方格とは?

 簡単にラテン方格を説明すると、各列各行に1つずつ要素が入るようにした並べ方です。組み合わせをばらけさせるのに使います。

このラテン方格を使用して分散の重み付けをしたものが直交表になります。
以下はこの場合に使用する直交表です。

考え方が難しい〜!って、私もそうです。
理論は難しい感じですけど、当てはまるパターンをそのまま行えば問題無いです。
詳しく知りたい方は以下の本が参考になります。
図解入門よくわかる最新実験計画法の基本と仕組み (How‐nual Visual Guide Book)

次はその使用する直交表を示していきます。

重要なのは、何水準・何因子を行うかで使用する直行表を割り当てればいいだけです。

試験結果が共通部分に現れることを利用して試験回数を削減します。

直交表の種類

まず種類を示す前に表記の仕方です。
直交表の表し方として以下のように書きます。

なんじゃこりゃ?ですが、これで2水準の因子が7個まで8回の試験で対応できる直交表という意味です。
 

直交表:2水準 3因子

直交表:2水準 7因子

直交表:2水準 15因子

直交表:2水準 31因子

直交表:3水準 4因子

直交表:3水準 13因子

使用する因子の数が少ない場合は、直交表の余りが出た因子は何も割り当てずにそのまま使用してください。
代表的なものを出しました。他にもたくさんありますし、導き出すことも可能です。
水準の組み合わせ(2水準と3水準の組み合わせなど)や多水準の直交表などもありますが、ここでは割愛します。
詳しくは文末にある参考資料を見てみてください。

結局、因子数・水準数が多くなると実験回数が多くなるので極力少なくするようにしましょう。

様々な種類がある
試験を行う因子・水準をできるだけ少なくする

Excelでの評価の仕方

直交表の種類は分かったと思います。具体的にどのように使っていくか説明します。

合格不合格の評価

ここでは合格の数値が分かっている状態で、組み合わせの網羅性を出していきます。

まず使用したい直交表を選択します。ここでは仮に8回試験の直交表(2水準7因子)を使用します。
先ほども説明したように因子の数が少なくても(この場合2水準であれば6因子でも)使用できます。
その場合は列(カラム)を無視してください。

・考え方(合格不合格)

考え方として、以下の連立方程式を解きます。
特性値(予測値、平均値)μと結果Sを比較して係数a〜gの変化を見ます。
特性値と結果が同じなら係数が0になります。異なると関わる係数に変化が出ます。

・Excelの使い方(合格不合格)

まず、必要直交表を出します。その直交表の最後の列にその実験特性値(予測値、平均値)μの列を追加します。
特性値にはOK/NGのような2極の場合は1,0で表してください。

まず先ほどの連立方程式を解くための逆行列を作成します。
Excelでは「MINVERSE関数」を使います。
①逆行列を作りたいところ(表示したい場所)に直交表+特性値の範囲と同じ範囲を選択します。
②入力欄にMINVERSEを記入します。
③MINVERSEの範囲(逆行列にしたいもの:直交表+特性値)を選択します。
④配列としてExcelに認識させます。Excelでは「Shift+Ctrl+Enter」で単なる数値ではなく関連がある配列として認識します。
これで逆行列の表が完成します。

今度は行列積をして係数a〜gの変化を表示させます。
Excelでは「MMULT関数」を使います。
①先程と同様に行列積を作りたい(表示したい場所)に因子数+1(特性値)の範囲を選択します。
②入力欄にMMULTを記入します。
③MMULTの範囲(行列積したいもの:直交表+特性値の逆行列、結果)を選択します。
④配列としてExcelに認識させます。Excelでは「Shift+Ctrl+Enter」で単なる数値ではなく関連がある配列として認識します。
これで行列積の表(係数a〜gの値)が完成します。

これらからどの因子が関連するか見ることができます。
 ・評価(係数)に変化がある因子が特性値に対して影響(変化)を持つと言えます。

もちろん、特性値と結果がまったく同じなら評価(係数)は0になります。
合格不合格などの評価の場合は、評価が0以外なら不合格ということになります。
不合格の要因としては、特性値(合格の値)が1の場合、評価のマイナスの因子が要因となります。
この場合、E,Gの因子がこの結果が特性値と異なる原因になると言えます。

Excelにより評価判断及び因子の関連性が判断できる
Excelで事前に計算式を作っておけば簡単に関連因子が割り出せる

最大または最小の組み合わせ推定の評価

ここでは数値が最大もしくは最小の組み合わせがどれか割り出す方法を説明します。
まず使用したい直交表を選択します。ここでは仮に4回試験の直交表(2水準3因子)を使用します。

・考え方(組み合わせ推定)

直交表を使用して評価値を出します。
その結果をそれぞれの要因の水準に割り当てます。
その要因と水準の割り当てられた結果の数で割りその値を比較します。

試験結果が複数の方が計測時の誤差が抑えられ精度は良くなります。
その時に試験の結果がDとすると真の計測値Sと誤差Nの関係は以下になります。
D = S+N

1回ならばこれでいいのですが、複数回やった場合は平均で表そうとすると誤差も平均で載ってきます。
試験の結果を3回(D1,D2,D3)行った際の試験の平均値Dとすると以下のように表せます。
D = (D1+D2+D3)/3 = ((S+N1)+(S+N2)+(S+N3))/3 = S+(N1+N2+N3)/3

誤差が真の計測値に近いと普通に平均だけでは、誤差(ばらつき)が真の計測値の差がわかりにくいです。
そこで分散の考え方です。
標本平均の分散の期待値を出します。
σ^2 = (D1^2+D2^2+D3^2)/3 = (計測1回目^2+計測2回目^2+計測3回目^2)/3回

この分散値自体は意味を成しませんが誤差が真の計測値より少しでも小さい場合、真の計測値が大きく反映されます。
「試験の結果が複数(n回)の場合」では、分散自体値が2乗しているので値の桁が大きくなり見にくいことがあるのでLOGを使用してスケールを小さくしています。
誤差(ばらつき)については、「ばらつきと工程能力」で説明しています。

・試験の結果が単一(1回)の場合

試験回数に対して結果が1つの場合を説明します。
実際にはノイズ(ばらつき)があるため、実験計画法により試験回数は減りますが試験結果は何回かやって複数出した方が正確になります。
あとで、結果が複数出した場合の説明しますがここでは結果が1回の説明をします。

今回の例では、試験結果が最大になる組み合わせ(因子と水準の組み合わせ)を求めていきます。
下記のように2水準3因子の直交表を使用し試験回数4回(4パターン)に対して結果を1回ずつ(計4個)とります。

この試験回数の並びのまま、各因子の試験順と試験結果を以下のように並び替えます。
表を見るとわかりますが、試験結果を因子の試験順に割り当てただけです。

そのあと、各因子の水準で合計の試験結果を出します。
また、各因子の水準が試験に出ててきた個数もカウントします。
直交表の試験組み合わせのため、各因子の水準の試験に出てきた個数は表により異なります。

平均をとり各因子の水準の値を推定します。
ここでは最大の組み合わせを求めたいので、最も大きな数値の各因子の水準が最大の組み合わせとなります。
(最小を出したい場合は各因子の水準が最小のものが最小の組み合わせとなります。)

ここでの最大の組み合わせは「A1,B0,C0」または「A1,B0,C1」になります。
違う直交表を使用した場合でも同様に行うことが可能です。

・試験の結果が複数(n回)の場合

試験回数に対して結果を複数出した場合(複数回計測した場合)を説明します。
先ほども説明しましたが、実際には誤差があるため実験計画法により試験回数は減りますが試験結果は何回かやって複数出した方が正確になります。

下記のように3因子2水準の直交表を使用し試験回数4回(4パターン)に対して結果を3回ずつ(計12個)とります。
途中までは「試験の結果が単一(1回)の場合」と同じです。

この試験回数の並びのまま、各因子の試験順と試験結果3個を分散して以下のように並び替えます。
先ほども説明しましたが、試験結果から標本平均の分散の期待値を出します。
 分散(σ^2)=(1回目の試験結果^2+ ・・・ +n回目の試験結果^2)/n

ここではLOGを使って対数にしています。
Excelを使うときは関数「LOG10」を使ってみてください。
並べ替えでは表を見るとわかりますが、分散した試験結果が因子ごとに繰り返ししているだけです。

そのあと、各因子の水準で合計の分散を出します。
また、各因子の水準が試験に出ててきた個数もカウントします。

平均をとり各因子の水準の値を推定します。
ここでは最大の組み合わせを求めたいので、最も大きな数値の各因子の水準が最大の組み合わせとなります。
(最小を出したい場合は各因子の水準が最小のものが最小の組み合わせとなります。)

ここでの最大の組み合わせは「A1,B0,C1」になります。
同様に違う直交表を使用した場合でも同様に行うことが可能です。

Excelにより最大の組み合わせも簡単に推定できる

試験をする上で注意点

これに限った事では無いですが、試験での測定には注意が必要です。
条件の偏りによりデータがおかしくならない様にする為です。例えば、人が測定するような実験の場合には先入観や前データの値の記憶など論理的以外の要素も含まれる可能性があります。無作為な順番で行う事で、それらの要素を低減できます。

1.数回測定する

測定値のばらつきを抑える為に数回測定します。ただし、結果がばらつかない場合は省略できます。

2.要因以外の内容を一定にする

条件となる要因だけに限定させるために、外要因は常に一定にする必要があります。

3.無作為な順番で行う

試験に対する慣れや先入観等を排除するため無作為な順で行う必要があります。

試験回数を削減できるが、因子・水準以外の外部要素を極力なくす努力が必要

 

経済学の分野の実験計画法(コンジョイント分析)等

要因をアイテムと呼び、水準をカテゴリと呼びます。基本的に同じ考えで、どのような要素(アイテムの中のカテゴリ)が一番強いか割り出します。

考え方は説明した内容と同じなので割愛します。
今まで説明したのと同じように試験ではないですが、持っているデータを使用して判断をする方法になります。
今まではどちらかと言えば、実験回数を減らすのが目的でした。
コンジョイント分析ではExcelの説明にあったように因子(ここでいう要素)がどの程度関係があるかを見る目的で使用します。

経済学以外でも様々な分野で使用されています。名前は色々違いますが。。。
実験回数を減らすだけでなく、コンジョイント分析のように関係性を見るのに使用しているケースも多いです。

・要因、原因の分析(要素の関連性の確認)
・製品不具合確認のテスト

様々な分野で確率的に要素判断や結果判断に使用されています。

実験計画法は、要素の関連がわからない場合に行います。そのため、関連性が分かる内容では実験を行うためそれだけ手間になります。(確認という意味では良いと思いますが)私は、関連性がその分野の熟練者は「何となく知っている」部分があり、それを経験・カンなどと言われているものであったと思っています。様々なものに使用してみましょう。

詳しく知りたい方はこちらの本が参考になります。

一部追加 2017/03/30

モバイルバージョンを終了