Планирование эксперимента

реклама
Практика. Планирование эксперимента
Модуль STATISTICA Планирование эксперимента предлагает исчерпывающий набор процедур
для построения и анализа экспериментальных планов, используемых в промышленных
исследованиях.
Вниманию пользователя предлагаются 2**(k-p) факторные планы с блоками (для планов,
содержащих более 100 факторов, имеются высокоэффективные алгоритмы для нахождения планов
с минимальной аберрацией и максимально несмешанных планов, в которых пользователь может
задавать эффекты взаимодействия, которые должны быть несмешанными), отсеивающие планы
(для более 100 факторов предусмотрены планы Плакетта-Бермана), 3**(k-p) факторные планы с
блоками (в том числе планы Бокса-Бенкена), смешанные планы, (малые) центральные
композиционные планы (или поверхности отклика), планы на Латинских квадратах, робастные
планы Тагучи и ортогональные массивы, планы для смесей и тернарных поверхностей, вершины и
центроиды для поверхностей и смесей с ограничениями, D- и A-оптимальные планы для
факторных планов, поверхностей и смесей.
Анализ экспериментов: основные моменты
Для анализа всех факторных планов, планов для поверхностей отклика и для смесей имеются
сходные опции. Они могут работать с несбалансированными и неполными планами и дают
пользователю полный контроль при выборе модели, подгоняемой к данным. Программа вычислит
обобщенную обратную матрицу X'X (где X обозначает матрицу плана) для оцениваемых эффектов,
а также выявления эффектов, являющихся псевдонимами других эффектов. Затем программа
автоматически выведет таблицу псевдонимов и вычислит оценки параметров для всех
существенных эффектов. Вы можете также быстро и просто включать в модель или исключать из
модели отдельные эффекты. Любой анализ может быть проведен с использованием
перекодированных значений факторов или исходных значений факторов. Предусмотрено большое
количество опций для просмотра оценок параметров, анализа дисперсионной таблицы и т. д.
Доступны также дополнительные опции для исследования предсказанных (подогнанных) средних,
поверхностей и т.п.; эти опции описаны ниже при рассмотрении соответствующих планов.
Анализ остатков и преобразования
Для дополнительного анализа остатков данной модели предусмотрено большое количество
графиков.
В частности, программа вычислит предсказанные (подогнанные) и остаточные значения и их
стандартные ошибки, заданные пользователем прогнозные интервалы и доверительные интервалы
для предсказанных (подогнанных) значений, стандартизованные предсказанные и остаточные
значения, стьюдентизированные остатки, удаленные остатки, стьюдентизированные удаленные
остатки, расстояния Махаланобиса и Кука, значение DFFIT и стандартизованное значение DFFIT.
1
Все эти статистики остатков могут быть сохранены для их дальнейшего анализа в других модулях
STATISTICA (например, для анализа сериальных корреляций ошибок в модуле Временные ряды).
Эти статистики остатков для каждого наблюдения можно также просмотреть в порядке
наблюдений или отcортировать по степени важности, что позволит быстро выделить выбросы. В
качестве вспомогательного средства для определения точности подгонки соответствующей
модели и для выявления выбросов вы можете просмотреть гистограммы остатков (и удаленных
остатков) и предсказанных значений, диаграммы рассеяния (удаленных) остатков по
предсказанным значениям или нормальные и полунормальные вероятностные графики
(удаленных) остатков. Для проверки сериальной корреляции остатков вы можете также отобразить
на графике (удаленные) остатки по номерам наблюдений. На всех графиках, на которых
отображаются отдельные наблюдения (например, значения остатков наблюдений), точки
обозначаются соответствующими номерами наблюдений или метками, что позволяет легко
определить выбросы в наборе данных. Окончательно, могут быть вычислены значения
максимального правдоподобия лямбда для преобразования Бокса-Кокса переменных отклика;
результатам преобразования Бокса-Кокса сопутствует также график зависимости сумм квадратов
остатков от лямбда, вместе с доверительными пределами для лямбда.
Оптимизация одномерных или многомерных переменных отклика: профиль отклика
(желательности)
Уникальный набор опций позволяет проводить в модели интерактивную оптимизацию
одномерных или многомерных переменных отклика. Во-первых, для моделей поверхности
отклика второго порядка и моделей смешанных поверхностей программа определит установки
факторов, соответствующие минимальной, максимальной или седловой точке соответствующей
поверхности (т.е. критические значения текущей поверхности, а также соответствующие
собственные значения и собственные векторы, для определения кривизны и ориентации в
пространстве квадратичной поверхности отклика). Заметим, что в планах для смесей опции
профиля желательности не основаны на простой перепараметризации модели смеси в модель
неограниченной поверхности (что может привести к ошибочным результатам, например, к
недопустимым для данной смеси оптимальным установкам факторов); вместо этого все
вычисления должны производиться на основе фактической модели смеси. Таким образом, при
поиске оптимальных установок факторов по функции желательности для одной или нескольких
переменных отклика гарантируется, что рассматривается только ограниченная область (смесь), и
что итоговые установки факторов приводят к допустимой смеси. Во-вторых, предусмотрен
исчерпывающий набор графических опций для визуализации предсказанных значений одной или
нескольких переменных отклика как функций каждого фактора в анализе при условии, что все
другие факторы установлены на некотором частном уровне. Точнее, для многомерных
переменных отклика Вы можете задать функцию желательности, которая отражает наиболее
желательное значение для каждой переменной отклика, а также оценить степень важности каждой
2
переменной для общей желательности. Затем Вы можете отобразить на графике профили функции
желательности (вычисленные по предсказанным значениям каждой переменной отклика) для
заданного числа уровней каждого фактора. На этом же графике могут быть показаны профили для
каждой отдельной переменной отклика, а также доверительные интервалы.
Более того, функция желательности может быть отображена на трехмерном графике
поверхности или на контурном графике (контуры желательности), и пользователь может
запросить матрицы таких графиков для всех факторов в анализе. Все установки, такие как сетка
факторов или функции желательности, могут быть легко изменены для интерактивного анализа
(например, можно быстро исключить отдельные отклики из анализа, и наблюдать эффекты на
общей функции желательности). Спецификации для сложных функций желательности для многих
переменных отклика могут быть сохранены в файле, а затем быстро восстановлены, если вы
захотите анализировать другие эксперименты с использованием тех же переменных отклика.
Кроме того, имеются опции для определения оптимального значения функции желательности, как
с использованием сеточного поиска по экспериментальной области, так и с использованием
эффективного алгоритма оптимизации функции (который обычно применяется для оптимизации
функций желательности в экспериментах с большим числом факторов).
Стандартные 2**(k-p) дробные факторные планы с блоками. Модуль STATISTICA
Планирование эксперимента предоставляет полный набор всех стандартных планов (или так
называемых планов с минимальной аберрацией).
Рисунок 1 - План эксперимента с двухуровневыми факторами
3
Пользователь может просмотреть планы в таблице результатов; опыты могут быть
рандомизированы (в целом или по блокам), и в таблицу результатов могут быть добавлены пустые
столбцы. Предоставляются опции для задания верхних и нижних установок факторов, для
просмотра и сохранения планов в терминах перекодированных уровней факторов или в исходных
метриках факторов. Пользователь может также запросить реплики, добавить центральные точки в
план, а также запросить инверсию исходного плана. Дробные генераторы плана и блоковые
генераторы плана, также как и матрица псевдонимов главных эффектов и взаимодействий, могут
быть легко просмотрены.
Модуль STATISTICA Планирование эксперимента автоматически проведет исчерпывающий
дисперсионный анализ плана. Пользователь полностью управляет включением эффектов и
взаимодействий в модель, он может также просмотреть корреляции между столбцами матрицы
плана (X), матрицу X'X (т.е. ковариационную и корреляционную матрицу оценок параметров).
Программа вычислит оценки параметров дисперсионного анализа, их стандартные ошибки и
доверительные интервалы, коэффициенты перекодированных (-1, +1) значений факторов, их
стандартные ошибки и доверительные интервалы, коэффициенты (стандартные ошибки,
доверительные интервалы) для непреобразованных значений факторов. Основываясь на этих
оценках, программа может вычислить предсказанные значения (стандартные ошибки,
доверительные интервалы) для заданных пользователем значений факторов. Программа выведет
полную таблицу дисперсионного анализа, основанную на среднеквадратичном (MS) разностном
члене, или, когда план хотя бы частично реплицирован, основываясь на оценке чистой ошибки.
Когда оценка чистой ошибки доступна, программа также вычислит тест для общей потери
согласия; когда план содержит центральные точки, программа проведет общую проверку на
кривизну.
Рисунок 2 - Диаграмма маргинальных средних
Пользователь может просмотреть таблицу средних и маргинальных средних, а также их
доверительные интервалы. Доступны многочисленные опции для просмотра результатов в
графическом виде: диаграммы Парето эффектов, нормальные и полунормальные вероятностные
графики эффектов, квадратичные и кубические диаграммы, графики средних, графики
взаимодействий (с доверительными интервалами для маргинальных средних), графики
поверхности отклика, контуры поверхности отклика. В дополнение к этому, при проведении
детального анализа остатков доступны все описанные выше основные процедуры для оценивания
качества подгонки модели, а также для нахождения оптимальных установок факторов для одной
или нескольких переменных отклика.
4
Регрессия поверхности смеси
Регрессионные планы поверхности смеси аналогичны планам факторной регрессии второй
степени без свободного члена. Смеси, как следует из имени, представляют собой некоторые
константы. Например, сумма долей различных ингредиентов в некотором материале всегда равна
100%. Поэтому доля одного ингредиента в материале может уменьшаться за счет увеличения
долей других ингредиентов. Регрессионные планы поверхности смеси с подобными
ограничениями не должны содержать свободный член. Матрица плана для подобного анализа с 3
непрерывными предикторами P, Q и R может иметь вид
Y = b1P + b2Q + b3R + b4P*Q + b5P*R + b6Q*R
Эти типы планов широко применяются в прикладных исследованиях (например, в
промышленных экспериментaх).
Пример 1: Анализ регрессии поверхности смеси.
Cornell (1990) описал простой и типичный план для смеси на примере исследования средней
плотности пирожков с рыбой. Слоеные пирожки содержали три слоя с разным типом рыбы: Mullet
(с кефалью), Sheepshead, и Croaker. Зависимая переменная, текстура (Texture), измерялась как сила
(в граммах * 10-3), требуемая для прокалывания поверхности пирожка. В эксперименте
использовался симплекс-вершинный план поверхности смеси второго порядка.
В этом примере мы оценим чистую ошибку, и потерю согласия. Для критериев потери
согласия требуется вычисление чистой ошибки, не учтенной в модели. Компоненты смеси в сумме
дают постоянную величину; суммы пропорций компонентов разных смесей некоторого материала
всегда должны быть равны 100%. Таким образом, пропорцию одного компонента можно
вычислить по сумме пропорций остальных, т.е. эта информация является избыточной. Эта
избыточность устраняется исключением из плана свободного члена.
Так же план поверхности смеси по умолчанию содержит дополнительные члены, помимо
членов главного эффекта.
Просмотр результатов.
Критерий неадекватности. Рассмотрим таблицу критериев неадекватности, содержащую
следующие результаты:
Рисунок 3 - Данные критерия неадекватности.
Критерий неадекватности маргинально значим (p<.10), это означает, что линейная модель,
содержащая только главные эффекты, слишком простая.
Теперь изменим анализ, задав план для квадратичной поверхности смеси.
Рисунок 4 - Данные критерия неадекватности на основе квадратичной поверхности смеси.
Заметьте, что критерий неадекватности для этого плана не вычислен. Это связано с тем, что
модель для поверхности смеси второго порядка исчерпала всю информацию, которую можно было
получить в этом симплекс-вершинном плане второго порядка.
Смешанная модель. Результаты в таблице показывают, что модель поверхности смеси
второго порядка высоко значима, p < 001. Заметьте, что число степеней свободы для смешанной
модели (сс Модель) равно 5, что на один меньше, чем количество эффектов в плане (6), т.е., 3
5
главных эффекта плюс 3 двухфакторных взаимодействия. Это связано с тем, что критерий
смешанной модели скорректирован на среднее, что приводит к уменьшению степеней свободы.
Альтернативные способы вычисления значения R-квадрат описаны у Kvalseth (1985).
Рисунок 5 - Данные критерия неадекватности по смешанной модели.
Регрессионные коэффициенты. Рассмотрим таблицу оценок параметров для коэффициентов
регрессионного уравнения.
Рисунок 6 - Данные по оценкам параметров.
Коэффициенты для всех эффектов кроме Mullet*Croaker и Sheepshd*Croaker являются
значимыми. Тем не менее, из-за исключения из модели свободного члена, нужно осторожно
относиться к коэффициентам для главных эффектов.
Пример 2: Анализ регрессии поверхности смеси.
Рисунок 7 - Таблица исходных данных
Верхние и нижние значения факторов. Опции в поле. Перекодировать факторы
(псевдокомпоненты) относятся к тому, как система STATISTICA перекодирует значения факторов
для заключительного анализа (заметим, что в диалоге результатов последние всегда доступны и
для непреобразованных установок факторов). А именно, программа по умолчанию всегда
преобразует установки факторов в так называемые псевдокомпоненты.
6
x'i = (xi-Li)/(Total-L)
Здесь x'i обозначает i-ую псевдокомпоненту, xi - значения исходной компоненты, Li ограничение (границу) для i-ой компоненты, а L - сумму всех ограничений снизу (границ) для всех
компонент плана. ыЭто преобразование также описано в разделе Вводный обзор, также см.
смотрите Cornell, 1990, глава 3. Коротко говоря, если имеются ограничения на факторы снизу, но
план построен как стандартный симплекс-вершинный или симплекс-центроидный, то установки
факторов будут перекодированы так, что окончательные результаты могут быть просмотрены и
проинтерпретированы в терминах стандартных симплекс-планов (то есть как диаграммы на
треугольнике).
Опции в поле Перекодировать факторы (псевдокомпоненты) позволяют вам использовать
действительные мимимумы факторов для этого преобразования (вместо Li), или вы можете
определить Заданные пользователем (верхние/нижние) значения факторов.
Уровень толерантности. В этом диалоге Толерантность не следует путать с уровнем
толерантности, который обсуждался, например, в модуле Множественная регрессия. Он просто
обозначает "проверку" корректности установок факторов, то есть, является ли константой по всем
опытам сумма установок факторов. В частности, если вы вводите данные вручную, часто
оказывается, что вы можете ввести .333 вместо 1/3. Разумеется, .333 точна только до трех
десятичных знаков, для того, чтобы ввести значение точно, вы должны ввести после запятой
бесконечный ряд троек. STATISTICA осуществит проверку на постоянность суммы плюс или
минус уровень толерантности. Однако заметим, что программа всегда пропорционально
корректирует значения факторов, так что они всегда суммируются к соответствующей константе
точно. Таким образом, если в 3-х факторном эксперименте, где общее смеси равно 1, вы ввели
значения .33, .33, .33, то программа скорректирует эти значения для каждого фактора .3333333... .
Просмотр результатов.
Вообще говоря, вам бы хотелось подогнать к данным модель, которая бы достаточно
объясняла природу измерений зависимой переменной. Стандартные модели планов для смесей,
перечисленные во вкладке Модель, подробно описаны в разделе Вводный обзор. Для текущего
набора данных мы спланировали исследование для полиномиальной модели порядка 2. В так
называемом каноническом виде квадратичная модель для смеси 3-х переменных может быть
записана следующим образом:
ypred = b1*x1+b2*x2+b3*x3
+b12*x1*x2+b13*x1*x3+b23*x2*x3
Здесь bi обозначают коэффициенты, а xi - значения факторов.
Просмотр коэффициентов. Просмотрите коэффициенты квадратичной модели.
Рисунок 8 - Таблица полученных коэффициентов по квадратичной модели
Это коэффициенты, относящиеся к перекодированным значениям факторов, в нашем случае к
долям (от 0 до 1), а не к процентам (от 0 до 100). Напомним, что критерии значимости для
линейных эффектов факторов не являются независимыми друг от друга, поэтому их следует
7
интерпретировать с осторожностью (поскольку значения 3-х компонент должны в сумме давать
константу, имеется только 2 степени свободы для всех линейных эффектов.
Из результатов, представленных в таблице результатов, показанной выше, кажется, что
взаимодействие Mullet (Кефаль) и Sheepshd (Овечья голова) (AB) статистически значимо, и его
следует включать в модель.
Давайте теперь посмотрим на коэффициенты для не преобразованных компонент. В этом
случае преобразование состоит всего лишь в делении значений факторов на 100 (чтобы
шкалировать их в диапазоне от 0 до 1). Таким образом, результаты в этом случае должны быть
подобны полученным и просмотренным выше, отличаясь только величиной коэффициентов.
Рисунок 9 - Таблица полученных коэффициентов непреобразованных компонент.
Как вы видите, коэффициенты для исходных компонент отличаются только порядком
величины.
Дисперсионный анализ. Давайте теперь просмотрим Дисперсионный анализ. Будет
представлено две таблицы. Первая из них суммирует тесты статистической значимости для
моделей возрастающей сложности (то есть с возрастающим числом параметров).
Рисунок 10 - Данные дисперсионного анализа 1.
Линейная модель является статистически значимой, то есть она подгоняет данные лучше, чем
модель, где все параметры равны 0 (нулю). Заметим, что тест для линейных параметров имеет
только 2 степени свободы, хотя предыдущие таблицы результатов показывают 3 параметра.
Повторим, что, так как сумма компонент смеси должна быть постоянной, 3 параметра для простых
линейных эффектов имеют только 2 степени свободы, ассоциированные с ними.
Также в этой таблице результатов показаны значения коэффициента детерминации RІ и
значения исправленных RІ. Они интерпретируются, как в модуле Множественная регрессия: RІ
является долей дисперсии измерений зависимой переменной, обусловленной (объясняемой)
соответствующей моделью. Значения исправленных RІ применяют к значениям RІ поправку на
число членов в соответствующей модели. Заметим, что термин доля дисперсии, обусловленной в
данном контексте относится к вариабельности предсказываемых значений зависимой переменной
вокруг соответствующего среднего, а не 0 (нуля). (Некоторые более старые программы
множественной регрессии иногда сообщают значения RІ для моделей без свободного члена как
8
долю вариабельности относительно начала координат, тогда как в модуле Множественная
регрессия приводятся обе статистики). Обратим внимание на улучшение подгонки модели при
добавлении параметров (когда подгоняются все более сложные модели). В этом примере
квадратичная модель обеспечивает улучшение над линейной моделью, которое является почти
статистически значимым (p=.0507). Таким образом, следует, вероятно, рассмотреть хотя бы
некоторые члены второго порядка для включения в окончательную модель. Вторая таблица
результатов дает общий критерий для всех параметров в текущей модели.
Рисунок 11 - Данные дисперсионного анализа 2
Как вы видите, комбинированный тест относительно всех параметров квадратичной модели
является высоко статистически значимым. Заметим, что критерий Потери согласия не может быть
применен для данного плана, поскольку квадратичная модель исчерпывает всю информацию,
которая может быть оценена с помощью этого симплекс-вершинного плана второго порядка. Если
бы вы, например, подгоняли Линейную модель, тогда эта таблица результатов выглядела бы так:
Рисунок 12 - Таблица результатов линейной модели
Теперь в модели присутствуют только линейные эффекты факторов, и остаточное отсутствие
согласия может быть проверено. Разумеется, оно будет идентично квадратичным эффектам,
показанным в таблице результатов ранее, поскольку остаточное отсутствие согласия не
обусловлено чистой ошибкой, а обусловлено квадратичными компонентами.
Диаграмма Парето эффектов. Диаграмма Парето является эффективным средством
определения того, какие эффекты имеют наибольший вклад на интересующую нас зависимую
переменную. Рассмотрим диаграмму Парето эффектов.
Эта диаграмма показывает стандартизованные коэффициенты, отсортированные по
абсолютной величине. Очевидно, что линейные эффекты факторов являются наиболее важными
для определения окончательного состава рыбных паштетов.
9
Рисунок 13 - Диаграмма Парето эффектов
Диаграммы поверхностей и контурные диаграммы. Мы можем визуализировать
соотношения между факторами и зависимой переменной (то есть подгоняемой функцией) на
треугольной диаграмме.
Рисунок 14 - Диаграмма поверхности
Вообще говоря, в треугольной диаграмме общее ограничение на смесь (все компоненты
должны суммироваться к постоянной) приводит к ограниченной области, которую можно
представлять треугольником. Когда вы двигаетесь вдоль одной из сторон треугольника,
показанного в горизонтальной плоскости, смеси трех компонент изменяются, но их сумма всегда
остается той же самой (благодаря треугольной форме фигуры в плоскости). Из графика
поверхности видно, что чем больше в смеси (паштете) Mullet (Кефали), тем больше Texture
(Текстура). Однако поверхность не совсем линейна, а имеет некоторую кривизну. Это, конечно,
соответствует оценкам параметров (для псевдокомпонент), а также диаграмме Парето, показанной
ранее.
10
График следа. График следа обеспечивает другой взгляд на поверхность над треугольником.
Перед обзором такого графика вначале посмотрим на график, расположенный ниже, который
показывает, как строится график следа. Предположим, что вы проведете прямые из вершин
треугольника к его противоположной стороне. Для каждой точки этой линии вы можете
зарегистрировать предсказываемые значения зависимой переменной, или "высоту" поверхности
отклика над треугольником. Этот График следа выглядит так:
Рисунок 16 - График следа
Заметим, что линия наклона для Mullet (Кефали) направлена вверх, то есть чем больше
относительная доля Mullet (Кефали), тем больше ожидаемое значение Texture (Текстуры). Другие
две линии отражают изгиб поверхности подобным же образом.
Как указано выше, этот график может быть создан для различных базисных смесей, то есть
линий, произвольно проведенных в треугольнике, а не обязательно соединяющих стороны с
соответствующим углами. Каждая такая линия может быть охарактеризована базисной смесью, то
есть смесью с фиксированным отношением двух компонент, тогда как третья изменяется.
Трехуровневые 3**(k-p) дробные факторные планы с блоками и планы Бокса-Бенкена
Модуль STATISTICA Планирование эксперимента содержит полную реализацию стандартных
(блоковых) 3**(k-p) планов.
Рисунок 17 - Анализ эксперимента с трехуровневыми факторами
11
В модуль также включены стандартные планы Бокса-Бенкена. Как и для других планов,
пользователь может отобразить и сохранить эти планы в стандартном или случайном порядке,
запросить реплики или отдельные опыты, просмотреть план и генераторы блоков и т.п. Программа
проведет полный анализ 3**(k-p) планов. Пользователь имеет полный контроль над включением
эффектов в анализ. Главные эффекты разбиваются на линейные и квадратичные эффекты, и
взаимодействия разбиваются на линейно-линейные, линейно-квадратичные, квадратичнолинейные и квадратично-квадратичные эффекты. Пользователь может просмотреть
корреляционные матрицы факторов и эффектов. Программа вычислит стандартные оценки
параметров дисперсионного анализа (стандартные ошибки, доверительные интервалы,
статистическую значимость, и т.д.), коэффициенты для перекодированных (-1, 0, +1) факторов и
коэффициенты для непреобразованных факторов. Основываясь на этих значениях, программа
предоставит опции для вычисления предсказанных значений (стандартных ошибок,
доверительных интервалов) для заданных пользователем значениях факторов. Таблица
дисперсионного анализа будет содержать критерии для линейных и квадратичных компонент
каждого эффекта и комбинированные тесты для эффектов с большим числом степеней свободы.
Если план содержит реплики, то оценка чистой ошибки может использоваться для
дисперсионного анализа и проверки значимости; в этом случае будет также проведен общий тест
на потерю согласия. Для интерпретации результатов программа вычислит таблицу средних (и
доверительных интервалов), а также маргинальные средние (и доверительные интервалы) для
взаимодействий.
Графические опции включают графики средних и маргинальных средних (с доверительными
интервалами), диаграммы Парето эффектов, нормальные и полунормальные вероятностные
графики эффектов, графики поверхности отклика и контурные графики. В дополнение к этому,
при проведении детального анализа остатков доступны все описанные выше основные процедуры
для оценивания качества подгонки модели, а также для нахождения оптимальных установок
факторов для одной или нескольких переменных отклика.
Рисунок 18 - График поверхности отклика
Смешанные факторные планы
Программа также поддерживает смешанные планы (название зарегистрировано в
Национальном Бюро Стандартов Департамента Торговли США). Опции построения и анализа для
этих планов идентичны опциям для 3**(k-p) планов.
Центральные композиционные планы (поверхности отклика)
12
Пользователь может выбрать в списке стандартных планов, содержащем малые центральные
композиционные планы (основанные на планах Плакетта-Бермана).
Рисунок 19 - Диаграмма рассеяния для центрального композиционного плана
В дополнение к стандартным опциям, доступным для всех планов (добавление опытов,
рандомизация, реплицирование, задание верхних и нижних значений факторов, и т.п.; смотрите
описание 2**(k-p) планов) пользователь может выбрать центрированные звездные точки, или
вычислить для ротатабельности, ортогональности, или и для того и для другого.
Опции анализа сходны с описанными ранее для 3**(k-p) и 2**(k-p) планов. Пользователь
может вычислить параметры дисперсионного анализа, коэффициенты для перекодированных
значений факторов и коэффициенты для непреобразованных факторов. Могут быть также
вычислены предсказанные значения для заданных пользователем значений факторов.
Пользователь имеет полный контроль над включением эффектов в модель, и может просмотреть
корреляционные матрицы факторов и эффектов. Если имеются реплики, таблица дисперсионного
анализа будет содержать оценку чистой ошибки и общий тест на потерю согласия.
Рисунок 20 - Поверхность отклика: карта линий уровня
Стандартные графические опции для результатов включают диаграммы Парето эффектов,
вероятностные графики эффектов, графики поверхности отклика и контурные графики (если
факторов больше двух, для задаваемых пользователем значений дополнительных факторов). В
дополнение к этому, при проведении детального анализа остатков доступны все описанные выше
основные процедуры для оценивания качества подгонки модели, а также для нахождения
оптимальных установок факторов для одной или нескольких переменных отклика.
13
Латинские квадраты
Рисунок 21 - Анализ эксперимента на латинском квадрате
Пользователь может выбирать между различными планами на Латинских квадратах, имеющих
до девяти уровней. Если это возможно, программа также сгенерирует доступные Греко-Латинские
и Гипер-Греко-Латинские квадраты. В случаях, когда имеется несколько альтернативных
Латинских квадратов, программа выберет один из них случайным образом, либо предложит
пользователю выбрать желаемый Латинский квадрат. Пользователь может просмотреть планы в
таблице результатов, рандомизировать порядок опытов, добавить пустые столбцы для удобства
ввода данных. План можно также сохранить в стандартном файле данных STATISTICA. После
добавления наблюдаемых значений в этот файл эксперимент может быть затем легко
проанализирован. В дополнение к полной таблице дисперсионного анализа модуль STATISTICA
Планирование эксперимента вычислит средние значения для всех факторов. Эти средние могут
быть представлены в графическом виде на итоговом графике.
Рисунок 22 - График главных эффектов
14
Робастые планы Тагучи. Модуль STATISTICA Планирование эксперимента позволяет
сгенерировать ортогональные массивы с числом факторов до 31; могут быть проанализированы
планы с числом факторов до 65. Как и во всех других типах планов, опыты эксперимента могут
быть рандомизированы, и пользователь может добавлять пустые столбцы в таблице результатов
для удобства ввода данных.
Рисунок 23 - План робастого эксперимента
Пользователь может также исследовать псевдонимы парных взаимодействий. Модуль
STATISTICA Планирование эксперимента автоматически вычислит стандартные отношения
сигнал-шум (С/Ш) для следующих задач:
1) меньше - лучше,
2) номинальное - наилучшее значение,
3) больше - лучше,
4) цель со знаком,
5) доля дефектов,
6) число дефектов на интервал (аккумуляционный анализ).
В дополнение к этому, могут быть проанализированы непреобразованные данные; таким
образом, пользователь может задавать любые типы отношений С/Ш с помощью формул в
таблицах исходных данных или с помощью языка STATISTICA BASIC и анализировать их с
помощью этих процедур. В дополнение к исчерпывающим описательным статистикам можно
просмотреть вычисленные отношения С/Ш. Все результаты дисперсионного анализа
отображаются в интерактивной таблице результатов, в которой пользователь может добавлять или
исключать эффекты в члене ошибки. Подобная таблица результатов позволяет пользователю
предсказывать отношение С/Ш при оптимальных условиях, то есть установках уровней факторов.
Опять таки, пользователь может включать или исключать эффекты в модели и задавать отдельные
уровни факторов. Окончательно, результирующие средние могут быть представлены на графике
главных эффектов по уровню фактора; если производится аккумуляционный анализ
категориальных данных, результаты могут быть представлены в виде столбчатых диаграмм или в
виде линейных графиков накопленных вероятностей по категориям уровней выбранных факторов.
Различные типы функций желательности отклика для одномерных и многомерных переменных
могут также быть оптимизированы с помощью профиля отклика (желательности), доступного в
2**(k-p), 3**(k-p) планах, центральных композиционных планах и т.д.
15
Рисунок 24 - Столбчатые диаграммы эффектов факторов
Планы для смесей и тернарные графики
Эта процедура содержит опции для построения симплекс-вершинных и симплекс-центроидных
планов для переменных смеси. Эти планы могут быть расширены путем добавления внутренних
точек и центроидов.
Рисунок 25 - План эксперимента для смеси
Пользователь может ввести ограничения снизу для каждого фактора, программа автоматически
построит соответствующий план на субсимплексе, определенном этими ограничениями.
Множественные верхние и нижние ограничения могут быть заданы с помощью общих средств
построения планов в ограниченных экспериментальных областях. Пользователь может добавить
отдельные опыты или реплики, отобразить и сохранить планы в стандартном или случайном
порядке. Программа вычислит коэффициенты для псевдокомпонент и компоненты в их исходной
метрике, вместе со стандартными ошибками, доверительными интервалами, и тестами на
статистическую значимость. Пользователь имеет полный контроль над включением членов в
модель; среди стандартных моделей имеются линейные, квадратичные, специальные кубические и
полные кубические модели. Таблица дисперсионного анализа будет содержать тесты для
дополнительной подгонки различных моделей, и если план содержит реплицированные опыты,
будет также вычислен тест на потерю согласия, основанный на оценке чистой ошибки. Результаты
16
содержат таблицу средних, корреляции столбцов матрицы плана (X), обратную матрицу плана X'X
(дисперсионную/ковариационную матрицу оценок параметров), диаграмму Парето, вероятностные
графики оценок параметров и т.п. Также пользователь может вычислить предсказанные значения,
основанные на заданных значениях факторов. Специализированные графики для подведения
итогов экспериментов для смеси включают графики следа отклика для заданных базисных смесей,
а также тернарные поверхности и контурные графики.
Рисунок 26 - Тернарный график
Если в эксперименте присутствует более 3 компонент, то поверхностные и контурные графики
могут быть получены для заданных пользователем значений дополнительных компонент. В
дополнение к этому, при проведении детального анализа остатков доступны все описанные выше
основные процедуры для оценивания качества подгонки модели, а также для нахождения
оптимальных установок факторов для одной или нескольких переменных отклика. Заметим, что
опции профиля отклика (желательности), доступные для планов для смесей, не основаны на
простой перепараметризации модели смеси в модель для неограниченной поверхности; вместо
этого все вычисления будут основаны на фактической (подогнанной) модели смеси. Таким
образом, при поиске оптимальных установок факторов по данной функции желательности для
одной или нескольких переменных отклика, гарантируется, что обследуется только ограниченная
(смесь) экспериментальная область, и что результирующие установки факторов дают допустимую
смесь.
Планы для поверхностей с ограничениями и смесей
Модуль STATISTICA Планирование эксперимента содержит процедуры для вычисления
вершин и центроидов для поверхностей с ограничениями и смесей, заданных с помощью
линейных ограничений.
Рисунок 27 - Точки плана для поверхностей и смесей с ограничениями
17
Пользователь может ввести верхние и нижние границы для факторов, а также задать
дополнительные линейные ограничения (в виде A1*x1 + ... + An*xn + A0 >= 0) на значения
факторов. Программа вычислит точки-вершины и, по желанию пользователя, точки-центроиды
для ограниченной области. Ограничения будут выводиться последовательно, и несущественные
ограничения будут выделены.
Рисунок 28 - График следа ожидаемого отклика
Имеются многочисленные дополнительные опции для просмотра характеристик ограниченной
области. Пользователь может просмотреть вершины и центроиды на 3-х мерных и тернарных
диаграммах рассеяния (для смесей). Также могут быть вычислены корреляционная матрица для
столбцов матрицы плана X, для различных стандартных типов планов, обратная матрица X'X (т.е.
дисперсионная/ковариационная матрица оценок параметров). Это позволяет пользователю
оценить характеристики плана, связанные с точками-вершинами и точками-центроидами. Эти
точки могут затем использоваться в оптимальных планах, для построения планов с минимальным
числом опытов.
D- и А-оптимальные планы
Программа включает несколько алгоритмов для построения оптимальных планов.Пользователь
может выбирать между критериями D оптимальности (по определителю матрицы плана) и A
оптимальности (по следу) и задавать модели для поверхностей и смесей. Список точек-кандидатов
для плана может быть введен вручную либо образован из файла данных STATISTICA (например, из
ранее созданного плана с помощью средств вычисления вершин и центроидов для поверхностей с
ограничениями и смесей, смотрите выше). Точки в списке кандидатов могут быть обозначены для
принудительного включения в окончательный план, и поэтому пользователь может расширить или
"подправить" существующие эксперименты.
Программа содержит все основные алгоритмы поиска для построения D- и A-оптимальных
планов: последовательный метод Дейкстры, метод простого обмена Винна-Митчелла, алгоритм
Митчелла DETMAX (обмен с отклонениями), алгоритм одновременного переключения Федорова и
модифицированный алгоритм одновременного переключения. Для окончательного плана
программа вычислит определитель матрицы X'X и коэффициенты D, A и G. Пользователь может
также просмотреть корреляционную матрицу для столбцов окончательной матрицы плана (X) и
обратную матрицу X'X (дисперсионную/ковариационную матрицу оценок параметров). Точки
окончательного плана могут быть представлены на 3-х мерных и тернарных диаграммах рассеяния
(для смесей).
18
Рисунок 29 - Результаты оптимального плана: поверхность отклика
Планы с минимальной аберрацией и максимально несмешанные 2**(k-p) дробные
факторные планы с блоками
В дополнение к стандартным 2**(k-p) планам модуль STATISTICA Планирование
эксперимента включает в себя общую опцию поиска плана для создания дробных факторных
планов с минимальной аберрацией (наименее смешанных) с блоками или без блоков с более чем
100 факторами и более чем 2,000 опытами.
Эти типы эффективных планов появились недавно, и они позволят Вам оценить большее число
(частных) факторных взаимодействий, чем в стандартных планах Бокса-Хантера; модуль
STATISTICA Планирование эксперимента является единственной программой, которая
предоставляет эту возможность. Для заданного разрешения Вы можете провести полный поиск
всех (неизоморфных) наборов генераторов или задать частные наборы взаимодействий, которые
Вы хотите оставить несмешанными для соответствующего разрешения. В дополнение к
основному критерию поиска "минимальной аберрации" Вы можете также выбрать критерий
"максимальной несмешанности", который приводит к плану с наибольшим возможным числом
несмешанных эффектов (несмешанных со всеми другими эффектами, для данного разрешения
плана). Эти планы могут быть далее расширены аналогично стандартным 2**(k-p) планам (путем
добавления реплик, центральных точек, инверсии, и т.д.). Все опции анализа применимы к этим
планам (или к произвольным 2**(k-p) планам).
Отсеивающие планы Плаккета-Бермана
Модуль STATISTICA Планирование эксперимента позволяет пользователю строить и
анализировать отсеивающие планы для большого числа факторов.
Программа строит планы Плакетта-Бермана (с матрицей Адамара) и насыщенные дробные
факторные планы с числом факторов до 127. Как и в случае с 2**(k-p) планами, пользователь
может запросить реплики плана, добавить точки, центральные точки, а также распечатать или
сохранить план. Для анализа отсеивающих планов доступны те же опции, которые имеются для
анализа 2**(k-p) планов.
19
Скачать