86 О СТРУКТУРЕ НАСЫЩЕННЫХ D

advertisement
Вестник БГУ. Сер. 1. 2013. № 3
5 . П е к а р с к и й А . А . Чебышевские рациональные приближения в круге, на окружности и на отрезке // Мат. сб. 1987.
Т. 133 (175). № 1 (5). С. 86.
Поступила в редакцию 28.02.13.
Валентин Николаевич Русак – доктор физико-математических наук, профессор кафедры высшей математики и математической физики.
Игорь Васильевич Рыбаченко – кандидат физико-математических наук, доцент кафедры высшей математики и математической физики.
УДК 519.4
В. П. КИРЛИЦА
О СТРУКТУРЕ НАСЫЩЕННЫХ D-ОПТИМАЛЬНЫХ ПЛАНОВ ЭКСПЕРИМЕНТОВ
Доказано, что для модели множественной линейной регрессии с дисперсией наблюдений, изменяющейся линейно, и контролируемыми переменными xij  1 точный D-оптимальный план экспериментов достигается, если все xij  1. Это является обобщением ранее полученного аналогичного результата для модели равноточных наблюдений. Установлено, что структура насыщенных D-оптимальных планов для трех равноточных наблюдений намного шире, чем это было известно ранее.
Три точки спектра такого плана лежат на одной из шести граней единичного куба, причем две точки – это концы одного
и того же ребра, а третья точка – любая точка, лежащая на противоположном ребре той же грани. Множество насыщенных
D-оптимальных планов экспериментов для трех равноточных наблюдений бесконечно и имеет мощность континуума. Реализация экспериментов по таким планам позволяет проводить эксперименты не на пределе возможных значений факторов,
влияющих на эксперимент. Исследована структура насыщенных D-оптимальных планов для некоторых линейных моделей
неравноточных наблюдений.
Ключевые слова: неравноточные наблюдения; D- и A-оптимальные планы экспериментов; насыщенные D-оптимальные
планы; структура насыщенных D-оптимальных планов с неравноточными наблюдениями.
For model of linear multiple regressions with variance of observations changing linearly and controllable variables xij  1 it is
proved that exact D-optimal design is obtained by setting xij  1 for all variables. It is generalization before the received similar result
for model of homoscedastic observations. It is established that the structure of saturated D-optimal designs for three homoscedastic
observations is much wider that is was known earlier. Three points of a spectrum of such design lay on one of six sides of unite cube
and two points it is the ends of the same edge and the third point is point laying on an opposite edge of the same side. The set of saturated D-optimal designs for linear model with three homoscedastical observations is infinity and have continuum power. Realizations
of experiments under such designs allow to make experiments not on a limit of possible values of the factors influencing experiments.
The structure of saturated D-optimal designs is investigated for some linear models of heteroscedastical observations.
Key words: heteroscedastic observations; D- and A-optimal designs of experiments; saturated D-optimal designs; structure of saturated D-optimal designs with heteroscedastic observations.
Введение
Рассмотрим линейную множественную модель наблюдений
yi  1 x1i    m xmi  ( x ( i ) ), i  1, , n; n  m,
(1)
где yi – наблюдаемые значения; x  ( x1i ,  , xmi ) – m-вектор контролируемых переменных, компоненты
которого выбираются из интервала [–1,1];  (1 ,  , m ) – m-вектор неизвестных параметров; ( x ( i ) ) –
случайные некоррелированные ошибки наблюдений с нулевым средним и дисперсией
D{( x ( i ) )}  di  a0  a1 x1i    am xmi  0
(2)
(i )
для каждой реализации x ( i ) из m-мерного единичного куба xij  1 , i =1, m ; j =1, n. Коэффициенты в (2)
удовлетворяют неравенствам: a0  0, a1   am  a0 .
Как известно [1], при фиксированном плане экспериментов  n , определяемом матрицей плана экспериментов
 x11 x21  xm1 


(3)
X       ,
 x x x 
mn 
 1n 2 n
наилучшая линейная несмещенная оценка ̂ вектора неизвестных параметров  для модели наблюдений (1), (2) есть
ˆ  M 1Y ,
(4)
где
n
1
(5)
M   x ( i ) ( x ( i ) ) –
i 1 d i
86
Математика и информатика
информационная матрица плана  n , матрица (5) предполагается неособенной:
n
y x(i )
Y=  i .
di
i 1
Точность оценки (4) определяется матрицей ковариаций M 1 . Определитель матрицы ковариаций
M 1 – обобщенная дисперсия оценки (4). План экспериментов 0n , максимизирующий определитель
M информационной матрицы, называется D-оптимальным.
Имеется обширная библиография работ [2–6], посвященных построению D-оптимальных планов
экспериментов для модели наблюдений (1) с равноточными наблюдениями ( ai  0, i  1, m ). В статье
[7] построены точные D-оптимальные планы экспериментов для одной из моделей неравноточных наблюдений вида (1), (2). В статье [2] впервые было доказано, что для равноточных наблюдений в модели
(1) D-оптимальный план определяется матрицей плана экспериментов (3), у которой все компоненты
xij  1 .
В данной статье результат, полученный в [2], обобщается на случай неравноточных наблюдений
(не все ai , i  1, m, равны нулю). Показано, что и в этом случае D-оптимальные планы экспериментов
определяются матрицей плана (3), все элементы которого xij  1 . Полученный результат позволяет
исследовать структуру некоторых насыщенных D-оптимальных планов экспериментов для неравноточных наблюдений, у которых число наблюдений равно числу неизвестных параметров. В частности,
установлено, что множество насыщенных D-оптимальных планов экспериментов для трех равноточных наблюдений гораздо шире множества, которое описано в статье [3]. Таких планов экспериментов
бесконечное, несчетное множество мощности континуума.
Модель неравноточных наблюдений
Для модели неравноточных наблюдений (1), (2) имеет место следующая теорема.
Теорема 1. Существует точный D-оптимальный план 0n для модели неравноточных наблюдений
(1), (2), все точки спектра которого лежат в вершинах m-мерного куба.
Д о к а з ат е л ь с т в о . Предположим, что существует D-оптимальный план 0n , для которого xij < 1
для некоторых значений i, j. Без потери общности рассуждений можем предположить, что таким элементом является x11 . Сделаем эту точку «плавающей», т. е. положим, что x11 = x  [1,1] . Обозначим
полученный таким образом план экспериментов как  x . Информационная матрица плана  x может
быть представлена как M(  x ) = A(x) + B, где
n
1  x
x ( i ) ( x ( i ) )


(
,
),
, d1 ( x)  a1 x  c1 , c1  a0  a2 x21    am xm1 ,
A( x) 
x
t
B

 
d1 ( x)  t 
di
i 2
t   ( x21 ,  , xm1 ).
Матрица B не зависит от x, и ранг A(x) = 1. Матрицы B и A(x) можно представить как
B  (b1 ,  , bm ), A( x)  (a1 ( x),  , am ( x)),
где bi и ai(x) – m-мерные столбцы, i = 1,2, …,m. Определитель матрицы A(x) + B равен сумме определителей матриц, содержащих различные комбинации столбцов матриц A(x) и B. Определители матриц
в этих комбинациях, содержащие более чем один столбец из A(x), равны нулю. Таким образом,
M ( x )  a1 ( x), b2 , b3 ,  , bm  b1 , a2 ( x), b3 ,  , bm    b1 , b2 , b3 ,  , am ( x)  b1 , b2 ,  , bm .
(6)
Вычисляя определители в правой части (6) и разлагая их в суммы по элементам столбцов a1(x), …,
am(x), получим
x 2   x  
f ( x)  A( x)  B 
 m,
(7)
a1 x  c1
где
n
z ( i ) ( z ( i ) )
m B , 
 0,( z ( i ) )  ( x2i ,  , xmi ).
di
i 2
В (7) , ,  – константы, не зависящие от x. Если функция f(x) не зависит от изменения x, а это будет
выполняться, если     a1 = 0, то в этом случае в D-оптимальном плане 0n значение x11 = x может
принимать любое значение из [–1,1]. Мы можем положить x =  1. Если же функция f(x) зависит от
изменения x, то при x = 1 либо при x = –1 она примет значение большее, чем f(x11). Чего не может быть.
Получим противоречие. Убедимся в этом. Производная функции f(x) равна
87
Вестник БГУ. Сер. 1. 2013. № 3
df ( x) a1 x 2  2c1 x  c1  a1

.
(8)
dx
(a1 x  c1 ) 2
Пусть D = 4  ( c12  а1(с1   a1  )) – дискриминант числителя в (8). Если D  0, то производная (8)
не меняет своего знака в интервале [–1,1], т. е. функция f(x) либо строго монотонно возрастает, либо
убывает на интервале [–1,1]. Значение f(1) либо f(–1) будет больше, чем f(x11). Если D > 0, то функция
f(x) является выпуклой. В самом деле,
d 2 f ( x)
D

 0.
2
dx
2(a1 x  c1 )3
В этом случае также f(1) либо f(–1) будет больше, чем f(x11). Теорема 1 доказана.
Из доказательства теоремы 1 следует, что, возможно, существуют D-оптимальные планы, у которых
некоторые точки спектра могут дрейфовать по одному из ребер m-мерного куба. Ниже будет показано,
что такая возможность действительно реализуется.
Насыщенные D-оптимальные планы
Планы экспериментов  n , у которых число точек спектра плана n совпадает с числом неизвестных
параметров m, называются насыщенными. Информационная матрица насыщенного плана  n для модели наблюдений (1), (2) имеет вид M = X  X , где
1
1
xn1 
 x11 x21


 d1 d1  d1 
X1       .
(9)


 x1n x2 n  xnn 
 d d
d n 
n
 n
Определитель информационной матрицы насыщенного плана равен квадрату определителя матрицы
X1. Насыщенный D-оптимальный план 0n – это такой план, который доставляет максимум абсолютной
величине определителя матрицы (9). Матрица (9) связана с матрицей плана эксперимента X: ее строки
пропорциональны соответствующим строкам матрицы (3). Поэтому
X
.
(10)
X1 
d1    d n
Одной из первых работ, посвященных структуре насыщенных D-оптимальных планов, была статья
Уильямсона [3], опубликованная в 1946 г. В ней описана структура насыщенных планов, 0n , n  2,7.
Построению таких планов посвящены также работы [4–6].
Вначале исследуем структуру насыщенных D-оптимальных планов с равноточными наблюдениями
0
3 . Покажем, что структура таких планов богаче, чем это было описано в работе [3]. В соответствии
с теоремой 1 и соотношением (10) построение насыщенного плана 30 для равноточных наблюдений
сводится к максимизации абсолютной величины определителя матрицы:
 x1i x2i x3i 


(11)
X   x1 j x2 j x3 j  ,
x x x 
 1k 2 k 3k 
где i, j, k – номера вершин единичного куба xs  1, s  1, 2,3, пронумерованных в некотором порядке.
В (11) все компоненты матрицы равны  1. Имеет место теорема.
Теорема 2. Насыщенные D-оптимальные планы 30 с равноточными наблюдениями для модели (1)
образуют бесконечное, несчетное множество планов следующей структуры. Три точки спектра плана должны лежать на одной из 6 граней единичного куба xi  1 , i = 1, 2, 3. Причем две точки – это
концы одного и того же ребра, а третья точка – любая точка, лежащая на противоположном ребре
той же грани.
Д о к а з ат е л ь с т в о . В матрице плана (11), определяющего план 30 , индексы i, j, k должны быть
различными, так как в противном случае определитель этой матрицы будет нулевым. Следовательно,
спектр плана 30 должен быть сосредоточен в трех различных вершинах единичного куба. Эти три
различные вершины должны находиться на одной грани куба. При нарушении этого условия строки
матрицы (11) будут линейно зависимыми, и ее определитель будет равен нулю. На каждой грани можно
88
Математика и информатика
четырьмя способами выбрать три различные вершины куба. Соответствующие им информационные
матрицы (11) будут иметь одинаковые по абсолютной величине значения определителей, равные 4.
Всего таких планов 24. Они и определяют структуру насыщенных планов, которая приведена в [3].
Однако структура насыщенных планов 30 для равноточных наблюдений богаче, чем та, что приведена в [3], и определяется теоремой 2. Действительно, на грани x1 = 1 куба, согласно условию теоремы
2, можно построить четыре матрицы планов экспериментов, определяющих D-оптимальные планы:
1 1 1 1 1 1 1 1 1 1 1 1

 
 
 

1 1 1 , 1 1 1 , 1 1 1 , 1 1 1 ,  1  x  1.
1 x 1 1 1 x  1 x
1 1 1 x 

 
 
Для каждого из этих планов функция f(x) в (7) не зависит от x и равна 16. Эти планы определяют насыщенные планы 30 для грани x1 =1. Всего можно построить 24 типа насыщенных планов 30 на единичном кубе для равноточных наблюдений. Они образуют бесконечное, несчетное множество мощности
континуума. Теорема 2 доказана.
Реализация D-оптимальных экспериментов, у которых все точки спектра плана лежат в вершинах
гиперкуба, означает, что эксперимент должен проводиться на пределе возможных значений факторов,
влияющих на эксперимент (температура, давление, концентрация веществ и т. д.). Это не всегда возможно либо небезопасно. Доказанная теорема позволяет ослабить требования, предъявляемые к одному из факторов.
Перейдем к исследованию структуры насыщенных планов 30 с неравноточными наблюдениями (2).
Построение таких планов сводится к максимизации абсолютного значения
X
,
(12)
di  d j  d k
где матрица X имеет структуру (11). Абсолютная величина определителя матрицы X со структурой (11)
равна нулю либо 4. Матрицы X со структурой (11), определители которых отличны от нуля, определяют
насыщенные планы 30 для равноточных наблюдений, точки спектра которых лежат в вершинах единичного куба. Среди таких планов согласно (12) надо выбрать те, для которых произведение di  d j  d k
минимально. Такие планы и определяют структуру насыщенных планов 30 с неравноточными наблюдениями (2). Сформулируем полученный результат в виде теоремы.
Теорема 3. Насыщенные D-оптимальные планы экспериментов 30 с неравноточными наблюдениями совпадают с планами 30 для равноточных наблюдений, у которых точки спектра лежат в вершинах единичного куба xi  1, i  1, 2,3, и у которых произведение дисперсий наблюдений в этих точках
спектра минимально.
Так, например, для дисперсии наблюдений d(x) = 10 – 2x1 + x2 – x3 план с точками спектра x (1) =
= (1, 1, 1), x (2) = (1, –1, 1), x (3) = (1, –1, –1) является насыщенным D-оптимальным.
Для четырех равноточных наблюдений насыщенный D-оптимальный план 04 определяется матрицей плана экспериментов, которая совпадает с матрицей Адамара H4 [3]:
 1 1 1 1


1 1 1 1
(13)
H4  
.
1 1 1 1


1 1 1 1
Остальные планы 04 можно получить из (13), умножая строки и столбцы этой матрицы на –1.
Для неравноточных наблюдений с дисперсией (2) насыщенные D-оптимальные планы 04 получаются путем максимизации абсолютной величины значений, аналогичных (12). Но теперь в знаменателе
(12) должны стоять произведения четырех дисперсий, а матрица X состоять из четырех различных
строк, представляющих координаты вершин четырехмерного куба. Таких вершин 16, из которых четыре различные вершины можно выбрать 1820 способами. Из этих комбинаций надо выбрать те, для
которых абсолютное значение выражения, аналогичного (12), будет минимально. Компьютерные расчеты дают основание для следующей гипотезы. Насыщенные D-оптимальные планы 04 находятся либо
среди D-оптимальных планов 04 для равноточных наблюдений, либо среди планов экспериментов, для
которых произведение соответствующих дисперсий – самое наименьшее среди всех возможных. Например, для дисперсии d(x) = 1 – 0,1x1 – 0,2x2 + 0,4x3 – 0,2x4 план 04 сосредоточен в точках x (1) = (1, 1, –1, 1),
89
Вестник БГУ. Сер. 1. 2013. № 3
x (2) = (1, 1, –1, –1), x (3) = (1, –1, –1, 1), x (4) = (–1, 1, –1, 1), которые не образуют D-оптимальный план
для равноточных наблюдений. Однако произведение дисперсий в этих точках равно 0,52  0,1  0,3 и оно
наименьшее среди всех возможных. Для дисперсии d(x) = 10 – 2x1 + x2 – x3 + x4 D-оптимальный план 04
сосредоточен в точках x (1) = (1, 1, 1, –1), x (2) = (1, –1, 1, 1), x (3) = (1, –1, –1, –1), x (4) = (–1, –1, 1, –1), которые образуют D-оптимальный план для равноточных наблюдений. Однако произведение дисперсий в
этих точках не наименьшее среди всех возможных. Предложенная гипотеза полностью подтверждается
при построении насыщенных D-оптимальных планов 30 .
Для пяти равноточных наблюдений насыщенный D-оптимальный план 50 можно строить на основе
матрицы планирования экспериментов [3]
 1 1 1 1 1


 1 1 1 1 1
 1 1 1 1 1


 1 1 1 1 1
 1 1 1 1 1


с определителем, равным 48. Таких планов можно построить 512. Для неравноточных наблюдений
D-оптимальный план 50 строится путем выбора пяти различных вершин пятимерного куба, которые
сформируют оптимальный план 50 . Для этого нужно рассмотреть 201 376 вариантов. Компьютерные
расчеты подтверждают верность выдвинутой гипотезы построения насыщенных D-оптимальных планов 50 для неравноточных наблюдений. Действительно, так для дисперсии d(x) = 10 – x1 +2x2 – x3 + x4 –
– 3x5 оптимальный план 50 сосредоточен в точках x (2) = (1, 1, 1, –1, 1), x (5) = (1, –1, 1, 1, 1), x (8) = (1, –1,
–1, –1, 1), x (14) = (–1, –1, 1, –1, 1), x (22) = (1, –1, 1, –1, –1), которые образуют D-оптимальный план для
равноточных наблюдений.
Б И Б Л И О Г РА Ф И Ч Е С К И Й С П И С О К
1 . Ф е д о р о в В . В . Теория оптимального эксперимента. М., 1968.
2 . M o y s s i a d i s C . , K o u n i a s S . Exact D-optimal N Observations 2k Designs of Resolution 3, when N  1 or 2 mod 4 // Math.
Operationsforch. U. Statist. 1983. Vol. 14. P. 367–379.
3 . Wi l l i a m s 1 o n J . Determinants whose elements are 0 and 1 // Am. Math. Monthly. 1946. Vol. 53. P. 427–434.
4 . E h l i c h H . Determinantenabsechatzungen fur binare Matrizen mit n  3 mod 4 // Math. Zeitcshr. 1964. Vol. 84. P. 438–447.
5 . Wo j t a s M . On Hadamard`s inequality for the determinants of order non-divisible by 4 // Colloq. Math. 1964. Vol. 12. P. 73–83.
6 . Ya n g C . H . On designs of maximal (+1, –1) matrices of order n  2 mod 4 // Math. Comp. 1968. Vol. 22. P. 174–180.
7 . K i r l i t s a V. P. Exact D-optimal designs of experiments for linear multiple model with linear variance of observations //
Computer data analysis and modeling. Minsk, 2004. Vol. 1. P. 165–167.
Поступила в редакцию 11.09.13.
Валерий Петрович Кирлица – кандидат физико-математических наук, доцент кафедры математического моделирования
и анализа данных.
УДК 517.925.7
В. И. ГРОМАК, А. И. ЛАПУЦКИЙ
АНАЛИЗ ОДНОЙ СИСТЕМЫ ГАРНЬЕ С ДВУМЯ НЕЗАВИСИМЫМИ ПЕРЕМЕННЫМИ
Системы Гарнье являются естественным обобщением уравнений Пенлеве на случай многих переменных. Исходная система Гарнье получается при построении изомонодромной деформации однородного ОДУ второго порядка с переменными коэффициентами, имеющего n устранимых особых точек и n+3 фуксовых особых точек. Количество устранимых особых точек
соответствует числу независимых переменных в полученной системе. В случае когда данная система имеет одну независимую
переменную, она совпадает с шестым уравнением Пенлеве. Делая замены переменных и параметров, можно осуществить
процесс слияния для системы Гарнье, аналогичный процессу слияния для уравнений Пенлеве. Полученные системы Гарнье
называются вырожденными и являются естественным обобщением других уравнений Пенлеве на случай многих переменных.
В данной статье рассматривается система Гарнье с двумя независимыми переменными, которая является обобщением второго
уравнения Пенлеве на случай двух независимых переменных. Приводятся классы новых алгебраических решений, а также
решений, выражающихся через функцию Бесселя первого рода.
Ключевые слова: система Гарнье; второе уравнение Пенлеве; преобразования Беклунда; рациональные решения; функция
Бесселя первого рода.
Garnier systems are a natural generalization of the Painlevé equations to the case of several variables. Origin Garnier system is
obtained for the construction of isomonodromic deformation of a homogeneous second-order ODE with variable coefficients has n
removable singular points and n+3 Fuchsian singular points. Number of removable singular points corresponds to the number of independent variables in the resulting system. In the case where the system has a single independent variable, it coincides with the sixth
90
Download