" Н а у к а м о л о д ы х " , 3 0 - 3 1 м а р т а 2 0 1 7 г . , А р з а м а с
П о с в я щ а е т с я 1 0 0 - л е т и ю Р о с т и с л а в а Е в г е н ь е в и ч а А л е к с е е в а
542
конкретным законам распределений наработки на отказ, принятые для
обработки цензурированной статистики.
Большой накопленный опыт в области практического применения
непараметрических методов оценивания функции плотности распределения при
наличии цензурированной информации получен в Обнинском государственном
университете атомной энергетики России при участии и под руководством А.В.
Антонова[4-5].
В процессе работы были исследованы методы, устраняющие граничные
эффекты ядерных оценок плотностей для неотрицательных случайных величин
(нарушение условий нормирования данных).
Выбор метода ядерной оценки плотности распределения осуществлялся
на основе результатов экспериментальных исследований по восстановлению
статистических данных об отказах разнокластерных вычислительных
комплексов. Результаты экспериментов показали, что непараметрический
метод ядерных оценок дает корректные результаты, начиная с очень малых
выборок. Основным преимуществом непараметрического метода ядерных
оценок является возможность производить оценку цензурированных данных.
Ядерная оценка плотности распределения описывается в виде:
∑
=
σ
ζ−
σ
=
n
i
t V
n
t f€
1
1
1 )(
,
(1)
где ζ
1
, ζ
2
,..., ζ
n
– выборка, полученная в результате наблюдения за объектом
исследования;
V
– ядро предлагаемой оценки; σ – параметр локальности;
n
–
объём наблюдений.
Для корректного отображения выходных данных были проведены
сравнения методов компенсации, зеркального отображения данных и усечения
ядра. На модельной выборке проведено сравнение эффективности
предложенных подходов. Результаты тестовых исследований показали, что
наилучшая точность оценки достигается применением принципа зеркального
отображения данных. Суть указанного принципа заключается в замене
классического ядра
σ
ζ−
1
t V
ядром
σ
ζ+
+
σ
ζ−
1
1
t V
t V
в формуле (1) для
ядерной оценки плотности распределения.
Для имитации потока отказов разнокластерных вычислительных систем
были исследованы законы распределения, максимально приближающие поток
отказов разнокластерных вычислительных систем к данным, полученным в
ходе их эксплуатации. В работе для оценки распределения данных использован
закон распределения Вейбулла:
k
) /x(
e
) ,k,x(F
λ −
−=λ
1
.
(2)