МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Таганрогский государственный радиотехнический университет
Е.Б.Механцев
ОБЕСПЕЧЕНИЕ НАДЕЖНОСТИ
ЭЛЕКТРОННЫХ СРЕДСТВ
Конспект лекций
Таганрог 2001
УДК 621.382.019.3 (075.8)
Механцев Е. Б.
Обеспечение надежности электронных средств: конспект лекций. Таганрог: Изд-во ТРТУ, 2001 .
ISBN 5-8327-0092-9
Излагаются основные положения теории надежности, основанные на статистическом подходе. Рассмотрены параметры, характеризующие надежность электронных компонентов. Рассмотрен расчет надежности систем без резерва и резервированных различными способами. Проиллюстрировано использование информационной избыточности и подход к созданию отказоустойчивых систем. Обсуждаются проблемы надежности современных СБИС.
Пособие предназначено для студентов специальности 200500 и 220800, обучающихся по очной безотрывной и дистанционной формам обучения.
Иллюстраций 15
Рецензенты:
ООО ЛАБОРАТОРИЯ СХЕМОТЕХНИКИ, г.Таганрог, директор Беседин И.В.
Кабаченко В.С., начальник отдела Таганрогского научно-исследовательского института связи
ISBN 5-8327-0092-9
Таганрогский государственный
радиотехнический университет, 2001.
1. Вводные замечания
Качество любого изделия характеризуется совокупностью свойств, обеспечивающих удовлетворение определенных потребностей в соответствии с его назначением. Естественно, что на первом месте всегда стоят показатели качества, определяющие потребительский свойства изделия. Для ПЭВМ это, например, удобство общения человека с машиной (эргономические характеристики), автономность (персональная!), с одной стороны, и возможность обмениваться информацией со всем миром с другой, производительность, объем устройств памяти и пр. Для разработчика и производителя ЭВМ не меньшую роль играет также конструкция, технологические и экономические характеристики машины, ее элементов и условий производства.
Одним из важнейших показателей качества как для пользователей вычислительных средств, так и для их разработчиков и производителей, является надежность работы, поскольку все остальные показатели теряют смысл, если изделие неработоспособно. В соответствии с ГОСТ 27.002 83, под надежностью понимается свойство объекта сохранять во времени в установленных пределах значения всех параметров, характеризующих способность выполнять требуемые функции в заданных режимах и условиях применения, технического обслуживания, ремонтов, хранения и транспортирования. Надежность является сложным свойством, которое состоит из безотказности, долговечности, ремонтопригодности и сохраняемости. Обеспечение надежности устройства определяется громадным числом объективных и субъективных факторов как технических, так и организационных, даже исчерпывающее перечисление которых затруднительно. Можно для примера указать, что на надежность устройства влияет большое число людей, участвующих в создании и всех этапах его жизни от момента формулировки технического задания на разработку и далее в проектировании, производстве, испытаниях, транспортировке, хранении, эксплуатации, вплоть до оформления акта списания. Квалификация, отношение к делу, условия работы этих людей все влияет на надежность изделия. При производстве аппарата решающее воздействие на его качество оказывают культура производства предприятия, качество производственных материалов и комплектующих (и, естественно, их происхождение), отработанность технологических процессов. Наконец, при эксплуатации изделия на его надежность влияют режимы и условия эксплуатации, в том числе параметры внешней среды (механические воздействия, температура, давление, влажность, радиация), условия энергоснабжения, атмосферные и другие помехи и т.д.
Надежность устройства характеризуется рядом показателей надежности, т.е. количественной мерой одного или нескольких свойств, составляющих надежность объекта. Поскольку, как отмечалось, надежность определяется большим числом факторов, зачастую носящих случайный характер, в качестве показателей надежности в настоящее время принято использовать статистические (вероятностные) меры, оценка которых базируется на математической статистике и теории вероятностей. Полученные при таком подходе значения показателей являются усредненными, т. е. справедливыми для характеристики достаточно многочисленной группы (выборки) изделий, а не для конкретного образца индивидуально. Тем не менее, они позволяют количественно оценить надежность проектируемого изделия и подразумевают, что комплексом системных, схемно-конструкторских, технологических и организационных мер заданные показатели надежности изделия будут обеспечены. Несмотря на ограниченную точность, оценка показателей надежности имеет смысл не только для прогнозирования, например долговечности изделия, но и для обоснования принятия решений при сравнении альтернативных вариантов при проектировании, а также для решения вопросов о достаточности (или недостаточности) принятых мер по обеспечению предусмотренных техническим заданием уровней показателей надежности при разработке изделия.
Ниже излагается основанный на статистике и теории вероятностей подход к оценке важнейших показателей надежности, а также некоторые способы их повышения, которые могут быть использованы в практике проектирования вычислительных и радиоэлектронных средств.
2. Основные понятия. Показатели надежности элементов
Принятый в настоящее время подход к оценке надежности сложных изделий является иерархическим. Это значит, что вначале каким-либо способом определяются показатели надежности элементов (деталей) нижнего уровня сложности, т.е. самых простых. Полученная информация является исходной для оценки устройств более высокого уровня (функциональных узлов, блоков, модулей) и так далее, вплоть до изделия в целом.
Поэтому начнем рассмотрение с самых простых элементов.
Будем понимать под наработкой продолжительность (время) работы объекта (элемента); наработкой на отказ время от начала эксплуатации (включения) до возникновения первого отказа.
Тогда один из главных показателей надежности (безотказности) вероятность безотказной работы определим как вероятность того, что в пределах заданной наработки отказа объекта не наступит.
Обозначим текущее время t, наработку до отказа T, вероятность безотказной работы p(t), термин “вероятность” P. При этих обозначениях сделанное определение можно записать так :
p(t) = P{T>t}. (1)
Вероятность отказа, т.е. противоположного к вероятности безотказной работы события, обозначим q(t). Тогда
q(t) = 1p(t) = P{T t}. (2)
Как видно, функция q(t) в терминах теории вероятностей характеризует вероятность того, что наработка до отказа не превышает текущего времени t и является интегральной функцией распределения времени работы элемента. В соответствии с общими свойствами интегральной функции распределения она является неубывающей, причем
q(0) = 0; q() = 1 и наоборот
p(0) = 1; p() = 0.
Соответствующая (2) дифференциальная функция распределения (плотность вероятности) f(t) связана с (2) обычными соотношениями:
или (3)
Поскольку исходные данные для определения показателей надежности элементов обычно определяются на основе статистических испытаний, остановимся на статистическом смысле введенных понятий, для чего рассмотрим воображаемый эксперимент.
Предположим, что ставятся на наработку (т.е. одновременно включаются) N одинаковых элементов. Будем присваивать текущий номер отказавшему элементу по мере выхода каждого из них из строя, т.е. T1 момент выхода из строя (наработка до отказа) первого элемента, T2 второго и т.д. Пусть k количество элементов, сохранивших работоспособность к данному моменту времени.
Можно построить график зависимости отношения k/N от времени. Фрагмент такого графика представлен на рис. 1.
Рис. 1. Зависимость k/N от времени
В момент времени t=0 все элементы исправны и k/N = N/N=1.
При отказе первого элемента в момент времени T1 количество сохранивших работоспособность элементов уменьшается на единицу k=N1; k/N=(N1)/N= 11/N, т.е. значение отношения k/N скачком уменьшается на 1/N и так далее вплоть до выхода всех элементов из строя.
Если увеличивать число взятых для испытания элементов, величина ступенек и временной интервал между ними будут уменьшаться, так что в пределе график превратится в плавно падающую кривую. В теории вероятностей доказывается, что
lim k/N = p(t),
N
т. е. это и будет функция, характеризующая вероятность безотказной работы элементов. Достаточно точное экспериментальное определение функции p(t) требует значительного числа элементов и продолжительных испытаний.
На практике, поскольку трудно организовать регистрацию отказа каждого элемента в любой момент времени, поступают несколько иначе. Весь планируемый срок испытаний tn делят на интервалы, продолжительностью t , после каждого из которых фиксируется количество отказавших за данный интервал элементов ni. Тогда функция вероятности безотказной работы может быть определена по результатам таких испытания в виде
.
Другим важным показателем надежности элементов является средняя наработка до отказа. Ею называют математическое ожидание наработки объекта до первого отказа. По определению, математическое ожидание времени работы можно записать так:
,
где f(t) плотность распределения времени работы. С учетом того, что интегральной функцией распределения времени работы является q(t), и, используя (2) , можно записать f(t) = d q(t)/dt = d p(t)/dt. Тогда, обозначив среднюю наработку до отказа T, получим
T = M(T) = = = .
В приведенном выше преобразовании использована формула интегрирования по частям, а выражение равно нулю как при t=0, так и при t=.
Таким образом,
T = , (4)
т.е. наработка до отказа численно равна площади, ограниченной кривой надежности и осями координат.
Значение T можно определить по результатам испытаний на основании эксперимента, проведение которого рассмотрено выше. Это будет просто среднее значение моментов выхода из строя отдельных элементов, т. е.
T = lim .
N
Одним из показателей надежности, широко используемых для проведения практических расчетов, является интенсивность отказов, которая имеет общепринятое обозначение (t). Интенсивность отказов это условная плотность вероятности отказа в любой момент времени t при условии, что до этого момента отказ не возникал. Можно показать, что
(t)=f(t)/p(t) = (dp(t)/dt)/p(t). (5)
Интегрируя выражение (5), получим
.
Потенцирование последнего выражения позволяет выразить в явной форме вероятность безотказной работы через интенсивность отказов, а именно:
p(t) = exp ( ). (6)
Обобщение многочисленных экспериментальных данных показывает, что зависимость интенсивности отказов от времени имеет характерный вид, приведенный на рис 2.
Pис.2. Зависимость интенсивности отказов от времени
В этой зависимости можно выделить три характерных участка. Начальный период времени работы элементов, обозначенный I, характеризуется высокой, но быстро падающей интенсивностью отказов, и его часто называют периодом приработки изделий. В этот промежуток времени от 0 до t1 отказывают в первую очередь детали, имеющие скрытые дефекты производства. В это же время происходят отказы, связанные с ошибками монтажа, некачественным проведением сборочных и монтажных операций. Этот участок тем меньше, чем совершеннее конструкция изделия, выше качество ее изготовления, лучше соблюдаются правила эксплуатации. Продолжительность периода приработки может достигать единиц процентов от времени нормальной эксплуатации изделий.
Второй период эксплуатации изделий в промежутке времени (t1 t2) является участком их нормальной работы. Он характеризуется практически постоянным во времени значением интенсивности отказов на довольно низком уровне. В идеале отказы здесь могут и не наблюдаться. Практически же для сложных изделий имеют место внезапные отказы за счет случайных факторов, предугадать которые не представляется возможным. Причины, связанные со старением изделий (деградация, усталость, старение), на участке II еще не проявляются. Продолжительность этого периода может составлять десятки тысяч часов и нередко превышает время морального старения аппаратуры.
Наконец, третий период эксплуатации изделий (t2 t3) характеризуется значительным повышением интенсивности отказов, связанных со старением материалов, естественным процессом износа, деградации элементов конструкции, т.е. изменением их внутренних физико-химических свойств. Отказы здесь проявляются и как случайные, и как постепенные, т.е. связанные с уходом за допустимые пределы значений параметров аппаратуры и ее элементов. Эксплуатация аппаратуры при достижении участка старения нецелесообразна.
Наряду c перечисленными, существует еще ряд показателей надежности, используемых не только при проектировании, но и при хранении и эксплуатации аппаратуры. В настоящем пособии они не затрагиваются.
3. Основные законы распределения показателей надежности
Исходными данными для проведения практических расчетов тех или иных характеристик надежности являются параметры, полученные по результатам статистических испытаний на надежность, проводимых обычно для массивных элементов электронной аппаратуры. Результаты этих испытаний обобщаются в параметрах законов распределения, используемых для описания выявленных статистических закономерностей. Чаще всего по результатам испытаний описывают интенсивность отказов (t) или плотность распределения времени работы (дифференцированный закон распределения времени работы) f(t), который называют иногда частотой отказов.
Экспоненциальный закон надежности естественным образом вытекает из (6) и зависимости (t), представленной на рис.2. Действительно, можно исключить из рассмотрения участок приработки I, если брать для использования элементы, прошедшие тренировку (приработку), в процеcсе которой будут отбракованы практически все детали, имеющие скрытые дефекты, и участок старения III, т.е. не использовать детали дольше назначенного им ресурса до старения. Тогда для промежутка времени (t1t2), соответствующего основному участку работоспособности элементов, можно принять (t), не зависящей от времени, т.е. (t) = = const. Выражение (6) в этом случае упростится:
p(t) = exp () = exp (t), (7)
и называется оно экспоненциальным законом надежности.
Вероятность отказа определяется противоположным
(в вероятностном смысле) выражением
q(t) = 1p(t) = 1- exp (t). (8)
Плотность распределения времени отказов будет иметь вид
f(t) = exp (t). (9)
С помощью (4) несложно определить наработку до отказа, характерную для этого случая:
T = =. (10)
Таким образом, при экспоненциальном законе надежности интенсивность отказов и наработка до отказа являются взаимно обратными величинами. Размерность интенсивности отказов 1/час физически соответствует количеству отказов, приходящихся на один элемент в единицу времени. Следует также отметить, что при экспоненциальном законе надежности наработка до отказа не отличается от средней наработки на отказ, т.е. среднего времени между отказами для восстанавливаемых изделий, T=T0.
С учетом (10) экспоненциальный закон надежности можно записать в виде
p(t) = exp (t/T). (11)
Графически эта зависимость представлена на рис.3.
Из свойств экспоненциальной зависимости известно, что за время T ее уровень снижается до значения 1/е = 0,37 (е основание натурального логарифма), т.е. можно утверждать, что за время, соответствующее наработке на отказ, вероятность безотказной работы снижается до уровня 1/е. Отрезок прямой 1 T на рис.3 является касательной функции p(t) в точке p(0)=1.
Pис.3. Экспоненциальный закон надежности
Для малых промежутков времени, т.е. t<p(t) = 1 и, соответственно q(t) = ,
т.е. в этом случае вероятность отказа определяется просто отношением интересующего нас времени работы к наработке до отказа.
Благодаря простоте и удобству использования экспоненциальный закон широко применяется в теории и практике описания надежности. Достаточно сказать, что интенсивность отказов, как постоянная для данных изделий величина, является самым распространенным паспортным параметром, характеризующим надежность большинства электронных компонентов (деталей).
Связано это с тем, что экспоненциальный закон описывает надежность объектов, у которых отсутствуют доминирующие процессы разрушения, приводящие к отказам, т.е. достаточно хорошо отработанных в процессе конструирования и производства объекты, в которых такого рода причины устранены. Это не значит, что исключены все причины отказа, но их происхождение носит случайный характер и вероятность отказа в данный временной интервал не зависит от времени предыдущей работы (будущее не зависит от прошлого).
Экспоненциальный закон удобен не только для характеристики надежности элементов, но и сложных систем. Это связано с тем, что поток случайных событий (отказов), характеризующих сложную систему, образующийся из многих частных независимых потоков с любыми характеристиками от частей системы, сходится к экспоненциальному.
Другим законом, используемым иногда для описания характеристики надежности, является закон Вейбулла. В распределении Вейбулла плотность вероятности определяется соотношением
f(t) = k 0 . (12)
В этом распределении уже два параметра, причем 0 задает масштаб кривой на оси абсцисс, а параметр k асимметрию и эксцесс (остроту) распределения. Другие показатели надежности, соответствующие (12), могут быть выражены с помощью формул (3) (5) следующим образом:
-
вероятность безотказной работы и вероятность отказа
p(t) = 1q(t) =;
-
интенсивность отказов (t) = 0 k ;
-
наработка до отказа ,
где Г ( + 1) = гамма-функция.
Наглядно проследить поведение функций (t) и p(t), соответствующих распределению Вейбулла, можно с помощью графиков, представленных на рис. 4 и 5. Очевидно, что при k=1 распределение Вейбулла не отличается от экспоненциального. При k>1 интенсивность отказов начинается с нуля и возрастает с течением времени. Наоборот, при k<1 интенсивность отказов имеет падающий характер. Такое разнообразие поведения функции при изменении одного параметра позволяет приспособить ее для описания самых разнообразных статистических закономерностей. В частности, распределение Вейбулла находит применение для описания параметров надежности в период приработки изделий (при k<1), при ускоренных испытаниях в жестких режимах, когда изделие быстро стареет (при k>1).
Рис. 4. Зависимость a(t) для распределения Вейбулла
В случае описания надежности изделий, в отказе которых можно выделить влияние какого-то одного доминирующего фактора (например, реле, надежность которых ограничена преимущественно стойкостью к электроэррозии контактных пар), используется закон нормального распределения. С учетом того, что время величина неотрицательная, т.е. применительно к задачам надежности, вероятность безотказной работы в этом случае можно представить в следующем виде:
p(t) = , (13)
где Ф(x) = интеграл вероятностей,
T0 средняя наработка на отказ,
среднее квадратичное отклонение наработки на отказ от ее среднего значения.
Две последние величины являются параметрами распределения.
Графически типичный вид зависимости (13) представлен на рис 6.
Рис. 5. Зависимость (t) для распределения Вейбулла
Наконец, для описания систем с резервированием, в которых могут находиться одновременно как исправные, так и отказавшие элементы, иногда удобно воспользоваться распределением Пуасона. В этом случае, например, можно описать вероятность появления нескольких (d) отказов за время (t) следующей формулой:
qd(t) = . (14)
Иногда для описания параметров надежности используют распределение Релея, гамма-распределение и др.
Рис. 6. Нормальная кривая распределения надежности
4. Надежность системы. Основное соединение элементов
Введенные показатели надежности в равной степени могут использоваться как для описания надежности элементов, так и устройств, собранных из них. Статистические испытания массовых радиоэлектронных компонентов на надежность можно организовать, хотя получение достоверных данных при этом потребует использования большого числа элементов и продолжительного времени. Организовать подобные испытания для устройств, особенно сложных, значительно труднее по экономическим соображениям, а иногда и вообще невозможно, если изделие выпускается единицами штук. Кроме того, надежность некоторых изделий (например, микросхем) настолько велика, а обновление электронной базы идет столь быстро, что за время испытаний изделие может морально устареть и полученную информацию о его надежности не удастся применить при проектировании аппаратуры с использованием этих изделий, хотя она может оказаться и полезной, например, для разработчиков микросхем.
Поэтому при оценке надежности проектируемых устройств основной задачей является выразить показатели надежности устройства через показатели надежности его элементов, считая, что последние известны.
Для упрощения последующего изложения будем называть любое устройство системой, а его составные части элементами.
Возможно множество вариантов связи показателей надежности системы и составляющих ее элементов, которые находят отражение в моделях, используемых для описания показателей надежности системы. Рассмотрим в первую очередь базовые модели, с помощью которых можно построить и проанализировать надежность более сложных систем.
Наиболее простой и распространенной является модель основного или последовательного (в смысле надежности) соединения элементов, представленная на рис.7. В этом случае элементы системы, каждый из которых характеризуется функцией вероятности безотказной работы pi(t), образуют последовательную цепочку из n элементов.
Рис.7. Модель последовательного соединения элементов
Все элементы такой цепочки необходимы для выполнения порученной системе функций. Для сохранения безотказности системы необходимо, чтобы все элементы такой системы были исправны. Это условие может быть выражено с помощью правила (теоремы) умножения вероятностей, которая гласит, что вероятность одновременного совершения n независимых совместимых случайных событий равна произведению вероятностей совершения этого события каждым элементом. В нашем случае таким событием является факт одновременной исправной работы всех элементов.
В соответствии с названным правилом вероятность безотказной работы системы Pc(t) может быть выражена так:
Pc(t) = , (15)
а вероятность отказа системы Qc(t)
Qc(t) = 1- .
Это значит, что система отказывает, когда отказывает хотя бы один ее элемент.
Формула (15) хорошо объясняет возникновение проблемы надежности. Напомним, что проблема надежности электронной аппаратуры возникла в связи с ее усложнением, с одной стороны, и с повышением важности решаемых задач с другой, когда отказ любого элемента мог оказаться связанным с большими экономическими потерями (транспорт, космос) или даже с опасностью для здоровья и жизни людей. Из выражения (15) видно, что как бы мало ни отличалась от единицы надежность элементов pi(t), всегда найдется такое n (сложная система), что надежность системы Pc окажется недопустимо низкой. В технике проблемы, связанные с усложнением аппаратуры, получили образное название “тирания количеств” и наиболее ярко проявились в первых поколениях ЭВМ.
Пусть показатели надежности элементов системы описываются экспоненциальным законом, в частности, вероятность безотказной работы любого элемента:
pi(t) = exp ().
Подставив это значение pi(t) в (15), получим
Pc(t)=, (16)
где
. (17)
Это значит, что если надежность элементов системы с последовательным их соединением описывается экспоненциальным законом, этим же законом описывается и надежность системы, причем интенсивность отказов системы определяется алгебраической суммой интенсивностей отказов всех ее элементов. Естественно, что наработка до отказа такой системы Тс определяется как
. (18)
Такая простая связь между показателями надежности системы и ее элементов очень упрощает анализ, а возникающие трудности связаны обычно c подбором значений интенсивностей отказов элементов , соответствующих условиям эксплуатации системы и режимам работы ее элементов.
Системы с основным соединением элементов очень распространены в технике и используются также в простых ПЭВМ. В них нет резервирования, т.е. каждый элемент является принципиально необходимым и его отказ приводит к отказу всего устройства. Надежность таких систем обеспечивается тщательным проектированием, высокой культурой производства и правильной эксплуатацией.
1>
Поделитесь с Вашими друзьями: |