Д. Стрельцов, региональный менеджер по России и странам СНГ Mitsubishi Electric
Надежность - один из ключевых параметров систем безопасности, свойственный, впрочем, любому техническому устройству или изделию. Есть отрасли, где понятие надежности является неотъемлемой технической характеристикой. К примеру, надежность самолета - это один из основополагающих факторов, наряду с аэродинамическими характеристиками. Современная медицина широко использует разного рода технические средства как для диагностических и исследовательских целей, так и для выполнения ответственных функций во время и после операции. К их работе приходится предъявлять особо высокие требования, так как перебои в работе, скажем, искусственного сердца во время операции могут привести к летальному исходу.
Впрочем, и в нашей отрасли зачастую встречаются случаи, когда от качества и надежности оборудования зависит не только сокращение финансовых потерь, но и успех расследования преступлений, связанных с покушением на жизнь людей.
Общая научная дисциплина, изучающая методы и приемы, которых следует придерживаться при проектировании, изготовлении, приеме, транспортировке и эксплуатации изделий для обеспечения максимальной их эффективности в процессе использования, а также разрабатывающая общие методы расчета качества устройств по известным качествам составляющих их частей, получила название теории надежности. Теория надежности устанавливает закономерности возникновения отказов устройств и методы их прогнозирования; изыскивает способы повышения надежности изделий при конструировании и последующем изготовлении, а также приемы поддержания надежности во время их хранения и эксплуатации; разрабатывает методы проверки надежности при приемке больших партий продукции.
Без сомнения, теория надежности является, прежде всего, наукой и основывается на проведении эмпирических исследований и их математической обработки. При этом, как и любая эмпирическая наука, теория надежности требует для своего разрешения как уже известных математических средств, так и разработки новых. Более того, мы должны исключить утверждения типа: «такая конструкция будет надежнее, чем иная», «мы убеждены, что наша продукция лучше, чем изготовляемая другим предприятием», которые не имеют иных подтверждений, кроме личной уверенности, не могут служить основой для надежных выводов. Буквально недавно, будучи докладчиком на конференции по ТСВН, мне пришлось услышать от трех представителей разных компаний, рассказывающих о своем оборудовании, которое располагается в абсолютно различных ценовых сегментах, что их оборудование надежно решает задачи видеонаблюдения. Встав на место пользователя, выбирающего систему видеонаблюдения, легко осознать, что сделать такой выбор абсолютно невозможно, опираясь только на данные рекламных проспектов и заверения различных производителей о надежности оборудования. Но, к сожалению, технические характеристики, отражающие, насколько надежно записаны данные и сохраняются для последующей обработки, не приводятся ни в рекламных материалах, ни в сопроводительной документации. А в современных экономических условиях, когда количество обслуживающего персонала сокращается, а число охраняемых объектов увеличивается, вопрос стоимости периодического обслуживания становится на один уровень с вопросом первоначальных затрат на приобретение и установку.
Конечно же, различные типы объектов требуют разные уровни надежности, согласитесь, задачи видеонаблюдения в магазине розничной торговли, отличаются от задач, решаемых системой в отделении банка. А следовательно, заказчик не должен платить за излишнюю надежность оборудования в первом случае и, с другой стороны, обязан иметь гарантии того, что оборудование будет безотказно выполнять возложенные задачи по организации видеонаблюдения на объекте.
Перед тем как перейти к оценке надежности, приведу классическое определение надежности. Надежность -свойство объекта выполнять заданные функции, сохраняя во времени значения установленных эксплуатационных показателей в заданных пределах, соответствующих заданным режимам и условиям использования, технического обслуживания, ремонтов, хранения и транспортирования.
В институте меня учили, что идеальное устройство то, которое разрушалось бы целиком единовременно, при этом в заранее указанное время. Однако реальные механизмы отказывают случайным образом и в случайное время, а, следовательно, для описания процессов надежности необходимо использовать математический аппарат теории вероятности. За основной количественный показатель надежности принимается вероятность безотказной работы изделия в течение заданного промежутка времени. Вероятность безотказной работы - вероятность того, что в данном интервале времени или в пределах заданной наработки не произойдет отказа изделия.
Рассмотрим несколько вариантов оценки надежности и области их применения.
Данный метод основывается на статистике отказов используемого оборудования и определяется соотношением всех вышедших из строя приборов к числу установленных за определенный промежуток времени.
Если производитель осуществляет сервисную поддержку, то такая статистика обязательно должна существовать. Но, как правило, эта информация не поступает в открытый доступ по тем или иным причинам. В принципе, из-за отсутствия регламентирующей базы проверить эти данные довольно сложно, а если процент отказа на некоторое оборудование составляет более 20% (да-да, и такое оборудование используется на важных объектах!), то вряд ли можно ожидать добровольное анонсирование данных со стороны производителя.
Вероятно, подобной информацией могли бы «поделиться» крупные пользователи, кто имеет в своем арсенале значительные количества различного оборудования, да и дистрибьюторы, осуществляющие поставку в Россию, могут иметь подобные данные. Но в реальной жизни получить информацию очень проблематично.
Стоит заметить, что для некоторых изделий, относительно несложных по конструкции, понятие отказа можно ввести совершенно точно. Например, электрическая лампочка: или горит, или не горит, если у нее перегорел волосок. Однако уже для сколько-нибудь сложных изделий понятие отказа является весьма относительным. Если видеорегистратор ведет запись, но при этом сильно шумит, можно ли считать, что он отказал?
Поэтому данная оценка является довольно примерной. Ее уместно применять, если выборка изделий эксплуатируется довольно длительный период времени (от 2 лет и более) и при этом процент используемых изделий примерно равен.
Для оценки работы электронной техники зачастую используется параметр MTBF (Mean Time Between Failure) - время наработки на отказ, т.е. среднестатистическое время, через которое произойдет отказ в работе определенного устройства. Само по себе значение MTBF является достаточно абстрактным, поскольку не учитывает дефектов, возникающих, например, при перевозке устройств, поскольку тестирование производится непосредственно производителем. Однако сравнение различных моделей по MTBF позволяет сравнить качество и надежность работы тех или иных приборов. В общем случае значение MTBF высчитывается следующей формулой:
Следует заметить, однако, что публикуемые величины MTBF часто основываются на результатах ускоренных испытаний - в течение ограниченного времени, позволяющего выявить преимущественно долю производственного брака. В таком случае заявленное значение MTBF говорит не столько о собственно надежности, и тем более не о долговечности, сколько о проценте забракованных изделий. Например, MTBF порядка 1 млн. часов для компьютерного накопителя на жестких дисках, очевидно, не означает 114 лет непрерывной безотказной работы, поскольку эксперимент такой продолжительности не мог быть проведен по определению.
Возвращаясь к рынку систем видеонаблюдения, стоит отметить, что никто из производителей не объявляет величину MTBF. К примеру, при подготовке статьи я запросил данную информацию на нашей фабрике, но... осторожные японцы вежливо ответили: «Cannot disclose the figure». Тем не менее, если бы производители публиковали значение MTBF для своего оборудования, это могло бы стать для простого пользователя некоторой точкой отсчета надежности при выборе того или иного оборудования.
Вышеперечисленные методики предполагают, что число отказов в единицу времени постоянно на протяжении всего срока эксплуатации. В реальной жизни это, конечно, не так. Для более точного описания времен отказов образцов, поставленных на испытание, традиционно используется распределение Вейбулла, названное в честь шведского исследователя Вало-ди Вейбулла (Waloddi Weibull), применявшего его для описания времен отказов разного типа. В России исследование этого распределения связано с именем известного русского математика Б.В. Гнеденко, бывшего долгие годы профессором Московского университета. Поэтому данное распределение часто называется распределением Вей-булла-Гнеденко.
Наиболее удобно при проведении анализа надежности использовать не функцию распределения времен отказов, а функцию интенсивности отказов, т.е. вероятность отказа в течение малого интервала времени при условии, что в начале интервала отказа не произошло. Другое название данной функции - функция рисков, которая определяется следующим образом:
где h(t) обозначает функцию интенсивности отказов или функцию риска в момент t,f(t) - плотность, а F(t) -функцию распределения времен отказов. Для большинства исследуемых изделий (компонент, устройств и т.д.) функция интенсивности имеет форму U-образной кривой (рис. 1).
Рис. 1. Функция интенсивности отказов
Рис. 2. Примеры функций отказов для различного оборудования
Ранняя стадия распределения называется областью «детских болезней» и определяется производственным браком, поэтому на ранней стадии жизни изделия риск его выхода из строя (отказ) достаточно велик. Как правило, гарантийные обязательства, предоставляемые производителями, перекрывают по времени данную область. При этом ведущие производители «детские болезни» лечат сами. Проводится очень жесткое дополнительное тестирование, и потребитель получает оборудование уже на этапе «устойчивой работы».
Следующая область характеризуется уменьшением отказов до определенного предела. Важными парамет-
рами являются как непосредственно величина интенсивности отказов, так и время безотказной работы, т.е. период до наступления следующего отрезка.
На последнем отрезке интенсивность отказов вновь увеличивается из-за старения (износа) изделия до тех пор, пока все детали не выйдут из строя.
Например, автомобили в начале эксплуатации часто имеют несколько мелких дефектов, приводящих к поломке. После того как автомобиль прошел обкатку, риск его выхода из строя существенно уменьшается. Затем интенсивность отказов (поломок) возрастает, достигая, в конце концов, своего максимального значения.
Распределение Вейбулла позволяет гибко моделировать различные возникающие на практике формы функции интенсивности. Для этого наносятся на график результаты экспериментов, далее подбирается параметр формы, определяющий функцию интенсивности. Ясно, что начальная фаза кривой аппроксимируется распределением Вейбулла с параметром формы c<1, постоянная фаза имеет параметр формы c=1, а финальная фаза (старение или износ) моделируется распределением с параметром формы c>1.
Имея в своем арсенале подобное распределение для регистраторов различных производителей, можно довольно четко прогнозировать риски, в том числе и финансовые, возникающие в результате отказа оборудования.
Рассмотрим ниже, как же практически можно использовать математический анализ, основанный на распределении отказов Вейбулла. Я поместил на график несколько вероятных функций интенсивности отказов (рис. 2). Сразу оговорюсь, что данных для построения точной кривой у меня было недостаточно, и я ориентировался на статистику отказов, имеющуюся в моем распоряжении.
В любом случае статистика показывает, что в большинстве эпизодов себестоимость оборудования обратно пропорциональна распределению отказов. Таким образом, более дорогое оборудование располагается ниже на графике, чем дешевое.
С другой стороны, имеются устройства, качество которых имеет довольно хорошие показатели. Но при этом период «детских болезней» заметен, т.е. фактически влияние производственного брака довольно существенно сказывается на сервисных затратах при пуско-наладке.
Как уже замечалось ранее, не менее важным фактором является период, в течение которого функция распределения отказов имеет постоянное значение. Фактически, это позволяет прогнозировать срок службы данного устройства. Более длительный период эксплуатации позволяет экономить средства на модернизацию системы видеонаблюдения в долгосрочной перспективе.
Как уже отмечалось ранее, при выборе того или иного оборудования, которое будет использоваться на данном объекте, в первую очередь, необходимо руководствоваться задачами, которые данная система будет решать. А это целиком и полностью зависит от величины вероятных потерь, которые может понести организация в случае отсутствия видеозаписи. К примеру, риски, которые могут быть в магазине, торгующем хлебом, существенно отличаются от рисков ювелирного магазина.
Так, для хлебного магазина имеет смысл рассматривать оборудование, которое располагается на нашем графике достаточно высоко (желтая кривая). Период «детских болезней» будет перекрываться гарантийными обязательствами поставщика, а в случае непредвиденного отказа риски от потери информации невелики.
Возвращаясь к техническому заданию, я еще раз хотел бы отметить, что неграмотно поставленные задачи, завышенные требования к оборудованию ведут только к вытягиванию денег с заказчика, поскольку оборудование решает задачи, не свойственные данному объекту. К примеру, недавно мне попало в руки ТЗ на организацию видеонаблюдения в гостинице, где было прописано, что все камеры должны вести запись со скоростью 25 к/с с разрешением D1. При этом необходимо иметь архив глубиною 30 суток. Организовать подобную систему нетрудно, сложнее понять, зачем заполнять дисковые пространства бесполезной видеозаписью пустых коридоров, а также кто, как и насколько оперативно будет осуществлять поиск необходимого видеоряда в случае необходимости.
Типичным примером таких объектов может служить сеть банкоматов.
Отсутствие оператора и высокая стоимость рисков требуют устанавливать оборудование с высокой степенью надежности. В нашей схеме это могут быть кривые, выделенные красным и зеленым цветами. Зеленая кривая описывает в целом надежное оборудование, но имеющее ярко выраженные «детские болезни». Несмотря на то, что этот период покрывается гарантийными обязательствами, в любом случае, любая проблема связана с выездом специалиста на место, а в ситуации, например, территориальных разрозненных филиалов Сбербанка расстояния могут быть значительными. При этом при постоянном расширении банкоматной сети оборудование инсталлируется круглый год, и, как видно из диаграммы, проблемы «детского периода» становятся постоянными. А следовательно, несмотря на довольно хорошие средние показатели надежности, наличие производственного брака усложняет использование подобного оборудования для распределенных объектов (рис. 3).
Рис. 3. Пример функции распределения отказов с ярко выраженным периодом «детских болезней»
Рис. 4. Функции интенсивности отказов для высококачественного оборудования
Выбор оборудования с меньшей вероятностью производственного брака позволит существенно сократить издержки, связанные с сервисным обслуживанием установленного оборудования.
Список объектов, попадающих под данную категорию, довольно широк. Это объекты банковской отрасли, энергетики, транспортной инфраструктуры и т.д. В данном случае высокие требования по надежности распространяются на весь период жизни устройств. При этом предъявляются высокие требования к продолжительности этого периода. Распределения Вейбулла для устройств, применяемых в данном сегменте, выглядят примерно как на рисунке 4. Различия в функции интенсивности отказов не такая разительные. Думаю, пользователь может и не почувствовать разницу между оборудованиями, имеющими среднее значение функции рисков 0,86 и 0,75. Поэтому на первый план выходят такие параметры, как функциональные возможности устройств, способность к интеграции, поддержка аналитики и т.д. Стоит заметить, что зачастую вопрос цены не является определяющим в данном сегменте рынка, при этом количественные показатели стоимости довольно справедливо отражают функциональные возможности устройств.
В заключение хотел бы отметить, что я не ставил перед собой цель представить полный анализ оценки надежности и отказов. Это явно выходит за рамки журнальной статьи. Те, кто заинтересовался данным вопросом, легко сможет почерпнуть информацию как в учебниках, так и в Интернете. Я же хотел привлечь внимание тех, кто озадачен выбором оборудования, которое бы отвечало полностью поставленным задачам, с одной стороны, а также использование которого было бы экономически выгодным - с другой. Думайте о том, что проектируете, запрашивайте дополнительную информацию с производителей и используйте оборудование согласно требованиям заказчиков.
Источник: "Алгоритм Безопасности" № 1, 2009 год.