Персональный сайт

В данном разделе приведены некоторые основные принципы и понятия, с которыми мы будем работать. В результате раскроем следующие вещи:

определение автоматизации, управления и информационных технологий (ИТ);
какая связь существует между приведенными в предыдущем пункте параметрами и как они связаны с производством;
концепция “жизненного цикла продукта”, а также понимание роли автоматизации и контроля в данном цикле;
классификация производственных предприятий и систем автоматизации.

Но для начала немного терминологии (верхний уровень нашего курса). Инженерная наука является дискретной дисциплиной со своим языком, задачами и инструментами (как и многие другие науки, искусство, религия или философия - везде есть свои “языки” общения). Основной вопрос инженера:

Как я могу решить данную проблему?

Это приводит нас к типичному представлению системы, как “черного ящика” (неизвестно и не важно, что внутри, важно - как заставить это работать). Такой подход позволяет нам не задумываться о внутреннем устройстве системы, а сосредоточится на входящих и выходящих данных, а так же взаимосвязи между ними и общей системой (можно сказать, рассматриваем потоки информации). Это очень похоже на программирование. Каждый элемент системы (или устройство) будет порождать конкретный выход из конкретного входа (рис. 1.1).

Рис. 1.1. Концепция черного ящика.

Другой важной особенностью инженерной науки являются ее специальные инструменты. Как правило, визуального представления информации:

технические чертежи и списки деталей,
схемы,
блок-схемы и программы,
технические планы и принципиальные схемы.

Думаю с подробностями вы уже познакомились в процессе своего обучения инженерному делу.

Контроль, автоматизация, робототехника и измерительная техника имеют первостепенное значение для развития промышленности, особенно в течении последних десятилетий. Даже в настоящее время идет процесс реиндустриализации стран - и он никогда и не останавливался (сейчас это Индустрия 4.0). Таким образом, автоматизация - это всегда актуальная тема, начиная с 18 века (вспомним дядюшку Форда).

На мой взгляд одной из основных проблем автоматизации и контроля сегодня является комплексный и интеллектуальный анализ информации. А для него необходимо быстрое и понятное получение информации из различных источников и ее качественная обработка. Все это непосредственно связано с принятием решений, неразрушающем контролем и автоматизацией способов получения информации (и это относится не только к промышленным системам)

Обособленной проблемой стоит описание “хаоса” - множества нелинейных динамических систем (то.что мы называем нормальным распределением). Вопреки линейным динамическим системам (которые можно решить “аналитически” и с которыми работают дифференциальные уравнения), хаотические системы крайне чувствительны к окружающим условиям и системным параметрам. Для таких систем были введены в работу нелинейные методы и многокомпонентные методы машинного обучения и анализа “больших данных”. В нашем же курсе мы будем рассматривать только простейшие случаи, относящиеся к неразрушающему контролю и способам получения информации с точки зрения физических сенсоров.

Примечание. Именно из-за повсеместного наличия “хаоса” за счет множественного наложения нелинейных динамических систем мы повсюду встречаем нормальное распределение вероятности событий в окружающем нас мире. Так-то.

Вообще, описание системы и последующий контроль - это проверка соответствия реальных параметров объекта установленным техническим требованиям (в специально выбранных точках). При этом в промышленности часто востребован именно неразрушающий контроль, поскольку важно не мешать техническому процессу и обеспечить его “замкнутость” (в меньшей степени важно еще и сохранить продукт). К неразрушающим методам относятся:

органолептический контроль (визуальный, на цвет и запах),
спектроскопия (УФ, ИК и рентгеновского диапазона волн),
ультразвуковой анализ,
контроль температуры,
контроль давления,
и т.д. (практически все простые физические параметры можно контролировать без разрушения вещества)*

* сложнее дело обстоит с более высоким уровнем анализа - химическим, биологическим, социальным и т.д.

Примечание. Обратите внимание, что все перечисленные методы относятся к “низкоуровневому” контролю физических величин. Гораздо сложнее дело обстоит с автоматизированным контролем более “сложных свойств”. К таким свойствам например относится цвет, химический состав, растворимость, цена, спрос и т.д. Тут уже важно применять сложные методы непрямого контроля и только лишь сенсорами не обойтись.

Все перечисленные выше сложные названия и методы по сути сводятся к тем или иным датчикам (или сенсорам), которые устанавливаются в производственных условиях. Полученные данные используют для определения целевых параметров с использованием различных инструкций, методик и стандартов (нормативная документация). Иными словами - анализируют. Все это еще раз подтверждает факт того, что мы окружены данными. Да и сами по сути является данными, которые пока не очень хорошо умеем обрабатывать. А все, что нам остается - наблюдать и экспериментировать, чтобы по результатам анализа строить гипотезы и теории, открывать законы. Ну и контролировать помышленное производство конечно же.

Когда мы анализируемые полученные при контроле параметры, то принято делить их на 3 типа (сразу скажу, что не всегда такое деление используется и конечно же оно не единственное).

Функциональные параметры - характеризующие работу системы или процесса (действующее усилие, напряжения, давление жидкости в гидросистеме, время разгона/торможения, удельный расход энергии и т.д.) - определяют процесс в целом, не дают возможность конкретизировать его стадии.
Структурные параметры - непосредственно характеризуют состояние конкретных стадий процесса или узлов оборудования (координаты положения элементов, коррозия и т.д.) - как правило, требуют проведение процесса в специальных условиях или разборки оборудования.
Параметры сопутствующих процессов - определяемые из внешних условий и процессов, сопутствующих целевому процессу или оборудованию (температура, вибрация, акустические сигналы, уровень и спектр шумов, погрешность обработки) - наиболее распространены для измерений.

Результатами контроля являются данные (количественные, ранговые или качественные), которые мы можем получить через специального вида взаимосвязи (для этого строят функции системы от времени, как правило - непрерывные с общей запись вида $K_J(t)$). Кроме того для результатов обязательно указывают размерность и установленные/допустимые отклонения (погрешности). Также важно понятие чувствительности процедуры измерения (параметр $K$ в формуле) к измеряемому параметру ($Q$): $\frac{dK}{dQ}$.

Задача. Подумайте, как выражается геометрический смысл чувствительности, другими словами как можно визуально представить чувствительность метода? Чтобы помочь себе - нарисуйте график $K_J(t) = aQ_J(t) + b$ для чувствительной и не чувствительной системы (параметры можете выбрать случайным образом).

Различают так же некоторые средства контроля: аппаратные, программные, ручные и автоматизированные, специализированные или универсальные.

Началом же неразрушающего контроля и диагностики принято считать открытие в ноябре 1895г. рентгеновских лучей (X-rays), которые позволили обнаружить металлический предмет в закрытой деревянной коробке (по тем временам это произвело фурор похлеще чем презентация новых айфонов).

Если вы представили себе как выглядит чувствительность, то становится понятно, что точность работы систем контроля зависит именно от чувствительности. Однако точность зависит и еще от нескольких важных параметров - разрешающей способности компонентов (характеризует способность отличить между собой два близких сигнала) и точности алгоритмов обработки всей получаемой информации. Кроме того, немаловажным фактором является точность калибровки измерительной системы (но это немного другое).

Задача. Подумайте, как в общем случае связаны между собой чувствительность и разрешающая способность. Всегда ли хорошо, когда наш график очень чувствительный?

Дополнительно отметим, что сегодня во многих системах функции оператора (человек) являются во многом определяющими и достаточно сложными для автоматизации. В частности по этому системы автоматического (машинного) принятия решений еще не получили широкого распространения и эта проблема очень актуальна в настоящее время.

Таким образом, я бы сказал, что сегодня существуют четыре важных направления развития автоматизированных методов контроля:

Машинное обучение методам и средствам анализа (интеллектуализация). Поиск функциональных метрик качества.
Разработка единой системы контроля качества технических объектов и окружающей среды (стандартизация).
Совершенствование диагностики (аппаратная и программная часть).
Стандартизация и внедрение систем контроля на местах (нормативная документация).

В нашем случае - мы рассмотрим 3 пункт с точки зрения его физических основ. А именно какие способы неразрушающего контроля промышленных процессов существуют на сегодняшний день с точки зрения различных сенсоров. Но для начала дополним нашу базу терминов следующими понятиями.

В основе любой системы контроля лежит процесс измерения. Он представляет собой процедуру определения неизвестного численного значения через сравнение с эталоном в определенных единицах измерения (это же относится и к калибровочным кривым и т.п. - везде в основе лежат эталоны).

Промышленность (Industry) - систематическая деятельность, которая может быть связана с производством/услугами/торговлей (нас будет интересовать только производство).

Автоматизация (automation) - набор технологий, обеспечивающий управление машинами и системами без значительного вмешательства человека (при этом в идеале должна быть увеличена производительность и экономический эффект по сравнению с ручным трудом).

Управление и контроль (Management and Control) - набор технологий, обеспечивающий получение желаемых выходных параметров для систем и машин через выставление входных параметров. Обычно, это процесс обработки информации с целью определения какого-либо события.

Сенсоры (Sensors) - устройства, осуществляющие функции измерения, счета и т.п., с целью получения информации. Часто еще сенсор называют датчиком, что является синонимом (однако некоторые специалисты любят утверждать, что датчик это более сложная структура, которая включает в себя сенсор с “обвесом”).

В рамках настоящего курса мы будем в основном рассматривать особенности аппаратной реализации неразрушающего контроля и некоторые общие понятия автоматизации в современной индустрии. Кроме того, в область моей профессиональной деятельности довольно долгое время входило обеспечение контроля на производстве минеральных удобрений, и я постараюсь приводить побольше конкретных примеров из данной области (рис. 1.2).

Рис. 1.2. Структура промышленного производства минеральных удобрений.

Задача. Чтобы лучше усвоить терминологию, потренируйтесь описать любой конкретный процесс в обозначенных терминах (например, управления температурой в паровом котле, включение и регулирование газовой комфорки и т.п.).

Кроме того, важно понимать, как связаны системы автоматизации и системы управления и контроля.

Системы автоматизации могут включать в себя системы управления и контроля, но обратное неверно.
Главная функция систем управления и контроля - следить за тем, чтобы выходной сигнал соответствовал значениям входного (иными словами, подчинялся заданной функциональной зависимости). При этом системы автоматизации могут выполнять бОльший функционал (вычислять “точки воздействия” для систем контроля, мониторить производительность системы, производить остановку и запуск производства, составлять и контролировать расписание работ и оборудования и т.д.).

Задача. Приведите пример автоматической системы, в которую выходит система контроля (интернет в помощь).

Помимо различных систем управления и контроля системы промышленной автоматизации широко используют возможности программирования и информационных технологий (ИТ, рис. 1.3).

Рис. 1.3. Основные области ИТ, используемые в промышленной автоматизации.

Задача. Попробуйте найти конкретные примеры использования ИТ в автоматизированных системах (интернет в помощь).

Но важно понимать, что промышленная автоматизация отличается от ИТ.

Промышленная автоматизация включает в себя значительное количество аппаратных технологий (приборы, датчики, двигатели, электроника для формирования сигнала и т.д.).
Системы автоматизации низкого уровня используют ИТ в меньшей степени, больше работая с аппаратным обеспечением, электроникой и встроенными вычислениями (например, сенсоры и актуаторы).

1.3 Автоматизация в промышленности (роль и типы)

Принято считать, что основными целями использования автоматизации в промышленности являются:

повышение качества и безопасности производства (минимизация ошибки за счет человеческого фактора);
увеличение экономического эффекта производства (… profit).

Сам экономический эффект выражается следующим образом:

$$Profit = (\frac{Price}{Unit} - \frac{Cost}{Unit}) \times \text{Production Volume}$$

Автоматизация влияет на соотношение стоимости (с позиции затрат на производство) к количеству продукции, позволяя оптимизировать этот параметр (прибыль предприятия может быть увеличена за счет производства большего объема более качественной продукции при уменьшении производственных и временных затрат). Таким образом автоматизация влияет на экономику с позиции:

масштаба (economy of scale) - снижение затрат на единицу продукции (за счет увеличения объема производства, повышения операционной и временной эффективности);
цели (области применения, economy of scope) - когда может производить более широкий ассортимент.

Типичный жизненный цикл продукта приведен на рис. 1.4.

Рис. 1.4. Типичный жизненный цикл продукта.

На первой стадии создается идея продукции на основе исследования рынков, спроса и активов. Затем создается макет производства и изготавливается прототип продукта. После проверки работоспособности производства и пригодности прототипа проводится масштабирование производства и его монтажа, чтобы убедиться в наличие необходимых ресурсов и технологий для массового производства. Затем идет непосредственное массовое производство и контроль качества продукции. Производимый продукт поступает на рынок, с которого приходит соответствующий ответ (feedback), на основании которого производство эволюционирует (наращивает мощности или меняет продукт).

Задача. Где здесь можно использовать автоматизацию и какие преимущества она дает?

Задача. Приведите примеры отраслей: где 1 - экономия масштаба важнее, чем экономия цели; 2 - наоборот и 3 - они равнозначны.

1.3.1 Типы производственных систем

Согласно введенным понятиям масштаба и цели можно предположить основные типы производств (рис. 1.5).

Рис. 1.5. Классификация производственных систем.

Непрерывный процесс (continuous flow process) - производимое изделие “непрерывно” (не является единичным объектом). Объемы велики, различие в продукции относительно не велико (нефтепереработка, цементное производство, сталелитейная промышленность и т.д.).
Массовое производство единичной продукции (mass manufacturing of discrete production) - большие объемы единичных объектов, вариации продуктов весьма ограничены (приборостроение, автомобилестроение, выпуск сковородок и т.д.).
Серийное производство (ассортиментное, batch production) - производит серию единичного или непрерывного продукта, различия между продукцией больше. Один и тот же комплект оборудования изготавливает много видов продукции (но для каждой серии/партии устанавливается отдельный набор параметров - “рецепт” партии) (фармацевтика, литейное производство, формовка пластмасс, печать и т.д.). Сюда же и относится производство минеральных удобрений (хотя для некоторых технологических схем и предприятий можно предположить и массовое производство единичной продукции).
Цеховое производство (мастерские, job shop) - небольшое количество единичной продукции, обычно на заказ, возможны любые изменения в изделии (прототипирование, 3Д печать, различные мастерские и т.д.).

1.3.2 Типы автоматизированных систем

Автоматические системы можно разделить на категории в зависимости от гибкости и степени интеграции в производственный процесс.

Фиксированная автоматизация (fixed automation) - фиксированный набор рабочих параметров для механизированного оборудования. Используется для выполнения фиксированных и повторяющихся действий с целью производства большего количества одинаковых деталей (используется в непрерывных и массовых типах производств, например: конвейеры покрасочного цеха, дистилляция, линии подачи пробы и т.д.).
Программируемая автоматизация (programmable automation) - изменение последовательности работы и конфигурации станков с помощью электронных средств управления. В данной схеме может потребоваться нетривиальное программирование (например, для различных PLC, обычно используется в серийном производстве где разнообразие рабочего оборудования низкое, а вариация продукции высокая; например бумажные или сталелитейные заводы и т.д.).
Гибкая автоматизация (flexible automation) - используется в гибких производственных системах (flexible manufacturing system, FMS), которые постоянно управляются компьютером (операторы вводят команды высокого уровня, при этом изменения нижнего уровня выполняются автоматически; обычно используется в серийном и цеховом производстве где много сортов продукции, а объемы работ варьируются от средних до низких). В таких системах обычно используются многоцелевые компьютеры с числовым программным управлением (ЧПУ, CNC), автомобили с автоматическим наведением (роботизированные системы, AGV) и др.
Интегрированная автоматизация (integrated automation) - полная автоматизация производства при которой все процессы выполняются и координируются компьютером (Computer Integrated Manufacturing - CIM). Другими словами, это полная интеграция технологических и управленческих операций с использованием ИТ. Часто в нее может входить и система бизнес управления. Пока что, успешные примеры таких систем крайне малы и сложно оценить, в каком виде производства они наиболее применимы.

Обратите внимание, что масштаб и сложность автоматизированных систем растет от фиксированной до интегрированной автоматизации. Но необходимо помнить, что тип автоматизации выбирается под каждое конкретное производство и задачи, а инвестиции в нее должны быть оправданы экономически.

Например, фиксированная автоматизация целесообразна, когда:

Различия в типе продукции малы (размер, форма, количество деталей, материал).
Существует прогнозируемый и стабильный спрос на продукт в течение 2-5 лет (и производственные мощности также стабильны).
Объем производства за единицу времени высок.
Требуется оптимальная производительность из-за конкуренции.

Гибкая автоматизация, с другой стороны, используется в следующих ситуациях:

Существуют значительные различия в типах продукции (для одной производственной системы).
Жизненный цикл модели продукта мал (частые усовершенствования и проектные модификации, которые изменяют производственные требования).
Объемы производства умеренны, а спрос не так предсказуем.

Тем не менее в рамках протекающей на сегодняшний день промышленной революции Индустрия 4.0 все чаще склоняются к использованию серийного производства и модернизации непрерывных и массовых производств для данных целей. В связи с чем гибкая автоматизации становиться все более востребованной.

Задача. Как в ходе технического осмотра отрасли можно определить, какой тип автоматизации преобладает в ней? Для какой фабрики вы бы порекомендовали интегрированное компьютерное производство и почему? Какой вид автоматизации вы бы порекомендовали для производства:

лампочек накаливания;

одежда;

текстиль;

минеральные удобрения;

печать;

фармацевтические препараты;

игрушки.

1.4 Упражнения

Опишите роль автоматизации с точки зрения общей рентабельности производственной системы.
Как промышленная автоматизация помогает экономить и каких типов эта экономия?
Введите в интернете запрос “история автоматизации” и прочитайте понравившиеся ссылки.
Изучите стандарт ISO 9001 “Quality management systems”. Какие основные критерии системы менеджмента качества мы смогли найти в данной нормативной документации?
Какие есть альтернативные определения промышленности, автоматизации и контроля?

2. Архитектура систем промышленной автоматизации (СПА)

2.1 Введение и цели

В настоящем разделе мы рассмотрим общую структуру системы автоматизации в промышленности. Хотелось бы, что бы по окончанию раздела вы могли:

привести элементы систем промышленной автоматизации и их иерархию (уровни организации);
описать функциональную связь уровней организации (и назвать соответствующие технологии);
привести реальные промышленные примеры для каждого из уровней;
смогли описать поток информации между данными уровнями.

2.2 Архитектура системы промышленной автоматизации

Перейдем к рассмотрению общей структуры всего промышленного комплекса, чтобы определить в нем свое место (рис. 2.1). Для простоты - представьте, что это один завод (например, АО “Рога и копыта”).

Рис. 2.1. Архитектура промышленного комплекса. Обратите внимание на обозначение уровней.

Начнем анализ с верхнего уровня - это наиболее соответствует человеческому восприятию всего процесса (с общего абстрактного уровня управления до конкретного алгоритмического). На 4 уровне (верхний) находится менеджмент верхнего уровня, т.е. управление всем предприятием (Enterprise). Данное понятие включает в себя определение экономических, научных, потребительских и прочих высокоуровневых направлений развития производства в целом. Думаю, это точно не то, что мы будем автоматизировать (пока что).

Далее следует контроль выпускаемой продукции (3 уровень, Production Control), где осуществляется проверка на соответствие ГОСТ и ТУ. Тоже выполняется пока людьми. Однако здесь отдаются уже более конкретные управляющие команды.

На 2 уровне расположился контроль принятия решений (Supervisory Control). Можно сказать что это переходный этап между понятным людям и понятным машинам командам и параметрам. Эту функцию берут на себя операторы производства вместе с автоматическими системами управления процессами (комната с большими мониторами на заводе). А то, что отображается на мониторах компьютеров и позволяет операторам понимать, что происходит в процессе производства называют АСУТП (Автоматизированная система управления технологическим процессом или supervisory control and data acquisition, SCADA). Очень часто этот уровень обозначают просто как АСУТП, хотя это уровень не ограничен только АСУТП и включает в себя еще и функции операторов по управлению процессом.

Уровень 1 (Automation Control) занимают системы автоматического контроля. Если говорить точнее, то системы поддержания заданных параметров качества (которые задаются АСУТП и операторами для конкретных точек процесса). На данном уровне часто используются компьютеры (PC) или логические контроллеры (PLC). Самая что ни на есть автоматизация! Те функции, которые не могут выполняться автоматически, берут на себя аппаратчики производства (цеховые рабочие).

На последнем, 0 уровне (Sensors & Actuacors) расположены сенсоры и актуаторы - устройства “получения” и “передачи” физической информации о процессе, которую они предоставляют на более высокие уровни управления.

Взаимодействие между уровнями обеспечивается единой информационно-коммуникационной системой предприятия (система управления производственными процессами или Manufacturing execution system, MES). Например, для АО “Апатит” такой системой является PI System.

От себя добавлю, что на сегодняшний день все большее распространение получают роботизированные системы контроля установленные прямо в производственном процессе (т.е. это система 0 - 2 уровня). Данные системы могут как взаимодействовать с АСУТП напрямую, так и работать автономно (например, как агрегаторы данных). На примере подобных систем можно хорошо проиллюстрировать связь описанных уровней с точки зрения промышленной автоматизации (рис. 2.2).

Рис. 2.2. Архитектура роботизированной системы контроля гранулометрического состава на предприятии, производящим минеральные удобрения.

Данная система была разработана мною с коллегами и служит для контроля гранулометрического состава производимых минеральных удобрений. Более подробная взаимосвязь компонентов и принцип работы приведены на рис. 2.3.

Рис. 2.3. Потоки передачи сигналов и данных для роботизированной системы контроля гранулометрического состава. Пунктирные линии представляют цифровые сигналы, остальные - аналоговые сигналы.

Отметим, что время принятия решения и количество информации, которые заложенны в одном конкретном решении увеличиваются от 0 до 4 уровня. Другими словами “чем выше уровень - тем более общие управляющие термины используются” (что означает большее количество времени и опыта/баз данных для декомпозиции этих запросов).

Пример. Менеджеры говорят “сделай качественно для рынка”; техотдел передает “сделай качественно согласно ГОСТ 2х2”; управление контролем качества проводят анализы и передают параметры операторам; те в свою очередь вводят в АСУТП параметры в виде “подкрутить ручки 1-2-3 в позиции 3-2-1”; аппаратчик или система автоматического контроля “подкручивает ручки и удерживает заданные параметры” в согласии с прочими параметрами системы; сенсоры и актуаторы “крутятся, меряют и урчат” передавая новую информацию на верх. Как-то так.

На первый взгляд - наше место находиться на 0 и 1 уровнях данной системы. Однако, часто и 2 уровень попадает в поле зрения автоматизации и неразрушающего контроля (см. заметку про роботизированные системы, рис. 2.2). Тем не менее, в рамках настоящего пособия будут рассматриваться измерительные устройства 0 уровня (сенсоры), поскольку именно они являются незыблемым фундаментом автоматического неразрушающего контроля. Но все же далее мы приведем краткое описание каждого из уровней автоматизации предприятия для формирования общей картины (начиная с самого низкого уровня).

2.3 Уровень 0. Сенсоры и актуаторы

Первой системой контроля (которая непосредственно отвечает за автоматизацию) будет система сенсоров (уровень 0). Она должна давать нам точную и чувствительную информацию (сигнал), связанную с физической величиной (например, температурой) (рис. 2.4). Получение такой информации возможно за счет специальных устройств - сенсоров (датчики, sensors/gages). Получение данной информации необходимо, чтобы на уровне 2 были произведены нужные вычисления и рассчитан ответ управляющей системы (или среагировал оператор). На основании данного ответа для актуатора или аппаратчика поступит новый ввод данных (например, для удержания процесса в технологических рамках).

Примечание. Все это “циклическое взаимодействие между уровнями 0-1-2 происходит для обеспечения общего качества по ГОСТ или ТУ в рамках уровня 4 в соответствии с требованиями рынка, которые передаются через уровень 5.

При этом, информация (сигнал) от/до уровня 0 передается в виде электрической или пневматической формах информации и дальше преобразуется либо в электрический сигранл по одному из протоколов связи с компьютером или ПЛК (например Modbus, Profibus, RS485, RS232 Ethernet и т.п.), либо во входной параметр технологического процесса (тепло, сила потока). Таким образом передать сигнал от процесса - задача сенсоров, принять управляющий сигнал и воздействовать на процесс - задача других устройств, актуаторов.

Рис. 2.4. Система сенсорного контроля (уровень 0).

При этом, нас интересует информация о состоянии физической среды (medium), которая относится к конкретному технологическому физическому процессу. Если более конкретно, то нас интересует измерение некоторой физической переменной, функционально связанной с этим явлением, лежащим в основе технологического процесса.

Пример. Информация о температуре теплоносителя в топке с точки зрения изменения данного параметра при измерении расхода жидкости.

Именно для этого нам нужен сенсор - черный ящик, находящийся в непосредственном контакте со средой, который обеспечивает контроль состояния этой среды (как правило, не разрушающий).

Сам же сенсор состоит из следующих основных элементов.

Чувствительный элемент (sensing element) - элемент, чьи физические/химические/биологические свойства изменяются в зависимости от физической среды (прямой или непрямой контакт).

Пример. Типичным примером сенсора является изменение удельного сопротивления из-за нагрева провода термистра (терморезистор, resistance Temperature Detector, RTD).

После, чувствительный элемент соединяется с модулем формирования сигнала (signal-conditioning element), который изменяет тип сигнала от чувствительного элемента (обычно преобразует его в электрическую форму: напряжение, ток, емкость или индуктивность). Данное преобразование зависит в основном от типа сенсора (именно по этому чувствительный элемент является уникальным для того или иного типа датчика). Как правило, для подобных модулей используются аналоговые электронные схемы, которые в конечном итоге вырабатывают электрические сигналы в виде напряжения или тока в определенных диапазонах. Кроме того, подобный модуль может также использоваться и для специальных функций, не связанных с преобразованием сигнала. Например, для нивелирования внешних условий измерений для термопар (“внешняя привязка”, ambient referencing).

Пример. Для температурного резистора (RTD) изменение сопротивления может быть легко преобразовано в напряжение путем включения RTD в измерительный мост (мост Уитстона, Wheatstone’s bridge). Таким образом данный мост служит модулем формирования сигнала.

Следующим модулем стоит элемент обработки сигнала (signal processing element), который используется для последующей работы с электрическим сигналом с целью фильтрации (устранение шумов), диагностики (оценка состояния датчика), линеаризации (получение выхода, линейно связанного с физическими параметрами среды) и т.д.. Как можно догадаться из количества функций этот элемент обычно имеет более общее назначение чем предыдущие.
Последний модуль - элемент целевой обработки сигнала (target signal-handling element). Обычно он тоже универсален и может выполнять различные функции: отображение данных/сигналов, запись, хранение, обратная связь с системой управления процессом и т.д.. Примерами могут служить регистратор температурных диаграмм, регистратор лент КИПиА, цифровой дисплей или аналого-цифровой преобразователь (АЦП, ADC) с последующим подключением к компьютеру системы управления процессом.

Примечание. Современные сенсоры обычно обладают дополнительным модулем/способностью цифровой передачи данных. Для этого используются серийные, параллельные или сетевые протоколы (например USB и упомянутые в разделе 2.2 RS485, RS232 Ethernet и т.п.). Такие сенсоры называют “умными” (smart) и они содержат соответствующие дополнительные цифровые электронные системы преобразования сигнала под протокол связи.

Таким образом, сенсор переводит входящие физические сигналы (температура, давление, скорость и т.д.) в выходящие электрические сигналы, которые в свою очередь являются входящими сигналами для следующего уровня автоматизации: управление ПЛК, анализа операторами, принятие решений и, т.д.

Примечание. Помимо электрических сигналов от сенсоров существуют еще и пневматические, но их рассмотрение выходит за рамки нашего курса.

Таким образом мы кратко рассмотрели как осуществляется передача информации от процесса до управления. Однако есть и обратное направление и чтобы осуществить управляющее воздействие на сам процесс, нам нужны исполнительные устройства или актуаторы (мы все еще на уровне 0). Данные устройства характеризуют воздействие на процесс, в зависимости от полученного сенсорного сигнала в соответствии с заданным управлением (задается с более высоких уровней, например 1 или 2).

Исполнительные устройства или актуаторы (Actuator) - это преобразователь электрического сигнала в физическое воздействие который необходим для обеспечения изменений в физических процессах (например, регуляция скорости потока, массы продукта, давления и т.д.).

Пример. Актуатор может повернуть заслонку или открыть сопло горелки, что приведет к изменению состояния физической среды в производственном процессе.

Таким образом, сенсоры и актуаторы являются двумя сторонами одной медали, но работают с преобразованиями различной силы: актуаторы являются исполнительными устройствами и потребляют много энергии (формируют воздействие определенной силы в зависимости от сигнала), в то время, как сенсоры формируют электрический сигнал из физического воздействия и не требуют высокой мощности. Следовательно, актуаторная система хоть и является обратной сенсорной по своей сути, но обычно входящие в ее состав устройства более энергоемкие и в большинстве случаев производят какое-либо движение (которое потом преобразуется в другие формы физического воздействия). Тем не менее логика работы актуаторов с сигналом примерно соответствует сенсорной логике (рис. 2.5).

Примечание. Аналогично сенсорам, существуют и “умные актуаторы”.

a)

b)

Рис. 2.5. Функциональная конфигурация типичной актуаторной системы (a) и пример ее промышленной реализации (b).

Разберем типичные блоки исполнительной системы (актуатора):

Элемент обработки сигнала (signal processing element) принимает команду от системы контроля в электрической форме (как правило, слабой мощности). Данная команда может обрабатываться несколькими путями. Например, может производиться усиление или фильтрация (для удаления входящего сигнала определенной частоты, которая может вызвать резонанс). Многие актуаторы исполняются в виде замкнутых блоков со встроенным управлением (т.е. 1ый уровень автоматизации) с обратной связью (в блок входит и получение сигнала от встроенного сенсора) для обеспечения своевременности и точности срабатывания. Поэтому электронный блок обработки сигналов часто содержит систему управления для самого привода (например ПЛК).
Элемент усиления мощности (power amplifying element) иногда содержит линейные каскады усиления мощности (linear power amplification stages). В других случаях он может состоять из силовых электронных схем, например, для электрических приводов (motor driven actuators). Требуется для получения необходимой актуатору мощности для осуществения воздействия на среду.
Элемент преобразования переменной (variable conversion element) выполняет функцию изменения характера сигнала, генерируемого электронным элементом усиления мощности (с электрической на не электрическую форму, как правило, в движение). Примерами являются электрогидравлические сервоклапаны (electrohydraulic servo valve), шаговые/серво двигатели (stepper/servo motors), преобразователи тока в пневматическое давление (Current to Pneumatic Pressure converters) и т.д.
Элемент преобразования энергии (energy conversation element), дополнительный элемент который, как правило, включает в себя элементы не электрического преобразования мощности (non-electrical power conversion element) и используется при необходимости дальнейшего увеличения мощности (как правило, с помощью гидравлических или пневматических механизмов). Кроме того в его составе могут использоваться элементы не электрического преобразования переменной (non-electrical variable conversion elements) для преобразования управляемой переменной в желаемую форму, часто в несколько этапов. Типичные примеры включают преобразование скорости движения в скорость потока в проточных клапанах, преобразователи поворотного движения в линейное с использованием специальных механизмов (например, червячная передача), преобразование скорости потока в тепло с использованием пара или горячих жидкостей и т.д.

В заключении, в актуаторах могут использоваться различные вспомогательные элементы (оборудование) для смазки/охлаждения/фильтрации, дополнительные резервуары, первичные приводы, датчики обратной связи, компоненты для отображения, дистанционное управление, а также защитные механизмы и т.д. поскольку уровень мощности (электрической) актуаторов значительно выше, чем сенсоров.

Подводя итог настоящему разделу, системы 0 уровня можно отобразить в общем виде на примере управления задвижкой крана, который регулирует поток в некоторой среде (рис. 2.6).

Рис. 2.6. Система контроля 0 уровня.

2.4 Уровень 1. Система автоматического управления (контроля)

Как вы могли видеть из рис. 2.6 - существует некоторый цикл, связывающий сенсор и актуатор. За счет этого уикла и взаимодействия данных устройств должно происходит некое управление средой. Именно этот цикл и понятие “управления” дает нам возможность подняться в автоматизации на уровень выше и рассмотреть систему автоматического управления (уровень 1). Как правило, под промышленными системами управления 1ого уровня подразумевается использование небольших управляющих контуров на базе программируемого логического контроллера (ПЛК, PL controller, PLC). Этот новый элемент (обычно электронный или пневматический) принимает на вход сигналы от операторов или АСУТП (устанавливает заданное значение), а так же обратную связь от сенсора (промышленного процесса) и на выходе выдает (или рассчитывает) сигналы для актуатора, чтобы реальное значение было как можно ближе к заданному (рис. 2.7).

Примечание. Широко изместный Arduino-контроллер в обычном исполнении не является ПЛК поскольку не предназначен для автономного использования в промышленных условиях и не обладает промышленными интерфейсами работы с сенсорами - это просто микроконтроллер. Но на сегодняшний день есть варианты Arduino-контроллеров, которые являются полноценными ПЛК, например Controllino.

Рис. 2.7. Цикл автоматической системы контроля (уровень 1).

Данный цикл также часто называют автоматическим управлением (Automatic Control), управлением процессом (Process Control), управлением с обратной связью (Feedback Control) и т.д. В данном случае целью контроллера является обеспечение таких сигналов на актуатор, чтобы вход от показаний сенсора (параметр технологического процесса y(t)) следовал за входом от команды управления (команда операторов r(t)) настолько близко, насколько это возможно (и по значению, и по времени). Как можно видеть на рис. 2.7 показана структура общего контура управления с его составными элементами, а именно: контроллером, приводом (актуатор), сенсором и самим процессом (среда, в которой происходит процесс). Кроме того, на рисунке отмечены сигналы, существующие в различных точках системы:

вход от команды управления (заданное значение или эталонный сигнал, set point or reference signal);
вход от сенсора (данные среды);
внешние помехи (шум, noise).

Несмотря на кажущуюся простоту работы ПЛК достичь точного соответствия заданному значению практически невозможно за счет наличия помех (изменение нагрузок, наводящие токи, шум датчика) и ограниченного времени отклика за счет внешних факторов производства (нестабильность, неопределенность и изменчивость в динамике процесса).

Примечание. Еще раз обратите внимание на новый элемент - контроллер. По сути это и есть промышленная система автоматического управления 1 уровня (по своей сути это связной - он обеспечивает прямую и обратную связь входных и выходных параметров между уровнями 0 и 1, следит за их соответствием друг другу).

Большинство промышленных “управляющих” сигналов для контроллера представляют собой “кусочно-неизменяемые” или дискретные сигналы (т.е. дискретные константы), указывающие на желаемое значение переменной/параметров процесса (например, желаемая температура, давление, расход, уровень и т.п.). Они задаются через определенные интервалы времени в виде конкретных величин и должны улучшать протекающие процессы и качество изделия. Однако сам процесс производства является непрерывным (continuous process). Из-за этого он склонен постоянно откланяется на разную величину от заданного параметра, что в теории приводит к частому и большому изменению управляющего сигнала и к ухудшению качества продукции (как и к выходу из строя актуаторов и контроллеров). Чтобы избежать этой проблемы применяют разные схемы “приблизительного” управления типа “П”, “ПИ”, “ПИД” и т.п. регуляции.

Примечание. Описанная проблема очень актуальна для различных автопилотов, особенно для автомобильного транспорта.

В целом, рассмотрение схем регуляции контроллеров выходит за рамки настоящего курса. Поэтому ограничусь лишь небольшими основами. Во-первых, мы рассматриваем контроллер с точки зрения управления процессом (т.е. как черный ящик), а потому в нашем случае он будет синонимом, т.е. “мгновенным” регулятором (хотя с аппаратной точки зрения это разные устройства). Тогда с точки зрения регуляции процесса существует несколько контроллеров:

П (P) - пропорциональный
И (I) - интегральный
Д(D) - дифференциальный
ПИ (PI) - пропорциональный и интегральный
ПД (PD) - пропорциональный и дифференциальный
ПИД (PID) - пропорциональный, интегральный и дифференциальный

Примечание. Сами понятия П, ПД, ПИ, ПИД (P, PD, PI, PID) и т.п. регуляторы означают устройства регулирования (черный ящик) для актуатора, которые генерируют на своем выходе обратную связь в виде результата некой передаточной функции для положения актуатора (т.е. на выходе возвращается по сути разность между установленным значением и значением сенсора, приближенная той или иной функцией). Тп передаточной функции как раз и обозначается как П, ПИ и т.д..

Пример. Рассмотрим регулирование комнатной температуры (поддержании ее значения в X градусов) с помощью некоего комнатного электронагревателя, выходная мощность которого зависит от уровня входного сигнала. Т.е. при изменении температуры на некую положительную величину e (повышении температуры до уровня X+e) к стандартному входному сигналу U нагревателя будет добавлен отрицательный сигнал регулятора u. Результирующим сигналом на входе нагревателя будет, таким образом, U-u , что уменьшит выходную мощность нагревателя, и, следовательно, комнатную температуру (отрицательная обратная связь от регулятора). Именно так (с отрицательной обратной связью) работает большинство регуляторов в промышленной автоматизации.

Очень часто e называют “ошибкой” или “отклонением”, Х - “заданным уровнем” или “заданным значением”, причем Х, в общем случае, может быть и регулируемым сигналом в каком-то другом контуре регулирования.

Далее мы немного более подробно рассмотрим работу ПИД (PID) регулятор как наиболее универсального представителя класса (беря за основу приведенный выше пример с температурой в комнате). Любой другой регулятор может быть получен путем обнуления коэффициента передачи в соответствующем слагаемом передаточной функции.

Итак, передаточная функция ПИД регулятора описывается уравнением:

$$ u(t) = P + I + D = K_p \cdot e(t) + K_i \int_0^t e(\tau) d \tau + K_d \frac{de}{dt} $$

Часто используются следующие обозначения:

$K_p$ - пропорциональный коэффициент усиления
$P_b = \frac{1}{K_p}$ - относительный диапазон регулирования
$K_i$ - интегральный коэффициент усиления
$T_i = \frac{1}{K_i}$ - постоянная интегрирования (размерность - время)
$K_d$ - дифференциальный коэффициент усиления
$T_d = K_d$ - постоянная дифференицирования (размерность - время)

Рассмотрим, каждое из слагаемого ПИД регулятора по порядку:

Пропорциональное регулирование (П или P регуляторы) - величина поправки в регулирующее воздействие, которая линейно пропорциональна величине отклонения. Логично, чем больше отклонение температуры в комнате от заданного уровня, тем сильнее следует изменить мощность нагревателя для компенсации изменения.
Интегральное регулирование - величина поправки в регулирующее воздействие, которая зависит от накопленного действия отклонения регулируемой величины. Например, пропорциональное регулирование попросту не позволяет прогреть комнату при открытом окне и уйти от низких температур в комнате (т.е. помещение будет проветриваться с той же скоростью, что и прогреваться). Но при интегральном регулировании, если накопленное действие пониженной температуры растет (интеграл), то это слагаемое даст дополнительное приращение мощности нагревателя (по сравнению с пропорциональным) и позволит прогреть комнату (считаем, что наш нагреватель обладает бесконечной мощностью).
Дифференциальное регулирование - величина поправки зависит от скорости изменения регулируемого параметра. Если температура на улице резко упала, то лучше поскорее прогреть комнату и стены (чтобы не дать им остыть). Однако следует помнить, что данный вид регулирования может легко вызвать резкие перепады и резонансы в управлении.

В случае кусочно-непрерывного управления (дискретные константы), мы получаем сигнал с сенсора на контроллере, рассчитываем управляющее воздействие, применяем его к актуатору, получаем новый сигнал с сенсора и т.д. В общем случае отклик системы измеряется волновыми характеристиками (рис. 2.8).

Рис. 2.8. Характеристики отклика типичного ПИД регулятора, работающего по замкнутой схеме управления.

Для регулятора существуют следующие характеристики и определения:

Время подъема (Rise Time) - время, при котором система проходит от 10 до 90 % заданного уровня (steady-state value).
Процент перевыполнения (Percent Overshoot) - величина превышения характеристики процесса (в процентах от заданного значения).
Время установки (Settling time) - это время, необходимое для того, чтобы переменная процесса достигла определенного процента конечного значения (обычно 5%).
Ошибка в установившемся состоянии (Steady-State Error) - это конечная разница между переменной процесса и заданным значением.
Сопротивление возмущающим воздействиям системы (disturbance rejection of the control system) - количественная мера того, насколько хорошо система управления способна преодолевать последствия возмущений.
Нелинейная система (nonlinear system) - это система, в которой параметры управления зависят от параметров системы (например, камера, частично заполненная жидкостью, будет показывать гораздо более быструю реакцию на мощность нагревателя, когда он почти пуст, чем когда он почти заполнен жидкостью).
Надежность системы управления (robustness of the control system) - мера того, насколько хорошо система управления выдержит возмущения и нелинейности.
Мертвое время (временем простоя, deadtime) - это задержка между моментом изменения переменной процесса и моментом, когда это изменение детектируются.

Пример. Если датчик температуры расположен на большом расстоянии от входного клапана холодной воды, он не будет выдавать изменение температуры сразу же после изменения положения клапана - вначале до него должны “дотечь” изменения. Кроме того, мертвое время также может быть вызвано приводом, который медленно реагирует на команду управления (клапан, который медленно открывается или закрывается).

Время цикла (loop cycle time) - интервал времени, между установкой новой дискретной константы и вызовом алгоритма управления (системы, которые быстро меняются или имеют сложное поведение, требуют более высокой скорости цикла управления).

Примечание. Точное определение приведенных выше терминов может варьироваться в различных промышленных и научных кругах.

Примечание. Одно устройство ПЛК может работать как регулятор в нескольких управляющих циклах (single-loop/multi-loop controller). Сегодня многие контроллеры предлагают адаптивное управление и алгоритмы нечеткой логики для улучшения управления процессом. Среди прочих требуемых и распространенных характеристик: возможность взаимодействия с системой принятия решений (АСУТП), взаимодействие в одноранговых сетях (peer-to-peer network) (таких, как Fieldbus или DeviceNet), поддержка ручного управления в случае сбоя автоматики. При этом программное обеспечение также является важным фактором и используется для настройки, мониторинга, автонастройки и сигнализации. В то время как большинство современных сложных контроллеров и регуляторов являются электронными, существуют и пневматические варианты.

Еще раз отмечу, что многие современные контроллеры, которые широко применяются для последовательного управления в конвейерных линиях, робототехнике, управлении процессом и многих других автоматизированных системах являются программируемыми логическими контроллерами (ПЛК, Programmable Logic Controller, PLC). По сути, ПЛК - это специализированная промышленная микропроцессорная вычислительная система реального времени внутри которой установлен контроллер (мозг).

Примечание. Стандартный программируемый логический контроллер состоит из:

процессорного блока (CPU), который интерпретирует входы, выполняет сохраненную программу управления и посылает выходные сигналы,

блока питания, который преобразует переменное напряжение в постоянное (обычно 12 или 24 В),

устройства памяти, хранящее данные (8 бит, 64 бита и т.д.),

входных и выходных интерфейсов для приема/отправки данных от/к внешним устройствам (цифровые или аналоговые),

интерфейса связи для приема и передачи данных от/к ПЛК.

Обычно, для настройки и прошивки ПЛК требуются специальные устройства для записи программного кода - программаторы, которое используется для разработки и последующей загрузки программы в память контроллера (иногда эту функцию выполняет компьютер).

Примечание. Некоторые современные ПЛК даже содержат операционную систему реального времени, например, OS-9 или VxWorks.

Задача. Вспомните/подумайте, является ли Arduino ПЛК?

2.5 Уровень 2. Контроль принятия решений

Остается последним из уровней, частично входящий в нашу область ответственности. Уровень 2 - контроль принятия решений (Supervisory Control, рис. 2.8). Данная ступень контроля на уровень выше “автоматических контроллеров” 1 уровня, которые контролируют лишь небольшую подсистему (и часто в замкнутом цикле).

Рис. 2.8. Общая система управления производством с точки зрения контроля принятия решений (уровень 2).

Контроль принятия решений обычно выполняет следующие функции:

Устанавливает “точки контроля” для важных переменных в технологических процессах (зависит от природы продукта, объема и типа производства) - это сильно влияет на управление процессом, энергией, качеством и эффективностью. Точка контроля - это определенное место в техническом процессе (среде), где производится контроль и управляющее воздействие. Можно сказать что туда ставится ПЛК.
Обеспечивает мониторинг/диагностику производительности многих технологических процессов: проверяет сенсоры и актуаторы, параметры процессов в выбранных точках контроля, следит на наличие ошибок (результаты сохраняются) и т.д..
Производит запуск/остановку/экстренные операции - специальные дискретные и непрерывные модели управления, созданные для ответа на команды оператора и диагностические события (такие, как обнаруженные ошибки или критические отклонения процессов).
Контроль переконфигурации/настройка систем автоматизации 1ого уровня - структурная или параметрическая перестройка контуров управления. Выполняется либо в ответ на команды оператора, либо в ответ на диагностические события. Реконфигурация управления может потребоваться также для адаптации контуров управления к изменению обратной связи от сенсоров или потребляемой энергии (например, при сжигании газа в масле, расхода компонента и т.д.).
Графический интерфейс - интерфейс оператора для ручного управления и корректирования.

Можно заметить, что данные системы зависимы от типа управляемого процесса (в противовес уровню 1, который обычно унифицирован). Как правило, в системах 2ого уровня присутствует смесь аппаратных и программных алгоритмов и такие системы стоят очень дорого.

Задание. Рассмотрите автоматическую систему контроля драйвера двигателя для ЧПУ (CNC Machine drivers) на рис. 2.9. Найдите, где данная система установила свои точки расчета (set points). Рассмотрите прочие функциональные особенности, согласно взаимодействию с уровнем 2.

Рис. 2.9. Автоматическая система контроля драйвера двигателя ЧПУ (https://www.datancnc.com/index_projectxq_id_166_jpid_91.html).

2.6 Прочие уровни управления

Кратко рассмотрим функции 3его уровня (контроль производства).

Планирование процесса: обработка доступности ресурсов для их оптимального использования и переработки (в зависимости от последовательности операций, которые необходимо выполнить с имеющимися партиями продукции).
Управление техническим обслуживанием: процессы принятия решений, связанные с обнаружением и развертыванием операций технического обслуживания.
Управление запасами: процессы принятия решений, связанные с мониторингом состояния запасов сырья, готовой продукции и т.д. и развертыванием операций, связанных с их управлением.
Управление качеством: оценка, документирование и управление качеством.

Как правило, на заводе за это отвечают отдел главного технолога и управление контроля качеством (лаборатории).

2.7 Заключение

В настоящей главе мы рассмотрели общие особенности системы управления производством на разных ее уровнях. Кратко описали каждый из уровней и составили основные диаграммы.

Не забываем, что время и информативность решений увеличиваются по мере увеличения уровня. На самом низком уровне система контроля работает очень быстро (один датчик) - собственно там и контроля-то нет, просто получение информации. На более высоких уровнях система работает гораздо медленнее (множество датчиков и процессов). Так на уровне АСУТП (2ой) время отклика всей системы на управляющее воздействие вполне может превышать 45-60 мин. (за это время может быть произведено сотни тонн готового продукта). На уровне менеджмента (4ый) происходит агрегирование информации по всему заводу за промежуток времени от суток и больше (суточные, недельные, квартальный, полугодовые и годовые отчеты о производственной деятельности).

При этом каждый из уровней соединен по тому или иному протоколу связи (как внутри себя, так и друг с другом) и все это образует единую информационную систему предприятия. Это относиться не только к высокому уровню, но и к сетям низкого уровня для связи компьютеров и ПЛК с датчиками и актуаторами (вспоминаем промышленные протоколы связи).

Конкретный пример технического задания на разработку системы АСУТП на примере прокатного цеха представлен в приложении ниже (2.8). В примере раскрываются основные функции в современных системах автоматизации и элементы, которые используются для их реализации.

2.8 Приложение А. Пример Технического задания для разработки автоматизированной системы управления технологическим процессом (2ой уровень управления) (TODO: может у кого есть более свежий пример?)

Данное приложение содержит спецификацию производственного участка холодного проката (PL-TCM), который обычно включает в себя линии:

подачи,
сортировки,
травления,
сдвоенного (тандемного) холодного проката.

Рассмотренная ниже спецификация обычно составляется при закупке и установке систем автоматизации для промышленных предприятий. Некоторые из описанных далее терминов и понятий будут рассмотрены в последующих главах более подробно.

Примечание. Линия травления и тандемный стан холодной прокатки (Pickling Line and Tandem Cold Mill, PL-TCM) как правило состоит из трех основных секций, а именно: секции травления для очистки поверхности полосы от оксидного слоя; секции боковой обрезки для обрезки краев полосы; и секции TCM для прокатки для достижения заданной толщины.

Рис. 2.10. Линия травления и тандемный стан холодной прокатки (https://www.ikeuchi.eu/solutions/industries/steel-making-industry/plate-mill-rolling-mill-production/).

Платформы (Platforms): Все указанные уровни управления должны быть реализованы с помощью программируемых логических контроллеров (ПЛК), микропроцессорных систем, а также ПК / рабочих станций по мере необходимости.

Каждая из систем автоматизации PL-TCM должна быть выделена в отдельный цикл управления в соответствии с функциональными требованиями и должна включать управляющие воздействия в разомкнутом и замкнутом контурах.

Режимы работы (Modes of operation): В основном, системы должны иметь два режима работы. В полуавтоматическом режиме параметры должны вводиться вручную опретором для различных участков PL-TCM через дисплей (VDU), и программа должна передавать эти значения циклам управления в соответствующей временной последовательности. В полностью автоматическом режиме система должна вычислять все установочные значения через математические модели и передавать их подчиненным системам управления по выбранному каналу передачи данных (тут можно указать конкретный канал передачи данных или оставить это на усмотрение исполнителя).

2.8.1 Базовый уровень

Функции, которые должны выполняться системой автоматизации базового уровня, должны охватывать, но не ограничиваться следующим.

Функциональность на базовом уровне:

Базовый уровень должен охватывать управление всем оборудованием, установление очередности, блокировку, слежение, специализированные технологические функции, хранение графиков прокатки и контрольных таблиц, протоколирование неисправностей и событий и т.д. Некоторые из них перечислены ниже.

Блокировки (interlocking), определение очередности (sequencing control) и последовательное управление оборудованием (например, для управления лентами (strips), управления резкой (shear) и т.п.). В том числе для автоматической обработки металлических катушек (coil) на входе и выходе, автоматическую последовательную работу сварочного/переварного (welding/rewelding) аппарата и управление последовательностью заправки лент (strip), а также для кислотной регенерационной системы (кислотного травления для очистки от оксидов, acid regeneration plant).
Расчет диаметра и ширины катушки на входных распределительных барабанах (reels).
Позиционное управление ушками катушек (coils ears) для центрального размещения катушек на стержнях (mandrels).
Генерация эталонных значений скорости для линии в зависимости от условий ее работы и ввода оператора, а также в зависимости от нагрузки на систему управления приводом.
Управление скоростью синхронизации приводов по мере необходимости.
Управление натяжением ленты (положением и прогибом) за счет управления соответствующими приводами и механизмами.
Центрирование валков с механическим приводом (power operated rolls), рулевых валков (steering/dancer rolls); управление положением лафетных вагонов (looper car). Автоматическое управление предварительной настройкой, измерение и контроль для датчика уровня натяжения (tension leveller). При необходимости автоматический контроль положения краев на натяжных барабанах (tension reels).
Контроль начального сдвига (entry shear) для автоматической резки полосы.
Контроль параметров травления (pickling parameters) с учетом скорости полосы в травильном участке.
Автоматическая настройка боковых триммеров (side trimmer).
Захваты, упорядочение и управление устройством для зачистки ленты (scrap baller), если таковое предусмотрено.
Автоматическая калибровка для контроля положения/точного позиционирования (по мере необходимости).
Ручное/автоматическое замедление/остановка ленты в точке сварки (weld point), боковом обрезчике, фрезерном и выходном срезах (mill and exit shear) на нивелире натяжения (т.е. на заданном уровне натяжения).
Управление технологическими функциями тандемного станка, такими как:
датчики натяжения;
контроль формы;
контроль прокатных усилий (roll force).
Хранение графиков прокатки сдвоенного (тандемного) станка, для всей номенклатуры продукции и всех возможных вариаций. Должны быть составлены подходящие справочные таблицы для операторов по настройке линии/оборудования в качестве руководства.
Автоматическая смена валков наряду с автоматическим позиционированием шпинделей (spindle).
Управление линией прокатки с учетом данных об износе валков, а также после смены валков.
Автоматическое управление вращающимися резцами перед натяжным валком.
Автоматическое управление очередностью работы контрольных валков.
Обеспечение ручного замедления/остановки ленты, а также контроля “пробега” для проверки дефектов на нивелире натяжения, входа в боковой триммер и выхода после прокатного стана с помощью специальной кнопки (push button station).
Слежение за лентой и изменение установленных значений для обеспечения непрерывной работы с лентами различного размера.
Настройка прокатного стана либо по сохраненному графику прокатки (ручной режим), либо по показаниям технологического процесса (с возможностью выгрузки и модификации оператором) (автоматический и полу-автоматический режим).
Автоматическое управление поточным взвешиванием, маркировкой и круговой обвязкой катушек после их доставки, включая натяжные барабаны.

Функции для операторов на базовом уровне:

Централизованная система диспетчерского управления должна быть обеспечена специализированными процессорами и MMI (man-machine interface, UI) на базовом уровне. Все необходимые сигналы должны приниматься через систему управления вводом, а также непосредственно от датчиков/устройств. Система должна быть способна выполнять следующие основные действия:

Централизованное включение и запуск различных линейных приводов (line drives) и вспомогательных систем (auxiliary system) с помощью мнемосхем (mimic display).
Отображение состояния приводов и электрооборудования завода для технического обслуживания.
Контроль и отображение значений для главных приводов прокатного стана и других приводов большой мощности для аварийных сигналов и аварийного отключения (например температуры обмоток).
Централизованное переключение и индикация состояния распределительных щитов (switchboards) 33 кВ и 6,6 кВ.
Индикация отдельных линейных схем распределительных щитов 33 кВ и 6,6 кВ, главных приводов, линейных вспомогательных приводов и т.д.
Сбор сигналов о неисправностях с различных участков предприятия с возможностью отображения и распечатки сообщений о неисправностях в текстовом виде.

2.8.2 Комплексные функции

Функциональность на уровне управления процессом.

Уровень управления процессом отвечает за вычисление и управление оптимизацией работы. На этом уровне должны быть реализованы такие функции, как:

генерация задаваемых значений с использованием математических моделей,
обучаемое управление,
отслеживание материалов внутри технологической линии/участка цеха,
ввод первичных данных для моделей (включая первичные данные для последующей оптимизации),
управление функциями процесса в реальном времени с учетом данных от базового уровня,
генерация отчетов и т.д.

Cпецифические функции, которые должны выполняться автоматизированной системой.

Слежение за катушкой внутри технологической линии/агрегата путем считывания пробитых отверстий (punched holes) по сварным швам (weld seams).
Ввод первичных данных (primary data input, PDI) катушек на входе в PL-TCM с обеспечением последующей выгрузки данных управления производством.
Генерация рабочих значений для прокатного стана с использованием данных PDI, модели стана, модели усилия прокатки, модели мощности, модели контроля толщины полосы, модели контроля формы/профиля с тепловым контролем плоскостности полосы, а также других участков.
Обучающий (адаптивный) контроль с использованием фактических данных и математической модели для расчетов настроек.
Хранение значений положения нивелиров, боковых триммеров.
Ввод данных о дефектах полосы вручную через инспекционную панель на объекте поточного контроля после бокового триммера.
Обработка фактических данных о работе прокатки, создание отчетов и отправка данных на уровень управления производством.

Функции информационной системы.

Информационная система, как правило, должна соответствовать следующим функциям:

Производственные данные должны быть доступны соответствующему персоналу в виде журналов и отчетов.
Вывод журналов и отчетов в заданное время или при наступлении определенных событий.
Должна быть обеспечена возможность изменения элементов и форматов журналов без дополнительного вмешательства в работу системы.
Записанная в журнале информация должна храниться в течение адекватного периода времени, обеспечивающего доступность исторических данных.
Информация в системе должна проверяться на целостность, достоверность и правдоподобие с последующим оповещением оператора.

Пользовательский интерфейс (MMI, UI).

Визуализация в системе должна осуществляться через интерфейс MMI для обеспечения управления и эксплуатации всей линии PL-TCM. Система должна отображать следующие экраны, с возможностью печати на бумажном носителе:

Имитация процесса для всей линии PL-TCM с помощью различных схем с выводом информации о состоянии всех важных приводов, а также с фактическими значениями всех важных параметров.
Динамическая информация в виде гистограммы для отображения эталонных и фактических значений важных параметров.
Графики, на которых отображаются тренды важных параметров процессов.
Сбор фактических параметров (среднее/максимальное/минимальное) для всей линии PL-TCM для генерации журналов по отдельным процессам и по производству в целом.

Стандарты.

Предлагаемые контроллеры и другое оборудование на базе микропроцессоров должны быть спроектированы/структурированы, изготовлены и испытаны в соответствии с рекомендациями, изложенными в МЭК-1131 (часть 2) (IEC-1131, part 2), с учетом (и за исключением) параметров отраслевых стандартов, принятых соответствующими производителями.

Аппаратное обеспечение.

Аппаратное обеспечение каждого основного контроллера/оборудования должно включать в себя основной блок обработки данных, модули памяти, стабилизированный блок питания, необходимые модули интерфейса связи, вспомогательное запоминающее устройство (при необходимости), модули ввода/вывода (I/O), удаленные станции ввода/вывода и инструмент программирования и отладки (programming and debugging tool, PADT). Аппаратная и программная структура должна быть модульной, чтобы отвечать широкому спектру технологических требований. Модули ввода/вывода должны свободно конфигурироваться в зависимости от требований.

Сеть.

Сетевое обеспечение должно соответствовать следующим спецификациям:

На каждом из двух уровней автоматизации все контроллеры и системы должны быть подключены в качестве отдельного узла к соответствующей шине данных локальной сети с использованием стандартизированных аппаратных и программных средств.
Система LAN должна соответствовать стандарту ISO-Open System Interconnect.
Все оборудование на уровне приводов должно быть надлежащим образом связано с базовым уровнем для эффективного обмена данными/сигналами между этими двумя уровнями. Однако все аварийные сигналы и сигналы безопасности должны быть подключены непосредственно к соответствующим контроллерам.
Аналогичным образом системы LAN для базового уровня и уровня управления процессом должна быть надлежащим образом связана соответствующим мостом/интерфейсом для эффективного обмена данными/сигналами. Должна быть также предусмотрена соответствующая связь между уровнем управления процессом и системой автоматизации производства.
Шины передачи данных должны быть сконструированы таким образом, чтобы обеспечивать оптимальную загрузку, и это должно быть четко указано в коммерческом предложении.
Дистанционные вводы/выводы измерительных приборов и машин на микропроцессорной основе (весы, машины для маркировки и кольцевого обвязывания катушек и т.д.) должны быть соединены по последовательным каналам связи (serial) с соответствующими контроллерами.
Персональные компьютеры и рабочие станции должны быть подключены по локальной сети соответствующего уровня.

Данные и визуализация.

В отношении безопасности, достоверности и правильной визуализации данных применяются следующие спецификации:

Все интерфейсы оператора (включающие цветной дисплей (VDU) и клавиатуру в качестве MMI для взаимодействия с соответствующей системой), должны быть подключены к соответствующей системе локальной сети.
Для предотвращения несанкционированного проникновения в систему должны быть предусмотрены блокировка клавиатуры/пароль.
Должна быть также предусмотрена проверка действительности и плановости входа оператора.
Для систем автоматизации должен быть предусмотрен инженерный пульт, состоящий из процессора, цветного VDU, клавиатуры/мыши и принтера. Консоль должна иметь необходимое аппаратное и программное обеспечение для связи с локальной сетью и иметь доступ ко всей системе. Основными функциями пульта должны быть автономная конфигурация базы данных, разработка программ, документаций и т.д.

Прикладное программное обеспечение.

Прикладное программное обеспечение должно быть представлено через программные модули из функциональных блоков, а также программные модули высокого уровня на базе программного обеспечения с соответствующим языком программирования.

Программное обеспечение должно быть удобным для пользователя, снабжено вспомогательными функциями и т.д. Для всей системы должен использоваться только один язык программирования. Однако для простых логических функций может использоваться другой язык программирования последовательного типа. Должно предоставляться только отлаженное и протестированное в промышленных условиях (или разработанное по производственным стандартам) программное обеспечение.

2.8.3 Обоснование для выбора системы

Будущее расширение. Выбор оборудования, стандартного программного обеспечения и сети должен быть таким, чтобы обеспечить оптимальную гибкость для будущего расширения, не влияя на надежность системы.

Надежность. Система должна быть спроектирована так, чтобы работать в автоматическом или полуавтоматическом режиме в условиях отказа (некоторых подсистем или всей системы в целом).

Запасная емкость. Система должна иметь достаточную вычислительную емкость для выполнения всех необходимых функций. При этом минимум 30% общей памяти должно оставаться не распределенным для использования в будущем.

Загрузка. Магистраль данных должна быть спроектирована таким образом, чтобы обеспечить оптимальную загрузку, и это должно быть четко указано в коммерческом предложении.

Структура программного обеспечения и качество программ. Программы должны быть выполнены на языке высокого уровня, который является эффективным и экономичным для предлагаемой системы с точки зрения модуляризации, скорости кодирования, использования памяти и времени работы. Структура программного обеспечения системы должна быть оптимально распределена/централизована для контроля и управления смежными технологическими областями в соответствии с современным уровнем архитектуры.

Интеграция. Коммуникационное программное обеспечение должно быть таким, чтобы системы могли независимо общаться между собой и с системой автоматизации базового управления/процессного контроля нижнего уровня (при необходимости). Должна быть предусмотрена возможность взаимодействия системы управления производством PL-TCM с системой управления более высокого уровня (АСУТП), которая в будущем будет развернута для всего металлургического завода.

Программируемость. Информационная система должна быть спроектирована таким образом, чтобы можно было изменять элементы данных и форматы журналов без излишнего вмешательства в работу системы.

Целостность и защита данных. Записанная в журнал информация должна храниться в течение соответствующего периода времени, обеспечивающего доступность записи исторических данных. Данные, получаемые системой, должны проверяться на целостность с точки зрения их достоверности и правдоподобия с помощью системы оповещения. Должно обеспечиваться хранение и запись важнейших данных при отключении системы электроснабжения или во время сбоя.

2.9 Задачи по разделу

Нарисуйте функциональную блок-схему типичного сенсора.
Нарисуйте функциональную блок-схему актуатора.
Рассмотрим электрогидравлический сервопривод клапана (рис. 2.6). Изучите и определите подсистемы актуатора и разделите эти подсистемы на классы элементов.
Нарисуйте блок-схему типичной промышленной системы управления 1 уровня.
Рассмотрим систему управления положением с приводом от двигателя, как это обычно бывает в приводах станков с ЧПУ (рис. 2.9). Определите основные датчики обратной связи в системе. Определить основные источники помех. Чем такой привод отличается от автоматической конвейерной системы?
Укажите основное различие системы последовательного логического управления от аналоговых систем управления.
Приведите пример и опишите промышленную систему, использующую дискретные датчики и дискретные исполнительные механизмы.
Назовите три основные функции системы диспетчерского контроля.
Изложить три основные функции системы управления производством.
Изучить и выяснить конкретные виды деятельности для контроля производства на любом типичном заводе. Нарисуйте пирамиду автоматизации и определите уровни.
Укажите три основные характеристики системы автоматизации, упомянутые в приложении А (раздел 2.8).

3. Основные характеристики измерительных систем

3.1 Введение и цели

Раздел посвящен основным параметрам (измерительным и статистическим), которые, как правило, приводятся в спецификациях на тот или иной сенсор. Не забываем, что ваш основной документ - это характеристика (specification, datasheet), которая предоставляется производителем сенсора/актуатора (да и любого другого устройства в электронике). Часто, эти спецификации используют различный стиль и терминологию, что может сбивать с толку. Однако всякий датчик характеризуется соотношениями между измеряемой величиной (вход) и его выходной величиной (которую он порождает на выходе в ответ на измеряемую величину). И существует всего два основных типа таких характеристик:

статические (включая случайную природу);
динамические.

Как мы уже говорили ранее, сенсор - это некая система (черный ящик). И, как и любая другая система, она может находиться в одном из двух режимов: стационарном (установившемся) и переходном (не путать со статическим и динамическим - это разные вещи).

Задача. Подумайте почему стационарный и переходный режимы и статические и динамические характеристики не одно и тоже. Приведите примеры.

Стационарный (установившийся) режим – обусловлен постоянным во времени расхождение между истинным значением регулируемой величины и ее заданным значением (отношение вход/выход - постоянная величина). Стационарный режим работы системы в свою очередь может быть двух видов: статический и динамический.
- Статический стационарный режим – это режим, при котором система находится в состоянии покоя вследствие того, что все внешние воздействия и параметры системы не меняются во времени. Другими словами, скорость изменения выходного параметра системы равна нулю (например, так работает любой электронный усилитель). Т.е. существующая ошибка управления стремится к постоянному значению, зависящему от величины воздействия (но не зависящему от времени). Обычно такой режим представляют в линейном виде (прямая с коэффициентом наклона $k$). Если модель объекта нелинейна, то обычно ее преобразуют к линейному виду путем линеаризации (например логарифмирование и т.п.).
- Динамический стационарный режим – это режим, при котором приложенные к системе внешние воздействия изменяются по какому-либо установившемуся закону. В результате чего система переходит в режим установившегося вынужденного движения, т. е. скорость или ускорение выходного параметра системы постоянно во времени. Такой режим используется для снятия частотных характеристик и бывает двух типов:
  - детерминированный динамический стационарный режим – при котором на систему действуют детерминированные (регулярные) динамические стационарные воздействия (например, гармонические колебания).
  - случайный динамический стационарный режим – при котором на систему действуют случайные динамические стационарные функции (TODO: привести пример).
Переходный режим – режим изменения во времени различных переменных системы (фазовые или выходные параметры, скорость или ускорение), в ходе которого система стремится к стационарному режиму (изменяет свое состояние и стремится перейти в новый или вернуться в старый стационарный режим).

Примечание. Изменение во времени или ускорение можно оценить через производную.

Далее мы кратко рассмотрим характеристики каждого из режимов работы системы и параметры, которыми она обладает

3.2 Статические характеристики стационарного режима работы системы

Для такой системы любое ее звено (а как следствие и вся система) описывается уравнениями вида $y = F(x,f)$, в которых отсутствует параметр времени $t$. Соответствующие им графики называются статическими характеристиками системы.

Статическую характеристику часто изображают графически с учетом количества входов (рис. 3.1). По сути это калибровочная кривая (градуировка) - зависимость отклика датчика от входящего параметра. Важно! - вид данной характеристики не зависит от времени.

Рис. 3.1. Схема включения (а) и статические характеристики (б) однотактного индуктивного датчика с плоскопараллельным воздушным зазором: 1 - идеальная (холостой ход) и 2 - реальная (нагрузочная).

В качестве другого примера рассмотрим обычный механический рычаг. Его можно рассматривать как “сенсор”, функцией которого является усиление (или ослабление) входящего сигнала (давим с одной стороны, чтобы применить силу с другой стороны рычага). Тогда статическая характеристика для него имеет вид $y = kx$. При это входной сигнал будет меняться в $k$ раз. Коэффициент $k = y/x$ (отношение выходной и входной величины, в нашем случае - плечи рычага) называется коэффициентом усиления звена (звено в нашем случае - это сам рычаг). Когда входная и выходная величины имеют разную природу (т.е. коэффициент имеет размерность), его называют коэффициентом передачи.

Для статических характеристик есть ряд параметров, которые нужно учитывать:

Диапазон (R, range, span) - определяет минимальное и максимальное значения входных и выходных значений для которых рекомендуется использовать устройство. Как правило, берется диапазон в котором отклик устройства будет линеен (например, $100-500^o C$ для термометра).
Чувствительность (k, sensitivity) - отношение между выходным и входным сигналом (обычно чем больше, тем лучше). Определяя чувствительность, принимают линейность входных-выходных характеристик (для определенного диапазона). Например, если чувствительность термопары $\frac{10 мкВ}{^o C}$, то она указана для “линейного” рабочего диапазона.

Задача. Более наглядно понятие чувствительности проявляется для пружины: как думаете о чем нам говорит величина 25 мм/кг?

Примечание. Чувствительность - не константа, она может зависеть от внешних условий эксплуатации (например, температуры). Подобное явление называется дрейф чувствительности. Для устранения подобного дрейфа в точных приборах используют контроль внешних параметров и их учет.

Пример. Допустим, чувствительность пружины при $20^o C$ составляет 25 мм/кг, а при $30^o C$ - 27 мм/кг. Тогда дрейф чувствительности равен $0.2 \frac{мм}{кг} \cdot \frac{1}{^o C}$.
Линейность (О, linearity) - максимальное отклонение от линейной модели. На практике зависимость выходного сигнала от входа обычно не линейна и нам нужно вводить различные коэффициенты (приближения), которые и характеризуют понятие линейности прибора (рис. 3.1, рис. 3.2).

Рис. 3.2. Линейность устройства.

$$ Linearity = \frac{\Delta O}{O_max - O_min} $$

где $\Delta O = max(\Delta O_1, \Delta O_2)$.

Примечание. Кроме коэффициента линейности, для оценки линейности и вида взаимосвязи между двумя величинами используют различные статистические параметры, такие как коэффициенты корреляции (Пирсона, Спирмана и др.).

Линейный диапазон работы (linear range) - диапазон входного сигнала, при котором мы получаем линейный отклик. Особенно важная характеристика для проведения точных измерений и если у датчика малая чувствительность.
Гистерезис (Hys. %, Hysteresis) - отклонение между возрастанием и убыванием сигнала (т.е. при одинаковом входном сигнале может быть разный выходной сигнал). Данное явление существует, как правило, в магнитных полях, но не ограничивается ими. Например, на рис. 3.3 показано отклонение манометра мембранного типа для одного и того же давления (возрастающего и убывающего).

Рис. 3.3. Гистерезис на примере манометра мембранного типа для одного и того же давления (возрастающего и убывающего).

$$ Hysteresis = \frac{H}{O_{max} - O_{min}} \cdot 100 $$

где $H$ - максимальный гистерезис (максимальная разница результатов при одинаковом входящем сигнале).

Разрешение (Res. %, resolution) - сколько информации от входящего сигнала содержится в выходящем. Другими словами, разрешение определяет минимальное детектируемое изменение во входящем сигнале:

$$Resolution = \frac{\Delta I}{I_{max} - I_{min}} \cdot 100$$

Коэффициент между измеряемым диапазоном и разрешением часто выражается в виде динамического диапазона (Дб, dB) (привет наушникам) и определяется как:

$$Dynamic\_range = \frac{measurment\_range}{resolutions}$$

Пример. Восьми битный двоичный АЦП (ADC) преобразователь со входящим сигналом +5В может измерить минимальное напряжение $\frac{5}{2^8-1}$ или 19.6 мВ (напомним, что двоичный 8-разрядный АЦП способен выдать 255 дискретных значений (0…255), поскольку $2^8 = 256$ и 1 тратится на аппаратные затраты).

При этом динамический диапазон n-битного ADC приблизительно равен $6 \cdot n$ дБ.

Разбор. Для АЦП динамический диапазон соответствует количеству бит, которые используются для цифровизации аналогового сигнала. Для идеального n битного АЦП минимальное детектируемое значение - это минимальный значимый бит (least significant bit, LSB). Тогда максимальное значение будет $(2n - 1) \cdot \text{LSB value}$.

Тогда:

$DR = 20 \cdot log_{10}(\frac{(2n-1) \cdot LSB}{LSB}) \approx 6.02 \cdot n$ (dB).

Таким образом, с 10-битным двоичным АЦП мы ожидали бы динамический диапазон 6.02 дБ. Кроме того, надо учитывать, что 10 битный двоичный АЦП сможет разрешать амплитуды сигналов от $x$ до $2^{10}x = 1024x$, где $x$ - это минимально допустимый уровень, который может быть обнаружен.
Точность (accuracy, случайная природа) - близость измеренного значения к фактическому или истинному значению, выражается в виде максимальной погрешности (измеренное значение - истинное значение) в процентах от максимального показания шкалы (это читерство, но для сенсоров так и делают!). Учитывает случайную и систематическую погрешности.

Например, если точность термометра в диапазоне $0-500^oC$ задана как $\pm 0.5%$, то измеренное значение всегда будет находиться в пределах $\pm 2.5^oC$ от истинного (измеренного с помощью поверенного прибора в процессе калибровки). Но, при $250^oC$, ошибка также будет $\pm 2.5^oC = 1 %$ (!). Поэтому всегда лучше выбирать шкалу измерений, где входной сигнал близок к максимальному значению. При этом не забываем, что истинную величину всегда трудно получить, для ее измерения используют стандартные калиброванные приборы в специальных лабораториях.
Воспроизводимость (прецизионность, случайная природа) - повторяемость показаний прибора (не путать с точностью!). Если мы будем измерять одну и ту же величину в течении интервала времени (например, в течение дня), то показания расположатся в определенном интервале в случайном порядке (случайная погрешность).

Эти случайные колебания показаний (в основном с гауссовым распределением) часто обусловлены случайными колебаниями ряда факторов, которые не были приняты во внимание при измерении переменной. При использовании прецизионного прибора последовательно полученные значения будут очень близким, но не одинаковыми по своим абсолютным значениям, а стандартное отклонение будет очень малым.

Количественно, точность может быть выражена через воспроизводимость следующим образом:

$$Precision = \frac{\text{measured range}}{\sigma_e}$$

Нужно четко понимать различие между воспроизводимостью и точностью (рис. 3.5)!

Воспроизводимость гарантирует повторение последовательных показаний (т.е. случайная погрешность мала), но не гарантирует их точность - измерения могут быть близки друг к другу, но далеки от истинного значения (систематическая погрешность велика). С другой стороны, точный прибор должен быть и воспроизводимым (т.е. случайная ошибка должна быть мала).

Для статической характеристики обычно используют прямую пропорциональную зависимость между установившимися значениями входной и выходной величин (очень часто весьма приближенно). Зависимость между установившимися значениями входной и выходной величин применительно к датчикам также называют калибровочной кривой (тарировочной, градуировочной).

Рис. 3.5. Точность и воспроизводимость (случайная и систематическая погрешность).

Примечание. В ряде случаев для удобства дальнейшего анализа фактическая нелинейная статическая характеристика датчика в определенных пределах измерения и с определенным влиянием на показания этого датчика может быть приближенно заменена неким линейным эквивалентом. Операция такой замены, по существу, означает разложение нелинейной функциональной зависимости, связывающей выходную и входную величины, в степенной ряд Тейлора с последующим отбрасыванием членов разложения 2-го и более высоких порядков. В определенных условиях такая операция является допустимой, и тогда она носит название линеаризации.

3.3 Динамические характеристики стационарного режима работы системы

Под динамической характеристикой датчика понимают поведение выходной величины во время переходного процесса (в ответ на изменение его входной величины).

Если в статической характеристике датчика строится зависимость только между значениями выходной величины $Y$ и входной величины $X$, то в динамической характеристике датчика участвует также и параметр времени $t$ (динамическая характеристика описывается зависимостью вида $Y(t)$).

Пример. Такие характеристики описывают “скорость реакции на изменения”. Например, человеческий глаз не может обнаружить ни одного события, продолжительность которого составляет менее одной десятой секунды (динамические характеристики человеческого глаза не очень). К этому же виду параметров относится и “мертвое время детектора” - сколько измерений в единицу времени детектор упускает из рассмотрения за счет их большой скорости изменения.

Для сравнения динамических характеристик различных датчиков принято считать, что при прочих равных условиях на их входы поступают воздействия одного и того же вида, а именно — ступенчатые. Это означает мгновенный «наброс» входной величины. На практике это соответствует, например, подаче напряжения на электродвигатель либо помещению термопары в закалочную печь и т. д. Двигатель будет набирать обороты не мгновенно, а в соответствии с динамическими свойствами привода, в который он включен. Точно так же показания термопары начнут отражать температуру в печи не мгновенно, а по мере разогрева ее спая и т. д. Характерные примеры динамических характеристик датчиков приведены на рис. 3.5.

Рис. 3.5. Динамические характеристики датчиков при ступенчатом входе. Разбор каждого случая приведен ниже.

На рис. 3.5 (а) приведено “чистое запаздывание” в датчике, когда его выходная величина просто повторяет в определенном масштабе входную величину, запаздывая по отношению к ней на постоянную величину.

На рис. 3.5 (б) показан апериодический характер переходного процесса, когда выходная величина постепенно приближается к новому установившемуся значению монотонным образом (монотонно убывая или, как показано на рисунке, монотонно возрастая).

Рис. 3.5 (в) соответствует так называемому колебательному характеру переходного процесса, когда выходная величина постепенно приближается к новому установившемуся значению, совершая за время переходного процесса одно или несколько колебаний, превышая на время новое значение выходной величины, а затем возвращаясь к нему.

Динамические процессы в датчиках характеризуются так называемыми показателями качества переходного процесса:

время завершения переходного процесса;
величина превышения выходного параметра над его новым установившимся значением (в течение переходного процесса);
степень колебательности (число колебаний) переходного процесса.

Кроме того, часто используется так называемый интегральный показатель качества переходного процесса, обычно представляющий собой площадь под кривой переходного процесса (т.е. интеграл).

Математически, динамические характеристики устройства обычно выражаются дифференциальным уравнением, связывающим входные и выходные величины. Для этого используют понятие передаточной функции. Эта функция - компактное описание взаимосвязи входящих и выходящих величин (как правило, через дифференциальные уравнения).

Примечание. Помимо передаточной функции, математическая модель системы может быть представлена аналитически (другими уравнениями), графически (переходными или частотными характеристиками) или в табличной форме.

В зависимости от используемых операторов линейные непрерывные модели делят на временные и частотные. К временным моделям относятся те, у которых аргументом является время. Это дифференциальные и разностные уравнения, записанные в явном виде или в операторной форме. Частотные модели предусматривают использование переменных операторов, аргументом которых является частота соответствующего сигнала (операторы Лапласа, Фурье и т. д).

В завершении раздела подчерку еще раз, что как вход, так и выход в случае динамических систем являются переменными по времени. Система с одним входом и одним выходом называется SISO (Single Input Single Outlet Output - система с одним входом и одним выходом), существуют так же и MIMO системы (Multi Input Multi Output), но в рамках настоящего курса мы будем работать только к системам SISO.

3.3.1 Передаточная функция (transfer function) (TODO: разобрать примеры подробнее, конкретно - что делать со временным сдвигом?)

Передаточная функция представляет собой удобное представление линейной и неизменной во времени динамической системы. Математически, передаточная функция является дифференциальной функцией комплексных переменных (для систем с конечной размерностью). Передаточную функцию можно получить с помощью эксперимента или алгебраических манипуляций с дифференциальными уравнениями, описывающими систему.

Дифференциальные уравнения.

Самым простым представлением системы является обычное дифференциальное уравнение (ODE, любое движение, а значит и динамический процесс в системах автоматического управления можно математически описать в виде дифференциального уравнения).

Дифференциальное уравнение представляет собой аналитическую зависимость, связывающую изменение выходной величины $у$ от входной $х$, с учетом скорости и ускорения данных величин (т.е. с учетом их изменения во времени). Порядок или степень дифференциального уравнения – наибольший порядок производных, входящих в него. Вид дифференциального уравнения зависит от свойств системы. В простейших случаях это линейные дифференциальные уравнения с постоянными коэффициентами.

Примечание. При работе с обычными дифференциальными уравнениями зависимые переменные являются функцией положительной вещественной переменной $t$ (часто это время). Применяя трансформацию Лапласа, мы переключаемся с функции времени на функцию сложной переменной $s$ (частота) и дифференциальное уравнение становится алгебраическим уравнением.

Всегда удобно выражать динамические характеристики на входе-выходе в виде линейного дифференциального уравнения. Поэтому часто нелинейная математическая модель линеаризируется и только потом вычисляется передаточная функция и порядок системы.

Графически, линеаризацию некоторого уравнения от двух переменных $F(х,у) = 0$ в окрестности некоторой точки $(х_0, у_0)$ можно представить как замену рассматриваемого участка кривой на касательную (рис. 3.6), уравнение которой определяется по формуле

$$ \frac{\delta F}{\delta x} dx + \frac{\delta F}{\delta y} dy = 0 $$

Рис. 3.6. Линеаризация в графической форме (https://kr.mathworks.com/help/slcontrol/ug/linearizing-nonlinear-models.html).

Это один их способов линеаризации нелинейного уравнения. Другой способ заключается в разложении в ряд Тейлора. Пусть в установившемся режиме части системы (или ее звена) описываются нелинейным алгебраическим уравнением $y = f(x)$, а входная и выходная величины имеют значения $х_0$ и $y_0$. Тогда нелинейную функцию можно разложить в ряд Тейлора в окрестностях выбранной точки $(х_0, y_0)$ и, отбросив члены ряда выше первого порядка, получить выражение

$$ \begin{equation}\begin{aligned} y & \approx f(x_0) + (\frac{df}{dx})_0 (x - x_0)\\ y - f(x_0) & = k \Delta x\\ \Delta y & = k \Delta x \end{aligned}\end{equation} $$

где $(\frac{df}{dx})_0$ - производная функции по $x$ в установившемся режиме (т.е. это касательная в точке $x_0$) при этом данная касательная выражается тангенсом угла наклона (мы ее заменяем на коэффициент $k = tg \alpha$).

Преобразование Лапласа

Такое преобразование “переключает” функции времени на функцию частоты (сложной переменной). Например, функционирование некоторой системы описывается уравнением вида

$$ a_0 \frac{d^2 y}{dt^2} + a_1 \frac{dy}{dt} + a_2 y = b_0 \frac{dx}{dt} + b_1 x $$

где $х$ и $у$ – входная и выходная величины.

Если в данное уравнение вместо $x(t)$ и $y(t)$ подставить функции $X(p)$ и $Y(p)$ комплексной переменной величины $p$, такие, что:

$$ \begin{equation}\begin{aligned} X(p) & = \int_0^\inf x(t) e^{-pt} dt Y(p) & = \int_0^\inf y(t) e^{-pt} dt \end{aligned}\end{equation} $$

Таким образом, исходное уравнение при нулевых начальных условиях равносильно линейному алгебраическому уравнению

$$ a_0 p^2 Y(p) + a_1 p Y(p) + a_2 Y(p) = b_0 p X(p) + b_1 p X(p) $$

где $p = \frac{d}{dt}$

Переход от одной модели (временной) к другой (частотной) достаточно прост и заключается в замене дифференциалов $\frac{d^n}{dt^n}$ на операторы $p^n$, интегралов $\int \dots dt$ на множители $\frac{1}{p}$, а самих переменных от времени $x(t)$ и $y(t)$ – на их частотные проекции $X(p)$ и $Y(p)$.

Такой переход от дифференциальных к алгебраическим уравнениям называется прямым преобразованием Лапласа, формулы преобразований - формулами прямого преобразования Лапласа, а полученное уравнение - операторным уравнением или уравнением в операторной форме.

Само преобразование Лапласа обозначается как

$$ L[x(t)] = X(p) $$

При этом $x(t)$ называют оригиналом, а $X(p)$ - изображением. Для обратного перехода от операторного уравнения к функциям от времени используется метод обратного преобразования Лапласа. Общая формула обратного преобразования Лапласа:

$$ x(t) = L^{-1} [X(p)] = \frac{1}{2 \pi} \int_{- \inf}^{+\inf} X(p) e^{pt} dt $$

Эта формула достаточно сложна и поэтому были разработаны специальные таблицы, в которые сведены наиболее часто встречающиеся изображения функций $X(p)$ и их оригиналы $x(t)$. Таким образом, описание линейных непрерывных систем может быть представлено через преобразование Лапласа в операторной форме, что позволяет нам уйти от временной неопределенности системы (+ есть “таблицы красных мячиков”, так любимые инженерами из анекдотов).

Передаточная функция

Следующая возможность описания временных уравнений являются передаточные функции. Это своего рода математические модели систем регулирования, поскольку они полностью характеризуют динамические свойства систем.

Передаточной функцией называется отношение изображения выходного сигнала $Y(p)$ к изображению входного воздействия $X(p)$ при нулевых начальных условиях:

$$ W(p) = \frac{Y(p)}{X(p)} $$

Разберем эту функцию подробнее. Допустим дифференциальная форма некой системы выглядит следующим образом

$$ a_0 \frac{d^n y}{dt^n} + a_{1} \frac{d^{n-1} y}{dt^{n-1}} + ... + a_n y = \\ = b_0 \frac{d^m u}{dt^m} + b_{1} \frac{d^{m-1} u}{dt^{m-1}} + ... + b_1 \frac{du}{dt} +b_m u \tag{3.1}\label{eq3.1}$$

где $u$ и $y$ сигналы на входе и выходе системы соответственно.

Учтем, что

Каждое дифференциальное уравнение можно представить в полиномиальной форме как мы разбирали ранее

$$ \begin{cases} a(s) &= a_0 s^n + a_1 s^{n-1} + a_2 s^{n-2} + ... + a_{n-1}s + a_n\\ b(s) &= b_0 s^m + b_1 s^{m-1} + b_2 s^{m-2} + ... + b_{m-1}s + b_m \end{cases} $$

где $b(s)$ и $a(s)$ - полиномы, характерные для нашей системы (вход и выход соответственно).

Вход задается уравнением $u(t) = e^{st}$. Тогда и выход системы также будет функцией подобного вида (по условию система линейна): $y(t) = y_0 e^{st}$.

Подставив все в уравнение $\eqref{eq3.1}$ получим

$$(a_0 s^n + a_1 s^{n-1} + ... + a_n) y_0 e^{st} = (b_0 s^m + b_1 s^{m-1} + ... + b_m) e^{st}$$

Если $a(s) \neq 0$, то:

$$ \begin{equation}\begin{aligned} y(t) = y_0 e^{st} = \frac{b(s)}{a(s)} e^{st} = G(s) u(t) \end{aligned}\end{equation} \tag{3.2}\label{eq3.2} $$

Где $G(s)$ - передаточная функция системы (transfer function of the system), характеризующая отношения входного сигнала к выходному. $m < n$ и $n$ называется порядком системы (обычно 0, 1 или 2), а $s$ - оператор передаточной функции (уравнение для сигнала).

Пример 3.1. Передаточная функция $G(s) = 1 / s$ соответствует дифференциальному уравнению $\frac{dy}{dt} = u$ и устройству - интегратору. В свою очередь $G(s) = s$ соответствует $y = \frac{du}{dt}$ - дифференциатору.

Пример 3.2. Передаточные функции временной задержки. Задержка по времени соответствует многим системам, для которых соотношение вход/выход равно:

$$y(t) = u(t - T)$$

Предположим вход $u(t) = e^{st}$, а выход: $y(t) = y_0 e^{st}$, тогда:

$$y(t) = y_0 e^{st} = e^{s(t-T)} = e^{-sT} e^{st} = e^{-sT} u(t)$$

Передаточная функция при временной задержке: $G(s) = e^{-sT}$ - не рациональная функция.

Примечание. В выводе формул используется экспонента, поскольку такие сигналы играют значимую роль в линейных системах (например, импульсный ответ линейной системы). Большая часть сигналов может быть представлена в экспоненциальной форме или как линейная комбинация таких форм. Неизменный сигнал, будет выражаться как: $e^{at}$ при $a=0$. Затухающий синусоидальный и косинусоидальный сигнал: $e^{(\sigma + i \omega)t} = e^{\sigma t} e^{i \omega t} = e^{\sigma t} (sin(\omega t) + i cos(\omega t))$.

Далее описаны некоторые примеры систем с их передаточными функциями.

3.3.2 Примеры систем и их передаточных функций

1. Потенциометр

Этот сенсор (рис. 3.5) не имеет элементов накопления энергии, а выходное напряжение может быть связано с входным сигналом (длина потенциометра) через уравнение:

$$ e_0(t) x_t = Ex_i(t) $$

или

$$ \begin{equation}\begin{aligned} \frac{e_0(t)}{x_i(t)} = \frac{E}{x_t} = const = G(s) \end{aligned}\end{equation} \tag{3.3}\label{eq3.3} $$

где $x_t$ - общая длина потенциометра, $E$ - действующее напряжение. Это система нулевого порядка.

Рис. 3.5. Потенциометр.

Задача. Подумайте, что обозначает $s$ при работе с передаточными функциями и чему равно $s$ в данном примере?

2. Термопара.

Обычная термопара (рис. 3.6) имеет горячий спай (рабочий конец) определенной массы ($m$).

Рис. 3.6. Термопара.

Если термопара погружена в жидкость при температуре $T_f$, тогда ее динамические характеристики (связанные с выходным напряжением $e_0$ и температурой на входе $T_f$) могут быть выражены следующей передаточной функцией:

$$ \begin{equation}\begin{aligned} \frac{e_0(t)}{T_f(t)} = \frac{K_v}{1+s \tau} = G(s) \end{aligned}\end{equation} \tag{3.4}\label{eq3.4} $$

где

$K_v$ - установившаяся чувствительность для напряжения термопары, выраженная в $В/^oC$.
$\tau$ - константа времени для термопары $=\frac{mC}{hA}$ [с]
$m$ - масса горячего спая (рабочий конец) [кг]
$C$ - удельная теплоемкость [Дж/(кг·К)]
$h$ - коэффициент теплопередачи [Вт/(м2·К)]
$A$ - площадь поверхности горячего спая [м2].

Таким образом, обычная термопара является сенсором первого порядка ($s=1$, линейная функция). Но если термопара помещена в металлический защитный кожух (как это обычно делается в промышленности), то порядок системы увеличивается за счет дополнительного энергоаккумулирующего элемента (тепловой массы кожуха), и она становится системой второго порядка ($s=2$, квадратичная функция).

3. Датчики вибрации

Сейсмические датчики (seismic sensor, рис. 3.7) обычно используются для измерений вибраций и ускорения.

Рис. 3.7. Датчик вибрации.

Передаточная функция (связь) между входящим смещением $x_i$ и выходящим смещением $x_0$ выражается как

$$ \begin{equation}\begin{aligned} \frac{x_0(t)}{x_i(t)} = \frac{Ms^2}{Ms^2 + Bs + K} = G(s) \end{aligned}\end{equation} \tag{3.5}\label{eq3.5} $$

где

$M$ - масса вибрирующего тела [г]
$B$ - константа затухания
$K$ - постоянная пружины.

Таким образом датчик вибрации является системой второго порядка.

3.3.3 Некоторые характеристики устройств с переменным сигналом

Как известно переходные и динамические процессы возможны только при каких-либо изменяющихся входных воздействиях. Только тогда происходит изменение внутренних параметров системы во времени (это и характеризует динамические свойства системы) с использованием переходных характеристик. Такие характеристики могут записываться аналитически или изображаться графически в виде кривой $y(t)$ (рис. 3.8).

Рис. 3.8. Графический пример переходных характеристик (https://en.wikipedia.org/wiki/Step_response).

Нужно понимать, что переходные и динамические процессы системы будут зависеть от входных воздействий. Обычно, для простоты анализа, входные воздействия приводят к одному из типовых видов (рис. 3.9).

Рис. 3.9. Основные входные воздействия: a - единичное ступенчатое, b - импульсное (дельна-функция), c - линейное, d - синусоидальное (гармоническое).

Единичная ступенчатая функция (функция Хэвисайда, единичная ступенчатая функция, функция единичного скачка, включенная единица) – кусочно-постоянная функция, равная нулю для отрицательных значений аргумента и единице – для положительных.
Дельта-функция ($\delta$-функция Дирака, дельта-импульс) – применяется в математической физике при решении задач, в которые входят сосредоточенные величины: сосредоточенная нагрузка, сосредоточенный заряд и т.д. Физически $\delta$-функцию можно представить как бесконечный всплеск единичной интенсивности.
Линейная функция - соответствует линейно возрастающему входному сигналу.
Синусоидальная (гармоническая) функция - соответствует гармоническим колебаниям входного сигнала.

Более подробно о математике, лежащей за данными функциями можно прочитать на хабре. Ниже приводятся некоторые важные характеристики переходных динамических систем с кратким описанием.

1. Переходная характеристика (степень реагирования на единичное воздействие как на рис. 3.9 a, step response performance)

Реакция системы на единичное ступенчатое воздействие при нулевых начальных условиях ($х(0) = 0$ и $у(0) = 0$). Нормализованная переходная функция системы обычно описывается как показано на рис. 3.10.

Рис. 3.10. Переходная функция динамической системы при ступенчатом воздействии (3.9 a).

Для описания такой системы используют следующие параметры динамического ответа (реагирования):

перерегулирование (peak overshoot, $M_p$) - разница между максимальным значением и значением покоя, обычно выражается в процентах;
время регулирования (время переходного процесса, setting time, $t_s$) - это время, необходимое для достижения ответа в пределах $\pm 2$ % от значения в устойчивом состоянии;
время нарастания (rise time, $t_r$) - интервал времени, за которое переходная характеристика (response) увеличивается с 10 до 90%

Задача. Найдите время нарастания на графике 3.10.

2. Амплитудно-частотная характеристика (frequency response perfomance)

Отражает зависимость амплитуды ответного сигнала системы от частоты ее входного сигнала (рис. 3.11).

Рис. 3.11. Частотный ответ

Предположим $G(s)$ это передаточная функция динамической системы, выраженная общим уравнением $\eqref{eq3.2}$. Если входящий сигнал является синусом с амплитудой $А$ и частотой $\omega$, тогда в равновесном состоянии, выходом будет также синус с такой же частотой, но другой амплитудой $B$ и будет фазовая разница между входом и выходом. Может быть доказано, что отношение амплитуд и фазовая разница будут выражены следующем образом:

$$\frac{B}{A} = |G(j\omega)|$$

$$\phi = \angle G(l\omega)$$

Графики, показывающие вариации амплитудных отношений и фазового угла от частоты, называются графиками амплитудно-частотной характеристики. Типичная амплитудно-частотная характеристика пьезоэлектрического акселерометра показаны на рис.3.12.

Рис. 3.12. Характеристики амплитуды в зависимости от частоты для пьезоэлектрического акселерометра.

3. Полоса пропускания и естественная частота (brandwidth and natural frequency)

Из рис. 3.12 следует, что амплитуда является константой для широкого диапазона частот. Этот диапазон называется шириной пропускания (bandwidth) измеряемой системы (если быть точным, это частотный диапазон в котором нормализованное амплитудное отношение не опускается ниже уровня 0.707 отн. ед. или -3 дБ). Устройства могут использоваться именно в данном диапазоне. Нижний и верхний лимиты называются “нижний и верхний срез (край, cut)” частот. Частота, при которой амплитудное отношение достигает пика, называется естественной (затухающей) частотой системы (damped, natural frequency).

3.4 Погрешности

Данный раздел посвящён очень важно и очень “странной” вещи - статистике и погрешностям измерений. Явлениям этой природы и частичному обзору статистики для исследований и измерений посвящен отдельный курс моей преподавательской деятельности “Планирование эксперимента и анализ данных”. Для хорошего понимания, что такое анализ данных, статистика и обработка результатов измерений - прошу ознакомиться. Далее же приводятся только некоторые тезисы и основные понятия, минимально необходимые для настоящего курса.

В практике любых измерений можно заметить, что если проводить повторные измерения в зафиксированных условиях, то результаты будут отличаться друг от друга. Часто это вызвано какими-либо внутренними источниками погрешности, которые изменяются случайным образом в случайный момент времени и сложны для предсказания. Для примера, характеристики диодов и элементов сопротивления (резисторов) на электронной схеме являются случайными, в зависимости от источника шумов (помех): температурного и наводящегося электрического или магнитного шума.

Таким образом, для описания результатов повторяющихся измерений с целью установления истинного значения необходимо использовать аппарат статистики. Наиболее распространенными понятиями в нем являются среднее и стандартное отклонение. Среднее серии измерении (показаний, $\overline{x}$), является наиболее точным приближением истинного значения. С другой стороны, стандартное отклонение ($\sigma$) является мерой разброса данных относительно среднего. При нормальном распределении величины и в случае правильных условий измерений (когда погрешности будет действительно случайной), 68 % измерений будут находиться в интервале $\pm \sigma$ от среднего. Обычно, чем меньше значение $\sigma$, тем более повторяемыми и точными будут измерения). Предел неопределенности исмерений обычно устанавливается равным $\pm 3\sigma$, это соответствует 99% доверительному интервалу (столько случайных измерений нашей величины должно оказаться в данном интервале). Диапазон неопределенности зачастую называют доверительным интервалом.

Примечание. Статистика и понимание природы ошибок - чрезвычайно важное знание. Особенно это важно при доказании своей правоты и проверки сделанных предположений. Например, отличаются ли 2 метода статистически значимо. Или видимое различие лишь случайно…

Для грамотной работы с измерительными устройствами и сенсорами необходимо уметь:

определять тип ошибки;
определять среднее, дисперсию и средне-квадратичное отклонение;
понимать лимитирующую ошибку устройства;
строить зависимость методом наименьших квадратов;
различать калибровку по 1 и 2 точкам.

В принципе, основной нашей задачей является получение данных о системе - измерение. Однако мы никогда не можем измерить истинное значение какой-либо физической величины, поскольку все относительно в этом мире и погрешности накапливаются. Да и из-за случайных факторов всегда есть вероятность ошибки. В наших силах лишь набрать массив измерений, посчитать статистики и сделать предположение об истинности полученных результатов. Для более вероятного получения наиболее близких к истине результатов используют калибровки и сравнения со стандартами.

3.4.1 Анализ ошибок

В общем случае ошибка измерения выражается как

$$ \begin{equation}\begin{aligned} \text{Error} = \text{Instrument reading} - \text{True reading} \end{aligned}\end{equation} \tag{3.6}\label{eq3.6} $$

Часто, ошибка выражается в процентах как:

$$ \begin{equation}\begin{aligned} \text{% Error} = \frac{\text{Instrument reding} - \text{True reading}}{\text{True reading}} \times 100 \end{aligned}\end{equation} \tag{3.7}\label{eq3.7} $$

Ошибки (погрешности) устройства могут быть 3 категорий:

Промахи (gross) - из-за человеческого фактора (считывание показание до достижения стабильности, ошибка записи, ошибка расчета и т.д.);
Систематические - те, которые влияют на все значения в одинаковой мере (ошибка установки 0, дрейф сигнала со временем), может быть исправлена калибровкой;
Случайные - ошибки статистической (т.е. неизвестной исследователю) природы, которые случайным образом оказывают влияние, не может быть исправлена, может быть только уменьшена и статистически учтена.

3.4.2 Систематические ошибки

Систематические ошибки могут возникать по разным причинам. Это может быть связано с неисправностями прибора или датчика. Прибор может иметь “ошибку нуля” (когда приборный ноль не соответствует истинному), или его выход может изменяться нелинейно со входом (отклоняясь от идеального линейного соотношения “вход/выход”). Кроме того, усилитель внутри прибора может иметь входное смещение по напряжению и току, что будет способствовать появлению ошибке нуля. Различные нелинейности в цепи усилителя также приведут к ошибке из-за нелинейности. Также систематическая погрешность может быть вызвана неправильной конструкцией измерительной схемы. Погрешность может возникать из-за эффекта нагрузки, неправильного выбора датчика или частоты отсечения фильтра. Систематические ошибки могут быть также вызваны эффектом окружающей среды (характеристики датчика могут изменяться с изменением температуры или других условий окружающей среды).

Главной особенностью систематических погрешностей является то, что источники погрешностей распознаются и могут быть в значительной степени уменьшены путем тщательного проектирования измерительной системы и выбора ее компонентов (или просто введением поправок). Помещение прибора в контролируемую среду может также помочь в уменьшении систематических ошибок. Они могут быть еще больше уменьшены путем правильной и регулярной калибровки прибора.

3.4.3 Случайные ошибки

В отличие от систематических погрешностей, случайные не имеют какой-либо известной природы и не могут быть устранены (они появляются из-за общей неопределенности, как-бы это не звучало). Такие ошибки могут быть только уменьшены с использованием законов статистики. Такие ошибки не смешенные (т.е. случайным образом распределены вокруг какого-то среднего значения как в большую, так и в меньшую сторону). Но к счастью, обычно такие ошибки следуют нормальному закону распределения и их величину можно уменьшить набором большего количества измерений и усреднением.

Основные понятия случайных величин перечислены ниже.

Среднее (Mean):

$$ \begin{equation}\begin{aligned} \overline{x} = \frac{1}{n} \sum_{i=1}^{n}x_i \end{aligned}\end{equation} \tag{3.8}\label{eq3.8} $$

где $n$ - общее число измерений и $x_i$ - значение единичного измерения.

Может быть показано, что средняя величина является наиболее вероятным значением для данной выборки, именно по этому среднее - одна из важнейших величин в статистическом анализе.

Отклонение (Deviation):

$$ \begin{equation}\begin{aligned} d_i = x_i - \overline{x} \end{aligned}\end{equation} \tag{3.9}\label{eq3.9} $$

Данная величина показывает насколько сильно единичные измерения отклоняются от среднего. К сожалению, усреднение данной величины не сможет предсказать как сильно может отклониться следующее измерение от среднего:

Среднее значение отклонений (Mean of deviation):

$$ \frac{1}{n} \sum_{i=1}^{n} (x_i - \overline{x}) = \overline{x} - \frac{1}{n}(n \overline{x}) = 0 $$

Важная величина - используется что бы оценить насколько все значения в некотором диапазоне отклоняются от истинных. Кроме того нужна для аппроксимации набора значений методом наименьших квадратов (МНК).

Дисперсия (Variance):

$$ \begin{equation}\begin{aligned} V = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \overline{x})^2 = \sigma^2 \end{aligned}\end{equation} \tag{3.10}\label{eq3.10} $$

Интересно, что усреднение для дисперсии ведется по $n-1$ величине. Это называется количеством степеней свободы, поскольку при единичном измерении оно никуда не отклониться (само от себя). Однако, для больших выборок ($n>30$), можно аппроксимировать дисперсию как:

$$ \begin{equation}\begin{aligned} V = \frac{1}{n} \sum_{i=1}^{n} (x_i - \overline{x})^2 = \sigma^2 \end{aligned}\end{equation} \tag{3.11}\label{eq3.11} $$

3.4.4 Распространение ошибки

Довольно часто искомая величина зависит от нескольких измеряемых значений (например расчет мощности источника постоянного тока по напряжению и току). Как тогда расчитать погрешность, если неопределенность измеряемых величин известна?

Допустим $y = f(x_1, x_2, ..., x_n)$. Если неопределенность (или отклонение) для $x_i$ известна и равна $\Delta x_i$, (i = 1, 2,.. n), то расчитаем неопределенность для $y$.

Для этого продифференцируем выражение и разложим его в ряд Тейлора:

$$ \begin{equation}\begin{aligned} \Delta y = \frac{\delta f}{\delta x_1} \Delta x_1 + \frac{\delta f}{\delta x_2} \Delta x_2 + ... + \frac{\delta f}{\delta x_n} \Delta x_n \end{aligned}\end{equation} \tag{3.12}\label{eq3.12} $$

Поскольку $\Delta x_i$ может быть как положительной, так и отрицательной, то максимальная погрешность достигается обыкновенным сложением абсолютных отклонений:

$$ |\Delta y| = \frac{\delta f}{\delta x_1} |\Delta x_1| + \frac{\delta f}{\delta x_2} |\Delta x_2| + ... + \frac{\delta f}{\delta x_n} |\Delta x_n| $$

Однако, это крайне маловероятное событие. На практике, $x_1, x_2 ,..., x_n$ являются независимыми величинами и все ошибки не проявляются в максимальной форме единовременно. Тогда, перейдя к средне квадратинчому отклонению из уравнения $\eqref{eq3.12}$ получим:

$$ \begin{equation}\begin{aligned} (\Delta y)^2 = (\frac{\delta f}{\delta x_1})^2 (\Delta x_1)^2 + (\frac{\delta f}{\delta x_2})^2 (\Delta x_2)^2 + ... + 2\frac{\delta f}{\delta x_1}\frac{\delta f}{\delta x_2} (\Delta x_1)(\Delta x_2) + ... \end{aligned}\end{equation} \tag{3.13}\label{eq3.13} $$

Если вариации $x_1, x_2, ...$ независимы, то положительное значение одного приращения с одинаковой вероятностью будет связано с отрицательным значением другого приращения, так что некоторые из величин могут быть приняты как ноль (все слагаемые с отличной от 2-ой степенью) для совокупности повторных наблюдений.

Мы уже определили дисперсию $V$ как ошибку среднего квадрата. Таким образом, среднее $(\Delta y)^2$ для набора повторных наблюдений, становится дисперсией $y$, или

$$ \begin{equation}\begin{aligned} (\Delta y)^2 = V(y) = (\frac{\delta f}{\delta x_1})^2 V(x_1) + (\frac{\delta f}{\delta x_2})^2 V(x_2) + ... \end{aligned}\end{equation} \tag{3.14}\label{eq3.14} $$

Тогда стандартное отклонение $y$:

$$ \sigma (y) = [(\frac{\delta f}{\delta x_1})^2 \sigma^2 (x_1) + (\frac{\delta f}{\delta x_2})^2 \sigma^2 (x_2) + ... ]^{\frac{1}{2}} $$

3.4.5 Ограничивающая ошибка (Limiting Error)

Ограничивающая погрешность является важным параметром, который используется для определения точности устройств. Ограничительная погрешность (или гарантированная погрешность) указывается изготовителем для определения максимального предела погрешности прибора.

Предположим, что точность вольтметра 0-100 В указана как 2% от полного диапазона шкалы. Это означает, что погрешность гарантированно будет в пределах $\pm 2V$ при любом показании. Если вольтметр считывает 50 В, то ошибка также находится в пределах $\pm 2V$. В результате, точность этого показания будет равна $\frac{20}{50} \times 100 = 4%$. Если общая производительность измерительной системы зависит от точности нескольких независимых параметров, то предельная или гарантийная погрешность определяется абсолютной погрешностью, как указано в выражении в $\eqref{eq3.13}$.

Например, если мы измеряем значение неизвестного элемента сопротивления с помощью моста wheatstone, чьи резисторы имеют заданную погрешность в 1%, 2% и 3% соответственно, то, поскольку

$$ R_x = \frac{R_1 R_2}{R_3} $$

$$ \Delta R_x = \frac{R_2}{R_3} \Delta R_1 + \frac{R_1}{R_3} \Delta R_2 - \frac{R_1 R_2}{R_3^2} \Delta R_3 $$

или

$$ \frac{\Delta R_x}{R_x} = \frac{\Delta R_1}{R_1} + \frac{\Delta R_2}{R_2} - \frac{\Delta R_3}{R3} $$

Тогда по логике $\eqref{eq3.13}$ абсолютная ошибка расчитывается с использованием только положительных значений, и ограничительная погрешность составит 6%.

3.4.6 Значимость арифметического среднего

Несмотря на распространенность такой процедуры как взятие арифметического среднего, давайте постараемся разобраться почему это так важно. А связано это с нем, что арифметическое среднее - это наиболее вероятное значение для выборки:

Допустим $x_1, x_2, ..., x_n$ - выборка из $n$ наблюдений. Пусть $X$ - центральное значение (пока не уточняем какое).

Тогда отклонения от центрального значения будут равны $(x_1 − X), (x_2 − X), ..., (x_n − X)$ соответственно.

Сумма квадратов отклонений: $S_{sq} = (x_1 − X)^2 + (x_2 − X)^2 + ... + (x_n − X)^2 = x_1^2 + x_2^2 + ... + x_n^2 - 2X(x_1 + x_2 + ... + x_n) + nX^2$

Найдем среднее $X$ при минимальных квадратах отклонений:

$$ \frac{dS_{sq}}{dX} = -2(x_1 + x_2 + ... + x_n) + 2nX = 0 $$

или

$$ X = \frac{1}{n}(x_1 + x_2 + ... + x_n) = \overline{x} $$

Таким образом арифметическое среднее - это центральное значение с точки зрения квадратов отклонений.

Стоит учитывать, что взяв другой набор измерений мы получим другое среднее (опять влияние наших любимых случайных погрешностей). Однако при очень большом количестве измерений мы приблизимся очень близко к истинному значению (математическое ожидание). Тогда возникает закономерный вопрос - как определить отклонение различных наборов средних значений от истинной величины?

3.4.7 Стандартное отклонение среднего

Предположим, имеется набор измерений $x_1, x_2, x_3, ..., x_n$. Тогда среднее, как мы выяснили ранее будет равно:

$$ \overline{x} = \frac{1}{n} (x_1 + x_2 + ... + x_n) = f(x_1 + x_2 + ... + x_n) $$

Используя выражение для дисперсии $\eqref{eq3.14}$ получим:

$$ V(y) = (\frac{\delta f}{\delta x_1})^2 V(x_1) + (\frac{\delta f}{\delta x_2})^2 V(x_2) + ... = \frac{1}{n^2} (V(x_1) + V(x_2) + ... + V(x_n)) $$

Тогда стандартное отклонение для измерений $x_1, x_2, x_3, ..., x_n$:

$$ \sigma = [\frac{1}{n}(V(x_1) + V(x_2) + ... + V(x_n))]^{\frac{1}{2}} $$

где $n$ - велико.

Таким образом,

$$ V(\overline{x}) = \frac{1}{n^2} (n \sigma^2) = \frac{\sigma^2}{n} $$

$$ \sigma(\overline{x}) = \frac{\sigma}{\sqrt{n}} $$

Вот мы и определили отклонение средних от истинного среднего. Полученная закономерность говорит о том, что воспроизводимость может быть улучшена (а $\sigma (x)$ уменьшена) за счет увеличения числа наблюдений. Но улучшение будет медленным из-за $\sqrt{n}$.

Пример. Предположим, что сенсор имеет случайную ошибку со стандартным отклонением 1%. Сколько измерений нужно сделать и усреднить, для того, чтобы уменьшить стандартное отклонение от истинного среднего до $ < 0.1%$?

Решение: $\frac{\sigma}{\sqrt{n}} < 0.1; \sqrt{n} > \frac{1}{0.1} = 10$; или $n > 100$.

3.4.8 Метод наименьших квадратов

Пожалуй это один из самых распространенных методов аппроксимации данных и о нем нужно хотя бы один раз услышать. В нашем случае рассмотрим данный метод для построения аппроксимирующей прямой. Это часто необходимо, когда по экспериментальным данным нужно предположить какую-либо зависимость (например, сопротивление от температуры и т.д.). Для этого необходимо найти такой полином, среднеквадратичное отклонение от которого до экспериментальных данных будет минимальным - это и есть МНК (метод наименьших квадратов, рис. 3.13)

Рис. 3.13. Метод наименьших квадратов.

Предположим, у нас имеется $n$ экспериментальных данных: $(x_1, y_1), (x_2, y_2), ..., (x_n, y_n)$. Мы хотим найти зависимость вида $y = a_0 + a_1 x$ при которой общий квадрат ошибки будет минимальным. Неизвестными являются $a_0$ и $a_1$. При этом ошибка для i-ого измерения:

$$ e_i = y_i - y = y_i - a_0 - a_1 x_i $$

А общая квадратичная ошибка:

$$ S_e = \sum_{i=1}^{n} e_i^2 = \sum_{i=1}{n} (y_i - a_0 - a_1 x_i)^2 $$

Для минимизации необходимо минимизировать эти ошибки: $\frac{\delta S_e}{\delta a_0} = 0$ и $\frac{\delta S_e}{\delta a_1} = 0$

или

$$ \begin{equation}\begin{aligned} \frac{\delta S_e}{\delta a_0} = -2 \sum_{i=1}^{n} (y_i - a_0 - a_1 x_i) = 0 \end{aligned}\end{equation} \tag{3.15}\label{eq3.15} $$

$$ \begin{equation}\begin{aligned} \frac{\delta S_e}{\delta a_1} = -2 \sum_{i=1}{n} x_i (y_i - a_0 - a_1 x_i) = 0 \end{aligned}\end{equation} \tag{3.16}\label{eq3.16} $$

Из $\eqref{eq3.15}$ и $\eqref{eq3.16}$ получим

$$ \sum_{i=1}^{n} y_i - a_0 n - a_1 \sum_{i=1}^{n} x_i = 0 $$

$$ \sum_{i=1}^{n} x_i y_i - a_0 \sum_{i=1}^{n} x_i - a_1 \sum_{i=1}^{n} x_i^2 = 0 $$

Решая данную систему получим:

$$ a_1 = \frac{n \sum_{i=1}^{n} x_i y_i - \sum_{i=1}^{n} x_i \sum_{i=1}^{n} y_i}{n \sum_{i=1}^{n} x_i^2 - (\sum_{i=1}^{n} x_i)^2} $$

или

$$ a_1 = \frac{\frac{1}{n} \sum_{i=1}^{n} x_i y_i - \overline{x} \overline{y}}{\frac{1}{n} \sum_{i=1}^{n} x_i^2 - \overline{x}^2} $$

где $\overline{x}$ и $\overline{y}$ - средние значения экспериментальных данных $x_i$ и $y_i$ соответственно.

Тогда:

$$ a_0 = \overline{y} - a_1 \overline{x} $$

Задача. Считая, что зависимость между переменными x и y имеет вид $y = ax^2 + bx + c$, найти оценки параметров $a$, $b$ и $c$ методом наименьших квадратов по выборке:

x 7 31 61 99 129 178 209

y 13 10 9 10 12 20 26


x	7	31	61	99	129	178	209
y	13	10	9	10	12	20	26

3.4.9 Калибровка и устранение погрешности

Уже упоминалось, случайные ошибки не могут быть устранены. Но, взяв ряд показаний при одном и том же условии и рассчитав их среднее, можно значительно сократить разброс случайных ошибок. На самом деле, если количество показаний очень велико, то среднее значение приблизится к истинному, и так ошибка может быть минимизирована. В другом случае - можно использовать статистический подход и оценить диапазон погрешности измерения.

С другой стороны, для систематической погрешности можно выявить ее источник (идентифицировать) и устранить его. Однако даже для простого устройства систематические ошибки могут возникать по целому ряду причин. А выявление и устранение всех источников ошибки может оказаться весьма утомительным процессом. Привлекательной альтернативой является калибровка прибора под различные известные входы.

Калибровка (calibration) - это процесс, в котором известный входной сигнал или ряд входных сигналов применяются к системе с целью выявить значение систематической погрешности для его математического устранения в расчетах. Сравнивая фактическое входное значение со значением выхода, можно наблюдать общий эффект от систематических ошибок. Затем в точках калибровки найденные ошибки обнуляются с помощью калибровочных диаграмм или с помощью расчитанных коэффициентов.

Строго говоря, калибровка подразумевает сравнение измеренной величины со стандартной (полученной в результате сравнения с эталонами). Однако в реальной калибровочной системе нам зачастую требуется не только стандартный прибор (например, для измерения давления), но и особый испытательный стенд (где желаемое давление может быть сгенерировано при различных условиях). В некоторых случаях процесс калибровки устройства еще более сложный. Например, в случае измерения ускорения, поскольку желаемое ускорение должно быть получено на конкретном объекте, то и измерительное устройство должно быть смонтировано на нем же. А фактическое значение полученного ускорения должно измеряться каким-то другим, косвенным образом.

Есть разные подходы для осуществления калибровки. Она может быть выполнена для всех точек с составлением обзорной таблицы (look-up table), по которой затем получают показание для каждого фактического измерения. Такой тип калибровки часто называют калибровкой с помощью программного обеспечения (software calibration). Однако более популярным способом является калибровка прибора в одной, двух или трех точках измерения и подгонка показаний прибора так, чтобы погрешность в этих точках была равна нулю. В этом случае ожидается, что погрешность для всего диапазона измерения уменьшиться и останется в пределах малого интервала (не забываем - основное наше предположение для сенсоров - что мы работаем в линейном диапазоне). Такие калибровки известны как калибровка в одной точке, в двух точках и в трех точках соответственно. Типичные характеристики входа-выхода измерительного устройства при этих трех калибровках показаны на рис. 3.14.

Рис. 3.14. Калибровка a) - по одной точке, b) - по двум точкам, c) - по трем точкам.

Калибровку по одной точке часто называют регулировкой смещения (offset adjustment), при котором отклонение в одной точке для системы должно быть нулевым (часто такая калибровка делается при 0 входе, т.е. сенсор калибруется по холостой пробе). Для электронных приборов часто это делается автоматически, а сам процесс называется автоматическая калибровка нуля (auto-zero). В большинстве же случаев, калибровка выполняется в двух точках: одна - 0 на входе, другая - в максимуме шкалы. Другое название подобной калибровки - корректировки нуля и диапазона (zero and span adjustment).

Необходимо упомянуть один важный момент - характеристики прибора со временем меняются. Поэтому даже при хорошей калибровке систематическая погрешность может опять появиться со временем (как правило, за счет изменения окружающих условия, таких как температура, место размещения и т.п.). Поэтому процесс калибровки должен повторяться через определенные промежутки времени регулярно.

3.4.1. Заключение по разделу 3.4

Погрешности и калибровка являются двумя основными проблемами при любых измерениях. Фактически, знания об измерениях остаются неполными без какого-либо всеобъемлющего представления об этих двух явлениях и в настоящий главе приведен только их краткий обзор. Были определены и объяснены термины “ошибка”, “предельная ошибка” и классифицированы различные типы ошибок. Мы также обсудили и метод наименьших квадратов для построения прямых линий (аппроксимация). Тем не менее я крайне рекомендую ознакомиться с курсом “Планирование эксперимента и анализ данных” для более глубокого понимания этих очень важных характеристик окружающего нас мира.

Кроме того, мы кратко рассмотрели понятие калибровки систем. Показано, что характеристики прибора могут меняться со временем в связи с чем необходимо достаточно часто и регулярно проводить калибровку (особенно при изменении внешних условий измерений). Для этого показаны различные методы существующей калибровки (калибровка по одной точке, калибровка по двум точкам и калибровка по трем точкам).

References

All_cite 1. Measurement and Instrumentation. Theory and Application. Book. 2nd Edition • 2016 2. Instrumentation Reference Book. Book. 4th Edition. 2010

M.B.Stout: Basic Electrical Measurements, 2/e, Prentice Hall of India, New Delhi, 1981.
R.Pallas-Areny and J.G.Webster: Analog Signal Processing, John Wiley, NY, 1999.
R.B. Northrup: Introduction to Instrumentation and Measurements (2/e), CRC Press, Boca Raton, 2005.
J.W. Dally, W.F. Riley and K.G. McConnell: Instrumentation for Engineering Measurements (2/e), John Wiley & Sons, NY, 2003.

3.5 Упражнения и вопросы

Имеется лазерный датчик перемещения со следующими характеристиками:
- Диапазон измерений: $\pm 10$ мм
- Точка измерения: 40 мм
- Разрешение: 3 мкм
- Линейность: 1 % полной шкалы
- Время отклика: 0.15 мс
- Линейный выход: 4-20 мА
Ответьте на следующие вопросы:
- Объясните смысл каждого из терминов.
- Предположим, дистанция между сенсором и объектом равна 35 мм. Какой должен быть выход в мА?
- Какая будет погрешность от нелинейности для данных условий?
- Определите чувствительность данного сенсора в мА/мм.
Определите разрешение 10-битного АЦП (ADC), если он питается от 10 В источника.
Точность датчика давления в диапазоне 0-10 кПа составляет 2%. Опер делите максимальную погрешность измерения в Па, если датчик показывает 4.0 кПа.
Докажите следующие утверждения:
- Потенциометр является устройством 0 порядка.
- Простая термопара является устройством 1ого порядка.
- Акселерометр является устройством второго порядка.
Определить ошибку (в процентах), если индикатор температуры показывает $189.8^o C$, когда фактическая температура составляет $195.5^o C$.
Проведите различие между грубой ошибкой и систематической ошибкой. Запишите два возможных источника систематической ошибки.
Объясните термин “ограничивающая погрешность”. Обоснуйте, почему при измерении всегда рекомендуется брать показания там, где они близки к полному диапазону.
Обоснуйте, почему наиболее вероятным значением множества единичных данных является их среднее арифметическое.
Значение сопротивления $R_t$ металлического провода при температуре $t$ задается выражением, $R_t = R_0 (1+ \alpha t)$ где, $R_0$ - сопротивление при $0^o C$, а $\alpha$ - температурный коэффициент сопротивления. Значения сопротивления металлического провода при различных температурах приведены ниже. Получить значения $R_0$ и $\alpha$ можно, используя метод наименьших квадратов.

Tempareture (oC) 20 40 60 80 100

Сопротивление (ом) 107.5 117.0 117.0 128.0 142.5
Большинство приборов имеют регулировку нуля и диапазона, что это значит?
Объясните калибровку по трем точкам и ее преимущество перед другими типами калибровок.


Tempareture (oC)	20	40	60	80	100
Сопротивление (ом)	107.5	117.0	117.0	128.0	142.5

4. Измерения температуры (temperature measurement)

4.1 Описание раздела

В настоящем разделе будет рассмотрено понятие температуры и способов ее измерения. Человечество не так давно научилось воспроизводимо измерять температуру и первые термометры появились только в 17 веке, благодаря открытию Галлилео Галелея (Galileo Galilei). Однако это открытие произошло одновременно с аналогичным открытием немецкого ученого Дреббелем (Drebbel). При этом первые термометры были чувствительны и к температуре, и к давлению - т.е. были не селективны.

Для калибровки шкалы исторически используется 2 точки однако они могут отличаться.

Шкала Фаренгейта: 0 - смесь соли со льдом, 96 - температура человеческого тела. Тогда температура плавления льда равна $32^0$, а кипения воды: $212^0$.
Шкала Цельсия: 0 - температура плавления льда, 100 - температура кипения воды.
Шкала Кельвина (самая поздняя и “абсолютная”): 0 - абсолютная температура замерзания газа водорода (абсолютный ноль), 273 - температура замерзания воды.

Задание 4.1. Вспомните, какие могут быть недостатки у калибровки по 2ум точкам?

Задание 4.2. На основании калибровочных данных, приведенных выше, предложите уравнения пересчета из одной шкалы в другую.

Изначально термометры служили для измерения атмосферной температуры или температуры тела. Однако сегодня нам необходимо измерять температуру для гораздо более широкого спектра задач и в гораздо более широких диапазонах. Для этого используются следующие основные типы термометров:

Жидкие и газообразные термометры (liquid and gas thermometer).
Биметаллические пластины (bimetallic strip).
Термометры сопротивления (металлические и полупроводниковые, resistance thermometers: RTD and Thermistors).
Термопары (thermocouple).
Соединительный полупроводниковый датчик (Junction semiconductor sensor).
Радиационный пирометр (Radiation pyrometer).

В рамках данного курса мы рассмотрим лишь некоторые из перечисленных типов термометров. Хотелось бы, что бы по окончанию раздела вы умели следующее:

Знали терминологию.
Различали принципы работы RTD и Термистора.
Могли объяснить значение термина компенсации сопротивления для RTD (“компенсация проводниками”, lead wire compensation).
Различали характеристики PTC и NTC термисторов.
Могли выбрать необходимую термопару для конкретного температурного диапазона.
Могли разработать простую компенсационную схему холодного соединения (cold junction compensation) для термопары.

4.2 Термометры на основе сопротивления (Resistance Thermometers)

Как известно из законов физики, сопротивление металлических проводников возрастает с ростом температуры. С другой стороны для полупроводников (semiconductors) - как правило зависимость обратная (уменьшается). Таким образом термометры, использующие металлические проводники для измерения температур, называются Термометр сопротивления (Resistance Temperature Detector, RTD), а использующие полупроводники - thermistors (термисторы). При этом RTD более прочны и имеют более-менее линейные характеристики в широком диапазоне температур. С другой стороны термисторы более чувствительны, но имеют нелинейные характеристики.

4.2.1 RTD (термометр сопротивления)

Общая формула зависимости сопротивления от температуры для металлического проводника может быть представлена как:

$$ R_t = R_0[1+\alpha(t-t_0) + \beta (t-t_0)^2 + \dots] $$

где $R_t$ и $R_0$ - значения сопротивления при $t^0 C$ и $t_0^0 C$ соответственно; $\alpha$, $\beta$ и т.д. - константы, которые зависят от металла.

Для небольшого диапазона температур, можно упростить уравнение до:

$$ R_t = R_0[1+\alpha(t-t_0)] $$

при этом для меди $\alpha = 0.00427 /^o C$.

Медь, никель и платина - наиболее часто используемые металлы для RTD. Диапазон измеряемых температур определяется в зависимости от диапазона, где зависимость сопротивление-температура приблизительно линейна (рис. 4.1).

Рис. 4.1. Зависимость сопротивление-температура для различных металлов при $t_0 = 0^0 C$.

Задача 4.3 Сравните приведенные характеристики с температурами плавления данных металлов. Какие выводы можно сделать?

Конструкция

Редко когда незащищенная металлическая проволока может быть использована для температурных измерений в промышленности. Для ее защиты от механических повреждений используют различные дополнительные материалы (рис. 4.2).

Рис. 4.2. Конструкция промышленного RTD.

Измерительная проволока зачастую помещается в оболочку из нержавеющей стали (помимо механической защиты, это обеспечивает удобство эксплуатации - дефектный сенсор может быть легко заменен на новый без изъятия корпуса из производства).
Между оболочкой и проволокой помещается проводящий тепло (но не проводящий электрический ток) материал (например, керамическая крошка).
Измерительный провод (resistance wired) должен быть аккуратно намотан на подложку из слюды (mika) или кварца, чтобы избежать растяжения и сжатия в процессе измерения температуры (такие материалы как кварц или слюда имеют небольшие значения температурных деформаций).

Улучшение качества сигнала (Signal conditioning)

Изменение сопротивления RTD может быть измерено непосредственно вольт-амперметром или с использованием измерительного моста (мост Уитстона, Wheatstone’s bridge). Однако основным ограничением для точного измерения температуры является вклад проводящих проводов (lead wires) в общее измеренное сопротивление. Поскольку длина проводника от RTD до измерительного устройства может изменяться, это может сказаться на точности измерения температуры. Однако существует метод для компенсации влияния длины проводника (т.е. его дополнительного сопротивления). Это метод заключается в использовании трехпроводного или четырех проводного RTD в виде моста (рис. 4.3).

Примечание. Вообще понятие моста чрезвычайно важно для измерительных систем и автоматизации в целом. Советую вам обращать пристальное внимание на все подобные “мостовые” схемы и хорошо разобраться в данном вопросе.

Рис. 4.3. Компенсационная схема для а) трех проводного и б) четырех проводного RTD

В трехпроводном методе один дополнительный “фиктивный” провод (4.3.а - а), взятый из элемента сопротивления, соединен в мост таким образом, что два подводящих провода (4.3.а - b, c) соединяются с двумя смежными рычагами моста, тем самым устраняя эффект друг от друга (рис. 4.3(а)). На рис. 4.3(b) показан четырехпроводной метод (схема Кельвина) измерения. Он аналогичен четырем клеммам сопротивления: две клеммы используются для подачи тока, в то время как две другие - для измерения напряжения. Тогда сопротивления проводов a, b, c, d компенсируют друг друга и измеряется только сопротивление целевого RDT.

4.2.2 Термистор (thermistor)

Термистор - это полупроводниковый тип термометров по сопротивлению. Они обладают бОльшей чувствительностью, но при этом у них крайне нелинейные характеристики. Это становиться понятным из того факта, что для типичного 2000 $\Omega$ термистора сопротивление меняется на 80 $\Omega/C^0$ при $25^0 C$, тогда как для платинового RTD изменением сопротивления составит 7 $\Omega/^0 C$ при тех же $25^0 C$. Термисторы могут быть 2 типов: а) с негативным температурным коэффициентом (NTC) и б) с позитивным температурным коэффициентом (PTC) (рис. 4.4).

Рис. 4.4. Типичные характеристики термисторов: а) NTC, б) PTC.

Наиболее распространенными являются термисторы NTC типа. Обычно они производятся из оксидов железа, марганца, магния и др. Их характеристики могут быть выражены уравнением:

$$ \begin{equation}\begin{aligned} R_T = R_0 e^{\beta (\frac{1}{T} - \frac{1}{T_0})} \end{aligned}\end{equation} \tag{4.1}\label{eq4.1} $$

где, $R_T$ - сопротивление при температуре T [K] $R_0$ - сопротивление при температуре $T_0$ [K] $T_0$ - температура сравнения, обычно $25^0 C$ $\beta$ - константа, которая определяется в зависимости от характеристик материала, обычно принимается 4000 условных единиц.

Из уравнения $\eqref{eq4.1}$ можно получить температурный коэффициент сопротивления [$K^{−1}$]:

$$ \alpha_T = \frac{1}{R_T} \frac{dR_T}{dT} = - \frac{\beta}{T^2} $$

Таким образом мы получили негативный коэффициент $\alpha_T$, что соответствует NTC термистору.

Термисторы обычно используются в интервале температур от -100 до +300 $^0$ C. При этом, как правило, только один термистор не может использоваться для всего диапазона измерений. Более того, существующие термисторы не являются взаимозаменяемыми: между двумя термисторами одного типа имеется заметное отклонение номинального сопротивления и температурного коэффициента. Таким образом, если неисправный термистор будет заменен новым аналогичного типа, то необходимо проводить калибровку. Доступные на рынке термисторы имеют стандартные значения в 1К, 2К, 10К, 20К, 100К и т.д.. Эти значения показывают уровень сопротивления при 25 $^0 C$ в [Ом]. Термисторы доступны в разных формах: шарик, стержень, диск и т.д.. Как правило, размер чувствительного элемента небольшой, что позволяет проводить точечное измерение температуры. Константа времени реагирования также мала, из-за малого размера элемента.

Стоит учитывать, что нелинейные отрицательные температурные характеристики также дают увеличение погрешности из-за эффекта самонагревания термистора. Когда через термистор протекает ток, то генерируется тепло согласно $I^2R$ потерям энергии, что может увеличить температуру чувствительного элемента. В свою очередь это приведет к уменьшению сопротивления и цепной реакции за счет чего продолжает увеличиваться проходящий ток и температура. Если не устранить данный эффект, он может привести к необратимому повреждению термистора (он просто сгорает). Для предотвращения такой цепной реакции необходимо ограничить протекание тока ниже указанного в спецификациях значения.

Нелинейные характеристики термисторов часто вызывают проблемы с точным измерением температуры и часто бывает необходимо специально линеаризовать характеристики термистора. Это может быть сделано за счет добавления одного постоянного сопротивления (резистора), параллельного термистору. Температурные характеристики нового эквивалентного сопротивления будут более линейными. Однако это приведет к уменьшению общей чувствительности.

Термисторы с позитивным температурным коэффициентом (PTC) имеют ограниченную область применения и в основном используются для защиты моторов и трансформаторов (transformer widings). Как показано на рис. 4.4 б), они имеют низкое и относительно постоянное сопротивление ниже пороговой температуры $T_R$, после которой сопротивление быстро возрастает. PTC термисторы производятся из соединений бария, свинца и титаната стронция.

4.3 Термопары (thermocouple)

Открытие возможности генерировать электрическую энергию от температуры (термальной энергии) принадлежит Thomas Johan Seeback (1821 г., в нашей литературе - Зеебек). Суть явления в том, что когда области соединения нескольких разнородных металлов (проводников) подвергается воздействию различных температур, то образуется ЭДС (электродвижущая сила). Фактическое значение генерируемого ЭДС зависит от используемых материалов и разницы температур между горячим и холодным соединениями. Генерируемая ЭДС, на самом деле, обусловлена сочетанием двух эффектов: эффект Пельтье (Peltier) и эффект Томсона (Thomson, в нашей литературе известный как эффект Зеебека). Типичный термоэлектрический переход в ЭДС показан на рис. 4.5.

Рис. 4.5. Классическая термопара (hot junction, cold junction - горячая и холодная область соединения проводников соответственно).

Генерируемая ЭДС может быть приблизительно выражена такой зависимостью:

$$ e_0 = C_1 (T_1 - T_2) + C_2 (T_1^2 - T_2^2) \mu v $$

где: $T_1$ и $T_2$ - горячая и холодная температуры (К). $C_1$ и $C_2$ - константы, зависящие от материала термопары (например, $C_1 = 62.1$, $C_2 = 0.045$ для Медно/Константной термопары).

Термопары очень широко используются при измерениях температур в производственных условиях. Основные причины такой популярности следующие:

они прочны, и их показания стабильны;
они могут измерять в широком диапазоне температур (большой линейный диапазон измерений);
их характеристики практически линейны в широком диапазоне с точностью около $\pm 0,05\%$.

Однако основным недостатком термопар является их низкая чувствительность по сравнению с другими приборами для измерения температуры (например, RTD или термисторами).

4.3.1 Материалы термопар

В теории, любая пара разных металлов (проводников) может использоваться как термопара. Но на практике, только несколько материалов получили широкое распространение. На выбор материалов влияет несколько факторов: чувствительность, стабильность калибровки, инертность в условиях эксплуатации и взаимозаменяемость (термопара должна иметь возможность заменены на такую же без дополнительной калибровки). В табл. 4.1 приведены основные термопары (их тип, композиция, диапазон температур, чувствительность и т.д.).

Табл. 4.1. Характеристики и материалы термопар

Тип	Позитивный сплав	Негативный сплав	Температурный диапазон, оС	Температурный коэффициент вариации (мкВ/ оС)	Линейный диапазон (оС) и чувствительность в нем (мкВ / оС)
R	Платина-Родий (87% Pt, 13% Rh)	Платина	0-1500	5.25-14.1	1100 - 1500 (13,6-14,1)
S	Платина-Родий (90% Pt, 10% Rh)	Платина	0-1500	5.4 - 12.2	1100 - 1500 (13,6-14,1)
K	Хромель (90% Ni, 10% Cr)	Алюмель (Ni94Al2, Mn3Si)	-200 - 1300	15.2 - 42.6	0 - 1000 (38 - 42.9)
E	Хромель	Константант (57% Cu, 43% Ni)	-200 - 1000	25.1 - 80.8	300 - 800 (77.9 - 80.8)
T	Медь	Константант	-200 - 350	15.8 - 61.8	нелинеен
J	Железо	Константант	-150 - 750	21.8 - 64.6	100 -500 (54.4 - 55.9)

Примечание. Верхний температурный диапазон работы термопары обычно зависит от условий, в которых она используется. Например, верхний порог для Chromel/Alumel термопары может быть увеличен в окислительной атмосфере, в то время как для Iron/Constantan он может быть увеличен в вакууме.

4.3.2 Законы термопар

Эффекты Плетье, Зеебека и Томпсона объясняют основные принципы генерации ЭДС от термопар. Но их не достаточно, чтобы обеспечить приемлемые методики измерений для каждой конкретной ситуации. Для этого существуют 3 закона термоэлектрических цепей (three laws of thermoelectric circuits), которые дают нам полезные практические советы по измерению температуры. Эти законы известны как:

закон однородной цепи (law of homogeneous circuit);
закон промежуточных металлов (law of intermediate metals);
закон промежуточных температур (law of intermediate temperature).

Эти законы можно объяснить с помощью рис. 4.6.

Рис. 4.6. Законы термопар.

Первый закон можно объяснить с помощью рис. 4.6 (a) - общая сгенерированная ЭДС зависит только от материалов и температур проводников и не зависит от промежуточных температур.

Согласно 2 закону (рис. 4.6 (b)), если подключить третий материал в любой точки (формируется 2 дополнительных соединения), то он не будет оказывать никакого эффекта, если эти 2 дополнительных соединения остаются при одинаковых температурах. Этот закон позволяет вставить измерительное устройство без влияния на общую ЭДС.

Третий закон относиться к калибровке термопар. Он гласит, что если термопара производит ЭДС $e_1$ при температуре проводников $T_1$ и $T_2$ и $e_2$ при температурах $T_2$ и $T_3$, то она производит общую ЭДС $e_1 + e_2$ при температурах $T_1$ и $T_3$ (рис. 4.6 (c)).

Третий закон особенно важен с точки зрения компенсации измерительного соединения. Калибровочный график термопары строится по холодному участку термопары ($0^оС$). Однако в реальных измерительных условиях температура холодного участка редко поддерживается одинаковой и равной температуре при калибровке (обычно ее никак не изолируют и она обладает температурой окружающей среды). Третий закон помогает нам вычислить точную температуру горячего участка с компенсацией новой температуры холодного участка с помощью калибровочных таблиц.

Пример 4.1 Следующая таблица была получена при калибровке железо-константной термопары с температурой калибровки $0^оС$ (эталонная).

Температура (оС)	15	30	40	...	180	190	200	208	210
ЭДС (мВ)	0.778	1.56	2.11	...	9.64	10.25	10.74	11.20	11.32

Пример. Предположим, что температура горячего стыка измеряется термопарой железо-константан при температуре холодного стыка $30^oC$, а измеренное напряжение составляет 9,64 мВ. Требуется найти фактическую температуру горячего участка термопары (горячий стык).

Решение

Обратимся к 3 закону термоэлектрических цепей (рис. 4.6 (с)): $T_1$ - неизвестная температура, $T_2 = 30^oC$, $T_3 = 0^0C$. Измеренное напряжение составляет $e_1 = 9.64$ мВ, а калибровочное напряжение $e_2 = 1.56$ мВ. Тогда: $e_3 = e_1 + e_2 = 11.20$ мВ. Следовательно, согласно калибровочной таблице, фактическая температура составит $T_1 = 208^oC$.

4.3.3 Компенсация холодного участка термопар (спай, стык)

Из рассмотренного выше примера следует, что выходное напряжение термопары будет изменяться при изменении температуры холодного участка (“холодного соединения”). Поэтому для измерения температуры желательно, чтобы холодный участок термопары поддерживался при постоянной температуре. Для данной цели можно использовать ледяную ванну или другие способы “изолирования” температуры от окружающей среды (например, использование термостатической печи с постоянной температурой), но это не является практичным решением для промышленности. Поэтому наиболее распространенный случай работы термопар - это когда холодное соединение имеет температуру окружающей среды. В этом случае при измерении высокой температуры погрешность будет мала (не значима) и ее можно уменьшить с помощью табличного пересчета.

Пример. При измерении температуры $1500^o C$ с температурой окружающей среды в пределах $25 \pm 15^o C$ погрешность составит около 1%.

Задача. Обоснуйте приведенное выше утверждение.

Однако при более низких температурах погрешность будет возрастать. Тогда используют различные варианты температурной компенсации (вспоминаем про измерительный мост). Типичная схема подобной компенсации приведена на рис. 4.7.

Рис. 4.7. Простой метод компенсации температуры холодного участка термопары.

Здесь через смещение операционного усилителя (op-amp) добавляется постоянное напряжение, соответствующее температуре окружающей среды. Напряжение термопары также усиливается этим же операционным усилителем (op-amp).

Более точный метод температурной компенсации холодного участка термопары представлен на рис. 4.8.

Рис. 4.8. Компенсационная схема с использованием измерительного моста (моста Уитстона, Wheatstone bridge).

Здесь термистор или ТДС (RTD) используется для измерения температуры окружающей среды и компенсации погрешности через мостовую схему. Мостовая схема балансируется при $0^o C$. Когда температура окружающей среды поднимается выше $0^o C$, генерируемая в термопаре ЭДС будет снижаться, но в то же время в мостовую цепь будет добавляться напряжение от термистора для компенсации.

Как указано на рис. 4.8, компенсация холодного участка термопары обычно происходит вместе с контурами формирования сигнала вдали от точки измерения (горячий участок). Это может потребовать использования длинных проводов из материала термопары к цепи компенсации. Для уменьшения длины дорогостоящих проводов термопары (в некоторых случаях платина) обычно используются недорогие компенсационные провода между термопарой и цепью компенсации. Эти провода подбираются таким образом, что бы их характеристики температурной ЭДС были близки к характеристикам проводов термопары при температуре окружающей среды.

4.4 Заключение

Температура является одним из самых важных параметров технологических процессов. Это параметр требует постоянного измерения в огромном количестве процессов и устройств (например очень хорошей практикой является измерение температуры двигателей различных актуаторов). При этом среди множества типов измерителей температуры, наиболее распространенными являются термометры сопротивления и термопары. Их популярность в основном обусловлена прочностью, повторяемостью (от сенсора к сенсору) и широкими линейными диапазонами рабочих температур. “Чистые” термометры сопротивления и термопары редко используются на практике, вместо этого их помещают в защитные металлические оболочки. Наряду с этим, должны использоваться и цепи формирования сигнала для уменьшения погрешностей (наши любимые измерительные мосты и различные их вариации).

Примечание. На практике существуют случаи, когда измеряемые температуры превышают $2000^o C$. Рассмотренные нами подходы не в состоянии измерить настолько высокую температуру. Вместо этого измерение проводится на расстоянии бесконтактным методом (радиационные пирометры). Но это уже совсем другая история…

4.5 Упражнения

Назовите материалы, которые обычно используется для ТДС (RTD). Какой из них обладает наиболее широкими линейными характеристиками?
Что имеется в виду под компенсацией проводов для ТДС? Как работают данные устройства?
PT-100 - это платиновый ТДС, сопротивление которого при $0^oC = 100 \Omega$. Если температурный коэффициент сопротивления платины составляет $3.91 \times 10^{-3} \frac{1}{^oC}$, то найдите его сопротивление при $100^oC$.
В чем разница между термистором NTC и PTC типа?
Обоснуйте, почему термистор больше подходит для измерения температуры в небольшом диапазоне.
Назовите три типа термопар и их температурные диапазоны.
Нарисуйте схемы и объясните 3 закона термопар.
Что подразумевается под компенсацией холодного участка термопары? Предложите 2 способа такой компенсации.
Термопара имеет линейную чувствительность $30 \mu v / ^oC$ и откалибрована при температуре холодного соединения $0^C$. Данная термопара используется для измерений при температуре холодного соединения $30^oC$. Найдите актуальную температуру горячего соединения, если генерируемая ЭДС равна $3.0 mv$.

5. Измерения давления и силы (temperature measurement)

5.1. Введение и цели

В этом разделе мы обсудим различные методы измерения давления и силы. Для этого, как правило, используют эластичные элементы, такие как мембраны (diaphragms) и трубки Бурдона (Bourdon tubes). С другой стороны, могут использоваться и тензодатчики (strain gages), однако они применяются для измерения силы (усилия). Конструкции и принципы работы различных упругих элементов для измерения давления рассмотрены далее в настоящей главе. За ними следует рассмотрение тензодатчиков и способов их использования в неразрушающем контроле.

В результате анализа данной главы необходимо уметь:

Назвать различные способы измерения давления с помощью эластичных преобразователей (transducers).
Объяснить конструкцию и принцип работы датчика давления с трубкой Бурдона (Bourdon tube).
Определить коэффициент деформации датчиков давления (strain gage).
Назвать различные материалы тензодатчиков и указать их коэффициенты замера (gage factors).
Нарисовать схему соединения несбалансированного моста с четырьмя тензодатчиками, чтобы получить максимальную чувствительность и идеальную температурную компенсацию.
Назвать различные способы измерения силы с помощью тензодатчиков.

5.2. Измерение давления

Измерение давления внутри замкнутого пространства (трубопровод или контейнер) в производственных условиях является весьма сложной задачей. Необходимо учитывать, что показатели давления могут меняться в широких диапазонах и довольно быстро (от очень высокого до вакуума). При этом измеряемая среда тоже может быть разнообразной: как жидкой, так и газообразной. В настоящей главе мы не будем обсуждать методы измерения давления в вакууме, а попытаемся сконцентрироваться на общих методах измерения давления, которое превышающего атмосферное (это наиболее частый случай в различных производствах). Такие измерения в основном осуществляются с помощью различных упругих элементов: мембран (diaphragms), мехов (bellows) и трубок Бурдона (Bourdon tubes). Эти эластичные элементы меняют свою форму в зависимости от приложенного давления, а изменение формы может быть измерено с помощью подходящих датчиков изгиба (deflection transducers) или конденсаторов.

5.2.1 Мембраны (diaphragms)

Как правило, различают три типа мембран:

Тонкая пластина (Thin plate);
Мембрана (Membrane);
Гофрированная диафрагма (Corrugated diaphragm) .

Данная классификация основана на различиях в силе воздействующего давления и вызываемых соответствующих смещениях. При этом принцип измерения остается одним и тем же - с использованием датчиков смещения (например, измеряя емкость конденсатора).

1. Тонкая пластина (thin plate) - изготавливается путем механической обработки цельного блока заготовки с изготовлением круглой тонкой части посередине. Такая конструкция похожа на мембрану, но используется для измерения относительно высокого давления.

2. В мембране (membrane) - чувствительный участок наклеивается между двумя твердыми блоками. Толщина мембраны гораздо меньше пластины в первом случае и, как следствие, смещение в ответ на давление гораздо больше (а значит больше и чувствительность).

3. Гофрированная мембрана (corrugated diaphragm). Используется для еще большего увеличения чувствительности. Когда при небольшом изменении давления может быть получено очень большое отклонение (изменение формы). Однако при этом теряется линейность отклика.

Общий вид мембранных датчиков приведен на рис. 5.1.

Рис. 5.1. Устройство датчиков мембранного типа.

Для изготовления таких сенсоров используются бронза, латунь, нержавеющая сталь и т.д. В последнее время широко используются мембраны из кремния в датчиках давления MEMS (Micro Electro Mechanical Systems, Микроэлектромеханические системы).

Отклонение мембраны может быть выражено как:

$$ f_n = \frac{1}{2 \pi} \sqrt{\frac{k}{m_{eq}}} $$

где

$m_{eq}$ - эквивалентная масса,

$k$ - константа упругости для диафрагмы.

Рабочее отклонение при измеряемом давлении должна быть меньше, чем собственное отклонение мембраны (иначе датчик выйдет из строя).

Как вы уже могли понять, принцип работы мембранных датчиков весьма прост. При подаче давления на мембрану она отклоняется, и максимальное отклонение в центре ($y_0$) может быть измерено с помощью датчика смещения (например как изменение емкости конденсатора). Для тонкой пластины максимальное отклонение $y_0$ мало ($y_0 \lt 0,3t$), а линейная зависимость между $p$ и $y_0$ выражатся как:

$$ y_0 = \frac{3}{16} p \frac{(1-\nu^2)}{Et^3}R^4 $$

где

$E$ - модуль упругости материала диафрагмы, и

$\nu$ - отношение Пуассона.

$$ p_{max} = 1.5(\frac{t}{R})^2 \sigma_{max} $$

где

$\sigma_{max}$ - упругая степень деформации материала.

Для обычной мембраны мембраны при большом отклонение соотношение между $p$ и $y_0$ будет нелинейным (для $\nu$ = 0.3):

$$ p = 3.58 \frac{Et^3}{R^4} y_0^3 $$

Для гофрированной мембраны трудно дать какую-либо определенную математическую связь между $p$ и $y_0$; но эта связь также сильно нелинейна.

По мере деформации мембраны, величина и знак деформации будут отличаться для разных мест мембраны. Для нивелирования подобного эффекта используют четырех датчика смещения на самой мембране. Принцип работы подобных датчиков будет рассмотрен в следующем разделе.

Кроме того, следует понимать, что в реальных условиях математический расчет поведения диафрагм - весьма сложная задача. Поэтому важно использовать калибровку и внимательно изучать документацию для каждого конкретного мембранного сенсора.

5.1.2 Меха (сильфоны, bellows)

Такой тип сенсоров (рис. 5.2) изготавливается с мягкими стенками и один из жестких концов сенсора фиксируется (на нем же расположены отверстия для входа среды). Другой конец мехов свободно перемещается (как правило, именно на нем и происходит измерение действующего на меха давления).

Рис. 5.2. Схема сенсора типа "меха".

Смещение свободного конца можно увеличить, за счет использования бОльшего количества изгибов (обычно варьируется от 5 до 20 “складок”). Часто используется внешняя пружина, установленная противоположно движению сильфонов. В результате из уравнения для пружины можно получить линейную зависимость для измерения давления:

$$ p \cdot A = k \cdot x $$

где

$A$ - площадь мехов,

$k$ - константа сжатия,

$x$ - перемещение мехов.

Для изготовления мехов обычно используют фосфорную бронзу, латунь, бериллиевую медь и нержавеющую сталь. Сильфоны изготавливаются либо путем токарной обработки цельного блока металла, либо путем пайки или сварки штампованных круглых колец, либо путем специальной прокатки (прессования) труб.

5.1.3 Трубка Бордона (Bourdon tube)

Наверное наиболее широко для индикации давления используются трубчатые манометры Бордона. Этот тип манометров был впервые разработан Э. Бордоном в 1849 году. Трубчатые манометры Бордона могут использоваться для измерения в широком диапазоне давлений: от вакуума до давления в несколько тысяч фунтов на кв. дюйм (psi). В основном такой манометр состоит из С-образной полой трубки, один конец которой закреплен и соединен с резьбовым соединением. Другой конец свободен и соединен с индикацией (рис. 5.3). Поперечное сечение трубы эллиптическое.

a)

b)

Рис. 5.3. Трубка Бордона, схема (а) и пример (b, https://en.wikipedia.org/wiki/Pressure_measurement).

При подаче давления эллиптическая труба пытается достичь круглого поперечного сечения, в результате чего трубка пытается выпрямиться. Таким образом, свободный конец трубки перемещается вверх в зависимости от величины давления. На свободном конце прикреплен механизм отклонения и индикации, который поворачивает указатель. В качестве материалов используют для изготовления также используют фосфорная бронзу, латунь и бериллиевую медь. Для 2” (два инч) общего диаметра трубы полезный ход свободного конца составляет примерно $\frac{1}{8}$”. Несмотря на то, что трубы С-типа наиболее распространены, используются также трубы других форм, например, гелиоцентрические (helical), витые (twisted) или спиральные (spiral).

5.3. Измерение силы

Следующем после измерения давления является измерение силы. Наиболее популярным способом здесь является использование деформируемых измерителей. Мы измеряем деформацию, возникшую под действием силы, с помощью деформационных датчиков. В свою очередь, умножив данную деформацию на эффективную площадь поперечного сечения и модуль Юнга материала (Young’s modulus) мы получаем значение действующей силы. Тензодатчики (Load cells) и измерительные кольца (Proving rings) - два распространенных метода измерения силы с помощью деформации (strain gages). Сначала мы обсудим принцип работы тензометрических датчиков, а затем перейдем к прочим методам измерения силы.

5.3.1 Тензодатчик (Strain Gage)

Тензодатчик (strain gages) (иногда в России его называют тензорезистор) является одним из самых популярных типов преобразователей и имеет широкий спектр применения. Он может использоваться для измерения силы, крутящего момента, давления, ускорения и многих других параметров которые связаны с силой воздействия. Основной принцип работы такого датчика весьма прост: при применении растяжения (strain) к тонкой металлической проволоке изменяются ее размеры и, следовательно, сопротивление.

5.3.1.1 Коэффициент тензочувствительности (коэффициент замера датчика деформации, Gage Factor)

Рассмотрим длинную прямую металлическую проволоку длиной $l$ круглого сечения диаметром $d$. При воздействии силы, приложенной к этому проводу с двух концов, изменяется размер датчика ($l$ меняется на $l + \Delta l$, $d$ меняется на $d + \Delta d$ и площадь сечения $A$ меняется на $A + \Delta A$, рис. 5.4).

Рис. 5.4. Изменение сопротивления в зависимости от деформации (изменение площади сечения А показано пунктиром).

Для простоты будем считать, что все изменения происходят в положительном направлении. Тогда зависимость сопротивление провода от его размеров будет выражаться следующим образом:

$$ R = \frac{\rho l}{A} $$

где

$\rho$ - электрическая проводимость, $l$ - размер проводника, $A$ - площадь сечения проводника.

Тогда изменение сопротивления в зависимости от растяжения:

$$ \Delta = (\frac{\delta R}{\delta l})\Delta l + (\frac{\delta R}{\delta A})\Delta A + (\frac{\delta R}{\delta \rho})\Delta \rho = \frac{\rho}{A} \Delta l - \frac{\rho}{A^2} \Delta A + \frac{l}{A} \Delta \rho = R \frac{\Delta l}{l} - R \frac{\Delta A}{A} + R \frac{\Delta \rho}{\rho} $$

или,

$$ \begin{equation}\begin{aligned} \frac{\Delta R}{R} = \frac{\Delta l}{l} - \frac{\Delta A}{A} + \frac{\Delta \rho}{\rho} \end{aligned}\end{equation} \tag{5.1}\label{eq5.1} $$

Тогда если площадь круглого сечения равна $A=\frac{\pi d^2}{4}$, то $\Delta A = \frac{\pi d}{2} \Delta d$. Или,

$$ \frac{\Delta A}{A} = 2 \frac{\Delta d}{d} $$

Следовательно,

$$ \frac{\Delta R}{R} = \frac{\Delta l}{l} - 2 \frac{\Delta d}{d} + \frac{\Delta \rho}{\rho} $$

Теперь введем константу, называемую “Пуассоновским отношением” (отношение поперечного сжатия к продольному расширению):

$$ v = -\frac{lateral\ strain}{longitudinal\ strain} = - \frac{\frac{\Delta d}{d}}{\frac{\Delta l}{l}} $$

Соотношение Пуассона является свойством материала и не зависит от размера. Итак, с учетом $\eqref{eq5.1}$ можно заключить, что:

$$ \frac{\Delta R}{R} = (1+2v)\frac{\Delta l}{l} + \frac{\Delta \rho}{\rho} $$

Следовательно,

$$ \frac{\frac{\Delta R}{R}}{\frac{\Delta l}{l}} = 1 + 2v + \frac{\frac{\Delta \rho}{\rho}}{\frac{\Delta l}{l}} $$

Последнее слагаемое в правой части вышеприведенного выражения представляет собой изменение сопротивления материала в результате приложенной деформации (возникающее из-за пьезостойкости материала). Фактически, все элементы в правой части приведенного выше уравнения не зависят от геометрии проволоки, подвергающейся деформации, а зависят только от свойств материала проволоки. Именно по этой причине для описания характеристик деформационного датчика используется так называемый коэффициент тензочувствительности (“Коэффициент замера”, gage factor). Который определяется как:

$$ G = \frac{\frac{\Delta R}{R}}{\frac{\Delta l}{l}}=1 + 2v + \frac{\frac{\Delta \rho}{\rho}}{\frac{\Delta l}{l}} $$

Если учесть, что для нормальных металлов отношение Пуассона $v$ варьируется в диапазоне $ 0.3 \leq v \leq 0.6 $, а коэффициент пьезостойкости варьируется в диапазоне $0.2 \leq \frac{\frac{\Delta \rho}{\rho}}{\frac{\Delta l}{l}} \leq 0.6$, то мы получим, что “коэффициент тензочувствительности” металлических тензодатчиков варьируется в диапазоне $1.8 \leq G \leq 2.6$.

Однако стоит учитывать, что для полупроводниковых тензодатчиков данный диапазон не верен и они имеют очень большой коэффициент тензочувствительности (в диапазоне 100-150 отн. ед.). Это достигается за счет сильного пьезостойкого свойства полупроводников. Коммерчески доступные тензодатчики имеют определенные фиксированные значения сопротивления, например, 120Ω, 350Ω, 1000Ω и др. Изготовитель также указывает коэффициент тензочувствительности и максимальный ток при измерении для исключения самонагрева датчика (обычно в диапазоне от 15 мА до 100 мА).

Выбор материала для металлического тензодатчика должен зависеть от нескольких факторов:

материал должен иметь низкий температурный коэффициент сопротивления;
материал должен иметь низкий коэффициент теплового расширения.

Исходя из приведенных факторов, только несколько сплавов пригодны для коммерческих металлических тензодатчиков:

Advance (55% Cu, 45% Ni): Gage Factor between 2.0 to 2.2;
Nichrome (80% Ni, 20% Co): Gage Factor between 2.2 to 2.5.
Иногда еще используется изоэластан (isoelastic) - другой зарегистрированный в качестве торговой марки сплав с Gage Factor около 3.5.

Тензодатчики полупроводникового типа, хотя и имеют большой коэффициент тензочувствительности, находят ограниченное применение из-за их высокой чувствительности и нелинейности характеристик (в чем-то аналогичных полупроводниковым термисторам).

5.3.1.2 Металлические тензометрические датчики (Strain Gage)

Как отмечалось выше, большинство тензодатчиков - металлические. Они могут быть двух типов: несвязанные и связанные. Несвязанный тензодатчик обычно используется для измерения деформации (или смещения) между неподвижной и подвижной конструкцией путем крепления к обоим конструкциям четырех металлических проводов таким образом, что два находятся в сжатии и два - в натяжении.

С другой стороны, в связанном деформационном датчике деформируемый элемент не связан проводами. При этом сам датчик находится на подложке, которая постоянно закрепляется на измеряемой конструкции с помощью клея. Чаще всего используются склеенные тензодатчики типа металлической фольги. Такие датчики изготавливается методом фотографического травления тонкораскатанного металлического проводника. Тонкие полоски фольги являются активными элементами тензодатчика, а толстые полоски фольги служат для обеспечения электрических соединений. Из-за большой площади толстой части их сопротивление мало и они не оказывают влияния на измерение сопротивления при деформации. Зато такой проводник увеличивает площадь для рассеивания тепла, кроме того становится проще соединить сигнальные провода с тензодатчиком.

Конструкция описанных типов тензодатчиков и варианты получения сигнала показана на рис. 5.5.

Рис. 5.5. Несвязанные (а) и связанные (б) металлические тензодатчики и варианты их подключения через мостовые схемы.

На рис. 5.5. (а) показана схема измерения давления. Мембрана напрямую соединена арматурой с несвязным тензодатчиком. С увеличением давления увеличивается нагрузка на измерительную пару В и С, а на измерительную пару А и D - уменьшается. Для получения сигнала используется измерительный мост с четырьмя активными элементами (мост Уитстона, уже встречаемый нами ранее). Резистор $R_y$ и потенциометр $R_x$ используются для первоначальной балансировки моста, $v_0$ - приложенное напряжение, а $dv_i$ - выходное (измеряемое) напряжение на вольтметре или аналогичном устройстве с внутренним сопротивлением $R_i$.

В свою очередь на рис. 5.5 (b) приведен связанный тензодатчик и вариант его подключения также через измерительный мост с постоянным балансирующим сопротивлением (например, $R_g = R_1 = R_2 = R_3 = 200 \Omega$, когда нет напряжения).

Задача 5.1 Как Вы думаете, какой вариант на рис. 5.5 наиболее чувствительный и точный. Обоснуйте свой ответ.

Задача 5.2 Если на рис. 5.5 (b) $R_g = R_1 = R_2 = R_3 = 200 \Omega$ при отсутствии давления, а само приложенное давление вызывает напряжение $V_{in} = 50 mV$. То каким будет измеренное напряжение $V_{measure}$, если размер датчика увеличился на 2%.

Учтите, что датчик на рис. 5.5 (b) может измерять деформацию только в одном направлении. Если мы хотим измерить деформацию в двух или более направлениях в одной и той же точке, то необходимо использовать розетку тензодатчиков. Она изготавливается путем укладки нескольких тензодатчиков в разных направлениях (на рис. 5.6 показана трехэлементная деформационная розетка, уложенная в стек под $45^0$).

Рис. 5.6. Трехэлементный тензодачик, уложенный розеткой под углом $45^oC$

В заключение отметим, что материал подложки для тензодатчика должен удовлетворять нескольким важным свойствам:

обладать высокой механической прочностью;
обладать высокой диэлектрической проницаемостью;
должен быть негигроскопичным (иначе поглощение влаги вызовет набухание и создаст локальную деформацию - т.е. систематическую погрешность).

Обычно в качестве подложки используют специально пропитанную бумага, стекловолокно и т.д. Крепежный материал, используемый для постоянной фиксации тензодатчика к конструкции также должен быть негигроскопичным (обычно используют эпоксидную смолу и целлюлозу).

5.3.1.3 Полупроводниковый тип тензодатчика (Strain Gage)

Тензопреобразователь полупроводникового типа изготавливается из тонкой кремниевой проволоки (обычно от 0,005 до 0,0005 дюйма и длиной от 0,05 до 0,5 дюйма). Такие датчики могут быть двух типов: p-типа и n-типа. В первом случае сопротивление увеличивается с положительной деформацией, а в последнем - уменьшается с температурой. Конструкция и типичные характеристики полупроводникового тензодатчика показаны на рис. 5.7.

Рис. 5.7. Конструкция n-типа (a) и характеристики (b) полупроводникового тензодатчика.

В настоящее время все большую популярность приобретают датчики давления MEMS. Они изготавливаются из небольшой кремниевой диафрагмы с установленными на ней четырьмя пьезорезистивными тензодатчиками. Подобные датчики оснащены встроенными контурами формирования сигнала и выдают напряжение, соответствующее приложенному давлению. Небольшой вес и малые габариты датчика делают его пригодным для измерения давления в специфических условиях применения.

5.3.1.4 Мост тензодатчиков (Strain Gage Bridge)

Еще раз подробнее рассмотрим мостовую схему для увеличения точности и чувствительности измерений. Для рассмотренных датчиков деформация является микроскопической (типичное значение: $\frac{\Delta l}{l} = 1 \times 10^{-4}$). В результате связанное с ним изменение сопротивления тоже мало, как и его линейный диапазон измерений. При этом если один тензодатчик подключен к измерительному мосту (Wheatstone bridge) с тремя фиксированными сопротивлениями, то выходное напряжение моста тоже будет линейным (выходное напряжение моста будет линейно изменяться с $\frac{\Delta R}{R}$ , если $\frac{\Delta R}{R}$ не превысит 0,1) (рис. 5.5 (b)).

При этом в реальных мостовых схемах, как правило, никогда не используется один тензодатчик - это связано не с улучшением линейности, а с получением идеальной температурной компенсации. Таким образом, если в нашем случае находится один тензодатчик в мосте с тремя плечами с фиксированным сопротивлением (рис. 5.5 (b)), то из-за повышения температуры, сопротивление тензодатчика будет изменяться. Это приведет к разбалансировке моста и даст ошибочный сигнал (даже если деформация датчика отсутствет). С другой стороны, если используется два одинаковых тензодатчика для одного моста (на соседних плечах, один на сжатие, другой на растяжение) - температурная компенсация может быть достигнута. Изменение температуры будет в равной степени влиять на сопротивления тензодатчиков и это обеспечит баланс моста при отсутствии деформаций. Такая конфигурация моста называется “push-pull”. Еще одним преимуществом такого решения является повышение чувствительности.

Фактически, все четыре рычага моста могут быть сформированы из активных тензодатчиков. Это позволит еще больше повысить чувствительность, сохраняя при этом свойство температурной компенсации (рис. 5.5 (а)) (именно так, например, делается в точных аналитических весах, измеряющих величины с точностью до 0.0001 г).

Можно показать, что если сопротивления тензодатчиков одинаковы и равны коэффициенту тензочувствительности $G$, то несбалансированное напряжение будет равно

$$ e_0 = \frac{EG}{4}(\epsilon_1 + \epsilon_3 - \epsilon_1) $$

где $\epsilon_1, \epsilon_2, \epsilon_3, \epsilon_4$ - это деформации, созданные с соответствующими знаками ($\epsilon = \frac{\Delta l}{l}$)

Примечание. Измерительные мосты применяются для измерения/балансировки электрического сопротивления (относятся к одинарным мостам). Далее приведены основные расчеты для моста (перед глазами нужно держать рис. 5.5 (b) и задачу 5.2.)

Итак, принято считать, что ток течет от + к - (хотя электронны движутся от - к + и несут с собой отрицательный заряд…) и проходить он будет по 2 путям: $A-B-C$ и $A-D-C$ (считаем, что сопротивление вольтметра велико настолько, что точки $D-B$ не соединены). Тогда если $\phi_A, \phi_B, \phi_C, \phi_D$ - потенциалы соответствующих точек, то напряжения между точками $A-C$ и $D-B$ равно

$$U_{AC} = \phi_A - \phi_C $$

$$U_{DB} = \phi_D - \phi_B $$

И сопротивление участков $A-B-C$ и $A-D-C$ равны:

$$R_{ABC} = R_1 + R_g$$

$$R_{ADC} = R_2 + R_3$$

Тогда по закону Ома токи на участках $A-B-C$ и $A-D-C$

$$I_{ABC} = \frac{U_{AC}}{R{ABC}} = \frac{U_{AC}}{R_1 + R_g}$$

$$I_{ADC} = \frac{U_AC}{R_{ADC}} = \frac{U_{AC}}{R_2 + R_3}$$

А напряжение на участках $D-C$ и $B-C$:

$$U_{DC} = I_{ADC}R_2$$

$$U_{BC} = I_{ABC}R_g$$

Потенциалы в точках B и D выражаются как:

$$\phi_D = \phi_C + U_{DC} = \phi_C + I_{ADC}R_2$$

$$\phi_B = \phi_C + U_{BC} = \phi_C + I_{ABC}R_g$$

Тогда напряжение $D-B$ будет:

$$\begin{align}U_{DB} & = \phi_D - \phi_B \\ & = (\phi_C + I_{ADC}R_2) - (\phi_C + I_{ABC}R_x) \\ & = I_{ADC}R_2 - I_{ABC}R_g \\ & = \frac{U_{AC}}{R_2 + R_3} \dot R_2 - \frac{U_{AC}}{R_1 + R_g} \dot R_g \end{align}$$

При этом если мост сбалансирован, то:

$$0 = U_{DB} = \frac{U_{AC}}{R_2 + R_3} \dot R_2 - \frac{U_{AC}}{R_1 + R_g} \dot R_g$$

$$\frac{R_2}{R_2 + R_3} = \frac{R_g}{R_1 + R_g}$$

$$R_g = \frac{R_2 R_3}{R_1} $$

5.3.2 Нагрузочная ячейка (Load Cell)

Нагрузочные ячейки широко используются для измерения силы. По своей сути - это комбинация тензодатчиков на упругом металлическом корпусе. Одним из наиболее распространенных способ измерения действующей силы на данную систему является весовой мост (weigh bridge, рис. 5.8). С точки зрения измерительных цепей - это мост Уитстона, где все 4 сопротивления являются тензодатчиками: два измеряют продольную деформацию (при сжатии ячейки они сжимаются), а два других - поперечную (при сжатии ячейки они растягиваются, рис. 5.8).

Рис. 5.8. Пример и схема нагрузочной ячейки (Load cell) с 4 тензодатчиками.

Тензодатчики, измеряющие одинаковую деформацию (скажем, растяжение) располагают на противоположных плечах моста, в то время как соседние плечи моста должны измерять противоположные деформации. Если тензодатчики идентичны по характеристикам, то это обеспечит не только идеальную температурную компенсацию, но и максимально достижимую чувствительность.

Сама деформация в случае весового моста задается уравнением:

$$ \epsilon = \frac{\nu F}{AE} $$

где $F$ - приложенная сила, $A$ - площадь поперечного сечения, $E$ - модуль Юнга для эластичного материала, $\nu$ - соотношение Пуассона.

5.3.3 Удостоверяющее кольцо (Proving Ring).

Еще одним распространенным типом датчиков для измерения силы воздействия являются удостоверяющие кольца. Данный тип устройств зачастую используется для проверки действующе силы. Удостоверяющие кольца могут использоваться для измерения как сжимающих, так и растягивающих усилий. Преимущество удостоверяющего кольца заключается в том, что благодаря его конструкции можно развить бОльшую деформацию по сравнению с тензодатчиком и проводить измерения в более широких диапазонах (рис. 5.9).

Рис. 5.9. Удостоверяющее кольцо.

Кольцо состоит из полого цилиндрического стержня радиуса $R$, толщины $t$ и осевой ширины $b$. Измеряемое усилие прикладывается к специальным площадкам, закрепленным с двух сторон удостоверяющего кольца. Четыре тензодатчика установлены на стенках испытательного кольца: два - на внутренней стороне и два - на внешней стороне (опять мост Уинстона, аналогичный предыдущему разделу). При воздействии на кольцо 2 датчика сжимаются ($- \epsilon$), в то время как датчики 1 и 3 - растягиваются ($+ \epsilon$). Величина деформации в таком случае задается выражением:

$$ \epsilon = \frac{1.08 FR}{Ebt^2} $$

5.3.4 Кантиливерная балка (Cantilever Beam)

С такими устройствами мы уже сталкивались в курсе когда рассматривали нагрузочные ячейки. По сути, кантиливерная балка является частным случаем нагрузочной ячейки (раздел 5.3.2). Такая конструкция может использоваться для измерения веса до 10 кг. Один конец балки является жестко закрепленным, а на другой (свободный) прилагается нагрузка (рис. 5.8).

Задача. Подумайте, как еще можно расположить тензодатчики?

Напряжение на фиксированном конце выражается как:

$$ \epsilon = \frac{6Fl}{Ebt^2} $$

где:

$l$ - длина балки

$t$ - толщина кантиливера

$b$ - ширина балки

$E$ - модуль Юнга для материала.

Создаваемую деформацию можно измерить, закрепив тензодатчики на фиксированном конце: два на верхней стороне балки (растяжение) и два на нижней (сжатие).

5.4. Заключение

В этой главе мы изучили наиболее часто встречающиеся типы сенсоров для измерения давления и силы. Мембраны используются для непосредственного измерения давления газов или жидкостей на систему (сигнал преобразуется в смещение, а затем, с помощью тензодатчиков или других сенсоров - в сопротивление или другой электрический сигнал).

С другой стороны, мы рассмотрели тензодатчики и их различные комбинации для измерения воздействующей силы. На примере удостоверяющих колец, нагрузочных ячеек и кантиливерных балок мы разобрали как с помощью тензодатчиков измеряют действующие на систему силы. Кроме того мы повторили устройство измерительных мостовых схем, которые позволяют добиться температурной компенсации и увеличить чувствительность измерений.

Задания для проверки

Какой из эластичных датчиков: сильфоны, тонкая пластина или гофрированная мембрана, может использоваться для измерения высокого давления?
Сильфоны обычно используются в сочетании с пружиной, почему?
Объяснить конструкцию и принцип работы трубы Бурдона для измерения давления.
Определите коэффициент деформации датчика. Какие материалы обычно используются для изготовления тензодатчиков? Какой из них имеет максимальный коэффициент замера (gage factor)?
Что такое розетка тензодатчиков?
$120 \Omega$ тензодатчик с коэффициентом тензочувствительности 2.0 подвергается деформации равной $1 \times 10^{- 6}$. Найдите как изменилось сопротивление тензодатчика.
Расскажите, каким образом можно компенсировать температурный эффект в тензодатчике?

Ссылки на литературу

6. Смещение и скорость (Displacement and Speed Measurement)

6.1 Введение

Смещение и скорость - это два важных параметра, измерения которых важны во многих промышленных системах (например в схемах позиционирования и управления).

Измеряемое типичными сенсорами смещение может быть в диапазоне от нескольких мкм до нескольких см. Кроме того, существует как контактное, так и бесконтактное измерение. Само же смещение может быть линейным или угловым (поворотным). Это же верно и в случае измерения скорости.

В результате освоения данной главы, неплохо было бы уметь:

Назвать три метода измерения смещения с помощью пассивных электронных датчиков.
Набросать конструкцию и характеристики LVDT.
Объяснить принципы работы индуктивных и емкостных типов датчиков приближения.
Различить емкостные датчики смещения с переменным расстоянием и переменной площадью.
Объяснить принцип действия оптического датчика смещения.
Назвать два метода бесконтактного измерения скорости вращения и объяснить принципы их работы.

6.2 Измерение смещения (displacement measurement)

Если мы хотим измерить некое смещение системы в пространстве, то можно использовать два типа измерения: контактное и бесконтактное. При этом принцип измерения можно разделить на две категории: электронное и оптическое. При электронном измерении используются пассивные электронные датчики, измеряющие индуктивность или емкость (inductance or capacitance). С другой стороны, оптический метод работает по принципу изменения интенсивности света в зависимости от расстояния.

Далее мы сознательно не будем отмечать диапазон измерений смещений для рассматриваемых сенсоров, т.к. он в основном зависит от используемой “механики” (т.е. всегда можно пропорционально увеличить или уменьшить размер измеряемых величин, используя конструкцию из рычагов и т.п.).

6.2.1 Потенциометр (potentiometer)

Потенциометры являются самым простыми измерителями смещения. Они могут использоваться как для линейного, так и для углового измерения перемещений (рис. 6.1).

Рис. 6.1. Потенциометр: a) - линейный, b) - поворотный

Подобные сенсоры являются резистивными датчиками (transducers, т.е. меняют свое сопротивление в ответ на воздействие). Тогда выходное напряжение после такого датчика будет пропорционально смещению согласно формуле:

$$ e_i = \frac{x_i}{x_t} e_0 $$

где

$x_i$ - приложенное смещение, $x_t$ - общее смещение и $e_0$ - питающее напряжение.

Основной проблемой потенциометров является проблема наличия контакта, возникающая в результате износа (есть подвижные детали, а значит будет быстрый износ). В результате, несмотря на простоту, применение потенциометров в промышленности весьма ограничено.

6.2.2 Линейный дифференциальный трансформатор (ЛДТ, Linear Variable Differential transformer, LVDT)

LVDT работает по принципу вариации взаимной индуктивности. Его конструкция состоит из трех неподвижных соосных обмоток (показаны коричневым на рис. 6.2) и подвижного ферромагнитного сердечника на оси трансформатора (показан синим). Сердечник короче чем длина всего трансформатора, поэтому при его перемещении меняется коэффициент магнитной связи обмоток и, следовательно, получаемый наведенный ток на обмотках. На центральную обмотку подается напряжение возбуждения, с боковых обмоток снимается наведенный сигнал, пропорциональный положению сердечника.

Это один из самых популярных типов датчиков смещения. Кроме того он имеет хорошую линейность в широком диапазоне перемещений. При этом масса подвижного тела мала, а сама подвижная часть не соприкасается с неподвижной деталью, что минимизирует сопротивление трения и вероятность выхода из строя датчика. Коммерческие LVDT доступны с полным диапазоном перемещения от $\pm 1,25$ мм до $\pm 250$ мм. Благодаря малой инерции сердечника, LVDT обладает хорошими динамическими характеристиками.

Конструкция и принцип работы LVDT приведены на рис. 6.2.

Рис. 6.2. Linear Variable Differential transformer (LVDT) и Последовательное соединение вторичных обмоток (изображение взять с сайта wikipedia.org и распространяется по лицензии CC BY-SA 3.0).

Как уже отмечалось выше, устройство работает по принципу изменений взаимной индуктивности между двумя катушками в зависимости от смещения ферритового сердечника. Датчик состоит из первичной обмотки и двух одинаковых вторичных обмоток трансформатора, намотанных на полый цилиндр (tubular former). Внутри цилиндра движется сердечник из ферромагнитного отожженного никель-железного сплава (феррит).

Две вторичные обмотки соединены последовательно друг с другом и выходное напряжение является разностью напряжений между ними:

$$ e_{out} = e_1 - e_2 $$

Первичная обмотка возбуждается источником переменного напряжения 1-10 В (r.m.s. A.C.), частота возбуждения находиться в диапазоне от 50 Гц до 50 КГц. При этом возможно 2 случая:

Выходное напряжение равно нулю, когда сердечник находится в центральном положении (напряжение, наведенное в обеих вторичных обмотках, одинаковое и поэтому разница равна нулю).
Напряжение возрастает по мере удаления сердечника от центрального положения, в любом направлении.

Таким образом, по измерению только выходного напряжения невозможно предсказать направление движения сердечника.

Для возможности определения направления движения используют фазовый чувствительный детектор (phase sensitive detector, PSD). Он подключается на выходе LVDT и сравнивает фазу выхода с первичным сигналом для определения направления движения. На выходе из фазового чувствительного детектора получаем постоянное напряжение (после фильтрации низких частот, рис. 6.3). При этом зависимость напряжения от смещения будет линейной.

Рис. 6.3. Выходное напряжение по отношению к характеристикам перемещения LVDT до (a) и после (b) фазочувствительного обнаружения.

Тем не менее описанный тип датчиков обладает рядом недостатков:

Чувствительность к наведенным магнитным полям.
Чувствительность к вибрациям.
Чувствительность к температуре.

Задача 6.1. На основании раздела 6.2.2 и информации в сети, составьте список плюсов LVDT.

Задача 6.2. Предложите схему для компенсации влияния температуры на показания LVDT по аналогии с датчиками давления.

6.2.3 Индуктивные датчики (Inductive type Sensors)

Рассмотренные в предыдущей главе LVDT работает по принципу изменения общей наведенной индуктивности (mutual inductance). С другой стороны существую индуктивные датчики, которые работают по принципу изменения исключительно собственной индуктивности. Часто они используются для оценки близости двух металлических объектов (рис. 6.4).

Рис. 6.4. Датчик близости на основе изменения собственной индуктивности.

В этом случае индуктивность катушки меняется по мере того, как ферромагнитный объект движется вблизи магнитного носителя (металл), изменяя таким образом сопротивление магнитного поля (magnetic path). Измерительная цепь (inductance measuring circuit) такого датчика обычно представляет собой мост переменного тока (AC bridge).

6.2.4 Ротационный дифференциальный трансформатор с переменной величиной (rotary variable differential transformer, RVDT)

Его конструкция аналогична конструкции LVDT, за исключением того, что сердечник спроектирован таким образом, что при его движении взаимная индуктивность между обмотками изменяется линейно с угловым смещением (рис. 6.5).

Рис. 6.5. Rotary Variable Differential Transformer (RVDT).

6.2.5 Вращающийся трансформатор с возбуждающей обмоткой на роторе (Ресольвер, Resolver)

Ресольвер также работают по принципу изменения взаимной индуктивности и широко используются для измерения вращательного движения. Основная конструкция показана на рис. 6.6.

Рис. 6.6. Схема ресольвера.

Ресольвер состоит из ротора, содержащего первичную обмотку и двух обмоток статора (с одинаковым количеством витков), расположенных перпендикулярно друг другу. Ротор крепится непосредственно к объекту, вращение которого измеряется. Если подаваемое AC напряжение на роторе равно $V_r$, то индуцированное напряжение на двух обмотках статора составит:

$$ \nu_{01} = KV_r cos \Theta $$

$$ \nu_{02} = KV_r sin \Theta $$

где

$K$ - константа.

Путем измерения описанных напряжений можно однозначно определить угловое положение ($0 \le \Theta \le 90^o$). Фазовая чувствительность необходима, если мы хотим измерить углы во всех четырех квадрантах и понимать в каком квадранте мы сейчас измеряем положение.

Примечание. Аналогично рассмотренному датчику работают сельсины (synchros), которые широко используются в качестве датчиков ошибок в системах позиционного регулирования. Кому интересно - может посмотреть в интернете.

6.2.6 Датчики емкости (Capacitance Sensors)

Датчики емкостного типа являются универсальным и выпускаются в различных размерах и формах. При этом они могут измерять очень маленькое смещение (порядка микрометров), что успешно используется в сенсорных экранах современных телефонов. Часто весь датчик изготовлен на кремниевом основании и интегрирован в технологическую схему в виде отдельной маленькой микросхемы. Думаю, что Вы догадываетесь о принципе работы подобных датчиков (мы ведь измеряем емкость, а значит - говорим о конденсаторах). Для использования различных режимов работы такого датчика необходимо учитывать емкость, формируемую диэлектриком между двумя проводящими параллельными пластинами. Емкостное сопротивление между пластинами задается формулой:

$$ C = \frac{\epsilon_r \epsilon_0 A}{d} $$

где

$A$ - площадь пластин

$d$ - расстояние между пластинами

$\epsilon_r$ - относительная диэлектрическая проницаемость диэлектрика (его пропускная способность, permittivity)

$\epsilon_0$ - абсолютная диэлектрическая проницаемость в вакууме = $8.854 \dot 10^{-12} \frac{F}{m}$

Емкостной датчик может быть сформирован по принципу изменения:

разделяющего пространства ($d$),
площади пластин ($A$),
диэлектрической проницаемости диэлектрика ($\epsilon_r$).

Сенсоры для измерения смещения обычно основаны на первых двух принципах, в то время как принцип переменной диэлектрической проницаемости используется для измерения влажности, уровня и др. На рис. 6.7 показаны схематические конструкции датчиков измерения емкости с переменным расстоянием и переменной площадью.

Рис. 6.7. Емкостные датчики смещения с вариацией a) разделяющего пространства, b) площади пластин проводника.

Емкостной датчик с переменным типом площади выдает линейные изменения емкости с входной переменной, в то время как датчик с переменным типом разделения имеет обратную зависимость от входящего смещения ($\frac{1}{x}$).

Емкостные датчики также используются как сенсоры приближения (рис. 6.7).

Рис. 6.7. Схематичное изображение емкостного датчика близости.

Измерительная часть датчика состоит из двух электродов: один круглый (В), а другой - кольцеобразный (А). Электроды разделены небольшим диэлектрическим промежутком. При попадании предмета в пределы измерительной части датчика, емкость между пластинами А и В изменяется. Разница может быть точно измерена при сравнении с емкостью фиксированного (эталонного) конденсатора.

Подобные сенсоры имеют небольшие размеры, бесконтактны и могут обнаруживать присутствие металлических или изолирующих (indulating) объектов в диапазоне около 0-5 см. Для обнаружения изолирующих объектов диэлектрическая постоянная такого объекта должна быть значительно больше чем диэлектрическая постоянная материала, разделяющего А-В.

Измерительные цепи для емкостных датчиков, как правило, являются емкостными мостами (аналогично рассмотренным ранее измерительным мостам по сопротивлению). При этом изменение емкости подобных сенсоров очень мало (несколько pF, в некоторых случаях даже меньше). Изменения такого порядка с трудом возникают и детектируются при наличии большой блуждающей емкости (которая обычно присутствует в промышленных системах). Кроме того полученный сигнал будет содержать много помех. Для минимизации всех описанных негативных влияний датчик должен быть тщательно спроектирован и экранирован. Это же касается и самой измерительной схемы (measuring circuit).

6.2.7 Оптические датчики (optical sensors)

Следующий тип сенсоров работает по принципу уменьшения интенсивности света с увеличением расстояния. Таким образом, если источник света и детектор зафиксированы, то количество задетектированного света (отраженного от движущейся поверхности) будет зависеть от расстояния и скорости движения измеряемой поверхности. Оптические сенсоры весьма капризны и требуют тщательной калибровки, поскольку количество полученного света зависит от отражательной способности поверхности, интенсивности излучения источника и т.д. Тем не менее, подобный датчик обеспечивает простой метод измерения смещения. В конструкции подобных устройств часто используются оптические волокна (optical fibers, рис. 6.9).

Рис. 6.9. Оптоволоконный сенсор определения близости.

В приведенном датчике используется 2 пучка волокон: одно передает свет от источника на измеряемую поверхность, другое - принимает отраженный свет и передает его в фотодетектор. Источниками света могут быть лазеры или светодиоды, а детекторами - фотодиоды (photodiodes) или фототранзистры (phototransistors).

6.3 Измерение скорости

Мы рассмотрели большое количество различных датчиков измерения расстояния и многие из них обладает хорошими динамическими характеристиками, что позволяет использовать их для измерения скорости. Однако для этого требуется перевести скорость в более удобную форму для измерений.

Самым простым способом измерить скорость является измерение скорости вращения (переводим поступательную скорость во вращательную через специальные механизмы). Для этого нужно поместить на вращающемся валу электрический генератор (tachogenerator) и измерить вырабатываемое им напряжение (которое будет пропорционально скорости). Однако, это измерение контактного типа (со всеми вытекающими минусами и рисками выхода из строя). Но существуют и другие - бесконтактные способы. Одним из них является оптический метод (рис. 6.10)

a)

b)

Рис. 6.10. Оптический датчик скорости: a) схема; b) пример такого датчика для определения скорости конвейерной ленты.

Для оптического измерения скорости вращения на валу (частота вращения которого должна быть измерена), устанавливается непрозрачный диск с перфорацией через равные интервалы (прозрачные окна). С одной стороны диска устанавливается источник света, а с другой - фотоприемник, который обнаруживает проходящий свет. Детектируемый сигнал будет формировать квадратную волну, частота которой будет определяться скоростью вала и количеством прозрачных отверстий на диске.

Однако не только оптическая схема может использоваться для изменения скорости. На рис. 6.11 приведена другая схема измерения - датчик переменного сопротивления (variable reluctance).

Рис. 6.11. Сенсор измерения скорости по переменному сопротивлению.

На валу устанавливается колесо с выступающими зубцами из ферромагнитного материала. Статический датчик представляет собой постоянный магнит с поисковой катушкой (search coil), которая монтируется на фиксированном расстоянии от колеса. Магнитный поток (flux) от постоянного магнита будет изменяться при движении колеса с ферромагнитными зубцами и улавливаться в катушке. При вращении колеса, в катушке будет изменяться наведенное напряжение, которое может быть выражено как:

$$ \phi(t) = \phi_0 + \phi_m sin \omega t $$

где

$\omega$ - угловая скорость колеса.

Тогда индуцируемое напряжение катушки:

$$ e = -N \frac{d \phi}{d t} = -N \omega \phi_m cos \omega t $$

где

$N$ - число оборотов поисковой катушки.

Таким образом и амплитуда, и частота наведенного напряжения будут зависеть от скорости вращения. Далее, напряжение подается на цепь компоратора (comparator circuit), который выдает на выходе квадратную волну с постоянной амплитудой и частотой, пропорциональной скорости.

Для обоих типов рассмотренных сенсоров результатам измерения скорости вращения является квадратная волны. Этот сигнал подается на частотный счетчик (frequency counter), который используется для подсчета количества квадратных импульсов через фиксированные интервалы времени и отображает скорость. Таким образом происходит измерение скорости вращения.

6.4 Заключение

В настоящей главе были рассмотрены некоторые техники измерения смещения и скорости. Выбор той или иной измерительной схемы зависит от технических требований, окружающей среды и доступности места установки. Само же измерение может быть проведено 2 путями:

первый - преобразование перемещения в изменение индуктивности или емкости с последующим использованием подходящей измерительной схемы;
второй - использовать оптический метод, основанный на детектировании отраженного света от движущейся поверхности.

Важным аспектом применением любой из этих схем является возможность определять близость объекта и учет внешних условий измерения.

С другой стороны была рассмотрена возможность определения скорости вращения. Наиболее популярным способом определения такой скорости является электрический генератор (tachogenerator). Он монтируется на вращающийся вал, а далее измеряется генерируемое напряжение (которое будет пропорционально скорости). Однако существуют и безконтактные способы измерить скорость, при которых полученный сигнал преобразуется в частотный с последующим измерением частоты.

Не забывайте, что рассмотренный материал покрывает лишь малую часть возможных способов определения смещения/близости объектов.

6.5 Вопросы для проверки

Какова функция фазового чувствительного детектора (PSD) в цепи LVDT?
Опишите конструкцию и принцип работы LVDT.
Приведите отличия между емкостными детекторами на основе изменения расстояния и площади.
Какие существуют достоинства и недостатки оптических датчиков перемещения/положения?
Назовите два способа бесконтактного измерения скорости. Объясните принцип работы любого из них (с использованием схем).
Оптический датчик измерения скорости имеет диск с 36 прямоугольными отверстиями через равные расстояния по периметру диска. Частота сигнала с фотодетектора составляет 360 Гц. Найдите частоту вращения вала в об/мин (rpm), на котором размещен данный диск.

6.6 Литература

RDP Group
Metrolog
Chen, Gang & Zhang, Bo & Liu, Pinkuan & Ding, Han. (2015). An Adaptive Analog Circuit for LVDT’s Nanometer Measurement Without Losing Sensitivity and Range. IEEE Sensors Journal. 15. 2248-2254. 10.1109/JSEN.2014.2364610.
Arun T Vemuri; Matthew Sullivan (2016). “Ratiometric measurements in the context of LVDT-sensor signal conditioning” (PDF). Texas Instruments Industrial Analog Applications Journal. Retrieved 27 October 2017.
LVDT
J.P. Bentley: Principles of Measurement Systems (3/e), Longman, U.K., 1995.
L.K.Baxter: Capacitance Sensors Design and Applications, IEEE Press, New Jersey, 1997.
D. Patranabis: Sensors and Transducers (2/e), PHI, New Delhi, 2003.

7. Измерение потока (Flow Measurement)

7.1 Введение и цели

Точное измерение потока жидкостей и газов является необходимым требованием для поддержания качества многих технологических процессов. Фактически, большинство промышленных контуров управления регулируют именно расход поступающих потоков жидких или газообразных сред.

В зависимости от ситуации могут существовать различные требования к измерению расхода. Это может быть объемный или массовый расход, среда может быть жидкой или газообразной, измерение может быть контактным или бесконтактным и т.д.. В результате существует множество промышленных типов расходомеров, например:

по давлению (переменного или постоянного перепада давления) (obstruction type: differential pressure or variable area);
механические счетчики турбинного типа (inferential, turbine type);
электромагнитные (electromagnetic);
механические счетчики шестерёнчатого типа (positive displacement, integrating);
вихревой (fluid dynamic, vortex shedding);
анемометры (anemometer);
ультразвуковые (ultrasonic);
массового расхода на эффекте Кориолиса (mass flowmeter, Coriolis).

После освоения предложенного материала будет хорошо если вы сможете:

Назвать различные типы расходомеров, используемые в промышленности.
Различать конструктивные различия между диафрагменными и лопастными расходомерами.
Понимать основной принцип работы расходомера заградительного типа.
Объяснить основные принципы работы расходомера турбинного и электромагнитного типа.
Привести принципиальную блок-схему формирования сигнала для типичных расходомеров.

7.2 Расходомеры по давлению

Одними из самых распространенных приборов измерения расхода являются датчики, основанные на связи скорости потока, его давлении и площади. Как можно догадаться, такие датчики бывают 2 типов.

Переменного давления. Такие, как орифиметр (Orifice meter, расходомер с сужающим диафрагменным устройством, которые являются грубой формой расходомера Вентури), расходомер Вентури (расходомер с сужающим устройством, Venturimeter), трубка Пито (Pitot tube).
Переменной площади (постоянный перепад давления) - ротаметры (rotameter)..

При этом в обоих случаях на пути потока создается заграждение, а перепад давления потока до и после этой преграды будет связан с расходом.

7.2.1 Основные принципы

Согласно показаниям числа рейнольдса $R_D$, поток может быть двух типов: ламинарный (можно представить его как “вязкий”, $R_D \le \sim 2000$) и турбулентный ($R_D > \sim 2000$).

В настоящем пособии будем считать, что поток турбулентный (обычно так и бывает на практике) и рассмотрим поток жидкости по замкнутой трубе переменного сечения (рис. 7.1).

Рис. 7.1. Поток через трубу переменного сечения (varying cross-section).

Пусть давление [Па], скорость [$м/c$], площадь поперечного сечения [$м^2$] и высота над базовой точкой [м] будут выражены как: $p_1$, $\nu_1$, $A_1$ и $z_1$ для сечения 1 и $p_2$, $\nu_2$, $A_2$ и $z_2$ для сечения 2 соответственно. Дополнительно предположим, что поток не сжимаемый. Тогда

$$ \begin{equation}\begin{aligned} \frac{p_1}{\gamma} + \frac{\nu^2}{2g} + z_1 = \frac{p_2}{\gamma} + \frac{\nu_2^2}{2g} + z_2 \end{aligned}\end{equation} \tag{7.1}\label{eq7.1} $$

где

$\gamma = \rho g$ - это удельный вес жидкости (specific weight of the fluid, $кг/(м \cdot с)^2$)

$\rho$ - плотность [$кг/м^3$]

$g$ - ускорение свободного падения [$9.81\ м/с^2$]

Если $z_1 = z_2$, тогда:

$$ \frac{p_1}{\gamma} + \frac{\nu_1^2}{2g} = \frac{p_2}{\gamma} + \frac{\nu_2^2}{2g} $$

При это, если жидкости не сжимаемые, то $nu_1 A_1 = nu_2 A_2$.

Таким образом,

$$ \nu_2^2 - \nu_1^2 = \frac{2g}{\gamma} (p_1 - p_2) $$

или

$$ \nu_2^2 (1-\frac{A_2^2}{A_1^2}) = \frac{2g}{\gamma} (p_1 - p_2) $$

В результате получаем

$$ \nu_2 = \frac{1}{\sqrt{(1-\frac{A_2^2}{A_1^2})}} \sqrt{\frac{2g}{\gamma} (p_1 - p_2)} = \frac{1}{\sqrt{1-\beta^4}} \sqrt{\frac{2g}{\gamma} (p_1 - p_2)} $$

Учитывая круглое сечение, определим $\beta$ как соотношение двух диаметров, т.е. $\beta = \frac{d_2}{d_1}$ и $\frac{A_2}{A_1} = \beta^2$

Тогда объемный поток через трубу, может быть выражен как:

$$ \begin{equation}\begin{aligned} Q = \nu_2 A_2 = \frac{A_2}{\sqrt{1-\beta^4}} \sqrt{\frac{2g}{\gamma} (p_1 - p_2)} = \frac{A_2}{\sqrt{1-(\frac{d_2}{d_1})^4}} \sqrt{\frac{2}{\rho} (p_1 - p_2)} \end{aligned}\end{equation} \tag{7.2}\label{eq7.2} $$

Примечание. Проверим все наши вычисления по размерности:

$$ Q = \nu_2 A_2 = \frac{м}{с} \cdot м^2 = \frac{м^3}{с} $$

С другой стороны:

$$Q = \frac{A_2}{\sqrt{1-(\frac{d_2}{d_1})^4}} \sqrt{\frac{2}{\rho} (p_1 - p_2)} = \\ = м^2 \cdot \sqrt{\frac{1}{\frac{кг}{м^3}} \cdot Па} = м^2 \cdot \sqrt{\frac{м^3}{кг} \cdot \frac{кг}{м \cdot с^2}} = м^2 \cdot \frac{м}{с} = \frac{м^3}{с}$$

Все сходится, ЧТД.

Для массы потока $Q_m = \rho Q\ [\frac{кг}{с}]$

Из приведенного выше выражения можно сделать вывод, что при наличии препятствия на пути движения потока, которое изменяет площадь поперечного сечения, будет наблюдаться разность статических давлений до и после препятствия. Измеряя разность этих давлений можно получить скорость потока с помощью уравнения $\eqref{eq7.2}$. Однако, данная формула справедлива только для несжимаемых потоков (т.е. жидкостей, не газов) и при этом зависимость между объемным расходом и отношением давлений является не линейной. Для получения линейной зависимости, необходимо использовать специальный контур обработки сигнала (контур с квадратным корнем, square rooting circuit). Но об этом мы поговорим далее.

Таким образом, в зависимости от типа препятствия, мы можем получить разные типы измерителей расхода.

7.2.2 Орифиметр (Orifice meter, расходомер с сужающим диафрагменным устройством)

Этот тип датчиков представляет собой грубую форму измерителя Вентури, где в трубе установлена диафрагменная пластина (orifice plate), как показано на рис. 7.2.

Примечание. Измеритель Вентури является “точкой отсчета” и основным измерителем данного класса датчиков. Его мы разберем немного позже.

Рис. 7.2. Орифиметр.

Если $d_1$ и $d_2$ диаметр трубы и отверстия в диафрагме (это упругая часть, сужающая диаметр исходной трубы) соответственно, то скорость потока может быть получена согласно уравнению $\eqref{eq7.2}$ при измерении разницы давлений $(p_1 - p_2)$.

Задача 7.1 Рассчитайте массовую скорость потока, если диаметр трубы 0.5 м, диаметр сужения 30 см, а разница давлений составляет 20 Па. Плотность жидкости равна 1 кг/м3.$

7.2.3. Поправки для расчета потока

Рассмотренное ранее выражение для потока $\eqref{eq7.2}$ хоть и связывает интересующие нас величины, но не является достаточно точным для реального применения (подумайте, почему). Для более точных расчетов необходимо использовать поправку в виде коэффициента расхода (discharge coefficient) ($C_d$):

$$ \begin{equation}\begin{aligned} Q = \nu_2 A_2 = \frac{C_d A_2}{\sqrt{1-\beta^4}} \sqrt{\frac{2}{\rho} (p_1 - p_2)} \end{aligned}\end{equation} \tag{7.3}\label{eq7.3} $$

Коэффициент $C_d$ определяется как отношение фактического потока к идеальному и всегда меньше 1. По факту существует 2 основных причины, по которым реальная скорость потока всегда меньше идеальной (которая получена по уравнению $\eqref{eq7.2}$).

Первая - предположение об отсутствия трения для потока не всегда верно. Сумма трений зависит от числа Рейнольдса ($R_D$).
Вторая (более важная) - это то, что реальная минимальная площадь “сжатого” потока не ограничивается отверстием $А_2$, а немного меньше и достигается на некотором расстоянии от диафрагмы (контакт Вена, Vena Contracta). Именно в этой точке необходимо брать давление для расчета, чтобы получить максимальную (и правильную) разность.

Таким образом, нам необходимо использовать поправочный коэффициент $C_d < 1$ для уточнения реальных расчетов.

На самом деле, $C_d$ зависит от $\beta$, также как и от $R_D$. Но было установлено, что для $R_D > 10^4$ поток является полностью турбулентным и зависимостью $C_d$ от $R_D$ можно пренебречь. В таком случае значение $C_d$ обычно варьируется между 0.6 и 0.7.

7.2.4. Падение давления, измеритель Вентури и форсунка в потоке (Venturimeter and Flow nozzle)

Установка рассмотренной ранее сужающей диафрагмы является наиболее распространенным случаем измерения скорости потока. Основным ее достоинством является то, что это дешевое устройство, простое в конструкции и легко устанавливаемое в трубу (рис. 7.3).

Рис. 7.3. Сужающая диафрагма и падение давления.

Обычно, такие диафрагмы - это круглые пластины с отверстием по центру. Врезки для измерения давления обычно делаются на расстоянии $D$ и $0.5 \cdot D$ выше и ниже по потоку от точки замера ($D$ - внутренний диаметр трубы).

Однако основным недостатком использования диафрагменной пластины является понижение давления в трубе (относительно штатного давления среды, рис. 7.3). После установленной диафрагмы давление потока значимо падает и может быть восстановлено лишь частично. Величина снижения давления достигает 40 %. При этом во многих промышленных системах это недопустимо и приводит к большим энергопотерям. Но описанная проблема решается использованием более совершенных конструкций: измерителем Вентури (рис. 7.4) или форсункой в потоке.

Рис. 7.4. Измеритель Вентури (https://en.wikipedia.org/wiki/Venturi_effect).

Конструкция Вентури обеспечивает постепенное изменение давления с последующим его восстановлением. В результате не наблюдается постоянного уменьшения давления в потоке, а коэффициент расхода $C_d$ варьируется между 0.95 и 0.98. Такая конструкция также обеспечивает высокую механическую прочность измерителя. Однако основным недостатком является высокая стоимость устройства.

Компромиссом между диафрагмой и измерителем Вентури является установка форсунки внутри потока (рис. 7.5).

Рис. 7.5. Форсунка в потоке.

В заключении стоит отметить, что при установке любых расходомеров заградительного типа (obstruction type flowmeters) существует несколько специфичных рекомендаций (внимательно читайте инструкцию к каждому конкретному датчику!) и наиболее важной из них является то, что рядом с расходомером не должно быть других препятствий или изгибов трубы. Несмотря на то, что данный тип расходомеров наиболее популярен в промышленности, их точность не велика при низких скоростях/расходах потока (для таких потоков они не рекомендуются).

7.2.5 Измерение расхода сжимаемого потока (газ)

До сих пор мы обсуждали измерения несжимаемых потоков (жидкости). В свою очередь для сжимаемых потоков (газы), скорость обычно измеряется в массовом расходе. Для газов, как и для жидкостей, также могут использоваться расходомеры заградительного типа, но тогда необходимо использование дополнительного корректирующего фактора для учета сжимаемости потока.

Массовый расход газа может быть выражен как:

$$ W = Y [\frac{C_d A_2}{\sqrt{1-\beta^4}} \sqrt{\frac{2g (p_1-p_2)}{\nu_1}}] $$

где,

$\nu = \frac{yRT}{p}$ - удельный объем газа (specific volume) [ $\frac{m^3}{kgf}$],

$y$ - фактор сжатия (compressibility factor),

$R$ - газовая постоянная (gas constant) [$\frac{J}{K \cdot mol}$],

$Y = \frac{Compressible\ flow\ rate\ (mass)}{Incomressible\ flow\ rate\ (mass)} = 1-(0.41+0.35 \beta^4) \frac{p_1-p_2}{p_1} \frac{1}{K}$ - приближенное эмпирическое выражение фактора расширения (используется для диапазона $0.8 \le \frac{p_2}{p_1} \ge 1.0$).

$K = \frac{C_p}{C_v}$ - соотношение удельных теплот (specific heat ration): для постоянного объема ($C_v$) и для постоянного давления ($C_P$). K = 1.66 для идеального одноатомного газа и K = 1.4 для воздуха (приблизительно двухатомный газ).

Все остальные обозначения приведены выше.

7.2.6 Трубка Пито (Pitot Tube)

Трубки Пито широко используются для измерения скорости в самолетах. Ее основной принцип работы и типичная конструкция приведены на рис. 7.6.

Рис. 7.6. Трубка Пито: a) основной принцип действия и b) конструкция.

Если в канал потока поместить твердый объект (blunt object), то скорость потока в точке, расположенной непосредственно перед ним, будет равна 0 (т.е. поток “останавливается” этим объектом). Предположив, что поток несжимаем. Тогда из $\eqref{eq7.1}$ получим:

$$ \frac{p_1}{\gamma} + \frac{\nu_1^2}{2g} = \frac{p_2}{\gamma} + \frac{\nu_2^2}{2g} $$

при $\nu_2 = 0$:

$$ \frac{\nu_1^2}{2g} = \frac{p_2 - p_1}{\gamma} $$

или

$$ \nu_1 = \sqrt{\frac{2g}{\gamma} (p_2 - p_1)} $$

Однако для сжимаемых потоков нужно вносить поправки.

7.2.7 Ротаметр (расходомер с переменной площадью, расходомер постоянного перепада давления)

Диафрагменные измерители, измерители Вентури и сопла (форсунки) работают по принципу переменного давления: площадь препятствия постоянна, а разница давлений меняется при изменении скорости потока. С другой стороны, ротаметр работает при постоянной разнице давлений, но за счет изменяющейся площади.

Такой тип приборов может быть использован только в вертикальной трубе. Его точность меньше по сравнению с другими типами расходомеров (примерно на 2%), но основным его достоинством является простота конструкции и установки. Дополнительно, расход может быть непосредственно виден на калибровочной шкале без помощи какого-либо дополнительного оборудования, а само устройство работает в широком диапазоне изменений расхода (примерно 10:1).

Основная конструкция приведена на рис. 7.7.

c)	Рис. 7.7. Конструкция ротаметра (a, b) и пример его использования (c).

Само устройство состоит из вертикальной трубы, суженой в нижней части. Внутри трубы находиться металлический поплавок цилиндрического типа. Поток течет вверх через зазор между трубой и поплавком. При движении поплавка вниз или вверх происходит изменение зазора, в результате чего изменяется площадь пропускного отверстия. Поплавок остановиться в том случае, когда тяга от падения давления через зазор труба-поплавок (направленная вверх) уравновеситься силой тяжести самого поплавка (направлена вниз). Положение поплавка предварительно калибруется по расходу потока.

Предположим, что:

$\gamma_1$ - удельный вес потока до поплавка (т.е. нормированный на объем или площадь)

$\gamma_2$ - удельный вес потока после поплавка

$\nu_f$ - объем потока

$A_f$ - площадь потока

$A_t$ - площадь сечения трубы при равновесии (в соответствии с калибровочной шкалой)

Тогда из уравнения $eqref{eq7.3}$ для сечения и с учетом несжимаемости жидкости мы имеем:

$$ \begin{equation}\begin{aligned} Q = \frac{C_d A_2}{\sqrt{1-(\frac{A_2}{A_1})^2}} \sqrt{\frac{2g}{\gamma_2} (p_1-p_2)} \end{aligned}\end{equation} \tag{7.4}\label{eq7.4} $$

Положим, $F_d$ - сила, действующая вниз на поплавок, $F_u$ - сила, действующая вверх на поплавок, $W$ - собственный вес поплавка (рис. 7.7).

Тогда при равновесии $W = F_u - F_d$ или

$$ V_f (\gamma_1 - \gamma_2) = p_1 A_f - p_2 A_f $$

$$ p_1 - p_2 = \frac{\nu_f}{A_f} (\gamma_1 - \gamma_2) $$

Подставляя полученное выражение в $\eqref{eq7.4}$ получим:

$$ \begin{equation}\begin{aligned} Q = \frac{C_d (A_t - A_f)}{\sqrt{1-(\frac{A_t - A_f}{A_f})}} [\sqrt{\frac{2g}{\gamma_2} \frac{\nu_f}{A_f} (\gamma_1 - \gamma_2)}] \end{aligned}\end{equation} \tag{7.5}\label{eq7.5} $$

Условие в третьей скобке в приведенном выше выражении - константа. Тогда при $(\frac{A_t-A_f}{A_t})^2 \lt \lt 1$ получим:

$$ Q = K (A_t - A_f) $$

Если труба сделана таким образом, что $A_t$ изменяется линейно со смещением, то у нее есть линейное соотношение в форме,

$$ Q = K_1 + K_2 x $$

То есть, шкала трубки может быть градуированной линейно по скорости потока. В противном случае смещение поплавка может быть преобразовано в электрический сигнал с помощью LVDT или аналогичного типа датчика перемещения. Для измерения больших расходов ротаметр обычно располагается в обходной (bypass) линии.

Основной источник погрешности ротаметра связан с изменением плотности измеряемой среды. Кроме того, наличие вязкости может оказывать дополнительное воздействие на поплавок (вязкость как дополнительная сила воздействия). Для минимизации подобных погрешностей используется особая конструкция поплавка (рис. 7.7)

Стоит учитывать, что устройство поплавка в значительной степени определяется производительностью ротаметра. В общем случае поплавок должен:

быть расположен вертикально;
создавать равномерную турбулентность, чтобы быть нечувствительным к вязкости;
уменьшить чувствительность ротаметра к изменению плотности потока.

В общем случае верхняя часть поплавка имеет острый край и несколько угловых канавок. Жидкость, проходящая через эти канавки, вызывает вращение поплавка и возникающая при этом турбулентность значительно снижает влияние вязкости.

Согласно $\eqref{eq7.5}$ объемный расход среды может быть записан как:

$$ Q = K \sqrt{\frac{2g}{\gamma_2} \frac{\nu_f}{A_f} (\gamma_1 - \gamma_2)} $$

Значения расходомера можно сделать практически независимыми от плотности потока, если правильно выбрать материал поплавка, например такой, что $\gamma_1 >> \gamma_2$. Тогда для измерения массового потока (W), мы можем использовать:

$$ W = \gamma_2 Q = K \sqrt{K_1 (\gamma_1 - \gamma_2) \gamma_2} $$

И условие $\frac{dW}{d \gamma_2} = 0$, выполняется, если $\gamma_1 = \gamma_2$. Этого можно добиться при использовании полого или пластикового поплавка.

7.2.8 Электромагнитные измерители потока (Electromagnetic Flowmeter)

Данный тип расходомеров отличается от остальных сразу по нескольким показателям.

Не создает препятствий для потока.
Выдает линейный выход в виде напряжения.
На выход не влияет давление, температура и вязкость потока.
Может быть измерен обратный поток.
Могут быть измерены малые скорости потока (до $10^{-6}$ m/sec).

Электромагнитные измерители потока подходят для измерения скорости только проводящих (например, ртуть) и слабо проводящих (например, вода) потоков. Основной принцип работы приведен на рис. 7.8.

a)

b)

Рис. 7.8. Электромагнитный измеритель потока: схема (a) и внешний вид (b) (https://en.wikipedia.org/wiki/Magnetic_flow_meter).

Устройство работает по принципу, основанному на электромагнитной индукции. Когда проводник движется в магнитном поле перпендикулярно направлению потока, напряжение будет наведено перпендикулярно направлению движения и перпендикулярно магнитному полю. При этом протекающая жидкость должна действовать как проводник. Внешнее магнитное поле прикладывается перпендикулярно направлению потока, и два электрода крепятся к стенке трубопровода, как показано на рисунке. Тогда наведенное напряжение составит:

$$ e_0 = \frac{B}{\nu} $$

где $l$ - длина проводника (в данном случае диаметр трубы $d$), а $v$ - скорость потока. Вышеприведенное выражение показывает обратную зависимость между наведенным напряжением и скоростью. Однако, применяемое магнитное поле не будет постоянным (DС), если жидкая среда является водой или любой другой поляризуемой жидкостью. Это связано с тем, что если магнитное поле является DC, то наведенное напряжение будет также DC и небольшое количество постоянного тока будет протекать при подключении измерительной цепи к клеммам. Этот небольшой ток вызовет электролиз и образуются пузырьки кислорода и водорода, которые будут прилипать к поверхностям электродов в течение некоторого времени. Это обеспечит изоляционный слой на поверхностях электродов, который нарушит процесс генерирования напряжения. В результате магнитное поле, применяемое для поляризуемых жидкостей должно быть переменным (возбужденное переменным током AC или импульсами постоянного тока).

Сам измеритель может использоваться только для жидкостей с умеренной проводимостью (более 10 мкм/см). В результате он не подходит для газов или жидких углеводородов, а примерная погрешность измерения скорости потока составляет около $\pm 1%$.

7.2.9. Механические счетчики турбинного типа (Turbine type Flowmeter)

Турбинный тип расходомеров - это простой способ измерить скорость потока. Вращающийся вал с угловыми лопастями турбинного типа помещается внутрь трубы. Протекающий поток вызывает вращение турбины и ее скорость вращения пропорциональна скорости потока (рис. 7.9).

Рис. 7.9. Турбинный расходомер.

Пусть лопасти наклонены на угол $\alpha$ к корпусу, то

$$ \frac{\omega_r R}{\overline{vi}} = tan \alpha $$

где,

$\overline{vi}$ - средняя скорость потока ($=\frac{Q}{A}$)

$Q$ - объемный расход

$A$ - эффективное сечение потока в трубе

$R$ - радиус лопастей

$\omega_r$ - угловая скорость лопастей.

Исходя из приведенного уравнения, объемный расход будет связан с угловой скоростью как $\omega_r = k Q$ где $k = \frac{tan \alpha}{RA}$.

При этом скорость вращения турбины может быть измерения разными путями (например, оптическим способом или по вырабатываемому напряжению (inductive pick up) и т.д.). Если на выходе получается частотный сигнал, то количество импульсов будет равно:

$$ n_p = \frac{T_p f}{Q} $$

где,

$n_p$ - количество импульсов на единицу объема;

$T_p$ - временная константа [мин];

$Q$ - объемный расход;

$f$ - частота [Гц].

Задача. Подумайте, в каких случаях может получаться частотный сигнал. Какую можно предложить схему для получения сигнала, связанного со скоростью потока с использованием турбины?

7.2.10 Вихревой расходомер (Vortex type flowmeter)

Образование завихрений в потоке, протекающем через препятствие является обычным явлением (например, обратите внимание на ветку или камень в реке). Однако не всем известно, что частота образования завихрений пропорциональна скорости потока. На рис. 7.10 показано устройство вихревого расходомера.

Рис. 7.10. Вихревой расходомер.

Принцип его работы основан на принципе затенения центра завихрения (principle of vertex shading). При размещении плотного предмета на пути потока образуются вихри. При этом вихри такого рода называются “Вихрь Кармана” (Karman Vortex). Если поток турбулентный и число Рейнольда большое ($R_D > 10^4$), то частота формирования вихрей задается как:

$$ f = \frac{N_{st}}{d} \nu $$

где,

$d$ - ширина плотного объекта [м];

$\nu$ - скорость потока [м/с];

$N_{st}$ - постоянна, называемая числом Струхаля (Strouhal Number.

На рис. 7.10 показана типичная схема измерения частоты образования завихрений ультразвуковым способом. Завихрение будет модулировать интенсивность ультразвука, получаемого приемником. При этом частота модуляции может быть легко измерена и использована для расчета скорости потока.

7.2.11 Заключение

В данной главе мы изучили различные способы измерения потоков в производственных условиях. Вы могли заметить, что большинство техник основаны на заграждающем типе расходомеров. При этом наиболее популярными являются мембранные расходомеры и расходомеры Вентури. Однако им требуются дополнительные преобразователи разницы давлений в соответствующий электрический сигнал, а так же устройства квадратичного преобразования для линеаризации выходящего сигнала (пропорционального расходу жидкости).

С другой стороны существует электромагнитный расходомер, который обеспечивает прямой метод измерения расхода и сам выдает линейный сигнал, пропорциональный расходу напряжение. Дополнительно, он не создает никаких препятствий потоку (а значит и не создает разницы давлений). Но данный метод измерения подходит только для проводящих жидкостей и не может использоваться для газов. Более того, поляризационные жидкости (например, вода) требуют отдельного контура возбуждения и обработки сигнала.

Помимо рассмотренных в настоящей главе существуют и другие типы расходомеров (например, достаточно дорогой, но не инвазивный ультразвуковой расходомер, рис. 7.11). Другим не рассмотренным типом датчиков является расходомер положительного вытеснения (Positive displacement flowmeter) - это интегральный тип расходомера который измеряет суммарный расход потока за заданное время (находит широкое применение в счетчиках воды, бензиновых насосах и т.п.).

Рис. 7.11. Пример ультразвукового расходомера на производстве фосфорной кислоты.

Упражнения

Что имеется в виду под коэффициентом расхода в расходомерах по давлению?
Сравнить преимущества и недостатки диафрагменного расходомера и вентуриметра.
Можно ли использовать ротаметр в горизонтальном трубопроводе? Если нет, то объясните почему.
Магнитное поле, действующее на электромагнитный расходомер, изменяется во времени и не является постоянным. Почему?
У какого типа расходомеров частота измерений изменяется со скоростью потока?
В чем разница между расходомерами с переменным и с постоянным перепадом давления?
Падение давления через отверстие расходомера по давлению измеряется для определенного расхода. Если удвоить расход, сохранив все остальные параметры постоянными, что произойдет с перепадом давления?
- Оно останется неизменным.
- Оно также удвоится.
- Оно уменьшиться вдвое.
- Оно увеличится в четыре раза.
Что будет с показаниями ротаметра, который предназначен для измерения расхода воды, но используется для измерения расхода рассола (удельный вес 1,15) без перекалибровки и изменения шкалы? Уменьшатся или увеличатся его показания? Ответ обоснуйте.

Список литературы

8. Измерение уровня, влажности и рН (Measurement of Level, Humidity and pH)

8.1 Введение и цели

Теперь мы переходим к более сложным параметрам для измерений: уровень жидкости, влажность (влагосодержание) и рН. Эти величины весьма важны для промышленного производства (в особенности - химического). В этой главе мы кратко рассмотрим различные техники, применимые в промышленности, а так же принципы измерения и конструктивные особенности.

По окончанию главы проверьте себя, что вы можете:

Привести различные методы измерения уровня и влагосодержания (moisture).
Объяснить основные техники измерения уровня и влажности (humidity).
Объяснить принцип измерения рН.
Обосновать необходимость использования специальной измерительной схемы для измерения рН.

8.2 Измерение уровня

Существует несколько случаев, когда нам необходимо измерить уровень жидкости в емкостях. В некоторых случаях суть проблемы весьма проста - нужно следить за уровнем воды в резервуаре и тогда достаточно простого механизма поплавкового типа. Но в некоторых случаях емкость может быть герметична, а жидкость - горючей или химически-активной, в результате чего процесс мониторинга усложняется. В зависимости от ситуации, существуют различные методы измерения уровня жидкости:

Поплавкового типа (Float type).
Датчики гидростатического перепада давления (гидростатический уровнемер, Hydrostatic differential pressure gage type).
Емкостной тип (Capacitance type).
Ультразвуковой (Ultrasonic type).
Зондирование радиационным излучением (Radiation technique).

Некоторые из этих датчиков и техник измерения рассмотрены далее.

8.2.1 Гидростатический уровнемер (Hydrostatic Differential Pressure type)

Первый из рассматриваемых типов сенсоров - гидростатический уровнемер. Принцип его работы основан на перепаде давлений между верхним и нижнем уровнем в емкости и выражается уравнением:

$$ p = \rho g h $$

где:

$h$ - высота уровня жидкости, $g$ - сила тяготения, а $\rho$ - плотность жидкости.

Таким образом, поместив два датчика давления внизу и наверху бака, мы можем измерить разность давлений, которая будет зависеть от уровня жидкости (нужна калибровка). Такая схема приведена на рис. 8.1.

Рис. 8.1. Измерение уровня с помощью гидростатической разницы в давлениях.

Примечание. Уровень жидкости в нагревательном котле (drum level of a boiler) обычно измеряется именно таким способом. Однако необходимо проводить аккуратную компенсацию изменения плотности воды с изменением давления и температуры.

8.2.2 Емкостной тип (Capacitance type)

Этот тип датчиков активно применяется в химической и нефтехимический промышленности и может быть использован для широкого диапазона температур (-40 to 200 $^oC$) и давлений (25 to 60 $kg/cm^2$). Для измерений используется цилиндр коаксиального типа (coaxial type cylinder), а емкость измеряется между внутренней и внешней стенками цилиндра (inner rod and the outer cylinder) - рис. 8.2. Общая емкость между двумя такими “клеммами” (terminals) является сумой:

емкости изоляционной втулки (insulating bushing) при пустом баке,
емкости воздуха и паров жидкости,
емкости жидкости.

Рис. 8.2. Емкостной датчик измерения уровня.

Если $C_1$ - общая емкость пустого бака, то емкость с уровнем жидкости $h$ может быть выражена как:

$$ C_i = C_1 + \frac{2 \pi \epsilon_0 (\epsilon_1 - \epsilon_2) h}{ln(\frac{r_2}{r_1})} $$

где $\epsilon_1$ - относительная диэлектрическая проницаемость жидкости (relative permittivity) и $\epsilon_2$ - относительная диэлектрическая проницаемость воздуха и паров жидкости ($\approx 1$ ).

Таким образом у нас имеется линейная зависимость от уровня жидкости. Еще одним преимуществом датчиком данного типа является то, что диэлектрическая проницаемость жидкости слабо зависит от температуры, а само это слабое влияние может быть легко скомпенсировано. При этом изолирующим слоем (внешним цилиндром) может являться и сам бак.

8.2.3 Ультразвуковой тип (Ultrasonic type)

Ультразвуковой метод может быть использован для измерения уровня жидкости в герметичной емкости, а сам принцип измерения аналогичен ультразвуковому измерению скорости потока кратко рассмотренному в главе 7. Пара передатчик/приемник ультразвукового типа размещается на дне резервуара. Генерируемая ультразвуковая волна может проходить через жидкость, но отражается на границе раздела фаз (жидкость-воздух) - рис. 8.3. Измеряется время, затраченное на прием отраженного импульса, которое зависит от уровня жидкости. Для обеспечения точности измерения необходима компенсация изменения скорости ультразвука от плотности (т.е. и температуры) жидкости.

Рис. 8.3. Ультразвуковой измеритель уровня.

8.2.4 Радиационная методика (Radiation technique)

Еще один метод, который мы обошли стороной в главе 7. Этот способ так же используется для измерения уровня жидкости в герметичных емкостях. Принцип работы основан на ослаблении радиоактивных лучей при прохождении через определенную среду (medium). Интенсивность излучения, прошедшего дистанцию $x$ задается уравнением:

$$ I(x) = I_0 e^{-\alpha x} $$

где

$I_0$ - начальная интенсивность (incidental intensity) и $\alpha$ - коэффициент поглощения среды.

Таким образом, если мы знаем $I_0$, и $\alpha$, а также измерили конечную интенсивность, то можно рассчитать $x$.

Могут быть использовано несколько подходов. В первом случае используется поплавок с внутренним радиоактивным источников, который двигается по вертикале в зависимости от уровня жидкости. Приемник в виде счетчика Гейгера-Мюллера (Geiger Muller Counter) при этом располагается на дне резервуара и измеряет интенсивность излучения (рис. 8.4 (а)).

В другом случае используется сборка источник-детектор, который движется по высоте сосуда (рис. 8.4 (б)). Как только блок “источник-детектор” пройдет через границу контакта жидкость-воздух, то сигнал принимаемый детектором сильно изменится. Данный метод часто используется при бутилировании продукции.

Рис. 8.4. Радиационный метод для измерения уровня.

Радиоактивные методы, хотя и основаны на простом принципе, находят ограниченное применение из-за возможной радиационной опасности (radiation hazards). Однако подобные подходы нашли широкое применение для измерения уровня зерен и гранулированных твердых частиц в промышленном производстве.

8.3 Измерение влажности (Humidity Measurement)

Измерение влажности находит широкое применение в различных отраслях обрабатывающей промышленности (например, влагосодержание в окружающем воздухе важно для производства полупроводниковых устройств, оптических волокон и т.д., а влажность продукта при сушке контролируется для текстиля, бумага, зерна и т.п.). Влажность может быть выражена разными способами:

абсолютная влажность (absolute humidity),
относительная влажность (relative humidity),
точка росы (dew point).

8.3.1 Гигрометры (Hygrometer)

Множество гигроскопичных материалов чувствительны к содержанию влаги (например, дерево, волосы, бумага и т.д.). Их размеры изменяются в зависимости от поглощённой влаги, что может использоваться при измерениях с использованием предварительной калибровки.

8.3.2 Психрометры (Psychrometer)

Психрометрический метод - является весьма популярным методом измерения относительной влажности. Для этого используются два термометра - с сухой и влажной колбами (dry bulb and wet bulb). Влажная - насыщена водяным паром, а сухая - находится в окружающих условиях. Разница температур между сухой и влажной колбами используется для расчета относительной влажности с помощью психрометрической диаграммы (любимые инженерами и сотрудниками лабораторий калибровочные таблицы, рис. 8.5).

Рис. 8.5. Типичный психрометр, до сих пор его можно часто увидеть в отечественных лабораториях. Изображение взято с сайта wikipedia.org и распространяется по лицензии CC BY-SA 3.0.

Стоит понимать, что несмотря на приведенный пример, весь процесс может быть полностью автоматизирован.

8.3.3 Измерение точки росы (Dew point measurement)

Суть этого способа заключается в том, что если охлаждать газ при постоянном давлении, то при достижении точки росы начнется конденсация пара. Точка росы может быть измерена, если в атмосферу такого газа поместить чистое стеклянное зеркало (температура которого контролируется и медленно снижается). При достижении температуры точки росы на зеркале начнется конденсация пара, которую можно задетектировать с помощью оптического метода анализа. При этом полученная температура записывается и по ней рассчитывается влажность окружающей среды.

8.3.4 Метод измерения по проводимости/емкости (Conductance/Capacitance method of measurement)

Многие твердые тела поглощают влагу из окружающей среды (влагосодержание, moisture) и их значения проводимости или емкости изменяются.

Пример. Содержание влаги в гранулах изменяет емкость между двумя электродами, помещенными внутрь. Таким образом, измеряя емкость, может быть рассчитана влажность гранул. Аналогичным образом, содержание влаги в бумаге и текстиле изменяет их сопротивление.

Схема измерения содержания влаги в материале детектора с помощью резистивного моста (Resistance Bridge) показана на рис. 8.6.

Рис. 8.6. Измерение влагосодержания по проводимости материала.

8.3.5 Инфракрасное измерение (Infrared Technique)

Данный подход основан на прямом взаимодействии с молекулами воды. Эти молекулы присутствуют практически в любом материале и могут активно поглощать инфракрасное излучение с длинами волн 1,94; 2,95 и 6,2 мкм. Степень поглощения на любой из этих длин волн будет связана с количеством молекул воды в измеряемом материале (однако, измерение будет происходить на поверхности).

Данный метод находит все более широкое применение в аналитической практике и автоматизированном контроле. Однако его описание выходит за рамки настоящего пособия.

8.4 Измерение рН (Measurement of pH)

рН - мера содержания ионов водорода в растворе (другими словами - кислотность раствора). Это важный параметр, определяющий общее качество жидкости, в том числе воды. рН выражается как:

$$ pH = \frac{1}{log_{10}C} $$

где $C$ - концентрация ионов $H^+$ в растворе [моль/л].

В чистой (деионизованной) воде концентрация ионов $H^+$ составляет $10^{-7}$ $\dfrac{моль}{л}$ при $25^oC$. Таким образом рН:

$$ pH = \frac{1}{log_{10}10^{-7}} = 7 $$

Преимущества использования шкалы рН состоит в том, что активность (т.е. сила) всех сильных и слабых кислот и оснований может быть сведена к шкале 0-14. Значение рН кислых растворов (acidic solutions) находится в диапазоне 0-7, а щелочных (alkaline solutions) - в диапазоне 7-14.

Значение рН растворов измеряют с помощью рН-метров. Они обычно состоят из пары электродов (могут выполняться в одном корпусе): измерительного (measuring) и электрода сравнения (reference) (оба погружаются в измеряемый раствор). Эти два электрода по существу образуют две половины электрохимической ячейки общий потенциал которой складывается из потенциалов этих половин. В то время как потенциал электрода сравнения постоянный, потенциал измерительного электрода зависит от концентрации гидрид-ионов и выражается уравнением Нернста (Nernst’s equation):

$$ E = E_0 + \frac{RT}{nF} ln(\alpha C) $$

где:

$E$ - электродный потенциал (e.m.f. of the half cell) [В];

$E_0$ - стандартный электродный потенциал (при стандартных условиях, emf of the half cell under saturated condition) [В];

$R$ - газовая постоянная ($8.314 \frac{Дж}{\text{моль К}}$);

$T$ - абсолютная температура (K);

$N$ - валентность иона (количество электронов, участвующих в реакции);

$F$ - постоянная Фарадея (Faraday Constant, $96485.33 \frac{Кл}{моль}$);

$\alpha$ - коэффициент активности (Activity coefficient, $0 \le \alpha \le 1$); для очень разбавленных растворов (very dilute solution), $\alpha \to 1$);

$C$ - молярная концентрация ионов (molar concentration of ions) [$\frac{моль}{л}$].

8.4.1 Электроды для измерения pH (Measuring and reference Electrodes)

Как отмечалось выше, для измерения рН в общем случае используется 2 электрода: измерительный и электрод сравнения.

Измерительный электрод изготавливается из тонкого селективного к $H^+$ стекла с ионами натрия. При погружении в водный раствор на поверхностях такой стеклянной колбы образуется потенциал, который чувствителен к концентрации ионов $H^+$ (чувствительность $59.2 \frac{m v}{pH}$ at $25^o C$). Буферный раствор внутри электрода имеет постоянную концентрацию ионов $H^+$ и обеспечивает электрическое соединение с выводным проводом.

В свою очередь основным назначением электрода сравнения является обеспечение непрерывности электрической цепи, т.к. потенциал не может быть измерен абсолютно (требуется измерить его относительно чего-то). При погружении измерительного и сравнительного электрода в ячейку потенциал измеряется между их проводами. Электрическое соединение электрода сравнения со средой поддерживается через солевой мостик. При этом электрод сравнения должен удовлетворят следующим основным требованиям:

Развиваемый потенциал должен быть независим от концентрации ионов $H^+$.
Потенциал не должен зависеть от температуры.
Потенциал не должен меняться во времени.

Учитывая данные требования обычно используют два типа электродов сравнения: каломельный ($Hg - HgCl_2$) и хлор-серебряный ($Ag-AgCl_2$).

Устройство электродов приведено на рис. 8.7.

Рис. 8.7. Измерительный электрод (a) и каломельный электрод сравнения (b).

Как отмечалось выше, иногда измерительный электрод и электрод сравнения могут быть изготовлены в одном корпусе (рис. 8.8).

Рис. 8.8. Комбинированный рН электрод.

Такой тип электродов называется комбинированным. В таком случае используется хлор-серебряный электрод сравнения.

8.4.2 Схема измерения (Measuring scheme)

Чувствительность рН электрода составляет около $59.2 \text{ мВ/pH}$ при $25^o C$. Этой чувствительности должно быть достаточно для измерения напряжения с помощью обычного вольтметра. Однако за счет наличия стеклянной мембраны между проводниками внутреннее сопротивление датчика рН очень велико (порядка $10^8 - 10^9 \Omega$) и в результате выходное сопротивление измерительного прибора должно быть как минимум в 10 раз больше сопротивления ячейки, что тяжело осуществимо в реальных условиях. Поэтому требуются специальные измерительные схемы.

Для усиления напряжения с электродов обычно используют усилительные цепи с транзисторами эффекта поля (FET-input amplifier circuits). Кроме того, сопротивление изоляции между выводами также должно быть очень высоким и для этого их обычно снабжают влагостойким изоляционным покрытием.

Примечание. Напряжение в pH-метре зависит от температуры (как видно из уравнения Нернста). Поэтому в измерительной схеме должна быть также предусмотрена подходящая схема температурной компенсации (вспоминаем измерительные мосты).

8.5 Вопросы для проверки

Как бы вы измерили уровень жидкости в герметичном резервуаре? Приведите схему любого из методов.
Назовите различные способы, используемые для измерения уровня жидкости. Объяснить принцип работы гидростатического манометра перепада давления.
Назовите несколько примеров, когда измерение влажности/влагосодержания (humidity / moisture) находит применение в промышленности.
Как можно измерить содержание влаги в твердых телах? Приведите пример и покажите схему.
Как можно определить pH раствора. Какова концентрация ионов водорода в растворе, если рН раствора 5,0?
С использованием схем объясните конструкцию измерительного и эталонного электродов. Почему для измерения pH требуется два электрода?
Почему при измерении рН должна быть предусмотрена схема температурной компенсации?
Какие специальные схемы должны быть предусмотрены для усиления напряжения, генерируемого рН-электродом? Обоснуйте.

8.6 Список литературы

9. Цепи передачи сигнала (Signal Conditioning Circuits)

9.1 Введение и цели

В данной заключительной главе мы подведем небольшой логический итог работы со всеми возможными датчиками, рассмотрев как передается и измеряется электрический сигнал, который мы получаем на выходе из 99% сенсоров. Как уже отмечалось ранее измерительная система состоит из 3 основных блоков:

чувствительный элемент (sensing element),
элемент, передающий сигнал (signal conditioning element),
элемент, обрабатывающий (формирующий) сигнал (signal processing element) (рис. 9.1)

Примечание. Для лучшего понимания, предлагаю освежить материал из главы 2.

Рис. 9.1. Основные элементы измерительной системы.

Чувствительный элемент преобразует не электрический сигнал (например температуру) в электрический (например напряжение, ток, сопротивление, емкость и т.д.).

Работа передающего сигнал элемента заключается в преобразовании различных форм электрических сигналов в напряжение (с уровнем, достаточным для дальнейшей обработки).

Следующим идет элемент, обрабатывающий сигнал. Он принимает выходящий от передающего элемента сигнал и преобразует его в более удобную форму для дальнейшего отображения/обработки (индикация, запись, управление обратной связью и др.). Например, к подобным преобразователям относятся: АЦП (аналого-цифровой преобразователь, Analog-to-digital converters, AD), цепи линеаризации (linearization circuits), измерительные мосты и др..

Успех в проектировании любой измерительной системы для сенсора в значительной степени зависит от конструкции и характеристик применяемых цепей обработки сигнала (signal conditioning circuits). Даже дорогостоящий и точный преобразователь может не обеспечить хороших эксплуатационных характеристик, если схема обработки сигнала спроектирована неверно. Схемы расположения и выбора пассивных и активных элементов данной цепи в значительной степени влияют на характеристики всей измерительной системы. Часто цепь обработки сигнала определяется выходным сигналом чувствительного элемента и в настоящее время многие коммерческие датчики имеют встроенную схему обработки сигнала. Такая компоновка помогает решить проблему несовместимости чувствительного элемента и цепи формирования (обработки) сигнала.

Если посмотреть на различные поперечные сечения чувствительных элементов и изучить схемы формирования сигнала, то можно заметить, что большинство из них используют стандартные блоки, такие как мосты (AC и DC bridges), усилители (amplifiers), фильтры (filters) и фазовые чувствительные детекторы (phase sensitive detectors) для формирования сигнала. В этой главе мы сконцентрируемся в основном на мостах и усилителях и поразмышляем над общими вопросами проектирования.

После изучения главы нужно уметь:

Определить различные блоки измерительной системы и объяснить назначение каждого блока.
Спроектировать несбалансированный измерительный мост (unbalanced Wheatstone bridge) и определить его чувствительность и другие параметры.
Объяснить преимущества использования конфигурации “push-pull” (двухтактную) в несбалансированных мостах AC и DC.
Дать определение CMRR усилителю и объяснить принцип его действия для усиления дифференциального сигнала (differential signal).
Сравнить характеристики одиночных входных усилителей (инвертирующих и не инвертирующих) (single input amplifiers (inverting and non-inverting)) с точки зрения усиления и входного импеданса.
Рассчитать выражение коэффициента усиления three-op.amp. instrumentation amplifier.

9.2 Несбалансированный мост постоянного тока (Unbalanced D.C. Bridge)

На данный момент мы чаще сталкивались со сбалансированным измерительным мостом (мост Уитстона, Wheatstone bridge), чем с его аналогом - не сбалансированными. Там не менее, последний получил широкое распространение в области приборостроения. Для иллюстрации несбалансированного DC моста рассмотрим схему на рис. 9.2.

Рис. 9.2. Несбалансированный мост постоянного тока.

Допустим, переменная сопротивление ($R_2 = R(1+x)$) - это сенсор, чье сопротивление меняется в зависимости от производственных параметров. Тогда $e_0$ - выходящее напряжение, которое будет изменяться пропорционально сопротивлению сенсора $x$ ($= \frac{\Delta R}{R}$). При этом $p$ - плечевое отношение (arm ratio) для моста, а $E$ - напряжение возбуждения.

Тогда,

$$ e_0 = [\frac{R(1+x)}{pR + R(1+x)} - \frac{R}{pR+R}]E = \frac{px}{(p+1+x)(p+1)} E $$

Исходя из приведенной формулы можно сделать несколько выводов:

Зависимость $e_0$ VS $x$ нелинейна (поскольку $x$ представлен и в числителе и в знаменателе).
Максимальная чувствительность моста может быть достигнута для плечевого отношения $p = 1$.

Вышеизложенное может быть проверено путем дифференцирования $e_0$ относительно $p$ и путем сравнения с 0 (это стандартная процедура поиска экстремума).

$$ \frac{de_0}{dp}=0 $$

получаем,

$$ x(p+1+x)(p+1)-px(2p+2+x) = 0 $$

или

$$ p^2 = 1 + x $$

т.е. $p = \sqrt{1+x} \approx 1$, для малых $x$.
Нелинейность моста уменьшается с возрастанием плечевого отношения $p$, но при этом уменьшается чувствительность.

Этот факт может быть проверен путем построения графика $\frac{e_0}{E}$ vs. $x$ для различных $p$ (рис. 9.3).

Рис. 9.3. Характеристики моста для разных плечевых отношений.
Для единичного плечевого отношения (коэффициент рычага) ($p=1$) и для малых $x$, мы можем получить приблизительно линейную связь

$$ \begin{equation}\begin{aligned} e+0 = \frac{x}{4} E \end{aligned}\end{equation} \tag{9.1}\label{eq9.1} $$
Как было показано в п.2, максимальная чувствительность моста достигается при плечевом отношении $p = 1$. Вместо того, что бы выравнять все сопротивления $R_1$, $R_2$, $R_3$, $R_4$ (сбалансированная схема), данное плечевое отношение может быть достигнуто и путем выбора различных сопротивлений. Их нужно выбирать так, чтобы $R_1 = R_2$, $R_3 = R_4$ для $x = 0$. Однако в большинстве случаев делать это не целесообразно, поскольку выходной импеданс (сопротивление) моста будет выше. Исходя из требования низкого выходного сопротивления элемента, формирующего сигнал, лучше спроектировать основной мост со всеми равными сопротивлениями.
Из вышеприведенных рассуждений может показаться, что нет никаких ограничений на выбор возбуждающего напряжения для моста. Более того, казалось бы чем больше входное напряжение, тем больше чувствительность для выходного напряжения. Однако ограничение на входное напряжение связано с допустимым рассеянием мощности на резисторах. Если мы повышаем входное $E$, это вызовет бОльшую потерю мощности на элементах сопротивления. А если потеря мощности превысит допустимый порог рассеяния, то произойдет самонагрев (self heating) резисторов и сенсора. В этом случае опять произойдет повышение температуры на резисторе, что опять изменит сопротивление и потерю мощности (цепная реакция). Зачастую это приводит к необратимому повреждению датчика (сгорит).

Двухконтактная схема (Push-Pull configuration)

Характеристики несбалансированного измерительного моста с одним элементом сопротивления на плече могут быть значимо улучшены с использованием двухконтактной схемы. Данная схема состоит из двух одинаковых элементов сопротивления в соседних плечах: пока сопротивление датчика падает, сопротивление на другом датчике возрастает на ту же величину (рис. 9.4).

Рис. 9.4. Несбалансированный мост постоянного тока с "push-pull" конфигурацией.

Несбалансированное напряжение может быть рассчитано как:

$$ e_0 = [\frac{R(1+x)}{R(1+x)+R(1-x)} - \frac{R}{2R}]E = [\frac{1+x}{2} - \frac{1}{2}]E = \frac{x}{2}E $$

Исходя из приведенного выражения можно заметить преимущества предложенной схемы. Во-первых, нелинейность моста может быть полностью устранена. Во-вторых, чувствительность увеличивается в 2 раза по сравнению с мостом с одним сенсором. Подобное решение может быть использовано и для AC мостов с индуктивными или емкостными сенсорами. Подобное применение описано ниже.

9.3 Насбалансированный мост переменного напряжения с двухконтактной схемой (Unbalanced A.C. Bridge with Push-Pull configuration)

На рис. 9.5 приведена схема несбалансированного двухконтактного АС моста с индуктивными или емкостными датчиками. Здесь возбуждающий DC сигнал заменен на источник AC и два одинаковых фиксированных сопротивления (расположенных на соседних плечах). При этом индуктивные (или емкостные) сенсоры расположены таким образом, что при увеличении одной индуктивности (емкости) другая уменьшается на такое же количество.

Рис. 9.5. Насбалансированный мост переменного напряжения с "push-pull" конфигурацией для a) индуктивного сенсора и b) для емкостного сенсора.

Для рис. 9.5(a),

$$ e_0 = [\frac{jwL(1+x)}{jwL(1+x) + jwL(1-x)} - \frac{R}{2R}]E $$

где $\omega$ - угловая частота возбуждения (angular frequency of excitation), $L$ - номинальное значение индуктивности и $x = \frac{\Delta L}{L}$.

Упростив выражение, получим доказательство линейных характеристик измерительного моста:

$$ \begin{equation}\begin{aligned} e_0 = \frac{x}{2}E \end{aligned}\end{equation} \tag{9.2}\label{eq9.2} $$

Для емкостного датчика (рис. 9.5(б)):

$$ \begin{equation}\begin{aligned} e_0 = [\frac{\frac{1}{jwC(1+x)}}{\frac{1}{jwC(1+x)} + \frac{1}{jwC(1-x)}} - \frac{R}{2r}]E =\\ [\frac{jwC(1-x)}{jwC(1+x) + jwC(1-x)} - \frac{R}{2R}]E = -\frac{x}{2} E \end{aligned}\end{equation} \tag{9.3}\label{eq9.3} $$

где $x = \frac{\Delta C}{C}$.

Как и ожидалось, здесь также получены линейные характеристики (вне зависимости от значения $x$). Но есть небольшое отличие от предыдущего выражения ($\eqref{9.2}$ и $\eqref{9.3}$) - отрицательный знак. Этот отрицательный знак для АС моста показывает, что выходящее напряжение на рис. 9.4(б) будет на $180^o$ в противофазе со входящим напряжением $E$. Однако мы не сможем обнаружить эту разницу, если будем использовать простой АС вольтметр для измерения выходящего напряжения. Фактически, если бы значение $x$ само было отрицательным, то это вызвало бы аналогичный эффект сдвига фаз, который мы не смогли бы обнаружить без специального оборудования для определения фазы.

Описанный тип схемы называется фазочувствительным устройством (PSD) и оно часто используется в сочетании с индуктивными и емкостными датчиками. Цепь PSD выпрямляет небольшое AC напряжение в DC. При этом полярность выходного напряжения в DC меняется на противоположную (имеет место смена фазы).

Емкостной усилитель (Capacitance Amplifier)

Здесь приводиться другая конфигурация, приемлемая для емкостной двухконтурной схемы с сенсором. Сама схема может быть определена как полумост и ее типичная конфигурация приведена на рис. 9.6.

Рис. 9.6. Емкостной усилитель (сенсор отмечен как подстраиваемая емкость).

В схеме последовательно соединены два идентичных источника напряжения с общим заземлением. Такой же эффект может быть достигнут с помощью трансформатора с центральным заземлением. Два сенсора-конденсатора $C_1$ и $C_2$ соединены, как показано на рис. 9.5. При этом несимметричный ток проходит через цепь усилителя с конденсатором обратной связи $C_f$. Тогда переменный ток через конденсаторы:

$$ I_1 = VjwC_1 $$

$$ I_2 = -VjwC_2 $$

Несбалансированный ток составит:

$$ I = I_1 + I_2 = Vjw(C_1 - C_2) $$

Выходящее напряжения от усилителя:

$$ V_0 = -\frac{I}{jwC_f} = -\frac{C_1 - C_2}{C_f} V $$

Таким образом мы получили линейный отклик. При этом его также можно получить, подключив конфигурацию “push-pull” емкостного сопротивления (рис. 9.6). Усиление схемы может быть скорректировано с помощью переменной величины $C_f$.

Стоит понимать однако, что мы рассмотрели идеальную схему. Для реальной схемы высокое сопротивление должно быть расположено параллельно с $C_f$.

9.4 Усилители (Amplifiers)

Усилитель является неотъемлемой частью любой схемы формирования сигнала. При этом существуют различные конфигурации усилителей и нужно уметь выбирать подходящую схему в зависимости от типа задач.

9.4.1 Инвертирующий и не инвертирующий усилители (Inverting and Non-inverting Amplifiers)

Эти два типа усилителей представляют собой устройства с одним выходом (при этом один из входов заземлен). Из схем этих двух популярных усилителей, показанных на рис. 9.7, видно, что коэффициент усиления по напряжению для инвертирующего усилителя:

$$ \frac{e_0}{e_i} = - \frac{R_2}{R_1} $$

Тогда как коэффициент от не инвертирующего усилителя:

$$ \frac{e_0}{e_i} = 1 + \frac{R_2}{R_1} $$

Рис. 9.7. Инвертирующий усилитель (a) и не инвертирующий усилитель (b).

Очевидно, что оба усилителя способны обеспечить любое желаемое усиление по напряжению (при условии, что фазовая инверсия не представляет проблемы для первого случая). Но в приведенных схемам можно заметить, что входное сопротивление инвертирующего усилителя конечное и составляет примерно $R_1$, в то время как не инвертирующий усилитель имеет бесконечное входное сопротивление.

Определенно, второй усилитель будет работать лучше, если мы хотим чтобы усилитель не загружал датчик (или мостовую схему).

9.4.2 Дифференциальный усилитель (Differential Amplifier)

Дифференциальный усилитель — электронный усилитель с двумя входами, выходной сигнал которого равен разности входных напряжений, умноженной на константу. Применяется в случаях, когда необходимо выделить небольшую разность напряжений на фоне значительной синфазной составляющей. Такие усилители полезны в тех случаях, когда обе входные клеммы являются инвертирующими, а сами усилители находят широкое применение в приборостроении. Типичный дифференциальный усилитель с одиночной конфигурацией усилителя (single op.amp. configuration) показан на рис. 9.8.

Рис. 9.8. Дифференциальный усилитель.

Применяя теорему о суперпозиции (superposition theorem), можно получить вклад каждого входа и добавить их алгебраически, чтобы получить выходное напряжение в виде:

$$ e_0 = \frac{R_4}{R_3 + R_4} (1+\frac{R_2}{R_1}) e_2 - \frac{R_2}{R_1} e_1 $$

Если мы выберем сопротивления таким образом, что $\frac{R_4}{R_3} = \frac{R_2}{R_1}$, то выходящее напряжение будет:

$$ \begin{equation} \begin{aligned} e_0 = \frac{R_2}{R_1} (e_2-e_1) \end{aligned}\end{equation} \tag{9.4}\label{eq9.4} $$

Однако такой тип дифференциального усилителя (с одним операционным усилителем, single op. amp.) также страдает от ограничения предельного входного сопротивления. Фактически, для оценки характеристик усилителя используется несколько критериев:

смещение и дрейф (offset and drift),
входной импеданс (input impedance),
усиление и пропускная способность (gain and bandwidth),
коэффициент отклонения общего режима (common mode rejection ratio, CMRR).

Эксплуатационные характеристики операционного усилителя оцениваются по коэффициенту усиления в полосе пропускания (который указывается в спецификации производителя). В разомкнутом контуре коэффициент усиления очень высок (около $10^5$), но полоса пропускания очень мала. В замкнутом контуре коэффициент усиления низкий, но достижимая ширина полосы пропускания высока. Обычно коэффициент усиления в однокаскадной операционной схеме усилителя (single stage operational amplifier circuit) ограничен примерно 10, поэтому достижима большАя ширина полосы пропускания. При этом для достижения бОльшего усиления можно объединять несколько усилителей в каскад (cascade).

Коэффициент CMRR является очень важным параметром для КИПиА (instrumentation circuit applications). Желательно использовать усилители с высокой CMRR при подключении к измерительным схемам. Сам коэффиуиент CMRR определяется как:

$$ CMRR = 20 log_{10}\frac{A_d}{A_c} $$

где:

$A_d$ это дифференциальное модовое усиление (differential mode gain), а $A_c$ это общее модовое усиление (common mode gain) усилителя.

Важность использования усилителя с высокой CMRR можно объяснить следующим примером:

Пример. Несбалансированное напряжение измерительного моста по сопротивлению должно быть усилено в 200 раз с помощью дифференциального усилителя. Конфигурация показана на рис. 9.9 с $R = 1000 \Omega$ и $x = 2 \times 10^{-3} \Omega$. Имеются два усилителя: один с $A_d = 200$ и $CMRR = 80 дБ$, а другой с $A_d = 200$ и $CMRR = 60 дБ$. Найдите значения $V_0$ для обоих случаев и вычислите ошибки.

Рис. 9.9. Измерительная схема к задаче.

Решение

Здесь $x = 2 \times 10^{-3} \Omega$. Используя $\eqref{9.1}$,

$$e_i = \frac{x}{4} x 10 = 5 mv = v_d$$

Общая мода напряжения для усилителя $v_c = 5 V$ (половина напряжения питания). Для усилителя 1: $A_d = 200$, $20 log \frac{A_d}{A_c}=80 dB$

Тогда, $\frac{A_d}{A_c} = 10^4$, или, $A_c = \frac{200}{10^4}=0.02$.

Таким образом, $v_0 = A_d v_d + A_c v_c = 200 \times 5 \times 10^{-3} + 0.02 \times 5 = 1.1 V$

В идеале, напряжение должно составлять 1.0 V для усиленного в 200 раз исходного сигнала (в случае несбалансированого моста). Однако из-за присутствия мостового несбалансированного напряжения достигается ошибка в 10%.

Во втором случае, CMRR составляет 60 dB (все остальное остается таким же). В данном случае $A_c = \frac{200}{10^3} = 0.2$ Таким образом,

$v_0 = A_d v_d + A_c v_c = 100 \times 5 \times 10^{-3} + 0.2 \times 5 = 2.0 V$

И рассчитанная погрешность в 100% появляется из-за общего напряжения!

Ссылаясь на рис. 9.8, при условии что операционный усилитель идеальный и сопротивление выбрано таким, что $\frac{R_4}{R_3} = \frac{R_2}{R_1}$ мы можем полностью устранить влияние общего напряжения (видно из примера $eqref{9.4}$). Однако если значения сопротивлений отличаются (например, из-за допусков резисторов), то общее напряжение приведет к большОй ошибке в усиленном выходном напряжении. Альтернативой рассмотренной схеме в приведенном выше примере является применение на клеммах мостового питания (bridge supply terminals) +5 и -5В, вместо +10 В и 0 В.

9.4.3 Измерительный усилитель (Instrumentation Amplifier)

Часто в приборостроении необходимо усиливать небольшое дифференциальное напряжение в несколько сотен раз. Одноступенчатый дифференциальный усилитель (рис. 9.8) не способен эффективно выполнять эту работу по нескольким причинам:

Входной импеданс конечен. Более того, достижимое усиление в однокаскадном усилителе ограничено из-за полосы пропускания.
Из-за ограничений, связанных со смещением тока в операционном усилителе.

Улучшенной версией рассмотренного ранее однокаскадного усилителя является инструментальный усилитель из 3 операционных усилителей (three op. amp. Instrumentation amplifier, а рис. 9.10).

Рис. 9.10. Инструментальный усилитель, состоящий из 3 операционных усилителей.

Основные свойства:

высокое дифференциальное усиление (регулируемое до 1000);
бесконечный входной импеданс;
большой коэффициент CMRR (80 дБ и более);
умеренная полоса пропускания.

Из рис. 9.10 видно, что входной каскад операционного усилителя не заглушает ток (поскольку вход подается на не инвертирующие входные клеммы). Таким образом, достигается второе свойство, упомянутое выше. Если посмотреть на входной каскад, то через сопротивления $R_1$ и $R_2$ протекает тот же самый входной ток $I$. Используя свойства идеального операционного усилителя, мы можем получить ток:

$$ I = \frac{e_1 - e_{i1}}{R_1} = \frac{e_{i1}-e_{i2}}{R_2} = \frac{e_{i2} - e_2}{R_1} $$

Далее мы получим напряжение

$$ e_1 = e_{i1} + \frac{R_1}{R_2} (e_{i1} - e_{i2}) $$

$$ e_2 = e_{i2} - \frac{R_1}{R_2} (e_{i1} - e{i2}) $$

Таким образом,

$$ e_1 - e_2 = (1+\frac{2R_1}{R_2})(e_{i1} - e{i2}) $$

Следующий (второй) каскад инструментального усилителя является простым дифференциальным усилителем, и, следовательно, используя $\eqref{9.4}$ по всему коэффициенту усиления:

$$ e_0 = \frac{R_4}{R_3}(e_2-e_1) = \frac{R_4}{R_3}(1+\frac{2R_1}{R_2})(e_{i2}-e_{i1}) $$

Таким образом, варьируя $R_2$ можно получить очень большой выигрыш (но соотношение обратное). При этом полоса пропускания не страдает (так как за усиление отвечают три операционных усилителя).

Примечание. На рынке представлено множество коммерчески доступных одночиповых инструментальных усилителей. Их коэффициент усиления можно настроить, подключив внешнее сопротивление или выбрав коэффициент усиления (50, 100 или 500) через перемычку.

9.5 Заключение

При проектировании схемы формирования сигнала необходимо учитывать несколько моментов. Линейность, чувствительность, эффект загрузки, ширина полосы пропускания, отклонение общего режима (Linearity, sensitivity, loading effect, bandwidth, common mode rejection) - важные вопросы, влияющие на работу схем формирования сигнала. В этом уроке мы узнали о различных конфигурациях несбалансированных мостов постоянного и переменного тока, подходящих для резистивных, емкостных преобразователей и преобразователей индуктивного типа. Кроме характеристик различных типов усилителей, использование общих операционных усилителей было также подробно рассмотрены. Однако реальная конструкция зависит от конкретного используемого сенсорного элемента и его характеристик.

Несколько других типов схем формирования сигнала (например, фазовый чувствительный детектор, фильтры и многие другие) были оставлены без внимания в ходе обсуждения (добавить).

9.6 Вопросы для проверки

Медный детектор температурного сопротивления имеет сопротивление $100 \Omega$ при $0^o C$. Коэффициент температурного сопротивления меди составляет $\frac{0.00427}{^oC}$ при $0^o C$. Чувствительный элемент помещен в несбалансированный измерительный мост как показано на рис. 9.2, остальные плечи имеют фиксированное сопротивление по $100 \Omega$. Постройте зависимость несбалансированного напряжения от температуры для диапазона температуры от $0^o C$ до $100^o C$, если напряжение возбуждения $E = 2V$. Являются ли характеристики линейными или нелинейными? Обоснуйте свой ответ.
Объясните преимущество использования схемы “push-pull” в мостовой схеме.
Для какого плечевого отношения достигается максимальная чувствительность несбалансированного измерительного моста?
Не инвертирующий усилитель обеспечивает более высокий входной импеданс измерительной схемы по сравнению с инвертирующим усилителем - обоснуйте это.
Дайте определение коэффициента CMRR операционного усилителя. Почему важен его учет при проектировании измерительной системы?
Разработайте дифференциальный усилитель с коэффициентом усиления 10 и нарисуйте его схему.
Приведите основные особенности инструментального усилителя.
Схема дифференциального усилителя, показанная на рис. 9.8, имеет сопротивления: $R_1 = 10K$, $R_2 = 100 K$, $R_3 = 11 K$ и $R_4 = 100 K$. Допустим, операционный усилитель является идеальным, найдите коэффициент CMRR усилителя.
Простая схема усилителя емкости показана на рисунке 9.11. $C_1$ представляет собой емкостный датчик, номинальное значение которого составляет 50 пФ. $C_2$ - фиксированный конденсатор 25 пФ. Найдите выходное напряжение при синусоидальном напряжении возбуждения 1В с пиком на частоте 1 кГц предположив, что операционный усилитель является идеальным.

Рис. 9.11 Задача 9.1.

9.7 Ссылки на источники

10. Заключение

В заключение этой небольшой статьи-пособия хочется подвести небольшой итог по рассмотренным темам. Были кратко исследованы и описаны следующие основные разделы:

Архитектура систем промышленной автоматизации - были описаны и исследованы все основные уровни принятия решения в промышленном производстве. Описана последовательность передачи сигнала внутри сенсоров, актуаторов, ПЛК и АСУТП. Приведен пример технического задания на разработку системы АСУТП по управлению цехом холодной прокатки стали.
Основные характеристики измерительных систем - приведен ряд статических и динамических характеристик измерительных систем (наши сенсоры). Дан краткий экскурс в погрешности, статистику, разрешающую способность и калибровку. Рассмотрены понятия передаточной функции, преобразования Лапласа, амплитудно-частотных характеристик и примеры использования данных понятий для описания работы сенсорных систем.
Сенсоры для измерения температуры - приведены примеры работы нескольких типов температурных сенсоров: термометры на основе сопротивления (RTD, термисторы) и термопары.
Сенсоры для измерения давления и силы - рассмотрена работа измерителей давления мембранного типа, мехов и трубок Бордона. Приведены различные способы измерения силы: тензодатчики, нагрузочная ячейка, удостоверяющее кольцо и кантиливерная балка.
Сенсоры для измерения скорости и смещения - измерение смещения с помощью потенциометров, линейного дифференциального трансформатора, индуктивных датчиков, ротационного дифференциального трансформатора с переменной величиной, ресольвера, датчиков емкости, оптических датчиков. Кроме того приведены примеры измерения скорости с помощью оптического и индуктивного метода.
Сенсоры для измерения потока - расходомеры по давлению (Вентури, орифиметр, вихревые и т.д.).
Сенсоры измерения уровня, влажности и Ph.

Кроме этого кратко были рассмотрены цепи передачи сигналов от сенсоров к системам автоматизации. Приведены их общие схемы и пару задач на расчет ключевых характеристик. Не обошлось и без вводного раздела с основными определениями и так любой инженерами концепции “черного ящика”. Описаны ключевые типы промышленных систем и систем автоматизации.

Надеюсь в рамках этого пособия в сон не клонило и прочитанный материал оказался полезен и интересен. В относительно ближайшее время попробую написать методичку по этому курсу и более подробно и физически-обоснованно раскрыть очень практическую и интересную тему работы автоматизированных систем неразрушающего контроля в промышленном производстве.

Буду рад любым замечаниям и предложениям по данному курсу!

Проектная деятельность

2018-12-09T00:00:00+03:00

Данная небольшая заметка относится к набору моих курсов для студентов Череповецкого Государственного Университета (ЧГУ). В рамках данной заметки раскрывается материал следующих дисциплин по учебному плану:

управление проектной деятельностью;
менеджмент проектов;
проектная деятельность;
управление инновационными проектами;
инженерное лидерство.

Все, кому это актуально или интересно - рад приветствовать!

1. Введение. Цели и задачи

Причина, по которой в рамках данной заметки собрано так много “различных” дисциплин учебного процесса проста. Их общая и основная ЦЕЛЬ - дать вам представление о проектной деятельности, ее методах, целях, задачах и показать реальные примеры этой деятельности. А потому, все они объединены в данный общий модуль. Тоже относиться и к инженерному лидерству - можете считать себя лидером, если смогли успешно реализовать собственный проект и работать с группой людей. Да и в рамках каждой из этих дисциплин мы изучаем по сути одни и те же подходы, но с разным уклонов в теоретическую или практическую область. Поэтому, по моему мнению, будет не лишним в рамках каждой из этих дисциплин заново “проходить” весь приведенный здесь материал, там самым закрепляя его (но с разным практическим уклоном и тестовыми заданиям).

Наши основные задачи:

познакомиться с проектной культурой и ее принципами;
проанализировать и изучить систему управления проектами;
отработать основные практически навыки разработки проектов;
исследовать путь развития проекта;
разобрать несколько практических примеров выигрышных проектов.

Для “проекта” мы рассмотрим следующие элементы:

основные признаки;
структуру;
критерии успешности;
жизненный цикл;
правила постановки цели (SMART);
правильное планирование;
диаграммы Ганта;
матрица ответственности команды;
инструменты анализа и управления рисками.

Вы научитесь:

отличать проектную деятельность от операционной;
учитывать критерии проекта при его разработке;
формировать цель и задачи для вашей идеи;
составлять план проекта и матрицу ответственности;
работать с рисками.

Кроме того, данная заметка будет пополняться следующими полезными практиками (возможно в виде отдельных статей в блоге):

примеры успешных проектов (презентаций и планов) автора;
разбор agile-системы управления командой в процессе выполнения проекта;
разбор современных инструментов планирования и управления проектами;
практика DevOps работы в GitLab для ведения и учета проектов.

2. Теоретические основы (обзор литературы)

Проектная деятельность - понятие, относящееся к широкому кругу деятельности и весьма интуитивное, а значит сложное в систематизации и конкретном объяснении. Но как известно, в любой непонятной ситуации - читай ГОСТ. Этим и займемся.

Первый этап любого исследования (будь то научная работа, поход в горы или попытка приготовить что-нибудь вкусненькое на кухне) начинается с обзора литературы и, подчеркну особенно, с обзора нормативной документации (НД) (ГОСТ, ТУ, ISO, ASTM, методик, СанПин, Указов, Приказов и т.д.). Крайне рекомендую провести самостоятельный поиск НД по заданной тематике, я мог не заметить что-то важное и интересное. Далее приведено сжатое изложение основных НД по тематике проектного менеджмента (что является синонимом проектного управления и прочих дисциплин, описанных в начале статьи).

2.1 ГОСТ Р 54869-2011. Проектный менеджмент. Требования к управлению проектом

Настоящий стандарт устанавливает требования к управлению проектом от его старта до завершения, при этом предметом стандартизации являются обязательные выходы процессов управления проектом. Рассказывает о различных понятиях и процессах в проекте, что является целью и выходом каждого процесса в проекте.

В переводе с эльфийского и в сжатом изложении данный ГОСТ рассматривает структуру проекта и те стадии и данные, которые должны содержаться в каждом из проектов. Основные понятия приведены на рис. 1, а процессы в составе проекта - на рис. 2.

Рис. 1. Основные понятия проектного менеджмента и их взаимосвязь.

Рис. 2. Схема процессов проекта.

2.2 ГОСТ Р 54870-2011. Проектный менеджмент. Требования к управлению портфелем проектов

Устанавливает требования к управлению портфелем проектов на этапах его формирования и реализации, при этом предметом стандартизации являются выходы процессов управления портфелем проектов. Управление портфелем проектов подразумевает деятельность, направленную на достижение стратегических целей организации путем формирования, оптимизации, мониторинга и контроля, управления изменениями портфеля проектов в условиях определенных ограничений. Управление портфелем проектов обеспечивает связь между уровнем стратегического управления в организации и уровнем управления проектами и программами.

Ok, Google, опять же, переведя на более понятный язык, получим, что вся стратегия развития компании/стартапа/личности — есть создание, управление и изменения набора проектов. Таким образом стандарт посвящен способам управления портфелем (т.е. набором) проектов. Приводятся некоторые понятия данного процесса (рис. 3).

Рис. 3. Понятия портфеля проектов.

Задание 1. Составьте схему, аналогичную рис. 3 для вашей дипломной или курсовой работы.

2.3 ГОСТ Р 54871-2011. Проектный менеджмент. Требования к управлению программой

Настоящий стандарт устанавливает требования к управлению программой для обеспечения эффективного достижения целей и реализации выгод программы.

Таким образом, это по сути способ адаптации ГОСТ №1 для “набора действий” (здесь называется программой). К проектам относится условно и более подробно здесь рассматриваться не будет.

2.4 ГОСТ Р 56715.1-2015. Проектный менеджмент. Системы проектного менеджмента. Часть 1. Основные положения

Является первым в серии “Проектный менеджмент - Системы проектного менеджмента”, которая состоит из следующих частей:

Часть 1: Основные положения;

Часть 2: Процессы и процессная модель (очень любят на кафедре - рекомендую прочитать!);

Часть 3: Методы;

Часть 4: Данные и модель данных;

Часть 5: Термины и определения.

Данная система ГОСТ-ов на мой взгляд наиболее полно описывает понятие проект и проектная деятельность. Так, утверждается, что проекты состоят из уникального набора процессов различных типов. Они (проекты) различаются по целям и конечным результатам, по величине, сложности, необходимому времени выполнения и затратам, по количеству задействованных и заинтересованных лиц. Проекты осуществляются организациями любого размера.

Руководство организации должно определять и документировать свою политику в области проектного менеджмента и все этапы ее реализации. Для этого следует внедрить, поддерживать на должном уровне и постоянно улучшать систему проектного менеджмента организации, а также предоставить все необходимые средства и организационные структуры.

Основной целью использования системы проектного менеджмента является успешная реализация проектов. В частности, основные на мой взгляд цели:

достижение целей заказчика/клиента;
построение прозрачной структуры проекта (для лучшей интерпретируемости и изучения);
обеспечение эффективной (максимально полной и своевременной) коммуникации между всеми участниками проекта;
определение фаз/этапов реализации проекта (планирование);
мониторинг и оценка рисков;
обеспечение качества;
создание возможности для контроля основных процессов проектного менеджмента;
обеспечение управления изменениями (корректировки планов) при необходимости;
установление профессиональных требований к проектному менеджменту и требований к компетентности персонала;
проведение комплексной оценки процессов единого проекта;
определение связей между проектами в рамках программы или портфеля проектов.

В рамках данной НД широко используются модели.

Задание 2. Что такое модель? Дайте свое определение.

Модели строятся в соответствии со специально установленными требованиями. Они должны отражать характерные задачи и процессы, визуализировать взаимосвязи и структуры, необходимые для решения задач. Используемая в настоящем стандарте модель описывает идеализированную систему проектного менеджмента, которая должна корректироваться для каждого конкретного случая применения.

Обозначим свойства системы проектного менеджмента по ГОСТ 56715.1-2015:

Гибкость: Система за короткое время может приспосабливаться к новым или изменившимся условиям.
Универсальность: Система позволяет максимально разностороннее применение и использование.
Модульность: Система строится из подсистем и может разрабатываться и расширяться модульным образом. При формировании процессов и выборе связующих звеньев создаются возможности для технической поддержки, ускорения и оптимизации процессов.
Совместимость: Системы, подсистемы и отдельные элементы системы являются интегрируемыми и совместимыми с внешними системами и частями систем, тем самым создавая возможности для формирования необходимой структуры и возникновения синергетического эффекта.
Прозрачность: Система делает видимыми процессы и их взаимосвязи.
Превентивность: Система поддерживает принцип работы “Предупреждение вместо реагирования”.

Таким образом, первый ГОСТ серии 56715 вводит нас в курс дела и обрисовывает общие черты проектного менеджмента.

2.5 ГОСТ Р 56715.2-2015. Проектный менеджмент. Системы проектного менеджмента. Часть 2. Процессы и процессная модель

Базовый принцип настоящего стандарта заключается в том, что желаемого результата можно достичь эффективнее, если все работы в рамках проекта и относящиеся к ним ресурсы используются и управляются на основе процессного подхода. В настоящем стандарте виды деятельности, необходимые для проектного менеджмента, формируются как процессы и вовлекаются во взаимодействие в их проектной среде. С одной стороны, это облегчает всем участникам проекта ориентацию на результаты в ходе реализации проекта, а с другой стороны, создает хорошую основу для создания кооперационных связей, выходящих за рамки предприятия, и непрерывного совершенствования системы.

С эльфийского: проект разбивается на процессы, своего рода “диаграмму действий”. При этом различают четыре группы процессов (по уменьшению приоритета):

руководства проектами;
проектного менеджмента;
обеспечивающие;
создания продукта проекта (производственные процессы).

Ход реализации проекта (жизненный цикл проекта), начиная с инициирования и заканчивается завершением группы фаз - взаимосвязанные отрезки. Настоящий стандарт различает фазы проекта и группы проектного менеджмента (процессы в каждой фазе). Пример одной фазы приведен на рис. 4. Каждый проект включает несколько фаз (своего рода подпроектов).

Задание 3. А теперь вспомним и представим себе рекурсию.

Рис 4. Графическое представление фаз проекта.

Фазы проекта разделяют жизненный цикл проекта на отрезки (взаимозависимые по времени) и отражают развитие проекта. В каждой фазе указывают виды работ и прочие необходимые данные. Разделение на группы процессов на уровне проектного менеджмента опирается на логически взаимосвязанные задачи и включает: “Инициирование (I)”, “Определение (D)”, “Планирование (P)”, “Контроль (S)” и “Завершение (A)”. Об этом мы более подробно и человеческим языком поговорим в следующей главе.

Можно обратить внимание, что интерпретация проектного менеджмента в данном стандарте немного отличается от ГОСТ-ов № 1-3, что говорит о достаточно вольном и интуитивном понимании в принципе “проектного управления”.

Рассмотрим пример расписанной фазы проекта (табл. 1).

Таблица 1. Пример фазы проекта.

	Инициирование	Определение	Планирование	Контроль	Завершение
1 Сроки		D.1.1 Определение вех проекта (ключевых событий)	P.1.1 Планирование работ P.1.2 Составление календарного плана P.1.3 Составление плана проекта	S.1.1 Запуск работ S.1.2 Управление сроками
2 Изменения			P.2.1 Планирование методов работы с изменениями	S.2.1 Управление изменениями
3 Информация/ коммуникация/ документация	I.3.1 Выдача разрешения	D.3.1 Определение информации, коммуникации и отчетности D.3.2 Определение маркетинга проекта D.3.3 Выдача разрешения	P.3.1 Планирование информации, коммуникации, отчетности и документации P.3.2 Выдача разрешения	S.3.1 Управление информацией, коммуникацией, отчетностью и документацией S.3.2 Приемка	A.3.1 Составление заключительного отчета по проекту A.3.2 Создание архива проектной документации
4 Затраты и финансы		D.4.1 Грубая (приближенная) оценка затрат	P.4.1 Составление плана затрат и финансовых средств	S.4.1 Управление затратами и финансовыми средствами	A.4.1 Составление калькуляции фактических издержек
5 Организация	I.5.1 Назначение ответственных I.5.2 Выбор процессов проектного менеджмента	D.5.1 Формирование команды управления проектом	P.5.1 Планирование организации работы над проектом	S.5.1 Проведение стартового совещания S.5.2 Создание команды проекта S.5.3 Развитие команды проекта	A.5.1 Проведение заключительного совещания A.5.2 Оценка достижений A.5.3 Роспуск проектной организации
6 Качество		D.6.1 Определение критериев успеха	Р.6.1 Планирование обеспечения качества	S.6.1 Обеспечение качества	A.6.1 Обобщение опыта проекта
7 Ресурсы			P.7.1 Составление ресурсного плана	S.7.1 Управление ресурсами	A.7.1 Освобождение ресурсов
8 Риск		D.8.1 Определение методов работы с рисками D.8.2 Анализ окружения проекта/ заинтересованных лиц D.8.3 Оценка реализуемости	Р.8.1 Анализ рисков Р.8.2 Планирование реагирования на риски	S.8.1 Управление рисками
9 Структура проекта		D.9.1 Составление укрупненной структуры	Р.9.1 Разработка структуры декомпозиции работ P.9.2 Описание пакетов работ P.9.3 Описание работ
10 Договора и дополнительные требования		D.10.1 Определение методов работы с договорами D.10.2 Определение содержания договора с заказчиком	P.10.1 Определение содержания договоров с поставщиками	S.10.1 Реализация договоров с клиентами и поставщиками S.10.2 Управление дополнительными требованиями	A.10.1 Окончание договоров
11 Цели и содержание	I.11.1 Первоначальное определение целей	D.11.1 Определение целей D.11.2 Определение содержания проекта		S.11.1 Управление целями и содержанием

Примеры диаграмм процессов проектного менеджмента приведены на рис. 5 и рис. 6 (извиняюсь за качество, буду искать более читабельные варианты. А на данном этапе лучше заглянуть в ГОСТ).

Рис. 5. Диаграммы процессов одной стадии в одной фазе.

Рис. 6. Диаграммы процессов одной стадии в одной фазе. Более сложный случай.

На этом краткий обзор этого ГОСТ-а можно закончить. Еще раз отмечу - процессные модели очень любят на кафедре и всегда требуют на защитах дипломных работ. Поэтому крайне рекомендую ознакомиться с ГОСТ-ом и попрактиковаться в декомпозиции различных процессов на такие диаграммы.

2.6 ГОСТ Р 56715.3-2015. Проектный менеджмент. Системы проектного менеджмента. Часть 3. Методы

Настоящий стандарт определяет основные методы, используемые в системах управления проектами.

В стандарте описываются некоторые метрики (параметры) для сравнения различных стратегий ведения проектов. Рассмотрим некоторые из них подробнее.

1.6.1 Оценка затрат - используется для прогнозирования того, какие ресурсы (персонал, финансы и т.д.) и в каком объеме необходимы для реализации проекта (табл. 2).

Таблица 2. Оценка затрат

Метод	Характеристика
Экспертная оценка	Оценка проводится одним экспертом или группой экспертов
Дельфийский метод	(Экспертная) оценка систематизируется путем структурированного многопрофильного опроса
Метод трех точек	(Экспертная) оценка дополняется оценкой оптимистического, реалистического и пессимистического пути. Сумма оценки определяется как среднее значение вышеуказанных значений, причем реалистическая оценка имеет больший вес, как правило, в четыре раза.
Совещательная оценка	(Экспертная) оценка проводится в форме коллективного, т.е. не анонимного многопрофильного опроса экспертов.Этапами совещательной оценки являются: 1) Выбор экспертов, которые будут проводить оценку. 2) Предоставление экспертам информации. 3) (Предварительная) оценка затрат экспертами. 4) Общее обсуждение результатов оценки, в частности отклонений (внимание также уделяется предпосылкам и допущениям). 5) Определение поддерживаемого всеми результата оценки, а также общих предпосылок.
Сравнение проектов (по аналогам)	Затраты проектов определяются с помощью актуальных требований расчетным путем из данных опыта аналогичных проектов.

1.6.2 контроль проектов. Используются, главным образом, для двух целей: контроля и управления изменениями. Другими словами они служат для целей сравнения “запланированного” с “реальным”, с тем, чтобы потом можно было отследить изменения проекта.

Форма и методы контроля зависят от размера и сложности проекта и должны соответствовать внутренним регламентам и стандартам организации. В ГОСТ приведены некоторые методы контроля.

Анализ по методу освоенного объема (EVA) (Earned Value Analysis). Включает совместный анализ таких показателей как расходы, временные затраты и полученные результаты (результативность). Анализ проводится для определенного объекта (например проект, фаза проекта, пакет рабочих заданий) на определенную дату. Для расчета необходимы плановые и фактические показатели и, если есть, оценка объема оставшихся затрат. На основе EVA можно сделать прогнозы в отношении ожидаемых издержек, а также определить срок завершения проекта. Кроме того, EVA имеет ряд важных для проекта показателей, таких как, CPI или SPI, которые также могут быть использованы в качестве показателей системы раннего предупреждения (табл. 3).

Таблица 3. Наиболее важные международные сокращения и показатели с примером расчета

Acronym	Name (Calculation)	Название (формула расчета)
ВАС	Budget at Completion	Бюджет по завершении (окончательная смета проекта)
DD	Data Date = Time now = As-of Date	Отчетная дата = Текущая дата = По состоянию на
PC	Percent(age) Complete	Процент выполнения (на день составления)
РСТ	Process Degree	Степень завершенности процесса Степень готовности по плану (на день составления)
PV	Planned Value	Плановое значение (на день составления)
BCWS	Budget Cost of Work Scheduled	Плановая стоимость запланированных работ
АС	Actual Cost	Фактические затраты (на день составления)
ACWP	Actual Cost of Work Performed	Фактическая стоимость выполненных работs
EV	Earned Value =ВАС * PC	Освоенный объем (на день составления)
BCWP	=Budget Cost of Work Performed	Плановая стоимость выполненных работ
API	Actual Performance Index =ACWP/BCWS=AC/PV	Фактический показатель деятельности (показатель издержек производства)
CPI	Cost Performance lndex =BCWP/ACWP=EV/AC	Индекс освоения затрат
SPI	Schedule Performance Index =BCWP/BCWS =EV/PV	Индекс выполнения сроков
CV	Cost Variance =BCWP-ACWP =EV-AC	Отклонение затрат = Сравнение заданных и фактических значений
CV%	Cost Variance Percentage =CV/BCWP * 100=CV/EV * 100	Отклонение затрат в процентах
SV	Schedule Variance =BCWP-BCWS=EV-PV	Отклонение от плана (несоответствие календарному графику) = Сравнение заданных и плановых значений
SV%	Schedule Variance Percentage =SV/BCWS * 100=SV/PV * 100	Отклонение от плана (несоответствие календарному графику) в процентах
EAC	Estimated Cost at Completion (Kosten) =ВАС/CPI	Предположительные затраты по завершении проекта (Линейный прогноз) ВАС * AC/EV= (Аддитивный прогноз) АС+ВАС-EV= (Первоначальный план) ВАС=
РАС	Projection at Completion (Zeit) =Planned Duration/SPI =((ВАС/SPI)-ВАС)/(Среднее значение BCWS/единица времени)	Прогноз (перспективная оценка) по завершении проектаs
VAC	Variance at Completion =ВАС-EAC	Прогнозное отклонение стоимости проекта (отклонение общих затрат по завершении проекта)
VAC%	Variance at Completion Percentage =VAC/ВАС * 100	Прогнозное отклонение стоимости проекта в процентах (отклонение общих затрат по завершении проекта в процентах)

Степень готовности проекта определяется на день составления (конкретный срок) (PC на основе EVA) путем сравнения заданного и фактического состояния и указывается в процентах (%). При этом степень готовности может определяться для различных задач (например проект, детальный проект, пакет рабочих заданий) и при необходимости указываться нарастающим итогом.

1.6.3 Сравнение проектов (анализ по аналогам)

Служит для прогнозирования данных новых проектов, например, для оценки затрат на основе оценки опыта реализации завершенных проектов и сравнении параметров проектов.

Данные о завершенных проектах должны собираться и классифицироваться заранее (архив, база знаний). Необходимо использовать данные о не менее чем 10-30 проектах. Если проекты очень похожи, будет достаточно меньшего количества аналогичных проектов.

Оценка опытных данных при сравнении проектов происходит путем параметрического расчета, определения средних значений или путем выводов по аналогии между отдельными проектами.

Параметрический расчет устанавливает связь между целевыми показателями проектов, например, затратами и продолжительностью проекта, и другими параметрами, например составом работ и достигнутыми результатами. Процесс расчета с помощью специальных или общих программных средств (приложений) по статистическому анализу показывает количественную среднюю взаимосвязь между целевыми показателями и параметрами.

Эта взаимосвязь или определенные средние значения и аналогии позволяют осуществить прогнозы в отношении новых отдельных параметров и оценку завершенных проектов по отдельным целевым признакам (частичное сравнение). Для общего прогноза или общей оценки реализации проекта результаты отдельных частичных сравнений могут объединяться (полное сравнение).

1.6.4 Формирование структуры проекта

Проекты, как правило, отличаются высокой сложностью. Они включают в себя множество взаимосвязанных задач, которые часто трудно спрогнозировать полностью.

Структурирование проекта служит для наглядного представления совокупности всех задач проекта с соответствующими зависимостями и оказывает поддержку процессам планирования и контроля благодаря рациональному структурированию.

Метод деления на составляющие (сверху вниз). Начинают с первого уровня, который представляет собой название проекта. Потом проект по определенному критерию делится на различные части. Они образуют второй уровень. Структурный план проекта будет готов, когда все части проекта будут разделены на пакеты работ.
Метод обобщения (снизу вверх). Пакеты работ одного проекта разрабатываются на основании предыдущего опыта и с применением соответствующих методов доработки. Структура работ проекта может строиться с использованием нескольких подходов к разбиению на составляющие (декомпозиции). Различают три вида структурных планов проекта:
- структурный план проекта, ориентированный на объект (определение пакетов работ сводится к (технической) структуре объекта);
- структурный план проекта, ориентированный на функции (пакеты работ разделяются по различным функциям (например, сбыт, разработка, испытание, изготовление));
- структурный план проекта, ориентированный на фазы и ход реализации проекта (классификация задач ориентируется на модель фаз жизненного цикла (например, проектирование, разработка, реализация, приемка)).

2.7 ГОСТ Р 56715.4-2015. Проектный менеджмент. Системы проектного менеджмента. Часть 4. Данные и модель данных

Представленная в настоящем стандарте модель данных описывает на профессиональном уровне элементарные структуры данных проектного менеджмента. Модель данных можно использовать для:

архивирования данных проектного менеджмента;

обмена данными проектного менеджмента между организациями и различными системами программного обеспечения;

спецификации требований к программному обеспечению проектного менеджмента (в качестве исходных данных).

Формат сохранения данных как правило xml. Элементы данных называются существительными и всегда используется в единственном числе. Элементы данных могут называться также двумя существительными, при этом, если возможно, для определения иерархии понятий используется позиция (порядок следования) существительного. Так, существует, например, иерархическое отношение между элементами данных Initiative (объект управления) и InitiativeGroup (группа объектов управления). Это отношение можно определить только по одному названию элементов. Для лучшего понимания присвоение имени из нескольких существительных происходит с использованием дефисов.

Таким образом данный стандарт устанавливает структуру данных при хранении и архивации проекта. Данная структура утверждена и является стандартизированной, что довольно удобно. Рекомендую полностью ознакомиться с ГОСТ, если вы чувствуете, что это необходимо и хотите потренировать английский язык, поскольку в нем приведены переводы основных величин.

Добавлю от себя, что сейчас очень часто прибегают к формату json для передачи данных, а хранят их в табличном виде в специальных базах данных (например Oracle или PostgreSQL). Но это требует больших “технических ресурсов” и используется в основном в ИТ-проектах.

2.8 ГОСТ Р 56715.5-2015. Проектный менеджмент. Системы проектного менеджмента. Часть 5. Термины и определения

Является по сути словарем терминов.

Задание 4. Ознакомиться с терминами и выписать 10 наиболее значимых на ваш взгляд.

2.9 ГОСТ Р ИСО 21500-2014. Руководство по проектному менеджменту

Настоящий стандарт содержит общие рекомендации, основные понятия и характеристики процессов проектного менеджмента, которые важны для выполнения проектов и влияют на их результаты

По сути представляет собой обобщение ГОСТ-ов с № 4-8. Однако с точки зрения полноты изложения и даты выпуска я рекомендую использовать именно предыдцщие стандарты.

Подводя итог. В целом данные стандарты, да и вся дисциплина призвана навести порядок в голове %username%. Так что если вы испытываете сложность с планированием и донесением своих планов до окружающих, можно попробовать изучить данную НД. Но даже если все в порядке, можно использовать ссылку на ГОСТ при рабочем споре — это может сильно упростить жизнь. Так что важно представлять, о чем же все-таки говорят данные стандарты, и уметь использовать данные понятия. А значит мы продолжаем и переходим к следующей части, которая призвана немного упростить нам жизнь.

3. Упрощение жизни по проектной деятельности

Далее попробую предоставить вам более понятное изложение о том, как надо работать с проектами.

Данная информация сейчас очень актуальна при работе в больших компаниях. В частности на “ФосАгро”, в которой я работал довольно долгое время (АО “НИУИФ”). В данной корпорации широко практиковались и я думаю практикуются различные тренинги по развитию и управлению проектами. Попробую поделиться тем, что я освоил в процессе своей работы и что потом отшлифовал при многократной защите и выполнении своих проектов (как внутри ФосАгро в АО “НИУИФ”, так и при участии в различных конкурсах и акселераторах).

3.1 Что такое проект и его особенности

Итак, проект по ISO 21500 - это “уникальный набор процессов, состоящих из скоординированных и управляемых задач с начальной и конечной датами, предпринятых для достижения цели”. Думаю стоит сказать немного понятнее: это ограниченная во времени деятельность, результатом которой являются новые и уникальные продукты, услуги и результаты. Этим проект принципиально отличается от операционной деятельности или процесса. Отличать их важно! Для этого существует набор параметров, которые мы разберем далее. Отмечу, что для меня лично, ключевым из этих параметров является вероятность (статистика) успеха - процесс всегда сопряжен с большими рисками, но и несет большую выгоду.

Процесс (операционная деятельность)	Проект
привычные результаты устоявшиеся бизнес-процессы отсутствие существенных рисков относительно постоянная команда (штат)	уникальные результаты ограниченный срок (конечность)) множество рисков гибкая команда проекта

Виды проектов для компании:

Экономический (цель - деньги)
Социальный (цель - люди)

Основные признаки проекта:

Наличие цели (составляется по специальным параметрам, об этом далее).
Наличие изменения некоторой системы (операционной деятельности).
Ограниченность во времени (всегда есть начало и конец проекта).
Неповторимость (уникальность по совокупности стадий).
Ограниченность требуемых ресурсов (есть спецификация и график потребления ресурсов).
Специфическая организация.

Задание 5. Подумайте, что из перечисленного относится к проекту и какому (социальному или экономическому): постройка жилого дома, выпуск новой продукции на заводе, эксплуатация электростанции, получение образования, вождение машины, семейная жизнь, руководство отделом, ремонт помещения.

Задание 6. Опишите свой опыт работы с проектом. Если не было - придумайте)

Причины возникновения проекта:

возможность
проблемам

Важно различать данные причины, от них зависит обоснование и разработка проекта. Особое внимание необходимо уделять: срокам, бюджету и качеству (как говорят, выберите любые 2, но наша цель - учесть все 3).

Наиболее частые причины провала проекта:

несоответствующие ресурсы;
неверные контрольные сроки;
слабые коммуникации;
недостаток внимания и проработки стадий проекта;
недостаточное финансирование;
недостаток инструментов управления;
недостаточная вовлеченность руководства проекта.

Проект успешен тогда и только тогда, когда он завершен:

в установленные сроки;
в рамках бюджета;
с удовлетворительным результатом (по цели и задачам);

3.2 Фазы и процессы в проекте

Вся структура проекта, включая деление на фазы и процессы, необходима для управления следующими его конечными свойствами:

Интеграцией - в программу или глобальный процесс (первичная работа по разработке проекта: устав, описание, план управления проектом, мониторинг).
Содержанием - включение всех необходимых работ в проект (планирование содержания, структуры работ, управление изменениями содержания).
Сроками - завершение вовремя (расписание; длительность, состав и взаимодействие между операциями).
Стоимостью - уложиться в бюджет.
Качеством - проект удовлетворял потребностям, для которых он создан (обеспечение и контроль качества, политики, цели и распределение ответственности).
Человеческими ресурсами - организация и управление командой.
Коммуникациями - подготовка, сбор, распределение, хранение, выборка и конечное размещение информации.
Рисками - анализ, реагирование, мониторинг управление рисками для повышения вероятности успеха.

Фазы проекта - это крупные блоки (считай содержание), которые стандартные бля любого проекта. Более формально - это совокупность логически связанных работ, выполнение которых приводит к получению конкретного результата по проекту.

Жизненный цикл проекта - набор последовательных фаз проекта. При этом содержание внутри фазы часто может зависеть от самого проекта и необходимого контроля.

Результат - измеримый, осязаемый и поддающийся контролю выход для проекта (т.е. количественный). Часто используется в более узком смысле, как нечто, требующее утверждение спонсором проекта или заказчиком.

Рис. 7. Уровень усилий и влияния на проект с учетом основных фаз (для упрощения фазы исполнения и контроля объединены).

Задание 7. Вспомните, какой ГОСТ описывает фазы проекта?

Далее давайте разберем каждую из фаз подробнее.

3.2.1 Начальная фаза (инициализация) проекта.

сбор исходных данных и анализ текущего состояния (обзор литературы) для выявления потребности в изменениях;
определение проекта:
- цели, задачи, результаты;
- основные требования, ограничения и критерии;
- уровень риска;
- окружение проекта, потенциальные участники (важно, рассмотрим подробнее далее);
- время, ресурсы, средства и т.д.
- определение и сравнение альтернатив проекту;
- утверждение концепции и получения одобрения для следующей фазы.

Результат - санкционирование начала проекта (если заказчик его утвердит) и составление резюме проекта - отдельный документ, похожий на дипломную работу где более развернуто описан проект с указанием фаз и действий внутри фаз.

Ниже приведен небольшой пример-описание начальной фазы и на какие вопросы она должна отвечать.

Пункт	Требования
Название	Интересное, интригующее, отвечающее содержанию
Актуальность (Зачем, что хотим?)	Решение проблемы (в операционной деятельности) или реализация потенциала: - почему необходимо реализовать проект? - почему эта возможность важная и приоритетная? Ключевая задача: описать, оцифровать (сделать измеримым), визуализировать.
Цель	Насколько решит или снизит проблемы (подробнее - далее).
Результат реализации	Какое конкретное улучшение/изменение получит спонсор/заказчик.
Этапы	Технология реализации проекта (важно!) - краткий план конкретных действий и промежуточные ожидаемые результаты.
Заказчик	Кто вкладывает ресурсы.
Пользователи	Аудитория, на которую проект окажет влияние.
Команда	Исполнители (как внутренние, так и внешние) - прописывать максимально конкретно, вплоть до должностей и ФИО.
Сроки	Разработки и реализации от момента согласования до завершающей стадии в месяцах. Если проект длительный - указывать промежуточные сроки, применительно к этапам.
Бюджет (предполагаемый)	Стоимость и количество инвестиций и предполагаемый экономический эффект (т.е. срок, когда инвестиции начнут окупаться).

Примечание. Важно всегда получать информацию (хотя бы экспертную оценку) по тематике проекта.

Примечание. Если проект направлен на решение проблемы - всегда подразумевается оценка и данные. Особенно когда есть оценочные прилагательные (больше, меньше и т.д.) - нужны данные.

Цель проекта - наиболее важный пункт во всей проектной деятельности, по сути - название вашей работы. Она должна удовлетворять SMART идеологии!

S	Конкретная	Дает ли однозначное представление о том, что должно быть достигнуто?
M	Измеримая	Имеются ли количественные или качественные критерии достижения?
A	Достижимая	Насколько реальная с точки зрения объективных условий и возможностей?
R	Согласованная	Как связана с другими целями?
T	Ограниченная по времени	К какому сроку цель должна быть достигнута?

Примеры:

SMART цели	Не цели
- снизить уровень текучести персонала до 10 % к началу второго квартала 2016 года. - обеспечить месячный товарооборот в размере 5 млн. рублей к 1 мая 2020 года. - занять второе место на региональном конкурсе "1-2-3" в этом году.	- работать лучше. - поучаствовать в конкурсе. - мотивировать персонал. - работать по плану.

Участники проекта

Еще раз повторюсь - нужно максимально конкретизировать любую информацию в проекте - в том числе и все участников, вплоть до отдела, должности и ФИО.

Рис. 8. Взаимодействие между участниками проекта. Пунктирные линии означают, что 2 участника могут быть одним и тем же лицом (а могут и не быть).

Роль	Описание
Инициатор	Автор идеи или основная заинтересованная сторона
Заказчик	Принятие решения об открытие проекта, мониторинг реализации, выделение бюджета, ключевые решения по проблемам (не входящим в сферу полномочий Куратора и Руководителя проекта), утверждение итогового отчета и принятие решения о закрытии.
Спонсор	Обеспечивает проект ресурсами. Может быть и заказчиком.
Выгодоприобретатель	Отвечает за контроль качества и принятие результатов проекта, дальнейшее использование результатов проекта.
Консультант (куратор = внутренний консультант, эксперты)	Отвечает за инициирование, мониторинг и контроль реализации. Участвует в согласовании ключевых событий проекта и формирует итоговое заключение.
Руководитель	Отвечает за достижение целей проекта, результативное и экономически эффективное использование ресурсов проекта.
Участник проектной команды	Отвечают за исполнение поручений Руководителя
Заинтересованные лица	Лица, попадающие в зону интереса проекта (не всегда выгодопреобретатели, эффект м.б. и негативным).

Отмечу, что полезно бывает проанализировать все заинтересованные стороны (stakeholder) с точки зрения матрицы влияния на проект.

Рис. 9. Матрица влияния на проект.

Задание 8. Проведите оценку того, как участники A-E влияют на проект, как бы Вы построили взаимодействие с данными людьми?

3.2.2. Фаза разработки - уже относится не просто к описанию проекта, но к планированию деятельности (набор команды, определение ролей, взаимодействие с командой и заказчиком и т.п.)

назначение руководителя, формирование команды и ответственных;
установление контактов и изучение целей, мотивации и требования заказчика/спонсора и др. ключевых участников;
развитие концепции и разработка основного содержания:
- конечный результат;
- стандарты качества;
- структура;
- основные работы;
- ресурсы.
планирование:
- разложение на простые стадии (декомпозиция);
- календарные планы;
- смета и бюджет;
- потребность в ресурсах;
- техника контроля;
- определение и распределение рисков.
организация/проведение торгов и заключение контрактов;
представление и выполнение базовых проектных и конструкторских работ;
получение одобрения на следующий шаг.

Управление содержанием проекта (как один из элементов фазы разработки):

Планирование содержания.
Определение содержания (подробное описание).
Создание иерархической структуры работ (ИСР).
Подтверждение содержания (формализация и утверждение - документирование).
Управление изменениями содержания.

План проекта - формальный и утвержденный документ, который может быть использован для управления исполнением проекта (может корректироваться в процессе). Состав:

Основание для выполнения проекта.
Описание подхода к управлению проектом.
Констатация целей.
ИСР.
Оценка стоимости и плановых дат (включая методы оценки).
Распределение ответственных (до уровня ИСР).
Основные контрольные события и их даты.
Ключевой и необходимый персонал.
Основные риски и плановая реакция на наступление каждого.
Планы управления составляющими проекта (целями, ресурсами, контрактами, рисками, взаимодействием, персоналом).
Открытые вопросы и отложенные решения.

Дополнительная информация плана проекта:

Ограничения и допущения.
Техническая документация (требования, спецификации, проектная документация).
Используемые стандарты и нормативы.

Примечание. Отличной идеей будет повесить план проекта на самое видное для команды место (на холодильник например) и постоянно напоминать о его существовании.

Остановимся подробнее на иерархической структуре работ (ИСР) проекта (Work Breakdown Structure (WBS)). Это некое дерево (или диаграмма), которое представляет собой деление проекта на естественные элементы с целью обеспечения контроля и управления.

Правила построения ИСР:

Работы нижнего уровня являются способом достижения работ верхнего.
Для каждой дочерней работы может быть только одна родительская.
На каждом уровне работы должны быть равнозначны (например, по объему и времени выполнения и т.д.).
На различных уровнях можно и нужно применять различные критерии декомпозиции (важное отличие от обычной классификации! при которой мы используем деление по некому “физическому” или прочему смыслу)

Декомпозиция прекращается, если для уровня:

работы ясны и понятны менеджеру и участникам проекта;
понятен конечный результат работы и способы его достижения;
временные характеристики и ответственность за выполнение работ могут быть однозначно определены.

Рис. 10. иерархическая структура работ (ИСР) проекта (Work Breakdown Structure (WBS)).

Управление сроками проекта (тоже относится к фазе разработки) - обеспечивает своевременное завершение проекта:

определение состава операций;
определение взаимосвязей операций;
оценка ресурсов операций;
оценка длительности операций;
разработка расписания (с учетом последовательности операций, их длительности, требований к ресурсам и ограничений на сроки);
управление расписанием.

Для данных целей часто используют диаграмму Ганта - графическое представления плана проекта (расписание). Выглядит как горизонтальные полосы, расположенные между двумя осями: списком задач по вертикали и датами по горизонтали. Довольно легко строиться в MS Excel или LibreOffice Calc закрашиванием соответствующих ячеек.

Рис. 10. Примеры диаграмм Ганта (https://ru.smartsheet.com/).

3.2.3 Фаза реализации - самая ответственная часть проекта. Состоит из:

организация/проведение торгов;
выполнение работ;
ввод в действие коммуникации участников;
ввод в действие системы стимулирования (мотивации) участников;
детальное проектирование и технические спецификации;
оперативное планирование работ;
информационный контроль за ходом работ;
управление материально-техническим обеспечением;
мониторинг и прогноз прогресса: ход, качество, продолжительность, стоимость и др. работы.
решение возникающих проблем.

При этом можно (а в некоторых случаях и нужно) объединять данную фазу с фазой Управления и контроля для проекта (проводить их параллельно друг другу). Для управления и контроля рекомендую сделать следующее:

Еще раз пройтись по плану проекта. Перед началом каждого этапа уточнять с каждым участником его задачи и обязанности.
Оценить сделанное по работам, срокам, трудоемкости, затратах и сравнить с запланированным (желательно с участниками проекта).
Принимать корректирующие меры, если требуется менять план.
Информировать людей о ходе реализации проекта.

Для анализа выполнения графика необходимы следующие данные:

Идентификаторы и описание событий (не забываем про количественные оценки!).
Имена ответственных лиц.
Предполагаемые даты достижения событий.
Фактические даты достижения событий.

Вся необходимая для контроля информация может быть отражена в таблице:

Работа	Ответственное лицо	Дата начала		Дата завершения		Комментарии
Работа	Ответственное лицо	плановая	факт	плановая	факт	Комментарии
Разработка анкет	Иванов А.					Критический путь
Проведение пилотного опроса	Петров В.
Печать инструкций	Иванов А.

При выборе периодичности наблюдений рекомендую учесть:

находятся ли работы на критическом пути (зависят ли от них сроки начала следующих работ);
имеет ли задача значительные риски;
наличие предварительных затруднений для аналогичных задач.

Контролировать выполнение работ нужно не реже одного раза в месяц.

Примечание. Сейчас очень популярна agile-система контроля и управления проектами. В ней сроки и идеология немного изменены для обеспечения максимальной эффективности, но за счет перенапряжения команды. Не всегда такая система будет эффективна и воспринята командой. Но об этом отдельно.

Квалификационный список проекта - удобная форма отображения квалификации и знаний сотрудников команды для распределения их ролей и контроля развития команды. Рекомендуется использовать следующую схему:

основная квалификация (соответствие поставленной задаче в качестве ведущей роли);
дополнительная квалификация (соответствие поставленной задаче в качестве исполнителя под ответственным руководством);
проявленный интерес (желание работника выполнять определенные задачи).

Пример:

	дизайнер (Иванов А)	аналитик (Петров П)	программист (Сидоров С)	HR-менеджер (Иванов Б)
разработка технической документации			осн. квалификация / проявленный интерес	проявленный интерес
проведение интервью	проявленный интерес	проявленный интерес		осн. квалификация / проявленный интерес
графический дизайн	осн. квалификация / проявленный интерес		доп. квалификация	проявленный интерес
разработка анкет	доп. квалификация	доп. квалификация		осн. квалификация

В качестве руководства при создании списка:

Составьте полный список специальностей, которые могут потребоваться для будущего проекта.
Составьте полный список людей для таблицы.
Предложите людям из списка оценить свои профессиональные качества и интерес во всех сферах проекта.
Предложите непосредственным руководителям этих людей оценить их проф. качества в необходимых сферах.
Сравните данные, проведите корректировку.
Составьте окончательный вариант квалификационного списка.

Матрица ответственности - используется для отображения связей между выполняемыми работами и членами проекта, устанавливает степень ответственности. При составлении используют методику RACI.

Методика RACI (или ARCI):

Ответственный (Accountable) - полностью отвечает за исполнение этапа/задачи, вправе принимать решения по способу реализации (может назначаться только один человек).
Исполнитель (Responsible) - исполняет задачу, не несет ответственности за выбор способ ее решения, не отвечает за качество и сроки реализации (может быть более одного).
Консультант (Consult before doing) - оказывает консультации в ходе решения задач проекта, контролирует качество реализации.
Наблюдатель (Inform after doing) - может оказывать консультации в ходе решения задач проекта, не несет ответственности. Оповещается после исполнения работ.

Можно использовать и другие роли, например:

О - основная обязанность (в целом по данной задаче).
Д - дополнительная обязанность (по выполнению отдельных частей задачи).
У - утверждение работ.
Э - экспертиза (методов и результатов работы).
П - приемка (результатов деятельности по данной работе).
Об - обеспечение (необходимыми материалами и информацией).

Операция	Иванов	Петров	Сидоров	Кузнецов	Сергеев
Задача 1	R	A	C	I	I
Задача 2	A	C	C	R	I
Задача 3	C	A	I	R	R
Задача 4	C	I	A	C	I

Для контроля так же важно использовать оценку стоимости проекта. Она может быть нескольких видов.

Экспертная (Expert Judgement) - привлечение экспертов области. После их предложений усредняем и приходим к единому решению в ходе дискуссии.
По 3 точкам (Three Point Estimation) - на основе пессимистичной (P), оптимистичной (O) и реалистичной(среднее, M):

$E = \frac{O+4M+P}{6}$

Отметим, что Р, О и М определяются экспертно в часах/днях/валюте в ходе обсуждения в команде на основании вопросов: “сколько времени займет проект, если не будет никаких рисков?”, “каким может быть самый негативный сценарий?” и т.п.

Результат расчета дает усредненную оценку.
Оценка по аналогам / “Сверху вниз” (Analogous Estimation) - опираемся на прошлый опыт, в т.ч. и на основе декомпозиции проекта.
Оценка по параметрам (Parametric Model) - один из самых точных и гибких методов, строим параметрическую модель - прогноз, взяв за основу прошлый опыт, имеющиеся данные, метрики и статистику.
Оценка “Снизу вверх” (Bottom-up Estimation) - оценивается стоимость каждой операции, затем они суммируются доя получения общей стоимости проекта.
Стоимость качества (Cost of Quality) - суммарные расходы создания продукта/услуги проекта в соответствии со стандартами качества. Т.е. отдельно оценивается стоимость работ, выполненных из-за несоответствия требованиям качества.

Управление рисками - включает процессы, связанные с определением, анализом и реагированием на риски проекта с целью повышения вероятности и степени влияния положительных и снижения вероятности негативных событий в проекте.

Риск проекта - неопределенное событие или условие, которое, в случае возникновения, имеет позитивное/негативное воздействие по меньшей мере на одну из целей проекта (например, сроки, стоимость, содержание или качество).

В план управления рисками может входить:

методология управления рисками;
роли и ответственности участвующих в управлении рисками;
бюджет для управления рисками;
определение периодичности процедур управления рисками;
пороговые критерии для распознавания наступления риска;
категории рисков;
матрицы вероятности и воздействия рисков;
форматы и отчеты шаблонов.

№	Риск	Влияние риска	Вероятность	На что влияет (сроки, бюджет, результаты)	Мероприятия по минимизации	Владелец риска
1
...

Примеры типовых рисков (по СТО 8.1-16-2018, АО “Апатит”)

Категория риска / тип проекта	Типовой состав рисков
Риски, применимые для всех типов проектов организационных преобразований
Управления содержанием	- Неточность/неполнота определения целей, задач и результатов проекта. - Изменение требований на поздних стадиях реализации проекта. - Недостоверность представляемой исходной информации. - Некачественная/недостаточная проработка документов и результатов проекта. - Не достижение целей, задач и результатов проекта.
Управления сроками	- Недостаточное планирование на начальных этапах реализации проекта. - Отсутствие исходных данных для детального планирования. - Нехватка ресурсов для реализации проекта в заданные сроки. - Нескоординированность действий проектной команды. - Отсутствие совместного планирования со взаимосвязанными проектами. - Несвоевременное обеспечение потребностей проекта структурными подразделениями и смежными проектами. - Длительное рассмотрение и согласование проектных документов.
Управления контрактами	- Длительные сроки проведения конкурсного отбора и заключения договора с внешним консультантом. - Нежелание внешнего консультанта принимать все условия типового договора. - Невозможность обеспечения постоянного присутствия специалистов на площадках Заказчика. - Нарушение условия договоров Исполнителем.
Управления персоналом	- Недостаточная квалификация работников/отсутствие необходимой экспертизы. - Нехватка ресурсов для реализации проекта в заданные сроки. - Изменение состава участников проектной группы от Заказчика и Подрядчика. - Отсутствие "реального" временного ресурса у участников рабочей группы. - Отсутствие реальных полномочий у руководителя проекта.
Макроэкономические	- Колебание курса доллара. - Изменение цен на сырье и готовую продукцию. - Повышение инфляции, рост заработной платы, увеличение налогов и др.
Риски, возникающие при реализации проектов организационных преобразований определенного типа
Разработка стратегии/ Концепции	- Выбор некорректного подхода к анализу деятельности. - Учет не всех факторов при разработке. - Недостаточная проработка плана мероприятий по реализации стратегии.
Создание/выделение нового подразделения	- Неправильная оценка численности и должностных обязанностей работников. - Невозможность найма персонала на имеющиеся вакансии. - Затруднение при получении необходимых лицензий и разрешений.
Внедрение нового бизнес- процесса	- Нежелание внешних участников процесса принять предлагаемые изменения. - Нежелание линейных руководителей проводить необходимые изменения процессов.
Повышение/понижение производительности персонала	- Нежелание линейных руководителей проводить необходимые изменения процессов. - Отсутствие необходимой статистики. - Отсутствие технической экспертизы по определенным типам/группам оборудования.

Оценка негативного влияния рисков на проект:

Объект \ Влияние	Очень низкое 0,05	Низкое 0,1	Умеренное 0,2	Высокое 0,4	Очень высокое, 0,8
Стоимость	Незначительное увеличение	Увеличение < 10%	Увеличение 10-20%	Увеличение 20-40%	Увеличение > 40%
Сроки	Незначительное увеличение	Увеличение < 5%	Увеличение 5-10 %	Увеличение 10-20 %	Увеличение > 20%
Содержание	Изменения не заметны	Незначительное увеличение	Значительные изменения	Неприемлемое для клиента изменение	Достижение конечных результатов невозможно
Качество	Изменения не заметны	Незначительное увеличение	Изменения требуют согласия клиента	Неприемлемое для клиента изменение	Достижение конечных результатов невозможно

Стратегии рисков и угроз по проекту:

Уклонение от риска - изменение плана проекта, направленное на устранение риска либо на защиту целей проекта от его воздействия.
Передача риска - перенос последствий риска на третью сторону (не устраняет, а передает управление). Обычно за перенос риска взимается страховая премия. Пример - страхование основных средств.
Снижение риска - снижение вероятности наступления риска или его последствий до приемлемого уровня.
Принятие риска - стратегия, при которой риск принимается. Команда проекта не пытается повлиять на риск.

3.2.4 Завершающая фаза:

планирование процесса завершения;
испытания продукта;
подготовка к эксплуатации (кадры, документация);
оценка результатов и подведение итогов (подготовка итоговых документов);
разрешение конфликтов;
накопление и хранение фактических и опытных данных для последующих проектов;
расформирование команды.

Критерии оценки проекта при его утверждении заказчиком, как правило, следующие.

Шкала оценки: 1 (критерий не проявляется), 2 (проявляется ниже среднего), 3 (проявляется удовлетворительно), 4 (проявляется выше среднего), 5 (проявляется идеально).

№	Предмет оценки	Критерий оценки
1	Сложность проекта	- Масштаб решаемой проблемы.
2	Детальная проработка проекта	- Детальная проработка проекта. - Наличие показателей результативности. - Соответствие мероприятий проекта его целям.
3	Обоснование выбора решения с учетом альтернативных вариантов	- Обоснование выбора решения с учетом альтернативных вариантов.
4	Учет экономической целесообразности	- Соответствие предлагаемых изменений и сметы проекта масштабу решаемой проблемы и ее негативных последствий.
5	Работа с рисками	- Минимизация рисков, связанных с реализацией проекта.
6	Эффективность предлагаемого решения	- Соответствие предлагаемых мероприятий ожидаемому результату.
7	Эффективная презентация	- Доступность изложения. - Логичность выступления (четкость структуры). - Умение аргументировать свою позицию. - Уверенность при ответах на вопросы. - Качество оформления презентации.

3.3 На заметку

В ходе выполнения проекта могут формироваться запросы на изменения, которые могут включать:

корректирующие действия;
предупреждающие действия;
исправление ошибок;
обновления.

Могут измениться:

результаты проекта;
содержание проекта;
план управления проектом;
проектная документация.

Мониторинг (наблюдение, сбор отчетности) и контроль (сравнение состояний) над работами проекта - это процесс непрерывного наблюдения, анализа и регулирования прогресса, который затрагивает следующие моменты:

сравнение текущего хода исполнения с планом;
оценка хода исполнения для выявления необходимости корректировки или предупреждения;
анализ, отслеживание и мониторинг рисков;
выявление достоверной и актуальной информационной базы по продуктам проекта и сопутствующей документации;
выявление и предоставление информации для отчетности;
представление и расчет прогнозов развития проекта.

Итак, думаю вы уже прочитали все, что было мной найдено и выложено на ресурсе. Этого вполне достаточно на мой взгляд. Однако вот в чем вопрос, внешний мир не ограничивается моим и вашим взглядами) Так что давайте ка послушаем, что о проектном менеджменте думают другие люди и насколько наши идеи сходятся. Так что милости прошу на курс который вам предстоит прочитать/прослушать и выполнить на нем все задания) (опционально). Этого будет вполне достаточно (не считая нашей практике, но об этом после). Так что удачи, менеджеры проектов)

4. Практика, задания и лабы (опционально)

Для всех, кому это необходимо привожу ряд практических и теоретических задания по курсу. Все они приведены в таблице № 12, а вот какие из них нужно выполнять необходимо спросить у меня лично старостам групп (или дождаться моего прямого указания).

Задания, встречающиеся в тексте выполнять и присылать мне не обязательно, но они встретятся на коллоквиуме/зачете/экзамене.

Таблица 12. Задания для выполнения

№	Название	Примечания
1	Входной контроль	-
2	Выполнить курс и показать скриншот результата	-
3	Практическое задание №1 (Различные системы управления проектами). Ознакомиться с различными системами управления проектами, составить таблицу с кратким описанием, достоинствами и недостатками каждой из них.	-
4	Практическое задание №2 (Практика работы в системе типа Kanboard на примере Trello.com). Зарегистрироваться на Trello.com и создать любой проект на Ваше усмотрение.	-
5	Практическое задание №3 (Практика работы в системе типа Kanboard на примере Trello.com). Организуйте рабочее совещание с приглашенными участниками (реальных людей приглашать не стоит, достаточно знать, как это делается), датой, повесткой дня и оповещением. В качестве инструкции, можете использовать этот сайт.	-
6	Практическое задание №4 (Практика работы в системе типа Kanboard на примере Trello.com). Создайте исследовательский проект. В качестве инструкции, можете использовать этот сайт.	-

5. Литература

ГОСТ Р 54869-2011 Проектный менеджмент. Требования к управлению проектом.
ГОСТ Р 54870-2011 Проектный менеджмент. Требования к управлению портфелем проектов.
ГОСТ Р 54871-2011 Проектный менеджмент. Требования к управлению программой.
ГОСТ Р 56715.1-2015 Проектный менеджмент. Системы проектного менеджмента. Часть 1. Основные положения.
ГОСТ Р 56715.2-2015 Проектный менеджмент. Системы проектного менеджмента. Часть 2. Процессы и процессная модель.
ГОСТ Р 56715.3-2015 Проектный менеджмент. Системы проектного менеджмента. Часть 3. Методы.
ГОСТ Р 56715.4-2015 Проектный менеджмент. Системы проектного менеджмента. Часть 4. Данные и модель данных.
ГОСТ Р 56715.5-2015 Проектный менеджмент. Системы проектного менеджмента. Часть 5. Термины и определения.
ГОСТ Р ИСО 21500-2014 Руководство по проектному менеджменту.
Курс “Основы управления проектами” на stepic.org.
Набор сайтов о системах управления проектами: Trello for Researchers, Using Trello in academia, Личный опыт каких-то ребят, Топ-7 методов управления проектами: Agile, Scrum, Kanban, PRINCE2 и другие.
Конечно же Википедия - отличное место, чтобы начать знакомство с предметом и узнать перевод необходимых терминов.
Немного примеров для расчета параметров проекта.
Project management glossary of terms.
Прекрасный переводчик deepl.com.
Конструктор html таблиц.
Составление диаграмм любой сложности.

Спасибо, что были с нами и приятного дня!

Drive Project

2018-12-09T12:00:00+03:00

This small note refers to the set of my courses for students of Cherepovets State University (ChSU). This course includes the following curriculum disciplines:

project activity management;
project management;
project activity;
management of innovative projects;
engineering leadership.

Warm welcome to all participants!

Table of Content

Introduction
Theoretical basis (literature review)
Simplified project activities and techniques
Practices, assignments and labs
Literatures

1. Introduction

So, the aim of my little note about project management is to give you some ideas of project activity, its methods, goals and objectives.

Primary tasks are:

learn culture and principles of any projects;
analyze and study the project management system;
develop basic practical skills in project development;
develop the path of project development;
explore some good projects practice.

For the “project” in chapter 3 we will consider:

main features;
structure;
criteria for success;
life cycle;
the rules for setting a goal (the S.M.A.R.T. one);
correct planning;
Gants diagrams;
team responsibility matrix;
tools for analysis;
risk management.

I hope, that you will learn how to:

make distinguish between project activities and operations;
consider project criteria;
set goals and objectives;
create a project plan and a responsibility matrix;
manage risks.

I will tell you a little about the ways to assess and control your knowledge. If I have enough time and energy, I will use the “ready-rating” for continuous control. This is my own feature, which I really want to test (that’s a coincidence, isn’t it?). Training will be based on examining your own readiness. In other words, you will be constantly checked for ability:

to face the real problems of the profession/skill;
to use theoretical concepts;
to use your own logic and intelligence.

This process will be automated and posted online (I think you have already noticed). The rating will include 3 grades: ready, ready in part, not ready. In my turn, I will explore it and modify it based on your comments, successes and failures (also progressing together with you). After all, successful works and strategies are based on mutual cooperation.

But this is not for sure…

If something doesn’t work out, we will limit ourselves to the classical intermediate and final control; which will br unique for each group and which we will talk about in our offline classes.

2. Some theoretical basis (based on GOST, which is like ISO in Russ.)

Project activities is a concept, which refers to a wide range of activities, and it is very intuitive (thus it is hard to give clear explanation and systematization of it). But as you know if you met any unclear situation, you must read regulatory documents (ISO or State Standards). This is what we will do now.

The first stage of any research (scientific, regular, or any other) begins with a review of the literature. I emphasize, that all researches must begins from a review of worldwide and home country regulatory documents (GOST, TU, ISO, ASTM, techniques, SanPin, etc.). Furthermore, I extremely recommend you to make an independent search of the relevant regulatory documents (RD), because I might miss something important and interesting.

Below you can find a brief summary of the main RD, which are related to the project management.

2.1 GOST R 54869-2011. Project Management. Requirements to project management

This standard specifies requirements to project management from its beginning to end (where is the subject of standardization are strictly defined outputs of project management processes). It describes the different concepts and processes inside the project (which have the defined goals and outputs).

In summary and with translation from Elvish. This GOST considers the project structure: stages, data and process in it. The basic concepts are shown on Fig. 1, and the processes within the project (Fig. 2).

Fig. 1. Main concepts of project management (with relationship).

Fig. 2. Scheme of processes in project.

2.2 GOST R 54870-2011. Project Management. Requirements for project portfolio management

The RD set requirements for project portfolio management at the stages of its formation and implementation, while the subject of standardization are the outputs of processes, which is related to project portfolio management. Project portfolio management involves activities, which leads to achieve the strategic goals of the organization through the formation, optimization, monitoring, control and change the project portfolio management under certain limitations. Project portfolio management provides a link between the level of strategic management in the organization and the level of project and program management.

Ok, Google! Again, by translating into a more understandable language, we get the basis, that the entire strategy of the company/startup/personality is the creation, management and change of a set of projects. Thus, the standard is dedicated to the methods of portfolio management (i.e. set of projects). The document describe some concepts of such processes too (fig. 3).

Fig. 3. Projects portfolio.

Task 1. Based of fig. 3 develop a scheme of processes (use fig. 2 as example).

2.3 GOST R 54871-2011. Project Management. Requirements to program management

This standard sets out the requirements for program management to ensure the effective achievement of program objectives and benefits.

In a fact, this document describe a way of adaptation of GOST No. 1 for “a set of actions” (here it is called the program). Program is not the project, that is why this documents will not be considered here in more detail (but you know it name, if you are interested).

2.4 GOST R 56715.1-2015. Project management. Project management systems. Part 1. Main statements (identical to DIN 69901-1:2009 in German)

Is the first document in the series “Project Management - Project Management Systems”. Series consists of the following parts:

Part 1: Basic statements;

Part 2: Processes and the process model;

Part 3: Methods;

Part 4: Data and Data Model;

Part 5: Terms and definitions.

This system of standards is the most fully describes, and it give clear concept of project and project activities (from my point of view of cause). Thus, it is stated that projects consist of a unique set of processes of different types. They (projects) differ in purposes, final results, size, complexity, necessary time of fulfillment, expenses and quantity of involved persons. And finally, the projects are implemented by organizations of any size.

Furthermore, standard declare, that the organization management should define the policy in the area of a project management and all stages of its realization (in form of a document). For this purpose it is necessary to introduce, support at appropriate level and constantly improve system of a project management of the organization.

The main purpose of the project management system is the successful implementation of projects. In particular, the main goals in my opinion:

achieving customer/client goals;
building a transparent project structure (for better interpretation and research);
ensuring effective communication between all project participants;
defining the phases/stages of project implementation (planning);
monitoring and risk assessment;
quality assurance;
creating an environment to control the main project management processes;
providing control of plan adjustments where necessary;
setting professional requirements for project management and staff competence;
carrying out a comprehensive assessment of the single project processes;
identification of links between projects within a program or a project portfolio.

Also, within the framework of the given regulatory document different models are widely used.

Task 2. Define the model in terms of GOST R 56715.1-2015

Models are built according to specially defined requirements. They should represent characteristic tasks and processes, visualize interrelationships and structures, which are necessary for solving the tasks. The model used in this standard describes an idealized project management system and need to be adapted for each specific application.

We shall denote properties of the system of project management, according to GOST 56715.1-2015:

Flexibility: The system can adapt to new/changed conditions in a short time.
Universality: The system allows maximum variety of application and usage.
Modularity: The System is built from subsystems and it can be developed and expanded in a modular manner.
Compatibility: Systems, sub-systems and individual system elements are integrated and compatible with external systems and system parts.
Transparency: The system makes visible the processes and their interrelationships.
Prevention: The system supports the principle of “warning instead of response”.

Thus, the first GOST of a 56715 series introduces us to the business and outlines the general features of project management.

2.5 GOST R 56715.2-2015. Project Management. Project management systems. Part 2. Processes and process model (identical to DIN 69901-2:2009 in German)

The fundamental principle of this standard is process approach, which is used for all project activities (include resources) to reach the desired result more effectively. The required activities for project management are formed as processes and involved in their project environment. On the one hand, it makes easier for all project participants to orientate themselves on results (during project implementation), and on the other hand, it provides a good basis for continuous improvement of the system and creating cooperative links (beyond the corporation).

From Elvish: the project is split into processes, a kind of “action chart”. At the same time, there are four groups of processes (on priority reduction):

leads of projects,
project management,
providing resources,
production processes (create of product)).

Project implementation progress (project life cycle) starting with initiation and ending with completion of a group of phases (which are interconnected segments). This standard distinguishes between project phases and project management groups (processes in each phase). An example of one phase is given in Fig. 4. Each project includes several phases (a kind of sub-projects).

Task 3. Now let’s remember and imagine the recursion.

Fig 4. Graphical representation of project phases.

The project phases divide the project life cycle into time-dependent sections, which are reflect project development. Types of work and other necessary data are indicated in each phase. The separation into process groups at project management level is based on logically interrelated tasks and includes: “Initializing (I)”, “Defining (D)”, “Planning (P)”, “Supervising (control, S)” and “Accomplishing (A)”. More about such phases we will study in chapter 3.

Pay attention, that interpretation of project management in the given standard differs from previous described GOSTs (№ 1-3). It testifies to free and intuitive understanding of the “projects”.

Let us consider an example of a described project phase (Table 1).

Table 1. Example of project phase.

	Initializing (I)	Defining (D)	Planning (P)	Supervising (S)	Accomplishing (A)
1. Deadlines		D.1.1 Identification of project steps (key events)	P.1.1 Work planning P.1.2 Calendar planning P.1.3 Project planning	S.1.1 Launching work S.1.2 Time management
2. Changes			P.2.1 Planning methods of working with changes	S.2.1 Change management
3. Information, documentation, communication	I.3.1 Granting permissions	D.3.1 Definition of information, communication and reports D.3.2 Definition of the project marketing D.3.3 Authorization	P.3.1 Planning of information, communication, reporting and documentation P.3.2 Authorization	S.3.1 Information, communication, reporting and documentation management S.3.2 Acceptance	A.3.1 Preparation of the final project report A.3.2 Creation of a project documentation archive
4. Expenses and finance		D.4.1 Rough (approximated) cost estimate	P.4.1 Preparation of cost and financial plan	S.4.1 Cost and financial management	A.4.1 Compilation of actual cost estimates
5. Organizing	I.5.1 Assignment of responsible persons I.5.2 Selection of project management processes	D.5.1 Forming a project management team	P.5.1 Project organization planning	S.5.1 Holding a startup meeting S.5.2 Creating a project team S.5.3 Developing a project team	A.5.1 Conducting the final meeting A.5.2 Assessment of achievements A.5.3 Disposal of the project organization
6. Quality		D.6.1 Defining criteria for success	Р.6.1 Planning for quality assurance	S.6.1 Quality assurance	A.6.1 Generalization of project experience
7. Resources			P.7.1 Developing a resource plan	S.7.1 Resource management	A.7.1 Release of resources
8. Risks		D.8.1 Definition of risk management methods D.8.2 Analysis of the environment of project or interested persons D.8.3 Realizability assessment	P.8.1 Risk analysis P.8.2 Risk response planning	S.8.1 Risk management
9. Project structure		D.9.1 Composition of an enlarged structure	P.9.1 Development of work decomposition structure P.9.2 Description of work packages P.9.3 Description of process
10. Contract and requirements		D.10.1 Determining the methods of working with contracts D.10.2 Determining the content of the contract with the customer	P10.1 Determining the content of supplier contracts	S.10.1 Implementation of contracts with customers and suppliers S.10.2 Management of additional requirements	A.10.1 Contracts finishing
11. Aims and content	I.11.1 Initial definition of objectives	D.11.1 Defining objectives D.11.2 Defining project content		S.11.1 Management of objectives and content

Examples of diagrams of project management processes are given in fig. 5 and fig. 6 (for more information see the GOST).

Fig. 5. Scheme of processes in one stage in one phase of project.

Fig. 6. Scheme of processes in one stage in one phase of project. More complicate example.

This is the end of this brief review of this GOST. I’ll note once again - process models are very fond of at the University department and always require at any project defences. Therefore, I highly recommend reading this GOST and practice the decomposition of various processes in such diagrams.

2.6 GOST R 56715.3-2015. Project management systems. Part 3. Methods (identical to DIN 69901-3:2009 in German)

This standard defines the basic methods that are used in project management systems.

The standard describes some metrics (parameters) for comparing different project management strategies. Let’s consider some of them in more detail.

1.6.1 Cost estimate - used for forecasting what resources (personnel, finances, etc.) and to what extent are necessary for project implementation (Table 2).

Table 2. Cost estimate

Method	Characteristics
Experts estimation	The evaluation shall be conducted by one expert or group of experts
Delphic method	Evaluation (from experts) is systematized through a structured multi-skilled survey.
Three dots methods	Evaluation (from experts) is supported by an assessment of the optimistic, realistic and pessimistic way. The sum of evaluation is defined as the average value of the above values (usually, the realistic evaluation takes in four times more powerful then others).
Collective evaluation	Evaluation (from experts) is conducted in the form of a collective, i.e., not anonymous, multidisciplinary expert survey. The stages of the collective evaluation are: 1) Selection of experts to carry out the evaluation. 2) Provision of information to the experts. 3) (Preliminary) expert cost estimate. 4) General discussion of evaluation results, in particular of deviations (attention is also paid to preconditions and assumptions). 5) Determining a fully supported assessment result as well as general preconditions.
Comparison of projects (by analogues)	Costs of projects are determined with the help of actual requirements by calculation from the experience data of similar projects.

1.6.2 project supervision. Used mainly for two objectives: control and modification management. In other words, it serves the purpose of comparing “planned” with “real” so that you can later track project modifications.

The form and methods of control depend on the size and complexity of the project and must comply with internal regulations and organizational standards. The GOST specifies some control methods.

The Earned Value Analysis (EVA) method. It includes a joint analysis of such indicators as cost, time consumption and results obtained (performance). The analysis is performed for a certain object (e.g. project, project phase, work package) on a certain date. The calculation requires to be planned and actual indicators and an estimate of the remaining costs (if available). On the basis of EVA it is possible to make forecasts about the expected expenses as well as determine the term of project completion. In addition, the EVA has a number of important project indicators, such as CPI or SPI, which can also be used as early warning system indicators. The most important international abbreviations and indicators with an example calculation show below.

Budget at Completion (BAC);
Data Date (DD) = Time now = As-of date;
Percent of complete (PC);
Process Degree (PCT);
Planned Value (PV);
Budget Cost of Work Scheduler (BCWS);
Actual Cost (AC);
Actual Cost of Work Performed (ACWP);
Earned Value (EV) $= BAC \cdot PC$;
Budget Cost of Work Performed (BCWP);
Actual Performance Index (API) $= \frac{ACWP}{BCWS} = \frac{AC}{PV}$;
Cost Performance Index (CPI) $= \frac{BCWP}{ACWP} = \frac{EV}{AC}$;
Scheduler Performance Index (SPI) $= \frac{BCWP}{BCWS} = \frac{EV}{PV}$;
Cost Variance (CV) $=BCWP - ACWP = EV - AC$;
Cost Variance Percentage (CV%) $=\frac{CV}{BCWP} \cdot 100% = \frac{CV}{EV} \cdot 100%$;
Scheduler Variance (SV) $=BCWP - BCWS = EV - PV$;
Scheduler Variance Percentage (SV%) $= \frac{SV}{BCWS} \cdot 100% = \frac{SV}{PV} \cdot 100%$;
Estimated Cost at Completion (Kosten, EAC):
$$EAC = BAC \cdot \frac{AC}{EV} = \frac{BAC}{CPI\ (cumulative)}\ (linear estimate)$$

$$EAC = AC + (BAC - EV)/ (summarizing estimate)$$

$$EAC = BAC (start planning)$$
Projection at Completion (Zeit, PAC) $=\frac{Planned\ Duration}{SPI} = \frac{\frac{BAC}{SPI} - BAC}{\frac{average\ BCWS}{time\ unit}}$;
Variance at Completion (VAC) $= BAC - EAC$;
Variance at Completion Percentage (VAC%) $= \frac{VAC}{BAC} \cdot 100%$.

The degree of project completion is determined on the date of compilation (specific date) (PC based on EVA) by comparing the set and actual status and is indicated as a percentage (%). The availability level can be defined for different tasks (e.g. project, detailed project, work package) and shown as a cumulative total (if necessary).

1.6.3 Comparison of projects (peer review)

It is used to forecast new projects data and compare project parameters (e.g. to evaluate costs based on experience with completed projects).

Data on completed projects should be preliminary collected and classified (archive, knowledge base). Data on at least 10-30 projects should be used. If the projects are very similar, a smaller number of similar projects will be sufficient.

Experimental data are evaluated in comparison of projects by parametric calculation, determination of average values or similar conclusions between projects.

Parametric calculation establishes a link between the project targets (e.g. costs and project duration, the composition of the work and the results achieved etc.). The calculation process use statistical analysis software (applications) and can show the quantitative average relationship between the targets and the parameters.

This relationship or given average allows making predictions about new individual parameters and evaluation (partial comparison). For an overall forecast or overall assessment of the project implementation, the results of individual partial comparisons can be combined (full comparison).

1.6.4 Project structure

Projects are usually very complex. They involve many interrelated tasks that are often difficult to fully predict.

Project structuring serves to visualize the entire range of project tasks with their respective dependencies and to support planning and control processes through rational structuring.

Method of division into components (from top to bottom). Begins with the first level, which is the project name. Then the project is divided into different parts by a certain criterion. They form the second level. The structural plan of the project is ready when all parts of the project are divided into work packages.
The method of generalization (from bottom to top). The work packages of one project are developed on the basis of previous experience and using appropriate methods of improvement. The structure of the project activities can be built using several approaches to decomposition. There are three types of project structural plans:
- the structural plan of the project oriented to the object (the definition of work packages is reduced to (technical) structure of the object);
- function-oriented structural project plan (work packages are divided into different functions (e.g. sales, development, testing, manufacturing));
- the structural plan of the project oriented to the phases and progress of the project (classification of tasks is oriented to the life cycle phase model (e.g. design, development, implementation, acceptance)).

2.7 GOST R 56715.4-2015. Project Management. Project management systems. Part 4. Data and data model (identical to DIN 69901-4:2009 in German)

The data model presented in this standard describes the elementary data structures of project management at the professional level. The data model can be used for:

archiving project management data;

exchange project management data between organizations and different software systems;

specification of project management software requirements (as input data).

Data saving format: xml. The data elements are named as nouns and are always used in the single form. The data elements can also be named as two nouns (the position (sequence) of the noun define the hierarchy where it possible). For example, there are a hierarchical relationship between the data elements “Initiative” and the “InitiativeGroup”. This relation can be defined only by name of the elements. For better understanding, assigning a name from multiple nouns is done using hyphens.

Thus, this standard establishes the data structure when storing and archiving a project. This structure is approved and standardized, which is quite convenient. I recommend to read the GOST completely if you feel it is necessary and want to practice English/German, as it contains translations of the main values.

2.8 GOST R 56715.5-2015. Project Management. Project management systems. Part 5. Terms and definitions (identical to DIN 69901-5:2009 in German)

Is basically a dictionary of terms.

Task 4. Review the terms and write out the 10 most important ones in your opinion.

2.9 GOST R ISO 21500-2014** Project Management Guide (identical to international standard ISO 21500:2012 "Guidance on project management")

This standard contains general recommendations, basic concepts and characteristics of project management processes, which are important for project implementation and affect their results.

Essentially, it is a short generalization of GOSTs No 4-8 (I recommend to use them instead of this standard).

In general, all standards (and the whole project management discipline) is designed to put order in the head of %username%. So if you have difficulty with planning and reporting your plans to others, you can try to study this n.a.. But even if everything is okay, you can use the reference to GOST in a working dispute - it can greatly simplify your life. So it is important to understand the main points of these standards, and to be able to use selected concepts. So we continue and move on to the next part, which is designed to simplify our lives a little.

3. Simplification of life in project activities

In this chapter I will try to give you a more understandable description of work with projects. This information is now very relevant, especially when you working in big companies. In particular, various trainings on self-development and project management are widely practiced at “PhosAgro” corporation (where I had worked for 10 years). I will try to share with you what I have learned in the course of my work in this company.

3.1 Introduction to project activities

So, project according to ISO 21500 is “a unique set of processes, which consists of coordinated and managed tasks with initial and final dates, undertaken to achieve the goal”. I think it is better to say a little more clearly: it is a time-limited activity which results are new and unique products or services. It is the main differences of project, compare to the operational activity or process. For me, one of the indicators of project activity is probability of success (the project is always associated with more risks than the operational activities).

Process (operational activities)	Project
usual results stable business process lack of big risks relatively stable team (staff)	unique results finite duration a lot of risks flexible project team

Types of projects for the company:

economic (target - money);
social (target - people).

The main features of the project:

the presence of a target;
the presence of a change in some system;
time limitations (there is always a start and an end to a project);
unique (by the set of stages);
limited resources required (there is a resource consumption specification and schedule);
specific organization.

Task 5. Think about which of the following is relevant to the project and which one (social or economic): construction of a residential building, production of new products in the factory, operation of the power plant, education, driving, family life, department management, repair of the room.

Task 6. Describe your experience with the project. If not, make up one.

Reasons for the project implementation:

possibility
problems

It is important to separate these reasons, the justification and design of the project depend on them. Special attention must be given to these reasons: time, budget and quality (as they say, choose any 2, but our goal is to consider all 3).

The most common reasons for failure of the project:

inappropriate resources;
wrong deadlines;
poor communication;
lack of focus and development of the project stages;
lack of funding;
lack of management tools;
lack of involvement of project leadership.

A project is successful when and only when it is completed:

in due time;
within budget;
with satisfactory results (in terms of goals and objectives);

3.2 Phases and processes inside a project

The phases and processes in a project are necessary for management

integration - to the program or global process (initial project development work: documentation, description, project management plan, monitoring);
content - place all necessary works in the project (content planning, work structures, content change management);
deadlines - make work on time (schedule, duration, composition and interaction between operations);
cost - stay within budget;
quality - the project met the needs for which it was created (quality assurance and control, policies, goals and responsibilities);
human resources - organization and management of the team;
communications - preparation, collection, distribution, storage, selection and final placement of information;
risks - analysis, response, monitoring and management of risks to increase the probability of success.

Project phases - this is a massive blocks (you can think about them as a table of content), which are the same for every project. They are logically connected activities, which leads to predefined result.

Project Life Cycle - a set of ordered project phases. Often may depend on the project itself and the necessary controls.

Result - a measurable, tactile and controllable output of the project. It is often used in a narrower sense, as something that requires approval by the project sponsor or the customer.

Fig. 7. Level of effort and impact on the project, taking into account the main phases (to simplify the initializing and defining phases and Implementing and Supervisory control phases are combined). *

* This project description also include implementation phase, which is not mentioned in GOSTs No 4-8 because of different point of view (when we management the project we do not implement it but define description of the project).

3.2.1 Initializing & Defining phases (phase I + D)

collection of baseline data and analysis of the current status (literature review) to identify the need for changes;
project identification:
goals, objectives, results;
basic requirements, limitations and criteria;
risk level;
the project environment, potential participants (it is important, let’s consider more details below);
time, resources, funds, etc.
identification and comparison of alternatives to the project;
approving the concept for the next phase.

The result is approval for the start of the project and the creation of a project summary. The definition of common project summary show in Table 3.

Table 3. Common content of the project summary

Item	Requirements
Name	Interesting, intriguing, relevant to the content
Relevance (Why, what do we want?)	Problem solution (in operational activity) or realization of potential: - why is it necessary to realize the project? - why is this possibility important and priority? Major problem need to be describe, digitize (make measurable) and visualize
Target (aim)	How much the target will solve or reduce the problems (for more - see below)
Implementation result	What specific improvement/changing will the sponsor/customer receive
Stages	Technology for project implementation (important!) - a brief plan of concrete actions and intermediate expected results
Sponsor/Customer	Who invests resources
Users	The public that the project will influence
Team	Developers (both internal and external) - describe as clearly as possible, as far as positions and full names.
Deadlines	Development and implementation from the moment of approval to the final stage in months. If the project is long - specify the intermediate deadlines for the stages.
Budget (expected)	Cost and number of investments and estimated economic effect (i.e. the period when the investment will start to pay off)

Note. It is always important to receive information on the subject of the project from the outside (at least an expert evaluation).

Note. If the project is targeted at solving the problem, evaluation and numerical data are always assumed. Especially when there are evaluation adjectives (more, less, etc.) - you need numerical data.

The goal of the project - is the main part of every project and should satisfy S.M.A.R.T. ideology!

S	Specific	Does it give a clear idea of what should be achieved?
M	Measurable	Are there quantitative or qualitative criteria for achievement?
A	Achievable	How real is it in terms of objective conditions and possibilities?
R	Relatable	What does it relate to other goals?
T	Time Limited	When should the goal be achieved?

Examples:

SMART goals	NOT goals
- reduce the level of staff attrition to 10% by the beginning of the second quarter of 2016. - to ensure a monthly sales volume of 5 million rubles by May 1, 2020. - to take second place in the regional competition "1-2-3" this year.	- work better. - to participate in the competition. - motivate the staff. - to work as planned.

Project participants

Once again, it is necessary to specify as much as possible any information in the project - including all participants, up to the department, positions and full names. Interaction between project participants show in fig. 8.

Fig. 8. Interaction between project participants. Dashed lines mean that 2 participants may or may not be the same person.

Note. Project Initiator is the author or owner of the main idea (and usually he/she prepare preliminary justification of the proposal).

More detail about participants explain in Table 4.

Table 4. Participants ant they roles.

Role	Description
Project Initiator (promoter)	Author of idea or main stakeholder (interested party)
Customer	Decision making on project opening; implementation monitoring; budget allocation; key decisions on the problems, which are not included in the competence of the Curator and Project Manager; approval of the final report and decision making on closing.
Sponsor	Providing resources to the project. May be the customer.
Beneficiary	Responsible for quality control and acceptance of project results. Future user of project results.
Consultant (tutor = internal consultant, expert)	Responsible for initiating, monitoring and controlling implementation. Participates in the coordination of key events of the project and participates in develop of the final conclusion.
Supervisor	Responsible for the achievement of project goals, as well as for efficient and cost-effective use of project resources.
Project team	Are responsible for the fulfillment of the supervisor's instructions
Interested parties	Persons who fall into the zone of interest of the project (not always the beneficiaries, the effect of project may be negative for they).

I should point out that it is useful to analyze all interested parties (stakeholders) in terms of the impact matrix on the project.

Fig. 9. Impact matrix.

Task 8. Describe your relationship with A-to-G people involving in your project.

2.2 Development & planning phase (P)

appointing a supervisor, forming a team and responsible people;
establishing contacts and studying goals, motivations and requirements of the customer/sponsor and other key participants;
concept development and core content development:
final result;
quality standards;
structure;
basic works;
resources.
planning:
decomposition into simple stages;
calendar plans;
estimate and budget;
resource requirement;
control technique;
risk identification and allocation.
tendering and contracting;
presentation and performance of basic design and construction (CAD) works;
obtaining approval for the next step.

Let’s pay more attention to Management of project content, which includes:

Content planning.
Content definition (detailed description).
Creating a hierarchical work structure (Work Breakdown Structure, WBS).
Validating the content (formalizing and documenting).
Content change management.

Project plan - formal and approved document that can be used to manage project execution (can be corrected in process). Composition:

Basis for project fulfillment.
Description of the approach to project management.
Description of goals.
WBS.
Valuation and scheduled deadlines (including valuation methods).
Allocation of responsible persons (up to WBS level).
Major control events and their dates.
Key and required personnel.
Key risks and planned response to each one.
Management plans for project components (objectives, resources, contracts, risks, interactions, staff).
Open issues and delayed decisions.

Additional information in the project plan:

Limitations and assumptions.
Technical documentation (requirements, specifications, project documentation).
Standards and regulations involved.

Note. It is always a good practice to pin project plan in the most viewed and visited place of your team.

Let’s consider the hierarchical structure of the project (Work Breakdown Structure, WBS), which divide the project into natural elements to ensure control and management.

Work Breakdown Structure (WBS) rules:

Lower-level works are the way to achieve upper-level works.
There can only be one parent work for each child.
For each level, the jobs must be equal (e.g. volume, time, etc.).
Different decomposition criteria can and should be applied at different levels (important difference from usual classification!).

The decomposition stops if for the level:

the work is clear and understandable to the manager and project participants;
the final result of the work is clear as well as the ways to achieve it;
the time characteristics and responsibility for the work can be clearly defined.

Main structure and example of WBS are shown on fig. 10.

Fig. 10. Work Breakdown Structure (WBS)

Management of project deadlines - ensures that the project is completed on time:

determining the composition of operations;
defining the interrelationships of operations;
estimating the resources of operations;
estimating the duration of operations;
developing a schedule (taking into account the sequence of operations, their duration, resource requirements and time limits);
schedule management.

For these purposes is often used the Gantt Chart, a graphical representation of the project plan (schedule). It looks like horizontal bars, located between two axes: list of tasks vertically and dates horizontally. It is quite easy to build in MS Excel or LibreOffice Calc by painting over the corresponding cells. You can find a lot of examples in the internet.

3.2.3 Implementing and supervising phase (S)

tenders (organizing or conducting);
work fulfillment;
launch of communication between participants;
launch of the motivation (incentive) system for participants;
detailed design and technical specifications of works;
operative planning of works;
informative control over work progress;
material and technical support management;
monitor and forecast of work progress (quality, duration, cost, etc);
solution of arising problems.

Management and control for the project. I recommend you to do the following:

Go through the plan again. Before starting each stage, clarify with each participant its tasks and responsibilities.
Evaluate what has already been done in terms of work, time, labor input and costs. Compare it with the plane (preferably with project participants).
Take corrective actions if plan changes is required.
Informing people about the progress of the project.

The following data are needed to analyze the progress of the schedule:

ID-s and descriptions of events.
Names of responsible persons.
Estimated and actual dates of events to be achieved.

All the necessary information for monitoring can be displayed in the table (Table 5).

Table 5. Example of data for monitoring

Job	Responsible	Start date		End date		Comment
Job	Responsible	plane	actual	plane	actual	Comment
Survey development	Ivanov A.					Critical path
Carrying out a pilot survey	Petrov V.
Instruction printing	Ivanov A.

When you choose the periodicity of observations, I recommend you to consider:

whether the job are on a critical path (whether the timing of the next job depends on it);
whether the task has significant risks;
if there are preliminary difficulties for similar tasks.

The work should be supervised at least once a month.

The project’s qualification list is a convenient form of displaying the qualification and knowledge of team members. It is recommended to use the following scheme:

basic qualification (what person can do as a leader);
additional qualification (what person can do under the management of the leader);
interest shown (desire of the employee to perform certain tasks).

Example is shown on the Table 6.

Table 6. Example of qualification list

	designer (Ivanov A)	analyst (Petrov P)	programmer (Sidorov S)	HR-manager (Ivanov B)
develop of technical documents			basic qualification/ shown interest	shown interest
interviewing	shown interest	shown interest		basic qualification/ shown interest
graphical design	basic qualification/ shown interest		additional qualification	shown interest
surveys development	additional qualification	additional qualification		basic qualification

As a guide for creating qualification table you can use follow statements:

Make a complete list of skills that may be required for the future project.
Create a complete list of people for the table.
Invite people from the list to evaluate their skills and interest in all areas of the project.
Invite the direct supervisors of these people to evaluate their professional qualities in the necessary areas.
Compare the data, make adjustments.
Compile the final version of the qualification list.

Responsibility Matrix - used to display the links between the performed jobs and project members, as well as establishes the degree of responsibility. The A.R.C.I. method is used for drawing up.

A.R.C.I. method (Table 7):

Accountable - fully responsible for the execution of the stage/task, has the right to make decisions on the way of implementation (only one person can be assigned).
Responsible - performs the task, is not responsible for the choice of the method of its solution, is not responsible for the quality and timing of implementation (there can be more than one person).
Consultant before doing - provides consultations during the solution of the project tasks, controls the quality of implementation.
Inform after doing (observer) - can provide consultations in the course of solving the project tasks, is not responsible. He is informed after carrying out of jobs.

Table 7. Example of A.R.C.I. method

Operations	Ivanov	Petrov	Sidorov	Kuznecov	Sergeev
Task 1	R	A	C	I	I
Task 2	A	C	C	R	I
Task 3	C	A	I	R	R
Task 4	C	I	A	C	I

Valuation of the project cost can perform in several ways.

Expert Judgment - attraction of experts from the project area. After their makes proposals, we average them and come to a single solution during the discussion.
Three Point Estimation - on the basis of pessimistic (P), optimistic (O), and realistic (R) future we calculate an average score:

$E = \frac{O+4R+P}{6}$.

Note that P, O and R are determined by expert opinion. P, O and R measure in hours/days/currency and calculate during the team discussion based on questions: “how long will the project take if there are no risks?”, “what can be the most negative scenario?” etc.

Analogous Estimation (from top to bottom) - based on past experience, including decomposition of the project.
Bottom-up Estimation - estimates the cost of each operation, then sums it up to the total cost of the project.
Parametric Model - one of the most accurate and flexible methods. We build a parametric model (based on past experience, available data, metrics and statistics), which is used to forecast.
Cost of Quality - the total cost of creating a project (which is product or service) calculate according to quality standards. This approach is not common and works only if our project have some regulatory documentation.

Risk management - includes processes related to the identification, analysis and response to project risks in order to increase the probability and impact of positive events and reduce the probability of negative events of the project.

Project Risk - An uncertain event or condition that has a positive or negative impact on at least one of the project objectives (e.g. timing, cost, content or quality) if it occurs.

The risk management scheme may include (Table 8):

risk management methodology;
roles and responsibilities of those who are involved in risk management;
budget for risk management;
defining the frequency of risk management procedures;
threshold criteria for recognizing the occurrence of risk;
risk categories;
probability and impact matrices for risks;
reports of templates.

Table 8. Example of risk management scheme.

No	Risks	Risk influence	Probability	Influence on ... (e.g. timing, cost, results, etc.)	Minimization procedures	Owner of risk
1
...

Example of typical risk are shown in Table 9 (according to regulatory documentation of JSC “Apatite” STO 8.1-16-2018).

Table 9. Example of risk description.

Risk category / type of project	Typical structure of risks
Risks, which are applicable to all types of organizational change projects
Content management	- Inaccuracy/incomplete determination of project goals, objectives and results. - Change of requirements at late stages of the project implementation. - Inaccuracy of the provided source information. - Poor quality/incomplete elaboration of documents and project results. - Not achieving project goals, objectives and results.
Deadlines management	- Insufficient planning at the initial stages of the project implementation. - Absence of baseline data for detailed planning. - Lack of resources to implement the project within the specified time frame. - Uncoordinated actions of the project team. - Lack of joint planning with interconnected projects. - Untimely provision of project needs by structural units and related projects. - Prolonged review and approval of project documents.
Contracts management	- Long terms of the tender selection and signing a contract with an external consultant. - The reluctance of an external consultant to accept all the conditions of the model contract. - Impossibility to ensure permanent presence of specialists at the Customer's facilities. - Violation of the terms and conditions of contracts by the Contractor.
Human resources management	- Insufficient qualification of employees / lack of necessary expertise. - Lack of resources to implement the project within the specified time frame. - Change in the structure of the project team from the Customer or the Contractor. - Absence of a "real" time resource for the working group members. - Lack of real authority from the project supervisor.
Macroeconomic	- Fluctuation of the USD exchange rate. - Changes in prices for raw materials and products. - Increase in inflation, wage growth, tax increases, etc.
Risks, which are associated with organizational change projects of a certain type
Strategy/Concepts development	- Choosing the wrong approach to activity analysis. - Not all factors are taken into account during development. - Insufficient planning to implement the strategy.
Creation of a new unit	- Incorrect estimates of the number of employees and their job duties. - Inability to hire staff for available vacancies. - Difficulty in obtaining the necessary licenses and permits.
New business process implementation	- The desire of external participants to not accept the proposed changes. - The reluctance of line managers to make the necessary changes in processes.
Increase/decrease in staff productivity	- The reluctance of line managers to make the necessary changes in the processes. - Lack of the necessary statistics. - Lack of technical expertise for certain types/groups of equipment.

The evaluation of the negative impact of risks on the project is given in the Table 10.

Table 10. Evaluation of risks impact.

Object/Influence	Very low 0.05	Low 0.1	Moderate 0.2	Hight 0.4	Very hight 0.8
Cost	Insignificant increase	Increase < 10%	Increase 10-20%	Increase 20-40%	Increase > 40%
Deadlines	Insignificant increase	Increase < 5%	Increase 5-10 %	Increase 10-20 %	Increase > 20%
Contents	Changes are not visible	Insignificant increase	Significant changes	Unacceptable change for client	Achieving the final results is impossible
Quality	Changes are not visible	Insignificant increase	Changes require client's approval	Unacceptable change for client	Achieving the final results is impossible

Risk and threat strategies for the project:

Risk avoidance - a change in the project plan to eliminate the risk or to protect project objectives from impacts.
Transfer of risk - transfer of the risk impact to a third party (does not eliminate, but transfers the control). Usually an insurance benefit is charged for risk transfer. Example - insurance of capital assets.
Risk reduction - reducing the probability of the risk or its consequences to an acceptable level.
Risk acceptance - is the strategy under which the risk is accepted. The project team does not try to influence the risk.

3.2.4 Accomplishing (A), final phase

planning the close of process;
product testing;
preparation for product exploitation (personnel, documentation);
evaluation of results and summarizing (preparation of final documents);
conflict handling;
accumulation and storage of actual and test data for future projects;
team disbandment.

Sometimes it is good to self-evaluate your project (or make a open survey for all involving people and experts). Criteria for project evaluation are shown in Table 11.

Table 11. Table of project evaluation criteria

No	Subject of evaluation	Criteria of evaluation
1	Project difficulty	- the scope of the solved problem.
2	Project development	- how detailed the project is developed? - are efficiency indicators available (preferably in numbers)? - are project actions correspond to its objectives?
3	Justification of solution choice according to alternatives.	- are choice of solutions justified (according to alternatives)?
4	Economic reasonability	- are the proposed solution and budget relevant to the scale of the problem (according to it negative consequences)?
5	Risk management	- are project risks minimized?
6	Effectivity of proposed solution	- are proposed actions corresponding to estimated result?
7	Effective presentation	- Understandable story. - Logic of the speech (clarity of structure). - Ability to justify your position. - Confidence in answering the questions. - Quality of presentation design.

*Rating scale: 1 (criterion not applicable), 2 (below average), 3 (satisfactory), 4 (above average), 5 (ideal).

3.3 For the notes and final records

In the course of the project implementation, next change requests will be able to arise:

corrective actions;
preventive actions;
error correction;
updates.

Moreover, will be able to change:

project results;
project content;
project management plan;
project documentation.

Monitoring (reporting) and control (comparing states) of the project’s works are a continuous processes of monitoring, analyzing and managing progress, which involves the following aspects:

comparing the current progress with the plan;
progress assessment to identify whether correction or warning is needed;
analysis, tracking and monitoring of risks;
identification of a reliable and up-to-date information base about project products and related documentation;
identification and provision of information for reporting;
presentation and calculation of project development forecasts.

So, I think you have already read everything that I have found and posted on this resource. That is quite enough in my opinion. But here’s the question, the outside world is not limited to my and your opinions) So let’s hear what other people think about project management and how our ideas match up. So please have fun with the course which you will have to read/listen and do all the tasks on it) And only that will be quite enough (for now). So, good luck, project managers!

4. Practice, tasks and labs (not necessary needed)

For all those who need it, I bring a number of practical and theoretical tasks about this course. All of them are given in Table 12 (concrete tasks should be taken from me by headmen of groups personally).

Tasks that meet in the text do not need to be performed and sent to me, but they will meet at the colloquium or examination.

Table 12. Practice, tasks and labs

No	Name	Comments
1	Entry control	-
2	Complete the course (need the screenshot or link to certificate)	-
3	Practical task No 1 (Different project management systems). To learn about different project management systems, make a table with a brief description, advantages and disadvantages of each of them (In Russ.).	-
4	Practical task No 2 (Practice of working in a Kanboard system using Trello.com as an example). Register on Trello.com and create any project at your choice.	-
5	Practical task No 3 (Practice of working in a Kanboard system using Trello.com as an example). Organize a meeting with invited participants (no need to invite real people, just know how to do it), date, agenda and notification. You can use this site, as an instruction.	-
6	Practical task No 4 (Practice of working in a Kanboard system using Trello.com as an example). Create research project. You can use this site, as an instruction.	-

5. Literature

GOST R 54869-2011 Project management. Requirements to project management (in Russ).
GOST R 54870-2011 Project management. Requirements for project portfolio management (in Russ).
GOST R 54871-2011 Project management. Requirements for program management (in Russ).
GOST R 56715.1-2015 Project management. Project management systems. Part 1. Main provisions (in Russ).
GOST R 56715.2-2015 Project management. Project management systems. Part 2. Processes and process model (in Russ).
GOST R 56715.3-2015 Project management. Project management systems. Part 3. Methods.(in Russ).
GOST R 56715.4-2015 Project management. Systems of project management. Part 4: Methods. Data and data model (in Russ).
GOST R 56715.5-2015 Project management. Project management systems. Part 5. Terms and definitions (in Russ).
GOST R ISO 21500-2014 Project Management Guide (in Russ).
Course “Basic of project management” on stepic.org (in Russ).
Set of sites about project management systems: Trello for Researchers, Using Trello in academia, Some guys’ personal experience (in Russ), Top 7 methods of project management: Agile, Scrum, Kanban, PRINCE2 and others (in Russ).
Of course Wiki - a good place to start and search the direction of further studies.
Some examples and calculation of projects’ parameters.
Project management glossary of terms.
Good translator deepl.com.
Creator of html tables.
Creator of diagrams.

Thank you for your attention!

Мои доклады и конференции

2018-08-02T00:00:00+03:00

В данной заметке собраны основные конференции и некоторые конкурсы, в которых я принимал участие. Приведены названия работ и материалы к ним.

Второй съезд аналитиков России, 2013, г. Москва, Россия
VIII Всероссийская конференция по рентгеноспектральному анализу, 2014, г. Иркутск, Россия
Третий съезд аналитиков России, 2017, г. Москва, Россия
11th Winter symposium on chemometrics (WSC11), 2018, Saint Petersburg, Russia
5th International Congress on Microscopy & Spectroscopy (INTERM), 2018, Oludeniz, Turkey
I Всероссийская конференция с международным участием «Математическое и компьютерное моделирование в науке о материалах”, 2019, г. Череповец, Россия
3rd International Conference on Information Processing and Control Engineering (ICIPCE), 2019, Moscow, Russia
Международная научно-практическая конференция АО “НИУИФ”: 100 лет развития науки и производства, 2019, г. Череповец, Россия
III Всероссийская конференция по аналитической спектроскопии с международным участием, 2019, г. Туапсе, Россия
3rd International Conference on Automation, Control and Robots (ICACR), 2019, Prague, Czech Republic
Ночь наук, 2019, г. Кировск, Россия
The 4th International Conference on Mechanical, System and Control Engineering (ICMSC), 2020, Kazan, Russia

1. Второй съезд аналитиков России, 2013, г. Москва, Россия

1.1 Постерный доклад.

Юновидов Д.В., Ребрикова А.Т., Осколок К.В., Соколов В.В. Рентгенофлуоресцентное определение технологически важных элементов в экстракционной фосфорной кислоте // Второй съезд аналитиков России. Москва. Россия. 2013. Тезисы. С. 289.

1.2 Постерный доклад.

Юновидов Д.В., Ребрикова А.Т., Осколок К.В., Соколов В.В. Техника виртуального эксперимента для количественного рентгенофлуоресцентного анализа экстракционной фосфорной кислоты // Второй съезд аналитиков России. Москва. Россия. 2013. Тезисы. С. 290.

2. VIII Всероссийская конференция по рентгеноспектральному анализу, 2014, г. Иркутск, Россия

2.1 Постерный доклад.

Юновидов Д. В., Эль-Салим С. З., Осколок К. В. Техника виртуального эксперимента и её применение для количественного рентгенофлуоресцентного анализа экстракционной фосфорной кислоты // VIII Всероссийская конференция по рентгеноспектральному анализу. Иркутск, Россия. 2014 г. Тезисы. С. 140.

2.2 Устный доклад.

Юновидов Д. В., Эль-Салим С.З., Осколок К.В. Восстановление спектра гомогенной системы по временным зависимостям интенсивностей линий в зарождающейся и развивающейся гетерогенной системе на примере экстракционной фосфорной кислоты // VIII Всероссийская конференция по рентгеноспектральному анализу. Иркутск. Россия. 2014 г. Тезисы. C. 139. (Оформление презентации убрано специально).

3. Третий съезд аналитиков России, 2017, г. Москва, Россия

3.1 Постерный доклад.

Юновидов Д.В., Соколов В.В., Бахвалов А.С. Использование спектра NPKS удобрений для оценки значимости стадий пробоподготовки для рентгенофлуоресцентного анализа // Третий съезд аналитиков России. Москва. Россия. 2017. Тезисы. С. 243.

4. 11th Winter symposium on chemometrics (WSC11), 2018, Saint Petersburg, Russia

Рис. 1. Сертификат.

4.1 Постерный доклад.

D. Yunovidov, V. Sokolov, A. Bahvalov Big data analysis and comprehensive analytical control of fertilizers // 11 Winter School of Chemometrics (WSC 11). Saint Petersburg. Russia. 2018. Theses.

5. 5th International Congress on Microscopy & Spectroscopy (INTERM), 2018, Oludeniz, Turkey

Рис. 2. Сертификат.

5.1 Постерный доклад.

D. Yunovidov, V. Sokolov, A. Bahvalov Optical addition to X-ray Fluorescence Analysis of Mineral Fertilizers // 5th International Congress on Microscopy & Spectroscopy (INTERM). Oludeniz. Turkey. 2018. Theses.

Научная работа (статья).

6. I Всероссийская конференция с международным участием «Математическое и компьютерное моделирование в науке о материалах", 2019, г. Череповец, Россия

Рис. 3. Сертификат

6.1 Устный доклад.

D.V. Yunovidov Multidimensional classification method of industrially produced mineral fertilizers for the representation of the “manufacturer–quality” model // Математическое и компьютерное моделирование в науке о материалах. Череповец. Россия. 2019. Тезисы.

6.2 Постерный доклад.

Надежин М.Н., Юновидов Д.В., Шабалов В.А., Соколов В.В. Моделирование и оценка связи гранулометрического состава с различными параметрами производства минеральных удобрений по схеме барабан-гранулятор-сушилка (на примере диаммонийфосфата) // Математическое и компьютерное моделирование в науке о материалах. Череповец. Россия. 2019. Тезисы.

6.3 Постерный доклад.

Сидорова Е.Е., Юновидов Д.В., Соколов В.В. Гранулометрический состав как параметр моделирования технологического процесса производства минеральных удобрений по схеме барабанный гранулятор-сушилка // Математическое и компьютерное моделирование в науке о материалах. Череповец. Россия. 2019. Тезисы.

7. 3rd International Conference on Information Processing and Control Engineering (ICIPCE), 2019, Moscow, Russia

Рис. 4. Сертификаты.

7.1 Устный доклад.

D.V. Yunovidov, M.N. Nadezhin, V.A. Shabalov Pattern recognition in the differentiated image for the powder and granulated materials particle size classification // 3rd International Conference on Information Processing and Control Engineering. Moscow. Russia. 2019. Theses.

Текст доклада.

Научная работа (статья).

8. Международная научно-практическая конференция АО "НИУИФ": 100 лет развития науки и производства, 2019, г. Череповец, Россия

Рис. 5. Сертификат.

8.1 Устный доклад.

Юновидов Д.В. Современные методы автоматизированного экспресс контроля при анализе качества минеральных удобрений // Международная научно-практическая конференция АО “НИУИФ”: 100 лет развития науки и производства. Череповец. Россия. 2019. Тезисы.

8.2 Устный доклад.

Юновидов Д.В. Современные методы анализа минеральных удобрений, сырья и полупродуктов // Международная научно-практическая конференция АО “НИУИФ”: 100 лет развития науки и производства. Секция аналитическая химия. Череповец. Россия. 2019. Тезисы.

9. III Всероссийская конференция по аналитической спектроскопии с международным участием, 2019, г. Туапсе, Россия

9.1 Постерный доклад.

Юновидов Д.В., Сидорова Е.Е., Надежин М.Н., Соколов В.В. Оптический контроль качества промышленной обработки минеральных удобрений кондиционирующими добавками // III Всероссийская конференция по аналитической спектроскопии с международным участием. Краснодар. Россия. 2019. Тезисы.

9.2 Постерный доклад.

Юновидов Д.В. Классификационный и регрессионный анализ марок минеральных удобрений // III Всероссийская конференция по аналитической спектроскопии с международным участием. Краснодар. Россия. 2019. Тезисы.

10. 3rd International Conference on Automation, Control and Robots (ICACR), 2019, Prague, Czech Republic

Рис. 6. Сертификат.

10.1 Устный доклад.

D.V. Yunovidov, V.A. Shabalov, V.V. Sokolov Method of Industrial Automated Optical-electronic Control of Granulometric Composition of Mineral Fertilizers // 3rd International Conference on Automation, Control and Robots. Prague. Czech Republic. 2019. Theses.

Текст доклада.

Научная работа (статья).

11. Ночь наук, 2019, г. Кировск, Россия

11.1 Устный доклад.

Юновидов Д.В. “НИУИФ - история и современность” // Ночь наук. Кировск. Россия. 2019.

12. The 4th International Conference on Mechanical, System and Control Engineering (ICMSC), 2020, Kazan, Russia

Рис. 7. Сертификаты.

12.1 Устный доклад

D.V. Yunovidov, K.A. Menshikov, E.E. Sidorova Robotic control system for particle size distribution of industrially produced mineral fertilizers // The 4th International Conference on Mechanical, System and Control Engineering. Kazan. Russia. 2020. Theses.

Текст доклада.

Научная работа принята к публикации в журнале IJMERR (International Journal of Mechanical Engineering and Robotics Research | http://www.ijmerr.com/).

Experiments and data

2019-12-09T10:00:00+03:00

Greetings to everyone who interested in this topic!

This section is dedicated to the basics of experiment planning and analysis of the acquired data. This is the core of any scientific and analytical work. However, I do not see much difference in what kind of science or discipline it will be. In fact, we conduct experiments and process data all the time. So, I will try to make this course as useful and meaningful as possible, regardless of the field of application. After all, we are all scientists and engineers in ordinary life (the question is: good or bad?). We solve various optimization tasks (e.g. how to get a higher salary), accumulate data through observations and draw conclusions from our own experience.

The goal of the course is to develop a general theoretical and practical vision of science, data and experiment.

Main objectives are:

Show the terminology and logic of experiments in science.
Describe the features of the experiment in terms of the investigated factors.
Define effective ways of carrying out the experiment and obtaining information in order to optimize the system response.
Provide an introduction to statistics and processing of the results.
Introduce the building of linear regression models.
Consider and solve some problems and examples, which are related to the course topic.

Many tasks and definitions in this module are taken from excellent courses from [coursera.org] (https://www.coursera.org/) and [stepic.org] (https://stepik.org/) (more in the reference list), as well as from various analytical chemistry’s textbooks and manuals. All presented material has been studied, structured and redesigned based on my own experience and reflects my subjective point of view.

1. Introduction. Science and scientific approach

Well, science and scientific approach, what is this?

Science - systematic representation about structure and organization of all “knowledge” (information) about our life and Universe with the possibility of verification and prediction.

As we know from ancient Greek’s philosophy, we have only two option to study our environment: the observation and the experiment (I really can’t see any controversies about this assumption in nowadays).

The scientific activity can be described as “data collection through observations and experiments”. Besides, they are constantly updated, systematized and analysed. The consequence is the acquisition (synthesis) of new knowledge and laws of our World. In other words, on the basis of data, we create theories and hypotheses that are confirmed/confronted by observations or experiments. Thus, we can assume the following cycle of scientific cognition (Fig. 1, Table 1).

Fig. 1. Relations in "science cycle".

Table 1. The terms of scientific study

	apply to unit or small amount	apply to all cases
describe what is happening	observation	law
describe why it is happening	hypothesis	theory

As a general rule, in any science we will work on hypotheses and theories, operating with laws and observations (data).

At the same time, we should not forget that the basic tool of description and classification of any phenomenon is mathematics. To work effectively in the modern world, we need one more tool - programming. I advise you not to forget about it and then your competence will be high.

The experiment itself is an essential part of science and our lives. It is the planned observation (made for a purpose). We all conduct experiments in our daily lives. As one teacher said, if you stop experimenting, you are disappointed in life. And that means it’s time to start any movement and experiment again.

The challenge. Think about it, have you experimented recently? What does an experiment mean to you?

Here’s a good example of an experiment. Let us grow the plant in front of our monitor and set the goal to optimize its growth. First of all, we should analyze how the growth is expressed: length, number of leaves, weight, etc.. Then, you need to determine factors (or features) that can affect the length of the plant: water amount for irrigation, irrigation frequency, soil type, plant pot type, fertilizer type, fertilizer amount, light, temperature, etc…

Thus, we have obtained quite a few factors, which can affect to our system. We need to understand which factors (or its combination) will allow us to achieve the goal.

From this example, we can see what we will face next. We will have to plan and describe our experiments, as well as process the data and demonstrate whether it is statistically correct (representative).

To successfully plan an experiment we need to understand the theory of examined field of knowledge as well as its terminology (in order to set goals and define factors correctly). In addition, it is important to use the scientific cycle, which is described earlier. Shall we begin?

2. Experiments, systems and factors

2.1 Introduction and terminology

During the experiment, our goal is outcome(s), what we want to know/optimize/represent in numeric form (i.e. measured). Synonym of the outcome is response of the system.

Factors (features, variables) -variable properties, which are supposed to determine the result of the experiment.

All experiments should have at least 1 changeable (and measurable) factor. And the more number of factors we take into account, the better (in the general case).

The factors themselves are divided into:

quantitative (numeric) - can be measured and compared (e.g. ordered by increasing/decreasing);
qualitative (categorical, nominal) - are determine the type of objects, but cannot be numeric compare.

Sometimes there are also the rank factors, which determine the type as qualitative variables, but they can be compared to each other (for example, the place in the competition). However, only quantitative or qualitative values are used to analyze results in major cases. Rank values are used to calculate various statistical criteria.

Example. Let’s consider a classical example of building an experiment and processing its results. We want to increase the profit of the store ($= \text{revenue} - \text{expenses}$) and we think that it will be influenced by 2 factors: the illumination of the room (we can set the dimmer at 50 \% and 75 \%) and the price of goods (let’s say 7.79 \$ or 8.49 \$). So we are faced with a two-factor experiment.

Note that such experiment should be carried out 4 times (for example, every Monday). It’s not enough just to change one feature one time (3 experiments), you need to add one more - when both features change at once. It will 2 times increase quantity of the received information and allow to compare influence of both features on experiment result. Further we will see the reason why.

While planning the experiment, we should use a special table (Table 2). The sequence of data in the table are called the standard test sequence.

Table 2. Example of the experiment data

No	real No	Dimmer, %	Price	Profit, $
1	3	50	Low	490
2	1	75	Low	570
3	4	50	High	370
4	2	75	High	450

Once we’ve recorded the results, we can start analyzing them. For example, the effect of light brightness at low price is 80 \$ (difference between dim and bright light). The same effect at a high price is 80 \$. So, we observe the increase of profit by 80 \$ from the illumination effect. You can see that the effect is the same at different price levels.

Same for the price effect: in dim light it goes to 120 \$, in bright light it goes to 120 \$. Thus, when the price of the goods increases, the profit falls (in our case only).

The challenge. What do you think might go wrong? What factors we didn’t take into consideration and what else might affect profit? Is our experiment reproducible (will we get the same results just repeating our experiment)?

It is interesting that for the above example, many people would not do 4 experiments, but 3. As the first experiment, they would choose low light and low price. Further, they would carry out the second experiment (increase the brightness of light at a constant price). Then, they would return to an initial point and would carry out the third experiment (increase only the price).

A lot of people will think that’s the way to do experiments. Because you only change one factor per time. You were trained to do that at school and university. You can only change one parameter at a time. But in general, you don’t have to do that!

If you limit yourself to these three experiments, you will get only one evaluation of the effect of light and only one evaluation of the effect of price. However, by carry out one more experiment we will be able to evaluate both effects twice (when both factors are increased). In total, we will get two estimates of illumination effect and two estimates of price effect on profit. Therefore, by adding just one additional experiment, we will actually double the received information.

Note. We have described a so-called “full factor experiment”. However, the example of a “fixed” experiment approach (when we change only one factor with fixed other factors) is very common in analytical chemistry. In case of calibration line, we change only one variable (analytical signal) under fixed conditions and calculate only one response (concentration). Why we can do this? What additional experimental work needs to be done before it is possible to fix other factors?

For further study we will need a number of terms and the concept of measurement error.

The generation of the set of our object observations is measurement process. The recording of observation in certain unit is quantitative analysis/the measurement (it is comparison with the established standard, e.g. when we measure something with a ruler). Thus, a quantitative measurement is a recorded result of a comparison in a certain units. Qualitative analysis is simply a relative result of comparison without units (more or less, there is an object or not). Sometimes you can read about semi-quantitative analysis, which is not very precise quantitative analysis (but better than nothing).

2.1.1 Accuracy and precision (repeatability)

We have arrived at the basic concepts of experimental data processing: accuracy and precision. These terms can be better explained by the analogy with targets for shooting (Fig. 2).

Fig. 2. Examples of accurate and precise shooting. From left to right: accurate and precise, not accurate but "precise", and not precise but accurate in average.

Accuracy indicates the closeness of the obtained result to the absolute value, and precise indicates closeness to the previous obtained result. Precise and accuracy are evaluated using a very important and useful tool - statistics (field of mathematics).

To estimate the accuracy of the obtained result, we can use the concept of absolute and relative error.

Absolute error can be measured as $a = x_{true} − x_{our}$, where $x_{true}$ - the true value (usually we didn’t know it and use referent or average values), $x_{our}$ - measured value. As you can see, the absolute error measured in the same unit as x.

Relative error can be measured as $\Delta = \frac{x_{true} - x_{our}}{x_{true}}$ and use relative unit or percent (if we multiply it with 100 \%).

Precision is defined a bit more complex and we will return to it in part 3 of this course.

It is worth saying that there are only 2 nature of error: random (due to the statistical nature of measurements, which is always present in our imperfect world) and systematic (due to the action of some constant disturbance force, which can be corrected).

Note. The prevalence of a “fixed” approach in analytical chemistry is caused by the fact that it provides greater accuracy and precision of the obtained results. However, before selecting the most significant factor and fixing all the others, it is necessary to carefully examine the system. This is what factor experiments are used for. In addition, factor experiment dominates in other fields of knowledge, including chemical technology.

2.1.2 Some words about the rules for result presentation

The significant digits and round rules are important concept of any nature sciences. In other words, it is necessary to show how many digits in the result have real physical justification. Other digits should be dropped (we will not lose the accuracy).

The number of significant digits determines the error of the experiment (and vice versa, the measurement result is rounded to the same digit as the absolute error with one significant digit).

Example. If, due to the experiment we get 100.1, 99.8 and 100.2 M of concentration for standard sample with justified concentration of 100.0 M, then average absolute error is: $\frac{\sum |x_i - 100|}{3} = \frac{0.1 + 0.2 + 0.2}{3} = 0.16666.. \approx 0.2$. Thus, our average experimental value is: $\frac{100.1 + 99.8 + 100.2}{3} = 100.0333... = 100.0$.

Such result is usually wrote as $100.0 \pm 0.2$. Last digit is not precisely define and can take any value within the limits of the experimental error $x \in [99.8; 100.2]$.

The significant numbers are very useful for the natural sciences. They allow us to simplify some stages of the experiment and make it more reproducible. They also can show our colleagues the accuracy of our research. For example, if we know the accuracy for our experiment (e.g. 4 significant numbers for 10.00 M), then we can weight our reagent with that accuracy (4 significant numbers also, like 10.50 g, without 4 digits after dot).

We show you below some rules for significant digits. If you want to understand and remember it, you have to think about error concepts. The last significant digit contains the absolute error of experiment.

Each digit other than 0 is significant (for example, 237 - 3 significant digits, 129.7 - 4 significant digits).
0 before not 0 digits - not significant (0.0165 - 3 significant digits). In this case it is better to apply “scientific” or exponential number record: $1.65 \cdot 10^{-1}$.
0 to decimal point - you can’t say for sure, that’s not how a scientist should write (you shouldn’t write 10, you should write it as $1.0 \cdot 10$). Unfortunately, I meet such a record very often in my practice. If you found such record too (e.g. 3700 units), then a person, who made it is not familiar with the practice of significant digits and just rounded experimental result up to the integer. You can only drop this number or analyze the experiment and set the number of significant digits by yourself (use the weighting accuracy or absolute error).
In other cases 0 is significant (85,950 - 5 significant digits, 12.06 - 4 significant digits).

Note. The scientific (exponential) record of a number always involves a single digit to the decimal point and the exact indication of significant digits after it (e.g. $1.650 \cdot 10^{-10}$ or $2.740 \cdot 10^{5}$). I strongly recommend you always using it in experimental practice.

Example. Mass of sample is 0.1 g. If you had weighted it with analytical scale with $\pm 0.0001$ g error, then you has to write your result as $0.1000 = 1.000 \cdot 10^{-1}$ g.

Moreover, there are some arithmetic rules for significant digits. They allows us to preserve physical sens in calculation and in finished result.

Add/subtract - use absolute categories (number size is important). Leave as many digits after the decimal point as there are in the summand with the smallest number of decimal digits (i.e. accuracy is limited by the number, which have the bigger absolute uncertainty). Remember, the last significant digit carries an uncertainty, which limits everything else and when we add/subtract numbers such effect will be proportional to the size of number.
Multiplication/division - use relative categories (at multiplication or division the uncertainty of the limiting number is proportionally transferred to the result). The number of significant digits of the result will be equal to the minimum number of significant digits of the participants (i.e. the accuracy is limited by the number, which have the bigger relative uncertainty). If the number of significant digits of participants are the same, the accuracy is limited by the number, which have the smallest mantissa (the absolute value, which is equal to all ordered digits of number).

Example. For $0.0304 \times 5.43$ mantissa of 1st number is 304, and mantissa of second number is 543. So, the 0.0304 is number, which limit accuracy (it’s relative error is bigger, then relative error of 5.43).

Logarithmization - logarithmic number and mantissa (in case of logarithmization it is the result of logarithm) contain the same number of significant digits.

Example. Let’s calculate the pH value of $2.0 \cdot 10^{-3}$ M of HCl solution. The base of logarithm and 10’s degree are the exact values. Then the result is:

$$ pH(2.0 \cdot 10^{-3}) = -lg(2.0 \cdot 10^{-3}) = -(lg(2.0) -3) = -(0.30 - 3) = 2.70 $$

Note, that due to the addition of an absolutely accurate value of 3, the final result have 3 significant digit - more, than the initial value (the absolute measurement error remained the same, but the relative error decreased).

Exponentiation - multiplication of numbers with the same number of significant digits. The number of significant digits in the result will be the same as in initial value.
Root of number - can be represented as a result in absolute degree, i.e. multiple multiplication of the result. The number of significant digits will thus remain the same as in the initial value.

$$ \sqrt{x} = a \\ x = a^2 $$

We follow the arithmetic order as in mathematics.
To avoid accumulation of an error, the result is rounded only at the end of the whole calculation. In intermediate calculations we leave the number of significant digits + 1. In the final result, this additional digit is rounded up.

Note. The above calculation rules with significant digits are nothing but an approximation for the error of the result. For this reason, it is extremely unwise to perform many calculations for values with errors (especially exponentiation, taking the root and logarithms) - the more such operations, the more uncertain our final result is in reality. The arithmetical rules for significant digits can be strictly justified on the basis of the law of error propagation (but we will certainly not do it).

Note. The results of gravimetric and titrimetric determinations are in most cases recorded as numbers with 4 or 2 significant digits, which is related to the error of measurement of the mass of substances (e.g. $\pm 0.0001$ g) and volumes of solutions (e.g. $\pm 0.03$ ml). However, the number of significant digits strongly depends on the initial weight of the analyzing sample.

Note. Experimental result and its error should have the same digits after decimal dot (e.g. $10.1 \pm 0.1$).

Rules of rounding: * we round up to the number of significant digits (the last digit has an uncertainty); * if the rounded digit is more than five or less, round it up to the appropriate side; * if the rounded digit is 5, we round it up to the nearest even digit (if we need to round up only one digit 5: $10.5 \approx 10$, but this is not the case if we round up 2 digits $10.51 \approx 11$); * do not round up intermediate calculations, leave the required number of significant digits + 1. * always remember that significant digits is an absolute measurement error of the value and you should work with them accordingly to described rules.

Example. Calculate the result:

$$ \frac{(\frac{97.7}{32.42} \cdot 100.0) + 36.04}{687} = \\ \frac{301_{.4} + 36.04}{687} = \frac{337_{.4}}{687} = 0.0491_1 = 0.0491 $$

2.2 Analysis of two-factor experiment

I hope, that I was able to show you how to record the results of experiments and convinced you about the importance of factor experiments in our lives. It’s time to move on to studying and analyzing them.

Let’s take the popcorn as an example. We will try to optimize the number of popped kernels. The good thing about this experiment is that you can repeat it at home. If you don’t understand something, you can feel free to write to me or watch [the course] (https://www.coursera.org/learn/experimentation) where this experiment is analyzed in more detail.

Well, we have 2 investigated factors in such experiment. This factors can take 2 values each: A - heating time (160 and 200 s) and B - type of kernels (yellow and white). We can easily calculate that the number of experiments will be 4.

Note. In general, you can use the following formula: $f^v = 2^2 = 4$, where $f$ is the number of factors and $v$ is the number of values, which each factor can have (according to another area of mathematics, combinatorics). In our case, we will always use the same number of levels for factors, consider it a kind of requirement for such plans of experiments.

Let us make a table of the experiment (Table 3) and denote - and + (low and high) level of factors (for the categorical factor order does not matter, we can choose any). Then for A: -: 160, +: 200, for B: -: White, +: Yellow.

Note. For informative results, it is important to:

do not use extremes for factors (otherwise they will be affected by many influences and will differ too much from each other, which will increase errors);

always carry out experiments in random order! This is the only way to get rid of the systematic error and the additional connections between the values.

Table 3. The results of a two-factor popcorn experiment.

Standard order	Random order (real)	A - time \*	B - corn	Results
1 2 3 4	3 1 4 2	- + - +	- - + +	52 74 62 80

* you should use the standard order for changing the level of factors. First, we change the 1st factor all the time, then we change the 2nd factor in matching order.

So, we have results, and now is good time for analysis. It’s always a good idea to start with visualization (this is how we think). The visualization of factor experiment is called cube plot (graph, chart). It is shown in Fig. 3.

Fig. 3. Cube plot of 2 factor popcorn-experiment with isolines (contour lines).

This plot shows the effect of each factors in corresponding square or cube corner (2 or 3 factor experiment respectively).

Let’s start with heating time effect. When you increase the cooking time for yellow popcorn, the result increases from 62 to 80 popped kernels (PK). Therefore, we see an increase by 18 units. For white popcorn we see a rise from 52 to 74 PK, which is an increase by 22 units. So, on average, we see an increase by 20 units when the heating time increases from 160 to 200 seconds.

Then let’s estimate the difference between the two types of popcorn. We fix heating time and look at the effect of switching from white to yellow popcorn: from 74 to 80 for 200 sec. and from 52 to 62 for 160 sec. On the average we see increase by 8 units during change from white to yellow popcorn. Make sure that your interpretation matches the cube chart. This visualization is very important for self-testing.

But besides the output, the cube plot also shows contour lines (contour plot or insolines). They indicate the area, which contain constant value of output (on 1 line the number of PK remain the same). They are drawn starting from any corner of the cubic diagram, which don’t have maximum or minimum value. Then, equal value is searched on the opposite side of the square and line is draw. To check the curvature of the line, we need to calculate our fixed value for the middle of the scale (we see it later in this course).

Then we draw the second line in the same way for the value of 74. The others lines are drawn parallel to the obtained ones.

Thanks to the isolines, we can quickly understand where to start moving to optimize the result, i.e. towards to our goal. For example, if the goal is to maximize the number of popped kernels, then we need to move perpendicular to the isolines in the upper right corner. It means, that we should take yellow popcorn and increase the cooking time (which is quite intuitive from the cube plot).

Such an approach to optimization (using the isolines) helps us to define the way of carrying out the next experiment. The contour diagram is our gradient (path to maximize or minimize the output).

Moreover, we have another type of visualization, it is the diagram of interaction (Fig. 4).

Fig. 4. diagram of interaction for 2 factor popcorn experiment.

Pay attention that these two lines are practically parallel, which means that there is practically no interaction in the examined system. The choice of a variable for the interaction diagram does not play a big role and we could choose another variable to be marked on the horizontal axis.

All the described methods of visualization do not require any software. You can use these visualization methods for both numerical and categorical factors. This shows the obvious advantage of such an approach to the experiment (we can quickly interpret the results using simple graphical tools, elementary mathematics and a sheet of paper).

Being that simple means, that the results can be easily shared with managers or colleagues at work.

2.3 Make a prediction

We discussed the example of planning, conducting and analyzing an experiment. But what does it give us? How can we present and use the obtained data? The answer is to build a prediction (model, regression equation). In our course, we will only consider linear models (with a few exceptions). Such models are the most universal (any smooth and monotonic function can be represented as a set of linear segments).

In case of our “popcorn experiment” (2-factor experiment), the obtained model consists of 3 parts:

$$ \hat{y} = a_0 + a_1 \cdot x_A + a_2 \cdot x_B $$

where,

$a_0$ is the intercept that we expect to see when there is no effect (when the encoded factor values = 0). This coefficient is calculated as an average of 4 values in a cubic diagram (i.e. its center).
$a_1$ - coefficient of influence of factor A (its coded value), which depends on preparation time. It is calculated as the average normalized difference between the high and low values of the factor: $a_1 = \frac{\frac{(80-62) + (74-52)}{2}}{2}$. Note that normalization involves the calculation of the coefficient for a unit change in the factor (i.e. from -1 to 0 or from 0 to +1), so we should divide the average by 2.
$a_2$ - Factor B coefficient, which depends on the type of grains. It is calculated similarly to point 2.

Considering the above description, our model will be:

$$ \hat{y} = 67 + 10 \cdot x_A + 4 \cdot x_B $$

The challenge. Check this model for different coded value of each factors.

2.4 Factors interaction

So far we have considered very ideal cases where factors have no interaction between each other and the target variable. However, this is frequently wrong.

Example. We try to wash our hands and conduct a 2-factor experiment: there is/no soap and warm/cold water. You may notice that the effect of warm water will increase when you use soap. And vice versa, the soap effect will be enhanced by using warm water. In other words, “interaction” indicates that the effect of one factor depends on the level of another factor.

Besides, these interactions are usually symmetrical. That means it makes no difference whether we wash our hands in warm water with soap or with soap in warm water, the result is the same.

The first indicator of the presence of interaction between factors is the asymmetry of lines in the interaction diagram or the curve form of isolines in the cubic diagram. If you observe such effects, it is double factors interaction (when the behavior of one variable is very depends on the level of the other one).

Let’s consider the experiment in the figure 5 and calculate all the coefficients. The experiment involved analysis of the effect of baking time (factor A) and sugar type (factor B) on cookie taste (on a scale from 1 to 10).

Fig. 5. Cube plot for experiment with factors interaction.

Note that the isolines are no longer parallel and should be presented in a curved form (once again, the result must be the same on the line). For this purpose I recommend you drawing an additional line in the center of the cube plot.

The expressed non-parallelism of lines indicates the presence of mutual influence of factors. Strictly speaking, when analyzing the experiment, it is always necessary to construct the model taking into account the mutual influence and exclude it only if the coefficient before this interaction is very small. Let us calculate the resulting model.

To build a model, the influence of each factor is calculated separately and in the same way as mention above. In case of interaction it is necessary to calculate changes at one fixed factor (sugar type) as an normalized averaged difference at high and low values of the feature: $interaction = \frac{(9-4) - (5-3)}{2} = $1.5$. Let us check the symmetry of the influence by fixing another factor: $interaction = \frac{(9-5)(4-3)}{2} = 1.5$. Thus, the influence is really symmetrical and equal (if not - take average value). Finally, our model is:

$$ \hat{y} = \frac{3+5+4+9}{4} + \frac{(5-3) + (9-4)}{2} \cdot \frac{1}{2} \cdot x_A +\\ \frac{(4-3) + (9-5)}{2} \cdot \frac{1}{2} \cdot x_B + \frac{1.5}{2} \cdot x_A x_B $$

$$ \hat{y} = 5.25 + 1.75 x_A + 1.25 x_B + 0.75 x_A x_B $$

The challenge. Build interaction diagram and verify that there is an interaction. Check the accuracy of models prediction with and without interaction.

2.5 Three-factor experiment

Once we have mastered the basics of analyzing the results of the experiment, we can make the initial conditions more complicated. A new example is taken from textbook, which is called “Statistics for Experimenters: Design, Innovation, and Discovery”. In the new experiment, an optimal combination of parameters is searched to reduce the pollutant in the waste water.

Once we have mastered the basics of analyzing the results of the experiment, we can make the initial conditions more complicated. A new example is taken from textbook, which is called [“Statistics for Experimentalists”] (https://www.amazon.com/Statistics-Experimenters-Design-Innovation-Discovery/dp/0471718130). In the new experiment, an optimal combination of parameters is searched to reduce the pollutant in the waste water of a wastewater treatment plant.

Three factors with 2 levels are considered. The first factor is C, which is a chemical compound (P and Q). The next factor is T (temperature), which is the water treatment temperature ($72^o F, $100^o F$). The last factor is S (stirring speed), which is mixing speed (200 or 400 rpm). Then the number of necessary experiments are:

$$ f^v = 3^2 = 8 $$

where $f$ is the number of factors and $v$ is the number of values of each factor.

The result of the experiment is the number of pollutants measured in pounds.

Using the standard procedure of the experiment, we will make a table 4.

Table 4: Results of a three-factor experiment.

Standard order	Random order (real)	C - chemical	T - time	S - stirring speed	Outcome
1 2 3 4 5 6 7 8	6 2 5 3 7 1 8 4	- + - + - + - +	- - + + - - + +	- - - - + + + +	5 30 6 33 4 3 5 4

One of the advantages of such table is the quickly overview of the factor impact to the result. For example, you can estimate how pollutant quantity change, when we vary the chemical compound (C factor). The level of the factor changes from low to high as well as the amount of pollutant. Look at the effect of Factor S. The first four experiments shows very high levels of pollutant, while the last four experiments shows low levels of it.

Just looking at the table, we can say that factors C and S are most likely important for understanding the results.

Based on the table of the experiment, we shall make a cube plot (Figure 6).

Fig. 6. Cube plot of 3 factors experiment.

According to acquire results, we need chemical Q with low temperature and hight mixing speed (400 rpm). Let’s analyze the main effects and interactions.

Let us start with the first factor C (choice between chemical compounds P and Q, where Q is a high level factor). From the cube plot we can get four estimates of the C effect (along each of the four horizontal edges). At high temperature and high stirring speed (i.e. high T level and high S level) the effect of this factor is 4-5 pounds of contamination. At high temperature and low speed: 33-6. At low temperature and high speed (i.e., T - and S +), the effect is equal: 3 and 4. And finally, at low temperature and low speed: 30 and 5.

We can analyze the obtained information in terms of each factor and their possible interaction.

During the tests, the chemical compound showed four results. The average for these four numbers is $\frac{50}{4} = 12.5$. But what does the resulting number 12.5 really mean? How would you explain this value to your manager, who knows nothing about statistics and experiments?
- The value of 12.5 indicates that on average we expect to see an increase of 12.5 pounds per ton of pollution when moving from chemical compound P to Q (although the model uses a 6.25 - half coefficient). Therefore, for the features in the model, we write half of the effect (taking into account normalization).
- The difference between the effects of a chemical at high and low mixing levels (S) is another thing to pay attention to. Note the huge difference, which indicates that there is a clear interaction between factor C and factor S.
Before we move on to the interactions, let us look at temperature (T). According to the table, there is no noticeable effect of temperature on the system response. This is also confirmed by the calculated coefficient in the model = 1.5 units (or 0.75 when normalizing the effect). This is a really weak effect.
Finally, let us consider the effect of stirring speed (S). The average for the effect is -14.5 (or -7.25 when normalizing). In other words, we expect a mean reduction of 14.5 pounds of pollution when moving from low to high mixing speed.

At this stage you should always take a moment to ensure that your results make sense. We can see that switching from chemical P to Q increases contamination (horizontal axis Figure 6). So the value of 6.25 looks adequate. A small value of 0.75 for temperature also looks logical, because it really has a very weak effect. Finally, an increase in stirring speed leads to the most significant reduction in pollution by 7.25 units.

Since we have finished interpreting the individual factors, we can move on to the interactions. Previously, we noted that the effect of the chemical changes greatly when the stirring speed is low. However, on the back edge of the cube (at high stirring speeds) the effect of chemical selection is almost equal to zero. It is obvious that the stirring speed changes the effect of the chemical compound. Thus, we observe the interaction between 2 factors (S and C). For numerical estimation, we will use a familiar technique of adding a new term to the equation.

We have two possibilities to calculate it using different levels of the variable: 1. at high temperature; 2. at low temperature.

There is no guarantee that the effect will be symmetrical, so we will perform both calculations, and then take the average (even if the effect is symmetrical we will not lose anything, otherwise we will take into account both effects). Next, we normalize it by the number of attribute levels, as always (write half).

So far, we have only considered the interaction between C-S factors. There if no strong interaction for other factors (the low temperature effect is possibilities of it). In fact, there is also a three-factor interaction C-T-S. But it is difficult to calculate it with bare hands. Further on, we will use a computer for this purpose. So let’s stop at the results we’ve got and analyze them for now.

General analysis of results. The main conclusion is that at low mixing speeds chemical Q is not effective, but at high mixing speeds both chemical compounds are equally effective. From this moment, the experiments become a really powerful tool. We saw the lowest level of contamination when using chemical Q with high S and low T (find this value in the cubic diagram). But what if, according to the government, the pollution should be less than 10? And with that, let’s say, chemical Q is twice as expensive as P…

In fact, we have now thought about the additional result - profit. Do not forget, that profit (or expenses) often play an important role in all systems. So you should always keep in mind the economic component of each corner of the cube.

At the same time, we have seen a small temperature effect. And here is the question: does it mean that there is no reason to consider temperature as a factor? And the answer is no. It is important to understand, that even minor effects provide us important information about system. So, in our example, we see that in the temperature range $[70; 100]^o F$ temperature has a negligible effect on the amount of pollutants. And this is important, because based on this information, an engineer or operator can choose the most economical working conditions. And again, it all comes down to profit. It’s very likely that working at lower temperatures will save energy. And since temperature has only a small impact on the system, we will not have a significant impact on the level of pollution if we decide to work at a lower temperature. And that’s a great result.

The challenge. Build a forecast for any case using the cube plot and check it for the model without influences. In which direction do the interactions work (increase or decrease the amount of pollutants)?

The challenge. Why do you think chemical compound Q is less effective at low mixing speed, but works very well at high speed?

2.6 Least square method for two factor experiment model

Coming to this section, we looked at some important examples of how to build and analyze an experiment. Moreover, we learned how to calculate models, which allows us to associate encoded factors with a target variable (output). However, we have chosen coefficients for the model intuitively, based on quite logical assumptions about averaging the effects of features. It is time to describe the model in a more formal way.

To build a mathematically justified predictive model, we will use the most common approach - the method of least squares (LSM). We will discuss the statistical basis of this method in Chapter 3, but for now we will focus on its general features and experimental application. As an example, we will consider our “popcorn experiment”. Let me remind you that the linear model for a two-factor experiment generally looks like this:

$$ \hat{y} = b_0 + b_A x_A + b_B x_B + b_{AB} x_A x_B $$

where $x_A$ and $x_B$ are coded factors (features with -1 or +1 values for time (A) and corn type (B)).

We carried out 4 experiments and for each of them our model shall be work. Then:

$$ \begin{cases} \hat{y_1} = b_0 + b_A x_{A-} + b_B {x_B-} + b_{AB} {x_A-} {x_B-} \\[2ex] \hat{y_2} = b_0 + b_A x_{A+} + b_B {x_B-} + b_{AB} {x_A+} {x_B-} \\[2ex] \hat{y_3} = b_0 + b_A x_{A-} + b_B {x_B+} + b_{AB} {x_A-} {x_B+} \\[2ex] \hat{y_4} = b_0 + b_A x_{A+} + b_B {x_B+} + b_{AB} {x_A+} {x_B+} \end{cases} $$

Therefore, after carrying out the experiment we have 4 equations with 4 unknowns, which means - we can solve them! These equations are linear, so the system of equations is quite simply solved using matrix methods. There is no need to be afraid, it is just a more convenient form of recording and calculation equations. Let me show you how to do it.

In the matrix form, our equations are written down as follows:

$$ \begin{pmatrix} y_1 \\ y_2 \\ y_3 \\ y_4 \\ \end{pmatrix} = \begin{pmatrix} 1 & -1 & -1 & -1 \cdot -1 \\ 1 & +1 & -1 & +1 \cdot -1 \\ 1 & -1 & +1 & -1 \cdot +1 \\ 1 & +1 & +1 & +1 \cdot +1 \\ \end{pmatrix} \begin{pmatrix} b_0 \\ b_A \\ b_B \\ b_{AB} \\ \end{pmatrix} $$

Matrix values $4 \times 4$ consist of coded variables. The other 2 vectors (matrices with one column or row of data) consist of experiment results and unknown coefficients before the coded variables. In the so-called “analytical” form (i.e. which has a strict mathematical justification) such matrix system has a solution:

$$ b = (X^T \cdot X)^{-1} \cdot (X^T \cdot y) $$

where $b$ and $y$ are vector with unknown coefficients and vector with tests results. The $X$ is matrix with coded factors.

Note. Factors should not always be coded (normal, “real” values can also be used). However, then we may face a number of problems (unbalanced values, solution instability, etc.). So it is better to always use encoded values (or at least normalized for mean and variance).

It is also possible to find the described solution of matrix equation manually (if the rules of linear algebra are used). However, it is better to use computer programs that will solve these equations very effectively for you. All we need is a $X$ matrix and a $y$ vector. And we have everything we need: the $X$ matrix is the result of the experiment table, and the $y$ vector is the results of four tests.

For computer calculations, we can use a number of programs. For me, the main ones are: MS Exel, R and Python. As you can see, 2 of the 3 listed programs are programming languages. But you should not fear them. For example, R is a very common and simple language for statistics and data analysis. It is rather easy to install and use while the result is clear. On the other hand, modern Exel provides a very wide range of functions to work with data (including working with models and databases, pivot tables, etc.). In addition, there are many paid and free programs for experiment planning and data analysis. You can search them in the Internet. But in our short course we will consider quite simple examples on R. Besides, you can study R in more detail in this course or this one in Russ..

2.7 RStudio for analyzing results of factors experiments

On the previous examples, you have learned to perform the necessary calculations and analysis of the experiment results by hand. However, using such approach our capabilities are very limited, and the risk of error is very high. It is time to switch to digital technologies. To do this, you will need to choose software to design the experiment and analyze the data. And in my opinion, the R programming language and RStudio programming environment are perfect for it.

R language and software to work with it are free, have an intuitive interface, but most importantly - R is widely used by various companies and researchers. R is so flexible, that you can even use it in a browser. You can take advantage of this feature if you don’t want to install software or cannot do it (for example, while using a work computer). However, if you are serious and want to work on your computer, you will need to download two programs: R itself and RStudio. In the first case, you will need to choose the fastest or closest download location (Russia or Germany in my case). Install both software packages on your computer and run RStudio (it will launch R in the background).

Create a new R-script from the “File” menu. In the opened window, we will write our simple commands and design the experiments.

I want to highlight follows:

first of all, users are often mistaken, because commands in R are case-sensitive (e.g. command c(1, 2, 3, 4) will create a list with 4 entries, but if you use capital C(1, 2, 3, 4), nothing will work);
secondly, if you need help, use help() command.

For example, our “popcorn-experiment” and work areas in RStudio are shown on Figure 7.

Fig. 7. "Popcorn-experiment" in RStudio. Windows are (from lest to right and upside down): window for script, variables in computer memory, console with results, help windows.

In the future, instead of screenshots, we will use just code that you can copy and execute in your RStudio:

A <- c(-1, +1, -1, +1)
B <- c(-1, -1, +1, +1)
y <- c(52, 74, 62, 80)
popped_corn <- lm(y ~ A + B + A*B)
popped_corn

Attentive students could notice that the recording of the experiment in the picture and in the code is different and we will soon find out why.

We will start at the end. Variable popped_corn contains the calculated coefficients of the model and simply outputs them to the console (this is the meaning of variables, they are references to certain values or operations, which we have assigned to them). Above, we declare the predicted model, which is called popped_corn. If this is your first time with R, you may be a little scared - I encourage you to be brave and believe in your abilities!

Let’s take a look at everything one by one. Let’s start with the reverse arrow (<-). It is symbols less (<) and dashes (-), which together look like an arrow. In the R language, this is the assign operation (i.e., we pass a value to a variable and then we can just write a variable to use that value). In other words, we create a variable with the name popped_corn and everything to the right of the arrow are assigned to it (the results of the linear model calculation). lm to the right of the arrow means “linear model” and indicate that we want to use least square methods to build a line. Finally, the tilde symbol (~) in the middle is interpreted as “predicted …” or “described …”.

Note. <- and = symbols are almost equivalent in R. However, I recommend to use <- as an assignment operation to avoid confusion. For more information, please read here.

Select all the commands and press Run to run the code. Alternatively, press the Source button (in the modification Source with Echo) without code selection. If we do not get an error message in Console, you will see the result (also in the console) and the existing variables (Environment tab). The output of this small code shows the coefficients for the constructed linear model. We got the 67 for intercept; 10 for the main effect of A; 4 for B and 1 for the two-factor interaction AB. Note, that these numbers exactly match our manual calculations.

This is the whole programming magic. It is really the fastest and most convenient way to get a model with computer help.

Note. The formula that describes the linear model has values for A, for B and for the AB interaction. But there is no variable for intercept (constants). R creates it automatically and when you enter only three parameters, R will show you four.

In Figure 7 you can see the command summary(popped_corn) instead of just calling popped_corn. This command provides you more statistical data for calculated parameters: coefficient errors, average square deviation, etc.. We will learn more about these parameters in 2 and 3 parts of our course.

Note. In any calculation program you should get exactly the same parameters for “popcorn-experiment”. This is a good check of software and calculation quality.

The challenge. Try to find instructions on the Internet about “how to calculate coefficients using the least squares method in MS Exel”. Use “popcorn experiment” data as an example.

Let’s continue our introduction to R. The next example is calculation of a three-factor experiment in water purification.

Open RStudio and create a new file for the example of wastewater treatment. It is very useful to specify our model at once and then declare all necessary variables.

water <- lm(y ~ C + T + S + C*T + C*S + S*T + C*T*S)

Remember that in the example of water treatment we considered three factors: C (chemical), T (temperature) and S (mixing speed). We also have three two factor interactions (CT, CS and ST) and one three factor interaction (CT*S). At the same time, we have the results of eight experiments.

Note. When conducting an experiment and analyzing the results, keep in mind that we will always need to conduct at least as many experiments as the unknown parameters in our model. For example, the “popcorn-experiment” have 4 parameters (2 single, 1 interaction and 1 intercept point) and 4 experiments. In the example with water treatment we have 8 experiments, so we can estimate 8 parameters (with interaction and intercept).

Notice that we can let R automatically set the encoded values C, T and S using the following code:

C <- T <- S <- c(-1, +1)

design <- expand.grid(C=C, T=T, S=S)
C <- design$C
T <- design$T
S <- design$S

water <- lm(y ~ C + T + S + C*T + C*S + S*T + C*T*S)

Run this code to create a linear model. To output the calculated coefficients to the console, use summary(water) command. Please note that the obtained parameters match our manual calculated values: 11.25, 6.25, 0.75, etc.

Note. We can add a little trick to set our model (this reduces the possibility of error). The results of the model will be similar (please check).

# We use a simplified model mode
water <- lm(y ~ C*T*S)

Note. When planning each experiment, always create a new code yourself. In this way, you will have some “outline” of the work, and it will be especially useful if you use comments (# strings, that are not accepted as code by R). This will solve the frequent problem of losing the results and description of the experiment. For example, you’ve done the work, and in a few months you need to go back to it and answer your boss’ questions or pass the project on to your colleague. If you give them only an Excel file or a set of documents that do not have a step-by-step description, it will be very difficult to reproduce your actions and thoughts. I come across this very often in my practice and urge you to avoid repeating both my and others’ mistakes!

Writing well commented and consistent code creates a well tracked and reproducible record of your work. This is a very important criterion for many companies and laboratories (some even have special requirements for traceability of work, for example ISO 9001-2015).

Here is one more code fragment that will help us interpret the results of the experiment. It allows us to visualize the influence of each effects within the obtained model (the greater is the absolute value of a parameter, the greater is its influence).

# Estimation of factor influence. Firstly, setup "pid" package: Tools -> Install Packages -> pid
library(pid)
paretoPlot(water)

The result is shown on Figure 8.

Fig. 8. Example of factor comparison, using the Pareto plot in RStudio.

The histogram shows the absolute value of each of the model parameters (this allows to estimate the scale of influence of each of the coded features). The parameters sign is also important, it shows the directions of the factor’s influence. But for better visual comparison it is more correct to use absolute values (the sign is highlighted in a different color). Such diagrams are often used to identify variables, that are not relevant for model and can be removed from the model. A histogram shows sorted values from the highest to the lowest absolute value. This allows us to quickly find the most important factors of the system. The longest bars correspond to the factors that most significantly affect the result.

Note. It is often important to use a clear black and white comparison, as not all people distinguish colors. In addition, sometimes it is necessary to print the report on a black and white printer.

Let’s analyze the plot. You will immediately notice that the $C \times T \times S$, $C \times T$ and $T \times S$ interactions are small, when compared to other parameters. The most significant factor is S. The color of the band indicates that S has a negative effect on the result. As you will remember, our goal was to minimize the pollution, so we immediately realize that increasing S will reduce the pollution, which is good. Another important factor is the effect of the chemical, C. Its effect is positive, i.e. if we choose the positive coded value of this categorical feature, we will get an increase in pollution.

Let us consider an even more complicated example - a four factor experiment with 2 measured parameters. This is a good problem from Box, Hunter and Hunter’s textbook. In this experiment, we use solar collectors and heat accumulators. Values of result of experiment are received from computer simulation (see the site).

Note. A little advice related to the simulations. Usually it is very simple to perform a simulation and there is a temptation to investigate it ineffectively. Often you will meet people who just play with the software by entering different values until they get the right answer. But the simulation should be taken as seriously as the real model. Always use a systematic approach and conduct factor experiments on it.

Note. There are two key advantages to using computer simulations: * fast results with sufficient computational power of the computer (or running in parallel mode); * it is possible to not randomize the order of experiments. The reason for this is quite simple - there are usually no random and systematic errors in the simulations, which depend on the time and external parameters of the experiment. When you repeat the simulation by entering the same initial values, usually you get the same answer. But be careful: some computer experiments do not give identical results when you repeat them, and in any case it is better to always use a random order. The cost of doing this is minimal, but it will protect you from a number of problems.

So, back to the solar water heater. We’re looking at four factors: * A - the amount of sunlight (insolation); * B - heat storage capacity (tank volume); * C - the water flow through the absorber; * D - interruption of sunlight (cloudiness).

In terms of the influence of these factors, two outputs are considered: * $y_1$ - energy collection efficiency; * $y_2$ - energy transfer efficiency.

You can immediately determine how many experiments will be conducted. It is $2^4 = 16$ tests if each factor has two levels (low and high).

So, there have been 16 tests and it is time to make up the code for model calculation:

# Solar panel case study, from BHH2, p 230
# ----------------------------------------
A <- B <- C <- D <- c(-1, +1)
design <- expand.grid(A=A, B=B, C=C, D=D)
A <- design$A
B <- design$B
C <- design$C
D <- design$D

# y1 - collection efficiently
y1 <- c(43.5, 51.3, 35.0, 38.4, 44.9, 52.4, 39.7, 41.3, 41.3, 50.2, 37.5, 39.2, 43.0, 51.9, 39.9, 41.6)

# y2 - energy delivery efficiency
y2 <- c(82, 83.7, 61.7, 100, 82.1, 84.1, 67.7, 100, 82, 86.3, 66, 100, 82.2, 89.8, 68.6, 100)

model.y1 <- lm(y1 ~ A*B*C*D)
summary(model.y1)
paretoPlot(model.y1)

model.y2 <- lm(y2 ~ A*B*C*D)
summary(model.y2)
paretoPlot(model.y2)

Note. The reason why the $A \times B \times C \times D$ record works is because of the model hierarchy principle for R. Let’s look at a simple example. If you wrote only $A \times B$, R will automatically include factor A and factor B in the model. After all, there can be no two-factor interaction of $A \times B$ if there is no factor A and factor B.

After the code is executed, you should study the obtained results. For this purpose, let’s build two separate linear models and Pareto diagrams (Figure 9): for the efficiency of energy collection y1 and for the efficiency of energy transfer y2.

Fig. 9. Example for factor importance calculate with Pareto plots.

As you remember, gray bars indicate a negative factor influence on the output, and black bars indicate a positive factor influence. According to the obtained model for energy collection efficiency ($y_1$) the biggest influence belongs to factors B and A, interaction $A \times B$ and factor C. Other interactions have a lower impact on the result.

We can observe a decrease in system response when factor B increases. In other words, when the tank volume increases, the collection efficiency decreases. This is the most important variable in the system.
Further, factor A (amount of sunlight) has a positive effect on the collection efficiency.
What kind of interaction do you think $A \times B$ will have? The correct answer is a high level for factor A and a low level for factor B. We can see it from the equation and the Pareto diagram. In this case, result increase from factor B and simultaneously makes the two-factor interaction work for us.
factor D has little effect on the result. This is a useful conclusion because it shows that cloud didn’t bother us. If we had to do more experiments in the future, we could no longer include factor D.

Thus, A, B and interaction A*B are the three most influential parameters of the model. Try to explain the influence of other factors by yourself.

Now let’s look at the second output variable - energy transfer efficiency $y_2$. If you study the corresponding Pareto diagram, you will see the following.

Huge influence of factor A.
Big influence of two-factor interaction $A \times B$.
Influence of C and D factors is insignificant.

The explanation is yours.

Note. You may have noticed that many high-level interactions (three-, four-factor and more) are small or equal to zero. This happens quite often and we will see how this can be used.

Note. I would like to mention an important thing on the analyzed data. In case of the $y_2$ model, the influence of factor B is small and you can conclude that factor B is not important. But this is not quite true. We cannot exclude factor B from the model because the $A \times B$ interaction is very important. This means that the influence of factor A depends on the level of factor B and vice versa. Therefore, we cannot ignore factor B.

Considering such an example, we come to the key question of experiment planning: can we simultaneously optimize both $y_1$ and $y_2$? What would be the best combination of factor levels that gives this maximum?

2.8 Reduce experiments expenses

Before answering the question about the model variable optimization, you should understand how to optimize the cost factor.

As you can see, the number of experiments (and thus time and cost) increases in degree depending on the number of factors. Let’s try to get rid of this limitation.

So far, we have considered so-called full-scale experiments, when the influence of each factor was fully studied for the model creation. In other words, we studied every change in every factor. But how can we reduce the number of experiments? This is possible by using half, quadro and etc. (by 2 times) experiment scheme. For example, using half-factor experiments involves cutting the number of experiments by half.

Of course, everything has a price and such actions will lead to information reduction. But there are 2 significant reasons for that:

The cost of each experiment can be high.
There is no confidence in the obtained results. What factors will be significant? Will the obtained data be optimal, etc.?

According to the famous scientist George Box for the first experiments and works should be allocated about 25 \% of the total budget and no more. We will need the rest in the further research process. Therefore, we need to understand that our initial assumptions are not absolute and may be quite wrong. This means we need insurance and the possibility of additional experiments.

Let’s study what result will we have in half-factor experiment and how to do such tests.

There is special scheme for choosing meaningful tests from our ideal full-factor experiment: open or closed loop selection. Let’s consider a familiar example of water treatment in terms of half-factor experiments (Figure 10).

Fig. 10. Selection of meaningful combination of factors for half-factor experiment.

Note. Feature values have changed to A, B, C for better convenience.

Note that this choice of experiments implies a complete change of factors A and B, while factor C is chosen as a result of the multiplication of the first encoded factors (keeping the sign as in Figure 10).

This approach to the experiment allows us to win jackpot if one of the factors turns out to be unimportant for the model. Then one of the directions of the cube will disappear and we will reduce the necessary number of experiments by half, and with earlier carried out tests we will have a full-factor experiment… Profit!

But that’s only one side of the coin. Let’s see what model we can get if we do a half-factor experiment:

# Half-factor experiment
# ----------------------------------------
# full-factors for A and B
A <- c(+1, -1, -1, +1)
B <- c(-1, +1, -1, +1)
# C = AB
C <- c(-1, -1, +1, +1)

# y - purify efficiently
y1 <- c(30, 6, 4, 4)

water <- lm(y1 ~ A*B*C)
summary(water)

You can see a lot of NA (not applicable) for interaction coefficients and these are normal. The model doesn’t have enough data. But we don’t need these factors. Let’s compare the resulting equation to the original one:

$$ \hat{y} = 11.25 + 6.25x_A + 0.75 x_B - 7.25 x_C + 0.25 x_A x_B - 6.75 x_A x_C - 0.25 x_B x_C - 0.25 x_A x_B a_C $$

$$ \hat{y} = 11.0 + 6.0 x_A - 6.0 x_B - 7.0 x_C $$

We have very similar coefficients (3 from 4 are very close to each other)! In other hand, the B coefficient is wrong and we don’t have the factors interaction.

Let’s take a closer look at what happens in a half-factorial experiment.

We have already described the logic of choosing necessary combinations of factors. However, we can get a generalized view of the selection of factors for half-factor and other type of experiments from a special table (trade-of-table, Figure 11).

Fig. 11. Trade-of-table for experiment schemes.

Or you can use R:

library(pid)
help(tradeOffTable)

Further on, we will return to studying this table, and for now we will look into it to choose how to encode our factors.

The next interesting question is what are the new coefficients and why do they differ from the full-factor experiment? That’s the key point to understanding. Actually, the coefficients in a half-factor experiment are a combination of elements from a full-factor experiment. Consider this in the example of water purification.

In a full-factor experiment, we have the following system of equations:

$$ \begin{pmatrix} y_1 \\ y_2 \\ y_3 \\ y_4 \\ y_5 \\ y_6 \\ y_7 \\ y_8 \\ \end{pmatrix} = \begin{pmatrix} +1 & -1 & -1 & -1 & +1 & +1 & +1 & -1\\ +1 & +1 & -1 & -1 & -1 & -1 & +1 & +1\\ +1 & -1 & +1 & -1 & -1 & +1 & -1 & +1\\ +1 & +1 & +1 & -1 & +1 & -1 & -1 & -1\\ +1 & -1 & -1 & +1 & +1 & -1 & -1 & +1\\ +1 & +1 & -1 & +1 & -1 & +1 & -1 & -1\\ +1 & -1 & +1 & +1 & -1 & -1 & +1 & -1\\ +1 & +1 & +1 & +1 & +1 & +1 & +1 & +1\\ \end{pmatrix} \begin{pmatrix} b_0 \\ b_A \\ b_B \\ b_C \\ b_{AB} \\ b_{AC} \\ b_{CB} \\ b_{ABC} \\ \end{pmatrix} $$

Use only selected features we can write equations as follow:

$$ \begin{pmatrix} \\ y_2 \\ y_3 \\ \\ y_5 \\ \\ \\ y_8 \\ \end{pmatrix} = \begin{pmatrix} \\ +1 & +1 & -1 & -1 & -1 & -1 & +1 & +1\\ +1 & -1 & +1 & -1 & -1 & +1 & -1 & +1\\ \\ +1 & -1 & -1 & +1 & +1 & -1 & -1 & +1\\ \\ \\ +1 & +1 & +1 & +1 & +1 & +1 & +1 & +1\\ \end{pmatrix} \begin{pmatrix} b_0 \\ b_A \\ b_B \\ b_C \\ b_{AB} \\ b_{AC} \\ b_{CB} \\ b_{ABC} \\ \end{pmatrix} $$

I pointed out, that these are not mathematical justification, but only the logic of half-factor experiment.

We cannot remove any of the last vectors with coefficients as each of them corresponds to the change of the factor, i.e. the length of matrix X, which remains unchanged. However, such a matrix record of multiplication makes no sense - it is necessary that the matrix dimension of $X$ corresponds to the dimensions of vectors $y$ and $b$. To make the matrix multiplication (and the system of linear equations itself) look correct, it is necessary to reduce the matrix dimension of $X$. For this purpose, note that the columns of this matrix are actually duplicated. In other words, parts of the coefficients correspond to the same coding of the remaining factors. Behind this lies the same influence of the investigated factors, which we will not be able to distinguish from each other in our experiment (from the mathematical point of view they will be identical).

Thus, if we record a real matrix system for a half-fraction experiment, the obtained coefficients will actually be a linear combination (aliasing, confounding) of the coefficients of a full-factor experiment:

$$ \begin{pmatrix} y_2 \\ y_3 \\ y_5 \\ y_8 \\ \end{pmatrix} = \begin{pmatrix} +1 & +1 & -1 & -1 & -1 & -1 & +1 & +1\\ +1 & -1 & +1 & -1 & -1 & +1 & -1 & +1\\ +1 & -1 & -1 & +1 & +1 & -1 & -1 & +1\\ +1 & +1 & +1 & +1 & +1 & +1 & +1 & +1\\ \end{pmatrix} \begin{pmatrix} b_0 = b_0 + b_{ABC} \\ b_A = b_A + b_{BC} \\ b_B = b_B + b_{AC}\\ b_C = b_C + b_{AB}\\ \end{pmatrix} $$

In other words, our new coefficients contain the influence of interaction of these factors besides the influence of “pure” factors A, B, C. This explains that the program outputs us only 4 factors and they differ from the initial factors of a full-factor experiment.

Note. Return to the comparison of the equations of a full-factor experiment and half-factor experiment and make sure that the new coefficients are actually linear combinations of the true ones.

This is how we have reduced the number of factors by eliminating the interaction, but have taken it into account in our new coefficients!

After we have learned about full-factor and half-factor experiments, we can suggest 2 possible goals of the experiment (and ways of its planning):

scanning (screening) - when we allow reduction of information about the system (for example, do not take into account interactions or get some incorrect parameter estimates) and carry out reduced factor experiments. This is done in order to get a general idea of the interactions in the system.
optimization - searches for the optimal response value. At such scheme reduction of experiments is not allowed and carrying out of full-factor experiment is required.

Thus, it is always necessary to plan and evaluate the effect of each factor and their interactions (scanning experiments) before optimization experimental work. Here are some useful preliminary conclusions on an example of water purification (a full-factor experiment require 16 very costly tests, and we consider 3 factors: A - temperature, B - mixing speed and C - chemical).

It is important to code your factors correctly when conducting a half-factor experiment. This will allow to get coefficients that are close to reality. For example, in the above encoding we can conclude that $\hat{b_C} = b_C + b_{AB} \approx b_C$ because we know, that there is no interaction between mixing and water temperature. In this way, we get a clear understanding of the impact of chemical choice on water purification.
We should use several encodings and look at the expected results of half-factor experiments. Choose the most interesting ones.
Always make half-factor experiments first, evaluate the results and only then “finish” the full-factor experiment (if everything is okay and you need more information).

So far, we had considered a lot of experiment and its results. There are a lot of themes, that I want to translate from my course (in Russ.), but it will cost me a lot of time. Further, you find only the table of contents of remain themes and Figures and Tables, which are related to them. If you interested in this course, please contact me via e-mail (or use “Comment” button) and I sent you the material or post it here as fast, as possible.

2.9 Experiment map construction

2.9.1 Disturbances

2.9.2 Blocking the interfering factor in the model calculation

Table 5. Examined factors when introducing an mobile application to the market.

	Low level (-)	Hight level (+)
A "Promotion"	1 free-in-app upgrade	30 days trial of all features
B "Message"	"CallApp" has your schedule available at your fingertips, on any device	"CallApp" features are configurable; only pay for the features you want
C "Price"	in-app purchase price is 89 $	in-app purchase price is 99 $

Table 6. Blocking of interfering factor, when introducing an mobile application to the market.

	A "Promotion"	B "Message"	C "Price"	D = ABC "OS"	Outcome
1	-	-	-	- (Android)	y_1* = y_1 + g
2	+	-	-	+ (iOS)	y_2' = y_2 - h
3	-	+	-	+	y_3* = y_3 - h
4	+	+	-	-	y_4' = y_4 + g
5	-	-	+	+	y_5* = y_5 - h
6	+	-	+	-	y_6' = y_6 + g
7	-	+	+	-	y_7' = y_7 + g
8	+	+	+	+	y_8* = y_8 - h

2.9.3 Analysis of linear combination of factors (aliasing) and planning of scanning experiments

Table 7. Conducting a quarter-factor experiment with an additional test experiment (9th).

Experiments	A "temperatire"	B "dissolved oxigen"	C "substrate type"	D = AB "agitation rate"	E = AC "pH"
1	-	-	-	+	+
2	+	-	-	-	-
3	-	+	-	-	+
4	+	+	-	+	-
5	-	-	+	+	-
6	+	-	+	-	+
7	-	+	+	-	-
8	+	+	+	+	+
9	+	0	0	0	+

Table 8. Conducting a scanning quarter-factor experiment with an additional test experiment (9th)..

Experiments	A	B	C	D=AB	E=AC	F=BC	G=ABC	y
1	-	-	-	+	+	+	-	320
2	+	-	-	-	-	+	+	276
3	-	+	-	-	+	-	+	306
4	+	+	-	+	-	-	-	290
5	-	-	+	+	-	-	+	272
6	+	-	+	-	+	-	-	274
7	-	+	+	-	-	+	-	290
8	+	+	+	+	+	+	+	255

Fig. 12. Results of conducted experiment.

Fig. 13. The result of the experiment after removing insignificant factors.

2.9.4 Response Surface Methods (RSM)

Fig. 14. The result of full-factor "popcorn-experiment".

Fig. 15. Obtained model for one-factor "popcorn experiment".

Fig. 16. Next experiment outside the model definition area. Evaluation of usability.

Fig. 17. Complication of the model.

2.9.5 Response Surface Methods (RSM). Complication of the model.

Fig. 18. Optimization surface and contour lines.

Fig. 19. Initial full-factor experiment.

Fig. 20. A response surface methods (RSM) to maximize production profits. Comparison of contour lines.

Fig. 21. A response surface methods (RSM) to maximize production profits. The next factors experiment.

Fig. 22. A response surface methods (RSM) to maximize production profits. The next factors experiment.

Fig. 23. An example of limitations in a system that provide asymmetry.

Fig. 24. A response surface methods (RSM) to maximize production profits. The next factors experiment (assume that contour lines are linear).

Fig. 25. Type of contour lines depending on the interaction of factors.

Fig. 26. Spread depending of optimum distance.

Fig. 27. "Lack of fit" effect. The last full-factor experiment shows 3 additional experiments to determine the noise level.

Fig. 28. Nonlinear model.

Fig. 29. Nonlinear model. Contours lines of optimum (calculated and real).

2.10 Conclusion

2.11 Questions

3. Comparison experiments. Statistical practice

3.1 Introduction

3.2 Type of representation of sample or general population

Fig. 30. Histograms for quantitative (numerical) (a) or qualitative (categorical) (b) features.

3.2.1 Representation of central tendency

div>

Fig. 31. Example of distributions at different values of mode, median and average (taken from https://stats.stackexchange.com/).

3.2.2 Representation of variability

3.2.3 Quantiles of distribution

	Fig. 32 (a). Anatomy of box plot (a).
	Fig. 32 (b). Examples of box plot from https://media.nature.com site and distributions, which are related to them.

3.3 Statistics and data comparison

3.3.1 Normal distribution

Fig. 33. Normal distribution.

Fig. 34. Example for calculating the percentage of observations.

3.3.2 Central limit theorem

3.3.3 Confidence intervals

3.3.4 The idea of statistical conclusion, p-value of significance

3.3.5 Practice of using statistics to compare data

Fig. 35. t-distribution (Student's).

3.3.6 Graphical comparison of distributions

Fig. 36. Example of data representation in histogram form.

Fig. 37. Example of data representation as box plot.

Fig. 38. Example of data representation as box plot with average value and confident interval for normalize data.

3.3.7 Normality data check

Fig. 39. Example of normality check with qq plot (more examples you can find in internet with "qq plot with distribution example" search)

3.3.8 Samples analysis

Fig. 40. F-distribution (picture is taken from en.wikipedia.org)

3.3.9 Multiple comparison

Fig. 41. Example of multiple comparison effect from https://xkcd.com.

3.4 Questions

Fig. q-1.

Fig. q-2.

4. Making accurate models. Analytical practice.

4.1 Correlation

Fig. 42. Correlation examples of 2 values from CQE Academy.

Fig. 43. Example of features binary comparison for 3 type of objects in data science practice.

Fig. 44. Correlation coefficient calculation.

4.2 One variable regression

Fig. 44. Working principle of Least Square Methods for Linear Regression.

4.3 Coefficient of determination

4.4 Conclusion

4.5 Questions

Fig. q-3.

Fig. q-4.

References

Планирование эксперимента и анализ данных

2019-12-09T10:00:00+03:00

Приветствую всех заинтересованных!

Данный раздел посвящен основам планирования эксперимента и анализу полученных данных. Это является основной любой научной и аналитической работы. При этом я не вижу больших различий в том, какая это будет наука или дисциплина. По сути мы проводим эксперименты и обрабатываем данные постоянно в нашей жизни. Так что постараюсь сделать этот курс максимально полезным и осмысленным вне зависимости от области применения. Ведь все мы в той или иной мере являемся учеными и инженерами и в обычной жизни (вопрос в том: хорошими или плохими?). Мы решаем различные оптимизационные задачи (например, как получать бОльшую зарплату), накапливаем данные через наблюдения и строим выводы, опираясь на собственный опыт.

Целью курса является формирование общих теоретических и практических представлений о том, что такое наука, данные и эксперимент.

Основные задачи:

Показать терминологию и логику построения экспериментов в науке.
Описать особенности проведения эксперимента с точки зрения исследуемых факторов.
Определить эффективные пути проведения эксперимента и получения информации с целью оптимизации отклика системы.
Дать введение в статистику и обработку результатов.
Познакомить с построением линейных регрессионных моделей со статистической точки зрения.
Рассмотреть и решить некоторые примеры и задачи по теме курса.

Многие задачи и определения взяты с прекрасных курсов coursera.org и stepic.org (подробнее в списке литературы), а также из различных учебников и пособий по аналитической химии. Категорически рекомендую вам эти платформы дистанционного обучения.

Весь представленный здесь материал исследован, структурирован и переработан исходя из собственного опыта работы и отражает мой субъективный взгляд на вещи.

0. Оглавление

Введение. Наука и научный подход
Эксперимент. Система и факторы
Сравнительные эксперименты. Статистическая практика
Построение точных моделей. Аналитическая практика

1. Введение. Наука и научный подход

Итак, наука и научный подход — что это такое?

Наука (от лат. scientia — знания) — системное представление о строении и организации знаний (информации) о вселенной с возможностью проверки и предсказания.

Вообще, как известно из древнегреческой философии, для изучения окружающего мира человеку доступно лишь две возможности: наблюдение и эксперимент. Данное утверждение можно принять за аксиому (по крайней мере я не встречал противоречий и в современном мире).

При этом научную деятельность можно охарактеризовать следующим образом - это сбор данных через наблюдения и эксперименты. Их постоянное обновление, систематизация и анализ. Следствием всего этого является получение (синтез) новых знаний и законов нашего мира.

Другими словами: на основе данных, мы создаем теории и гипотезы, которые подтверждаются/опровергаются наблюдениями или экспериментами. Это и есть наука. Таким образом можно предположить следующий цикл научного познания (рис. 1, табл. 1).

Рис. 1. Взаимосвязь научных понятий.

Таблица 1. Термины научного познания

	применимо к единице или малому количеству	применимо ко всем случаем
описывает что происходит	наблюдение	закон
объясняет почему явление происходит	гипотеза	теория

Как правило в любой науке мы с вами будем работать над гипотезами и теориями, оперируя законами и наблюдениями (все на основе данных).

При этом не стоит забывать, что основным инструментом описания и классификации любого явления является математика. Для эффективной же работы в современном мире нам требуется еще один инструмент — программирование. Советую не забывать об этом и тогда ваша конкурентоспособность будет высокой.

Сам же эксперимент - это неотрывная частью науки и нашей жизни. Это запланированное наблюдение (проводимое с какой-либо целью). Все мы проводим эксперименты в повседневной жизни. Как сказал один преподаватель, если вы перестали экспериментировать - вы разочаровались в жизни. А это значит, что пора начать любое движение и снова экспериментировать.

Задача. Подумайте, какие эксперименты вы проводили в недавнее время? Что значит эксперимент для вас?

Вот хороший пример эксперимента. Допусти, мы выращиваем растение у себя перед монитором и поставили себе цель - оптимизировать его рост. В первую очередь, стоит проанализировать в чем выражается рост: длинна, количество листьев, вес и т.д.. Затем, нужно определить параметры, которые могут влиять на длину растения: количество воды для полива, частота полива, тип почвы, тип горшка для растения, тип удобрения, количество удобрения, свет, температура и т.д..

Таким образом, мы получили довольно много факторов, для которых нужно провести эксперименты, что бы узнать, какой фактор (или комбинация факторов) позволит нам добиться цели.

Примечание. Предлагаю запомнить последовательность: цель - факторы в которых выражается цель - влияющие на факторы параметры - эксперимент.

Из этого примера мы можем понять, с чем столкнемся дальше. Нам предстоит планировать и описывать эксперименты, а также обрабатывать данные и доказывать их правоту (представительность) с точки зрения статистики.

Для планирования эксперимента важно знать теорию соответствующей ему области знаний (в которой мы проводим этот эксперимент) и терминологию (что бы правильно ставить цели и определять параметры). Помимо этого, важно пользоваться обозначенным ранее научным циклом. А теперь, непосредственно к делу.

2. Эксперимент. Система и факторы

2.1 Введение и терминология

При проведении эксперимента, нашей целью является результат (outcome) - то, что мы хотим узнать/оптимизировать/представить в численном виде (т.е. то, что можно измерить). Синонимами результата являются реакция/оклик системы.

Факторы (factors, features) - изменяемые свойства, от которых предположительно зависит результат эксперимента (на них влияют соответствующие переменные (variables), но часто данные термины используют как синонимы).

Все эксперименты должны иметь хотя бы 1 изменяемый (и измеряемый) фактор. И чем больше факторов мы примем к рассмотрению, тем лучше (в общем случае).

Сами факторы делятся на:

количественные (quantitative) - которые можно измерить и сравнить (упорядочить по возрастанию/убыванию);
качественные (категориальные, номинативные, qualitative) - определяющие тип, но которые нельзя сравнить.

Иногда выделяют еще и ранговые факторы - определяющие тип, но которые можно сравнить (например, место в соревновании и т.п.). Но для анализа результатов в подавляющем случае используют только количественные или качественные величины. Ранговые величины используются при расчете различных статистических критериев.

Пример. Давайте рассмотрим классический пример построения эксперимента и обработки его результатов. Мы хотим увеличить прибыль магазина ($= \text{доход} - \text{расходы}$) и считаем, что на это будут влиять 2 фактора: освещенность помещения (можем выставить диммер освещения на 50% и 75%) и цена товара (допустим 7.79 $ или 8.49 $). Вот мы и столкнулись с двухфакторным экспериментом.

Отметим, что такой эксперимент нужно проводить 4 раза (например, каждый понедельник). Недостаточно просто менять по одному признаку (3 эксперимента), нужно добавить еще один - когда меняются оба признака сразу. Это увеличит количество полученной информации в 2 раза и позволит провести сравнение влияния обоих признаков на результат эксперимента. Дальше мы увидим почему это так.

При планировании эксперимента составляют специальную таблицу (табл. 2). Порядок записи данных в таблице называется стандартным порядком испытаний.

Таблица 2. Пример записи результатов эксперимента.

No	real No	Dimmer, %	Price	Profit, $
1	3	50	Low	490
2	1	75	Low	570
3	4	50	High	370
4	2	75	High	450

Даже просто записав получившиеся результаты, мы можем начать их анализ. Например, эффект яркости света при низкой цене составляет 80 $ (разница между тусклым и ярким светом). Тот же эффект при высокой цене будет 80 $. Таким образом, мы наблюдаем увеличение прибыли на 80 $ от эффекта освещения. Можно заметить, что эффект сохраняется при разных уровнях цены.

Аналогично для эффекта цены: при слабой освещенности он составит 120 $, при ярком свете - тоже 120 $. Таким образом, при увеличении цены на товар, прибыль падает (для нашего случая).

Задача. Как Вы думаете, что могло пойти не так? Какие факторы мы не учли и что еще может оказывать влияние на прибыль? Является ли наш эксперимент воспроизводимым (получим ли мы те же результаты при изменении прочих факторов)?

Интересно, что для рассмотренного примера многие люди провели бы не 4, а 3 опыта в рамках эксперимента. В качестве первого опыта они выбрали бы слабую освещенность и низкую цену. Далее, они бы проведи второй опыт - увеличили яркость света (оставив неизменной цену). Затем, они вернулись бы к начальной точке и провели бы третий опыт, увеличив только цену.

Многие посчитают, что так и надо проводить эксперименты (потому что каждый раз вы меняете только один фактор). Вас учили этому в школе и университете. Менять только один параметр за раз. Но в общем случае так делать не надо!

Если вы ограничитесь тремя экспериментами, вы получите только одну оценку эффекта от освещенности и только одну оценку эффекта от цены. Однако, всего один дополнительный опыт при увеличении обоих факторов позволит нам оценить оба эффекта дважды. Мы получаем две оценки влияния освещенности и две оценки влияния цены на прибыль. Поэтому, добавив всего один дополнительный опыт, мы фактически удвоили количество полученной информации.

Во многих случаях, этот дополнительный опыт стоит затраченных усилий.

Примечание. Мы описали так называемый “полнофакторный” эксперимент (full factor experiment). при этом мы изменяли сразу оба параметра. Однако пример “фиксированного” подхода к эксперименту (когда мы меняем только один фактор при фиксированных прочих факторах) очень распространен в аналитической химии. В случае построения градуировочной прямой мы меняем обычно только одну переменную (аналитический сигнал) в фиксированных условиях и измеряем только один отклик (концентрацию). Как Вы думаете почему? Какую дополнительную экспериментальную работу необходимо сделать, прежде чем станет возможно зафиксировать остальные факторы?

Немного терминов для словарного запаса. Множество наших наблюдений за объектом есть процесс измерения. В свою очередь запись измерения в определенных величинах — это количественный анализ/измерение (сравнение с установленным стандартом, например, измерение линейкой). Таким образом, количественное измерение — записанный результат сравнения в определенной размерности. Качественный анализ — просто результат сравнения (больше или меньше, есть объект или нет, как правило без размерности). Иногда говорят о полуколичественном анализе, подразумевая не очень точный количественный анализ (но лучше, чем ничего).

2.1.1 Точность и воспроизводимость

Мы подошли к основным понятиям обработки результатов эксперимента: точность (прецизионность, accuracy) и воспроизводимость (precision). Лучше всего эти понятия объясняет аналогия с мишенями для стрельбы (рис. 2).

Рис. 2. Примеры с точностью и воспроизводимостью стрельбы. Точно и воспроизводимо, не точно и воспроизводимо и "точно" и не воспроизводимо (когда среднее значение не точных результатов оказывается случайно близким к истинному значению).

Точность определяет близость полученного результата к абсолютному значению, а воспроизводимость — насколько близко от предыдущего полученного результата будет лежать следующее такое же измерение. Воспроизводимость и точность оцениваются с помощью очень важного и полезного инструмента — статистики (область математики).

Для оценки точности полученного результата мы можем использовать понятие абсолютной и относительной погрешности.

Абсолютная погрешность (absolute error): $a = x_{true} − x_{our}$, где: $x_{true}$ — истинное значение (как правило никогда не известно, поэтому за него обычно принимаем значение референтного метода анализа или среднее), $x_{our}$ — полученное нами значение. Как можно заметить по формуле, абсолютная погрешность измеряется в тех же величинах что и само измерение.

Относительная погрешность (relative error): $\Delta = \frac{x_{true} - x_{our}}{x_{true}}$. Относительная погрешность измеряется в процентах (на то она и относительная).

Воспроизводимость в свою очередь определяется немного сложнее и к ней мы вернемся в 3 части курса, посвященной статистической обработке результатов.

Стоит сказать, что существует всего 2 природы погрешности: случайная (random, обусловленная статистической природой измерений, всегда присутствует в нашем несовершенном мире) и систематическая (systematic), обусловленная действием какой-либо постоянной возмущающей силы, которую можно вычислить или учесть (например, гравитация, плохо откалиброванный прибор и т.д.).

Примечание. Распространенность “фиксированного” подход в аналитической химии вызвано тем, что он обеспечивает большую точность и достоверность полученных результатов. Однако, прежде чем выбрать наиболее значимый фактор и зафиксировать все остальные, необходимо тщательно изучить систему. Для этого и используется факторный эксперимент. Кроме того, факторный эксперимент доминирует в остальных областях знаний, включая химическую технологию.

2.1.2 Немного о правилах представления результата

Важным понятием любой естественной науки является понятие значащих цифр и правил округления. Помимо размерности, точности и воспроизводимости, нужно правильно оценить количество значащих цифр для полученных экспериментальных данных. Другими словами, нужно показать сколько цифр в полученном результате имеют реальное физическое обоснование (физический смысл). Прочие цифры нужно отбросить (точности мы не потеряем, но цифры станут достоверными).

Количество значащих цифр определяет погрешность эксперимента (и наоборот, результат измерения округляется до того же знака, что и абсолютная погрешность с одной значащей цифрой).

Пример. Если в ходе повторения эксперимента по измерению концентрации стандартного образца с установленной концентрацией в 100.0 моль/л мы получили значение 100.1, 99.8, 100.2, то средняя абсолютная погрешность составит $\frac{\sum |x_i - 100|}{3} = \frac{0.1 + 0.2 + 0.2}{3} = 0.16666.. \approx 0.2$. Тогда средний результат измерения будет $\frac{100.1 + 99.8 + 100.2}{3} = 100.0333... \approx 100.0$.

Обычно такой результат записывают в виде $100.0 \pm 0.2$. Последняя цифра при такой записи получается как бы не точно определена и может принимать любое значение в пределах экспериментальной погрешности $x \in [99.8; 100.2]$.

Значащие цифры очень полезны для естественных наук. Они позволяют упростить некоторые стадии эксперимента и сделать его более воспроизводимым, показать коллегам с какой точностью мы проводили исследования. Например, зная необходимую точность эксперимента и значащие цифры, можно рассчитать с какой точностью нужно взвешивать реактивы (если точность эксперимента ограничена 2 значащими цифрами, то взвешивать с 4 значащими цифрами нет смысла).

Далее мы приведем наборы правил для значащих цифр. Чтобы их понять и запомнить нужно мыслить категориями погрешности. Всегда помните, что последняя значащая цифра несет в себе неопределенность от абсолютной погрешности.

Для записи значащих цифр есть несколько правил.

Каждая цифра, отличная от 0 - значащая (например, 237 — 3 значащих цифры, 129.7 - 4 значащие цифры).
0 перед не 0-ми числами — не значащий (0.0165 — 3 значащие цифры). В таком случае лучше применять “научную” запись числа: $1.65 \cdot 10^{-1}$.
0 до десятичной точки — нельзя сказать наверняка, так ученый писать не должен (10 писать нельзя, записывать нужно как $1.0 \cdot 10$. Однако к сожалению, такая запись очень часто встречалась в моей практике. Если вы встретили запись эксперимента в виде 3700 единиц, то скорее всего человек не знаком с практикой значащих цифр и просто округлил до целого. Лучше проанализировать эксперимент и установить количество значащих цифр (например, точность взвешивания или абсолютную погрешность).
В остальных случаях 0 - значим (85.950 — 5 значащих цифр, 12.06 — 4 значащих цифры).

Примечание. Научная (экспоненциальная) запись числа всегда подразумевает одну цифру до десятичной точки и точное указание значащих цифр, например, $1.650 \cdot 10^{-10}$ или $2.740 \cdot 10^{5}$. Настоятельно рекомендую всегда пользоваться ею в экспериментальной практике.

Пример. Масса образца равна 0.1 г. Если взвешивание проводили на аналитических весах с погрешностью $\pm 0.0001$ г, то правильное представление результата будет 0.1000 г или $1.000 \cdot 10^{-1}$ г.

Также есть правила для арифметических действий со значащими цифрами, которые позволяют нам сохранить физический смысл величин при математических вычислениях в естественных науках.

Сложение/вычитание — мыслите абсолютными категориями (важен порядок числа). Оставляют столько цифр после запятой, сколько их содержится в слагаемом с наименьшим числом десятичных знаков (т.е. точность лимитируется числом, имеющим наибольшую абсолютную недостоверность). Помните, что последняя цифра несет неопределенность, которая ограничивает все остальное, но при сложении ее влияние будет пропорционально ее порядку.
Умножение/деление — мыслите относительными категориями (при умножении или делении недостоверность лимитирующего числа пропорционально переноситься на результат). Количество значащих цифр результата будет равно минимальному количеству значащих цифр участников (т.е. точность лимитируется числом, имеющим наибольшую относительную недостоверность). Если число значащих цифр одинаково, то лимитирует точность то, у которого мантисса меньше (абсолютная величина, равная всем выписанным подряд числам).

Пример. При $0.0304 \times 5.43$ точность лимитирует первое (мантисса 1-ого 304, мантисса 2-ого 543). Это работает, поскольку относительная погрешность у меньшего числа будет больше.

Логарифмирование - логарифмируемое число и мантисса (в случае логарифмирования - результат логарифма) содержат одинаковое количество значащих цифр.

Пример. Рассчитаем значение pH $2.0 \cdot 10^{-3}$ М раствора HCl. Учтем, что основание логарифма и степени 10 в экспоненциальной записи числа - точные величины. Тогда результат:

$$ pH(2.0 \cdot 10^{-3}) = -lg(2.0 \cdot 10^{-3}) = -(lg(2.0) -3) = -(0.30 - 3) = 2.70 $$

Обратите внимание, что за счет сложения с абсолютно точной величиной 3, точность конечного результата составила 3 значащих цифры (абсолютная погрешность измерения осталась прежней, а вот относительная погрешность уменьшилась).

Возведение в степень - множественное умножение чисел, с одинаковым количеством значащих цифр и число значащих цифр результата будет таким же.
Корень числа - можно представить как результат в абсолютной степени, т.е. множественное умножение результата, которое даст число, возводимое в корень. Таким образом число значащих цифр останется неизменным.

$$ \sqrt{x} = a \\ x = a^2 $$

Соблюдаем арифметический порядок действий как в математике.
Во избежание накопления ошибки, округление результата делается только в конце всего вычисления. В промежуточных расчетах оставляем количество значащих цифр + 1. В конечном результате эта дополнительная цифра округляется.

Примечание. Приведенные правила вычислений со значащими цифрами есть не что иное, как приближение для погрешности результата. По этой причине чрезвычайно не желательно производить много расчетов для величин с погрешностями (особенно возведение в степень, взятие корня и логарифмирование) - чем больше таких операций, тем более не определен наш конечный результат в действительности. Правила обращения со значащими цифрами при математических операциях можно строго обосновать на основе закона распространения погрешностей (но делать так мы конечно же не будем).

Примечание. Результаты грави- и титриметрических определений в большинстве случаев записывают в виде чисел, содержащих 4 или 2 значащие цифры, что связано с погрешностью измерения массы веществ (например, $\pm 0.0001$ г) и объемов (например, $\pm 0.03$ мл) растворов. Но количество значащих цифр сильно зависит от исходной массы навески.

Примечание. Результат анализа и его погрешность должны содержать одинаковое число знаков после запятой (например, $10.1 \pm 0.1$).

Правила округления:

округляем до количества значащих цифр (последняя несет в себе неопределенность);
если отбрасываемая цифра больше пяти или меньше — округляем в соответствующую сторону;
если отбрасываемая цифра 5 — округляем до ближайшего четного (если нужно округлить только одну цифру 5: $10.5 \approx 10$, но это не так, если округляем 2 цифры $10.51 \approx 11$);
не округляем промежуточные вычисления или оставляем нужное количество значащих цифр + 1.
всегда помните, что значащие цифры это показатель абсолютной погрешности измерения величины и работать с ними нужно соответственно.

Подводя итог еще раз рассмотрим зачем нам нужно всегда использовать значащие цифры, а не писать все что выводит нам калькулятор.

Являются достоверными и позволяют определять точность операций.
Можем определить лимитирующую стадию эксперимента (где наш эксперимент наименее точен и что в эксперименте стоит улучшить).
Показывают физический смысл округления чисел.

Пример. Необходимо рассчитать результат вычисления:

$$ \frac{(\frac{97.7}{32.42} \cdot 100.0) + 36.04}{687} = \\ \frac{301_{.4} + 36.04}{687} = \frac{337_{.4}}{687} = 0.0491_1 \approx 0.0491 $$

2.2 Анализ двухфакторного эксперимента

Я надеюсь, что смог показать вам как нужно записывать результаты экспериментов и убедил вас в значимости факторных экспериментов в нашей жизни. Время перейти к их изучению и анализу.

В качестве примера рассмотрим попкорн. Мы будем стараться оптимизировать количество лопнувших зерен. Этот эксперимент хорош тем, что вы можете повторить его у себя дома.

Примечание. Если что-то будет непонятно, то можете смело писать мне или посмотреть курс, где данный эксперимент разобран более подробно.

В самом эксперименте у нас будут 2 исследуемых фактора, которые принимают по 2 значения: А - время нагрева (160 и 200 с) и В - тип попкорна (желтый и белый). Можно легко посчитать, что число экспериментов будет 4.

Примечание. В общем случае для расчета количества экспериментов используют следующую формулу: $f^v = 2^2 = 4$, где $f$ - число факторов, а $v$ - число значений, принимаемых фактором (согласно еще одной области математике - комбинаторике). В нашем случае мы всегда будем рассматривать одинаковое число уровней у факторов, считайте это своего рода требованием для подобных планов экспериментов.

Составим таблицу эксперимента (табл. 3). Обозначим низкое и высокое значение фактора как - и + соответственно (для категориального - не важно, выбираем любой). Тогда для А: - = 160, + = 200, для В: - = белый, + = желтый.

Примечание. Для получения информативных результатов важно:

не использовать экстремальных значений для факторов (иначе на них оказывается множество влияний и они слишком сильно будут отличаться друг от друга, что увеличит погрешности);

всегда проводить эксперименты в случайном порядке! Только так мы сможем избавиться от систематической погрешности и возникающих дополнительных связях между величинами.

Таблица 3. Результаты двухфакторного “попкорн-эксперимента”.

Standard order	Random order (real)	A - time *	B - corn	Results
1 2 3 4	3 1 4 2	- + - +	- - + +	52 74 62 80

* используем стандартный подход: сначала все время изменяем 1-ый фактор, а 2-ой ставим ему в соответствие.

Итак, результаты получены. Само время проводить анализ. Начинать всегда лучше всего с визуализации (так уж устроено наше мышление). Визуализация факторного эксперимента называется кубической диаграммой (графиком/планом, cube plot). Она приведен на рис. 3.

Рис. 3. Кубическая диаграмма 2-ух факторного эксперимента с попкорном. На диаграмме изображены изолинии.

Эта диаграмма показывает эффект от каждого фактора в соответствующем углу квадрата или куба (2 или 3 факторные эксперименты).

Начнем с оценки эффекта от времени. При увеличении времени готовки для желтого попкорна, результат увеличивается с 62 до 80 лопнувших зерен (ЛЗ). Мы видим рост на 18 единиц. Для белого попкорна мы видим изменение с 52 до 74 ЛЗ, то есть рост на 22 единицы. Итак, в среднем мы видим увеличение на 20 единиц при увеличении продолжительности нагрева со 160 до 200 секунд.

Далее давайте оценим разницу между двумя типами попкорна. Зафиксируем время нагрева и посмотрим на эффект от перехода от белого к желтому попкорну: с 74 до 80 для 200 с и с 52 до 62 для 160 с. В среднем мы видим увеличение на 8 единиц при переходе от белого к желтому попкорну. Убедитесь, что ваша интерпретация соответствует кубической диаграмме. Эта визуализация очень важна для самопроверки результатов анализа.

Но помимо результатов, на кубической диаграмме отображены еще и контурные линии (contour plot, их еще называют изолиниями, isolines). Они обозначают область, в которой значение измеряемого признака остается постоянным (на 1 линии количество лопнувших зерен будет постоянным). Их рисуют начиная с любого угла кубической диаграммы, значение в котором не является максимальным или минимальным. Затем ищут это же значение на противоположенной стороне квадрата и проводят линию в соответствии с предполагаемым уровнем результата. Для проверки кривизны линии нужно рассчитать наше фиксированное значение для середины шкалы.

Затем рисуем вторую линию аналогично для значения в 74. Остальные рисуем параллельно полученным линиям.

Благодаря изолиниям можно быстро понять, куда начинать движение для оптимизации результата, т.е. по направлению к нашей цели. Например, если цель — максимизировать количество лопнувших зерен, то двигаться нужно перпендикулярно изолиниям в верхний правый угол. В данном случае это означает, что мы должны взять желтый попкорн и увеличить время приготовления (что вполне интуитивно понятно из кубической диаграммы).

Такой подход к оптимизации (с использованием изолиний) помогает нам определиться с метом проведения следующего эксперимента. Контурная диаграмма - это наш градиент (gradient, путь, по которому пройдут наши эксперименты для подтверждения/опровержения закона или теории).

Отмечу, что есть еще один способ визуализации - диаграмма взаимодействия (interaction plot) (рис. 4).

Рис. 4. Диаграмма взаимодействия для 2 факторного эксперимента с попкорном.

Обратите внимание, что эти две линии практически параллельны, что означает, что в исследуемой системе практически отсутствует взаимодействие. Выбор переменной для диаграммы взаимодействия не играет большой роли и мы могли бы выбрать другую переменную для обозначения на горизонтальной оси.

Для всех описанных методов визуализации не требуется какое-либо программное обеспечение. Вы можете использовать эти методы визуализации как для числовых, так и для категориальных факторов. Все это демонстрирует явное преимущество такого подхода к эксперименту: мы можем быстро интерпретировать результаты, используя простые графические инструменты, элементарную математику и лист бумаги.

Тот факт, что все так просто, означает, что результатами будет легко поделиться с менеджерами или коллегами на работе.

2.3 Построение прогнозов

Мы рассмотрели пример планирования, проведения и анализа эксперимента. Но что это нам дает? Как мы можем представить и использовать полученные данные? Ответ - построить прогноз (модель, уравнение регрессии). В рамках нашего курса мы будем рассматривать только линейные модели (за небольшим исключением). Такие модели наиболее универсальные (любую гладкую и монотонную функцию можно представить как набор линейных отрезков).

В случае нашего “попкорн-эксперимента” (2-ух факторный эксперимент), полученная модель состоит из 3 частей:

$$ \hat{y} = a_0 + a_1 \cdot x_A + a_2 \cdot x_B $$

где,

$a_0$ - базовый результат (intercept), который мы ожидаем увидеть при отсутствии влияния (когда закодированные значения факторов = 0). Этот коэффициент рассчитывается как среднее из 4 значений на кубической диаграмме (т.е. ее центр).
$a_1$ - коэффициент влияния фактора А (его закодированного значения), зависит от времени приготовления. Рассчитывается как средняя нормированная разница между высоким и низким значением фактора: $a_1 = \frac{\frac{(80-62) + (74-52)}{2}}{2}$. Обратите внимание, нормировка подразумевает расчет коэффициента для единичного изменения фактора (т.е. с -1 до 0 или от 0 до +1), поэтому мы должны разделить усредненное значение на 2.
$a_2$ - коэффициент влияния фактора В, зависящий от типа зерен. Рассчитывается аналогично пункту 2.

Учитывая приведенное описание наша модель будет:

$$\hat{y} = 67 + 10 \cdot x_A + 4 \cdot x_B$$

Задача. Проверьте корректность прогнозов этого уравнения для различных значений переменных A и B. Обращайте внимание на изолинии!

2.4 Взаимодействие между факторами

До сих пор мы рассматривали весьма идеальные случаи где нет взаимного влияния факторов друг на друга и на целевую переменную. Однако зачастую это не так.

Пример. Мы пытаемся отмыть руки и проводим 2-ух факторный эксперимент: есть/нет мыла и теплая/холодная вода. Можно заметить, что эффект теплой воды усилится при использовании мыла. И наоборот, эффект мыла усилится при использовании теплой воды. То есть “взаимодействие” говорит о том, что эффект одного фактора зависит от уровня другого фактора.

Кроме этого, эти взаимодействия обычно симметричны (не не всегда!). Т.е. нет разницы будем ли мыть руки в теплой воде с мылом или с мылом в теплой воде, результат будет одинаков.

Первым показателем наличия взаимосвязи является несимметричность линий на диаграмме взаимодействия или изогнутость изолинии на кубической диаграмме. Если вы наблюдаете такие эффекты, то это проявляется двухфакторное взаимодействие (когда поведение одной переменной сильно отличается в зависимости от уровня другой переменной).

Рассмотрим эксперимент на рис. 5 и рассчитаем все коэффициенты. Эксперимент заключался в анализе влияния времени выпечки (фактор А) и типа подсластителя (фактор В) на вкус печенья (по шкале от 1 до 10).

Рис. 5. Кубическая диаграмма эксперимента со взаимодействием признаков.

Обратите внимание, что изолинии уже не параллельные и изображать их нужно в изогнутом виде (еще раз напомню, на изолинии должно быть одинаковое значение результата). Для этого рекомендую провести вспомогательную линию по центру кубической диаграммы.

Выраженная не параллельность линий сигнализирует о наличии взаимного влияние факторов друг на друга. Строго говоря, при анализе эксперимента нужно всегда строить модель с учетом взаимного влияния и исключать его только если коэффициент перед этим фактором в модели очень мал. Рассчитаем получившуюся модель.

Для начала рассчитаем влияние каждого фактора на эксперимент в отдельности (без учета взаимного влияния, аналогично предыдущему примеру).

Затем, учтем фактор взаимного влияния, рассчитав изменения при одном фиксированном факторе (тип подсластителя). Тогда, математически, взаимодействие рассчитывается как усредненная разница при высоком и низком значении признака:

$$interaction = \frac{(9-4) - (5-3)}{2} = 1.5$$

Это значение нормируется на единицу изменчивости фактора (уже классический прием).

Проверим симметричность влияния, зафиксировав другой фактор:

$$interaction = \frac{(9-5)(4-3)}{2} = 1.5$$

Таким образом влияние действительно симметрично и равнозначно. В итоге, наша модель запишется в виде:

$$ \hat{y} = \frac{3+5+4+9}{4} + \frac{(5-3) + (9-4)}{2} \cdot \frac{1}{2} \cdot x_A +\\ \frac{(4-3) + (9-5)}{2} \cdot \frac{1}{2} \cdot x_B + \frac{1.5}{2} \cdot x_A x_B $$

$$ \hat{y} = 5.25 + 1.75 x_A + 1.25 x_B + 0.75 x_A x_B $$

Задача. Постройте диаграмму взаимодействия факторов и убедитесь в наличие взаимодействия. Проверьте точность предсказания нашей модели для краевых значений и различной времени готовки без учета взаимного влияния и с учетом взаимного влияния.

2.5 Трехфакторный эксперимент

После того, как мы освоили азы анализа результатов эксперимента, мы можем усложнить исходные условия.

Новый пример взят из учебника Бокса, Хантера и Хантера, которая называется “Статистика для экспериментаторов”. В этом эксперименте проводится поиск оптимальной комбинации параметров для уменьшения количества загрязнителя в сточных водах очистных сооружений.

Рассматривается три фактора с 2 уровнями.

Первый фактор — С (chemical), химическое соединение (два соединения P и Q).
Следующий фактор - T (temperature), температура очистки воды ($72^o F, $100^o F$).
Последний фактор - S (stirring speed), это скорость перемешивания (200 или 400 оборотов в минуту).

Тогда количество необходимых экспериментов составит:

$$ f^v = 3^2 = 8 $$

где $f$ - число факторов, а $v$ - число значений, принимаемых фактором.

Результатом эксперимента будет количество загрязняющих веществ, измеренное в фунтах.

Используя стандартный порядок проведения эксперимента, составим таблицу эксперимента (табл. 4).

Таблица 4. Результаты трехфакторного эксперимента.

Standard order	Random order (real)	C - chemical	T - time	S - stirring speed	Outcome
1 2 3 4 5 6 7 8	6 2 5 3 7 1 8 4	- + - + - + - +	- - + + - - + +	- - - - + + + +	5 30 6 33 4 3 5 4

Одно из преимуществ такой таблицы заключается в том, что мы можем быстро получить общее представление о влиянии фактора на результат. Например, оцените как изменяется количество загрязняющих веществ, когда мы меняем фактор химического соединения C? Уровень фактора меняется с низкого на высокий и мы видим ту же самую картину с количеством загрязняющих веществ. Посмотрите на эффект фактора S. Первые четыре эксперимента в среднем показали очень высокий уровень загрязнения, а последние четыре эксперимента — низкий уровень загрязнения.

Просто глядя на таблицу, мы можем сказать, что факторы C и S скорее всего важны для понимания полученных результатов.

На основании таблицы эксперимента составим кубическую диаграмму (рис. 6.)

Рис. 6. Кубическая диаграмма трехфакторного эксперимента.

Общий вывод. Согласно полученным результатам, нам нужно взять химикат Q, проводить очистку при низкой температуре и на высокой скорости перемешивания (400 оборотов в минуту).

Проанализируем основные эффекты и взаимодействия.

Начнем с первого фактора C (выбора между химическими соединениями P и Q, где Q — высокий уровень фактора). Из кубической диаграммы мы можем получить четыре оценки эффекта С (вдоль каждого из четырех горизонтальных ребер). При высокой температуре и высокой скорости перемешивания (т.е. высокий уровень T и высокий уровень S) эффект от этого фактора равен 4-5 фунтов загрязнения. При высокой температуре и низкой скорости: 33-6. При низкой температуре и высокой скорости (т.е. Т - и S +), эффект равен: 3-4. И, наконец, при низкой температуре и низкой скорости: 30 и 5.

Мы можем проанализировать полученную информацию с точки зрения каждого фактора и их возможного взаимодействия.

В ходе опытов, химическое соединение показало четыре результата. Среднее для этих четырех чисел равно $\frac{50}{4} = 12.5$. Но что на самом деле означает полученное число 12.5? Как бы вы объяснили это значение своему менеджеру, который ничего не смыслит в статистике и экспериментах?
- Значение в 12.5 говорит о том, что в среднем мы ожидаем увидеть увеличение количества загрязняющих веществ на 12.5 фунтов на тонну при переходе от химического соединения P к Q (хотя для модели используется коэффициент 6.25 - половина). Таким образом для категориальных признаков в модели мы пишем половину от эффекта (учитываем нормировку).
- Еще одна вещь, на которую следует обратить внимание, это расхождение эффектов химиката при высоком и низком уровне перемешивания (S). Обратите внимание на огромную разницу, которая говорит о том, что существует явное взаимодействие между фактором C и фактором S.
Прежде чем мы перейдем к взаимодействиям, давайте рассмотрим температуру (T). Заметное влияние температуры на отклик системы в таблице отсутствует. Это же подтверждает рассчитанный коэффициент в модели = 1.5 единицы (или 0.75 при нормировании эффекта). Это действительно слабый эффект.
Наконец, рассмотрим эффект скорости перемешивания (S). Среднее для эффекта равно -14.5 (или -7.25 при нормировке). Другими словами, мы ожидаем среднее снижение количества загрязняющих веществ на 14.5 фунтов при переходе от низкой скорости перемешивания к высокой.

$$ \hat{y} = 11.25 + 6.25 x_C + 0.75 x_T - 7.25 x_S \dots $$

На этом этапе вам всегда надо делать паузу, чтобы убедиться, что полученные результаты имеют смысл. По горизонтальной оси мы видим, что переход от химиката P к Q увеличивает загрязнение (рис. 6). Поэтому значение 6.25 выглядит адекватно. Небольшое значение 0,75 для температуры также выглядит логично, потому что она действительно имеет очень слабый эффект. И, наконец, увеличение скорости перемешивания приводит к наиболее существенному снижению загрязнения: на 7.25 единиц.

Примечание. Всегда проверяйте полученные коэффициенты модели на разумность!

Как только мы закончили с интерпретацией факторов по отдельности, можно перейти к взаимодействиям. Ранее мы отметили, что эффект химиката сильно меняется при низкой скорости перемешивания. Однако на задней грани куба (при высоких скоростях перемешивания) эффект от выбора химиката практически равен нулю. Очевидно, что скорость перемешивания изменяет эффект от химического соединения. Таким образом мы наблюдаем взаимодействие между 2 факторами S и C. Для численной оценки воспользуемся уже знакомым нам приемом - добавим новый член в уравнение.

У нас есть две возможности его рассчитать, фиксируя разные уровни переменной:

при высокой температуре;
вторая — при низкой температуре.

Нет гарантии, что эффект будет симметричен, поэтому произведем оба расчета, а затем возьмем среднее (даже если эффект будет симметричен мы ничего не потеряем, а в противном случае - учтем оба влияния). А потом, как и всегда, нормируем на количество уровней признака (запишем половину).

Пока что, мы учли только взаимодействие между факторами С-S. По остальным двухфакторным взаимодействиям не наблюдается видимого значимого влияния (одна из возможных причин - температура слабо влияет на модель). На самом деле, есть еще и трехфакторное взаимодействие C-T-S. Но пытаться все это учесть в ручную весьма утомительно и велик шанс наделать при этом ошибок. Далее мы будем использовать для этого компьютер. Поэтому пока остановимся на полученных результатов и проанализируем их.

Общий анализ результатов. Основное заключение - при низких скоростях перемешивания химикат Q не эффективен, но при высоких оба химических соединения одинаково эффективны. Начиная с этого момента эксперименты становятся действительно мощным инструментом. Мы увидели, что самый низкий уровень загрязнений был при использовании химиката Q с высокой S и низкой T (найдите это значение на кубической диаграмме). Но что если, согласно требованиям правительства, загрязнение должно быть меньше 10? И при этом, допустим, химикат Q стоит вдвое дороже, чем P…

На самом деле мы сейчас мысленно оценили дополнительный результат — прибыль. Не забывайте, что прибыль (или расходы) часто играют важную роль во всех системах. Поэтому вы всегда должны иметь в виду экономическую составляющую каждого угла куба.

При этом мы убедились в малом эффекте температуры. И вот в чем вопрос: значит ли это, что рассматривать температуру в качестве фактора бессмысленно? И ответ - нет. Важно понимать, что даже незначительные эффекты представляют для нас важную информацию для изучения системы. Так, в нашем примере мы видим, что в диапазоне температур $[70; 100]^o F$ температура оказывает незначительное влияние на количество загрязняющих веществ. И это важно, потому что на основании этой информации инженер или оператор может подобрать наиболее экономически выгодные условия работы. И, опять-таки, все сводится к прибыли. Вполне вероятно, что работа при более низкой температуре позволит сэкономить энергию. А поскольку температура оказывает лишь незначительное влияние на систему в целом, мы не окажем существенного влияния на уровень загрязнения если решим работать при низкой температуре. И это отличный результат.

Задание. Постройте прогноз для любого случая из кубической диаграммы и проверьте его для модели без учета влияний и с учетом влияний. В какую сторону работают взаимодействия (увеличивают или уменьшают количество загрязняющих веществ)?

Задача. Как Вы думаете, почему химическое соединение Q оказывается менее эффективным при низкой скорости перемешивания, но при высокой работает очень хорошо?

2.6 Построение модели методом наименьших квадратов (МНК) для 2 факторного эксперимента

Дойдя до этого раздела, мы рассмотрели несколько важных примеров того, как нужно строить и анализировать эксперимент. Более того, мы научились рассчитывать модель, которая позволяет связать закодированные факторы с целевой переменной. Однако, коэффициенты для модели мы подбирали интуитивно, основываясь на вполне логичных представлениях об усреднении влияний признаков. Настало время более формального описания модели по результатам экспериментов.

Для построения математически обоснованной прогнозной модели мы воспользуемся наиболее распространенным подходом - методом наименьших квадратов (МНК). Мы еще затронем статистическое обоснование данного метода в 3 главе, а пока сосредоточимся на его общих особенностях и экспериментальном применении. В качестве примера, мы будем рассматривать наш “попкорн-эксперимент”. Напомню, что линейная модель для двухфакторного эксперимента в общем случае выглядит как:

$$ \hat{y} = b_0 + b_A x_A + b_B x_B + b_{AB} x_A x_B $$

при этом $x_A$ и $x_B$ - кодированные переменные (через значения -1 и +1 мы кодируем реальные физические величины: для А - время, а для В - тип зерен).

В нашем случае проводилось 4 опыта, для каждого из которых должна быть справедлива предложенная модель. Тогда мы можем составить систему уравнений:

Таким образом, проведя эксперимент мы имеем 4 уравнения с 4 неизвестными, а значит - можем решить их!

Эти уравнения — линейные, поэтому система уравнений достаточно просто решается с использованием матричных методов. Не стоит пугаться, это просто более удобная форма записи и метод расчета. Давайте я покажу вам, как это сделать.

В матричной форме наши уравнения записываются следующим образом:

Значения в матрице $4 \times 4$ состоят из кодированных переменных. Остальные 2 вектора (матрицы с одним столбцом или строкой данных) состоят из результатов опытов и неизвестных нам коэффициентов перед кодированными переменными.

В так называемом “аналитическом” виде (т.е. который имеет строгое математическое обоснование), такая матричная система имеет решение:

$$ b = (X^T \cdot X)^{-1} \cdot (X^T \cdot y) $$

где $b$ и $y$ - векторы неизвестных коэффициентов и результатов эксперимента соответственно, а $X$ - матрица кодированных переменных ($X^T$ - транспонированная матрица, $(X)^{-1}$ - обратная матрица).

Примечание. Факторы не всегда должны быть кодированными (могут использоваться и обычные, “реальные” значения). Однако тогда мы можем столкнуться с рядом проблем (несбалансированность величин, неустойчивость решения и т.д.). Так что лучше всегда использовать кодированные значения (или хотя бы нормированные на среднее и дисперсию).

Найти описанное решение можно и в ручную (если использовать правила линейной алгебры). Однако лучше использовать компьютерные программы, которые очень эффективно решат за вас эти уравнения. Все, что нам нужно, это матрица $X$ и вектор $y$. И у нас есть все необходимое: матрица $X$ получилась из таблицы эксперимента, а вектор $y$ — это просто результаты четырех экспериментов.

Для компьютерных расчетов мы можем использовать ряд программ. Основные из них: MS Exel, R, Python и др. Как можно заметить, 2 из 3 перечисленных мною программ - языки программирования. Но не стоит их боятся. Например R - это очень распространенный и простой язык для статистики и анализа данных. Установить и использовать его довольно легко, а результат получается наглядным. С другой стороны современный Exel предоставляет весьма широкий набор функций работы с данными (в том числе работа с моделями и базами данных, pivot tables и т.д.). Помимо этого доступно множество платных и бесплатных программ для планирования эксперимента и анализа данных. Вы можете провести их поиск в интернете. Но в рамках нашего небольшого курса мы рассмотрим довольно простые примеры на R. Кроме того, более подробно работа с R рассмотрена в этом курсе с русскими субтитрами или другом, русскоязычном курсе.

2.7 Анализ факторного эксперимента с использованием RStudio

На предыдущих примерах вы научились выполнять необходимые расчеты и анализ результатов эксперимента в ручную. Однако при таком подходе наши возможности сильно ограничены, а риск ошибки очень высок. Время переходить на цифровые технологии! Для этого понадобится выбрать программное обеспечение для построения эксперимента и анализа данных. И на мой взгляд для этого отлично подходит язык программирования R и среда разработки RStudio.

Язык R и ПО для работы с ним бесплатны, имеют интуитивно понятный интерфейс, но самое главное, что R широко используется различными компаниями и исследователями. R настолько универсален, что вы можете использовать его даже в браузере. Можете воспользоваться этой возможностью, если не хотите устанавливать ПО или не можете им воспользоваться (например, потому что пользуетесь рабочим компьютером). Если все же Вы настроены серьезно и хотите работать на своем компьютере, то вам потребуется загрузить две программы: сам R и RStudio. В первом случае нужно будет выбрать место скачивания, наиболее быстрое или близкое к вам (Россия или Германия). Установите оба пакета программного обеспечения на компьютер и запустите RStudio (она уже сама будет запускать R в фоновом режиме).

Создайте новый R-скрипт через меню File. В открывшемся окне мы будем писать свои простые команды и планировать эксперименты с последующим их анализом.

Я хочу обратить внимание на 2 вещи:

во-первых, пользователи часто ошибаются, потому что команды в R чувствительны к регистру (например, команда c(1, 2, 3, 4) создаст список с 4 записями, но если вы используете заглавную C(1, 2, 3, 4), то ничего не получится);
во-вторых, если вам понадобилась помощь, используйте команду справки help().

Пример, “попкорн-эксперимент” и рабочие области в RStudio показаны на рис. 7.

Рис. 7. "Попкорн-эксперимент" в RStudio. Изображены окна (слева на право и сверху в низ): написания скриптов, отображения переменных в памяти компьютера, консоль для вывода результата скрипта, окно справки по командам.

В дальнейшем, вместо скриншотов, мы будем использовать просто код, который вы можете скопировать и выполнить у себя в RStudio:

A <- c(-1, +1, -1, +1)
B <- c(-1, -1, +1, +1)
y <- c(52, 74, 62, 80)
popped_corn <- lm(y ~ A + B + A*B)
popped_corn

Внимательные ученики могли обратить внимание, что запись эксперимента на картинке и в коде отличается и скоро мы узнаем почему.

Мы начнем с конца (своего рода обратная задача). Переменная popped_corn содержит в себе рассчитанные коэффициенты модели и просто выводит их в консоль (в этом и состоит смысл переменных, они являются ссылками на определенные значения или операции, которые мы присвоили им). Выше мы объявляем саму прогнозную модель под названием popped_corn. Если это ваше первое знакомство с R, вам может стать немного страшно - призываю быть мужественными и верь в свои силы!

Рассмотрим все по очереди. Начнем с обратной стрелки (<-). Это символы меньше (<) и тире (-), которые вместе похожи на стрелку. На языке R так выглядит операция присваивания (т.е. мы передаем переменной какое-либо значение и дальше можем просто писать переменную для использования этого значения). Другими словами, мы создаем переменную с именем popped_corn и присваиваем ей все, что находится справа от стрелки, в данном случае — линейную модель (точнее, результаты расчета линейной модели). lm справа от стрелки означает “линейная модель”, указывая на то, что мы хотим получить линию методом наименьших квадратов. И наконец, символ в середине — тильду (~) — можно интерпретировать как “предсказывается …” или “описывается …”.

Примечание. В R использование <- и = практически эквивалентно, но я рекомендую использовать <- в качестве операции присвоения, чтобы избежать путаницы. Подробнее, можете почитать здесь.

Для запуска кода выделите все команды и нажмите Run или без выделения - кнопку Source (в модификации Source with Echo). Если мы не получили сообщение об ошибке в Console, то Вы увидите результат (тоже в консоли) и существующие переменные справа (Environment). Выходные данные этого небольшого кода показывают коэффициенты для построенной линейной модели.

Мы должны получить центральную точку (intercept) 67; основной эффект для А: 10 единиц; для B: 4 и эффект двухфакторного взаимодействия AB: -1. Обратите внимание, что эти числа точно соответствуют нашим расчетам вручную.

Вот и вся магия программирования. Это действительно самый быстрый и удобный способ получить модель с помощью компьютера.

Примечание. В формуле, описывающей линейную модель есть члены для A, для B и взаимодействия AB. Но, как вы могли заметить, в ней нет члена, отражающего центральную точку (константы). R создает его автоматически. Т.е. при вводе только трех параметров R покажет вам четыре.

На рис. 7 вы можете заметить команду summary(popped_corn), вместо простого вызова popped_corn. Эта команда позволяет получить расширенные данные по расчету параметров: погрешности определения коэффициентов, среднее квадратичное отклонение модели от экспериментов и т.д.. Более подробно с этими параметрами мы познакомимся во 2 и 3 частях нашего курса.

Примечание. В любой программе для расчетов вы должны получить точно такие же параметры для нашего эксперимента. Это хорошая проверка качества программного обеспечения и расчетов.

Задача. Попробуйте найти инструкцию в интернете как считать коэффициенты методом наименьших квадратов в MS Exel. В качестве примера используйте данные “попкорн-эксперимента”.

Продолжим наше знакомство с R. Следующим примером будет расчет трехфакторного эксперимента по очистке воды.

Откройте RStudio и создайте новый файл для примера с очисткой сточных вод. Весьма логичным будет сразу задать нашу модель и затем объявить все необходимые переменные.

water <- lm(y ~ C + T + S + C*T + C*S + S*T + C*T*S)

Помните, что в примере с очисткой воды мы рассматривали три фактора: C (фактор “химиката”), T (фактор температуры) и S (фактор скорости перемешивания). Также у нас есть три двухфакторных взаимодействия (C*T, C*S и S*T) и одно трехфакторное взаимодействие (C*T*S). При этом у нас имеются результаты восьми экспериментов.

Примечание. При проведении эксперимента и анализе результатов следует помнить, что нам всегда потребуется провести как минимум столько же экспериментов, сколько неизвестных в нашей модели (сколько мы оцениваем параметров). Например, в “попкорн-эксперименте” было 4 параметра (2 единичных, 1 взаимодействие и один базовый) и 4 эксперимента. В примере с очисткой воды у нас есть 8 экспериментов, поэтому мы можем оценить 8 параметров (с учетом взаимодействия и базового значения).

Обратите внимание, что мы можем позволить R автоматически задать закодированные значения C, T и S, используя следующий код:

C <- T <- S <- c(-1, +1)

design <- expand.grid(C=C, T=T, S=S)
C <- design$C
T <- design$T
S <- design$S

water <- lm(y ~ C + T + S + C*T + C*S + S*T + C*T*S)

Первая строка задает три переменные сразу. Если мы проверим переменные, то увидим, что их значения -1 и +1. Далее, составим из них таблицу стандартного порядка для эксперимента, и извлечем столбцы значений C, T и S. Можете сравнить полученные значения с табл. 4 при ручном планировании эксперимента.

Теперь вы для каждого эксперимента можете пользоваться описанным подходом.

Последнее - нужно задать вектор результатов эксперимента (берем также из нашей таблицы 4):

C <- T <- S <- c(-1, +1)

design <- expand.grid(C=C, T=T, S=S)
C <- design$C
T <- design$T
S <- design$S
y <- c(5, 30, 6, 33, 4, 3, 5, 4)

water <- lm(y ~ C + T + S + C*T + C*S + S*T + C*T*S)

Запустите этот код, чтобы создать линейную модель. Для вывода рассчитанных коэффициентов в консоль используйте команду summary(water). Обратите внимание, что полученные значения параметров совпали с нашими расчетами вручную: 11.25, 6.25, 0.75 и т.д.

Примечание. Мы можем добавить небольшую хитрость, что бы задать нашу модель (это уменьшает возможность ошибки). Результаты модели будут аналогичны (прошу проверить).

# Используем упрощенную форму задания модели
water <- lm(y ~ C*T*S)

Примечание. При планировании каждого эксперимента всегда сами составляйте новый код и сохраняйте его. Так у вас останется некий “конспект” проделанной вами работы, и он будет особенно полезен, если вы будете использовать комментарии (строки, которые не воспринимаются программой как код, для R - начинаются с #). Это решит частую проблему потерю результатов и описания эксперимента. Например, вы провели работу, а через несколько месяцев вам нужно вернуться к ней и ответить на вопросы начальника или передать этот проект вашему коллеге. Если вы дадите им только файл Excel или набор документов, в которых нет пошагового описания, то будет очень сложно воспроизвести ваши действия и ход ваших мыслей. Я очень часто с этим сталкиваюсь в своей практике и призываю вас не повторять моих и чужих ошибок!

Написание хорошо закомментированного и последовательного кода создает хорошо прослеживаемую и воспроизводимую запись вашей работы. Это очень важный критерий для многих компаний и лабораторий (в некоторых даже существуют специальные требования к прослеживаемости результатов работы, например ISO 9001-2015).

Вот еще один фрагмент кода, который поможет нам в интерпретации результатов эксперимента. Он позволяет визуализировать влияние каждого из эффектов в полученной модели (чем больше абсолютное значение параметра перед кодированным фактором, тем больше его влияние).

# Оценка значимости факторов. Предварительно установите пакет "pid" Tools -> Install Packages -> pid
library(pid)
paretoPlot(water)

Результаты выполнения кода приведены на рис. 8.

Рис. 8. Пример сравнения факторов по диаграмме Парето (Pareto plot) в RStudio.

Гистограмма показывает абсолютное значение каждого из параметров модели (это позволяет оценить масштаб влияния каждого из признаков). Знак коэффициента перед признаком тоже важен, он показывает направления влияния признака. Но для лучшего визуального сравнения правильнее использовать абсолютные значения (знак при этом выделен другим цветом). Такие диаграммы часто используются для определения неинтересных для нас переменных, которые потом можно удалить из модели. Гистограмма показывает параметры, отсортированные от наибольшего до наименьшего абсолютного значения. Это позволяет быстро находить наиболее важные факторы системы. Самые длинные полосы соответствуют факторам, наиболее значительно влияющим на результат.

Примечание. Часто важно использовать наглядное черно-белое сравнение, поскольку не все люди различают цвета. Кроме этого, иногда приходится печатать отчет на черно-белом принтере.

Проведем анализ построенной диаграммы. Сразу можно заметить, что взаимодействие $C \times T \times S$ и взаимодействия $C \times T$ и $T \times S$ малы по сравнению с другими параметрами. Наиболее значимым является фактор S. Цвет полосы указывает на то, что S оказывает на результат отрицательное влияние. Как вы помните, наша цель заключалась в минимизации загрязнения, поэтому мы сразу понимаем, что увеличение S приведет к уменьшению загрязнения, что хорошо. Другим значимым фактором является эффект от химиката, C. Его влияние уже положительно, т.е. если мы выберем положительное кодированное значение этого категориального признака, то получим увеличение загрязнения.

Рассмотрим еще более сложный пример - четырехфакторный эксперимент с 2 измеряемыми параметрами. Это хорошая задачка из учебника Бокса, Хантера и Хантера. В этом эксперименте мы используем солнечные коллекторы и теплоаккумуляторы. Значения результата эксперимента получены из компьютерной симуляции и приведены на сайте.

Примечание. Небольшой совет, относящийся к симуляциям. Обычно проводить симуляцию очень просто и возникает искушение исследовать ее неэффективно. Часто можно встретить людей, которые просто играют с ПО, вводя разные значения, пока не получат нужный ответ. Но к симуляции следует относиться так же серьезно, как и к реальной модели. Всегда используйте систематический подход и проводите факторные эксперименты.

Примечание. Есть два ключевых преимущества использования компьютерных симуляций:

быстрый результат при достаточной вычислительной мощности компьютера (или запуска в параллельном режиме);

можно не рандомизировать порядок экспериментов. И причина этого довольно проста - как правило в симуляциях отсутствуют случайные и систематические ошибки, которые зависят от времени проведения эксперимента. Когда вы повторяете симуляцию при вводе одинаковых начальных значений вы получаете одинаковый ответ. Но будьте осторожны: некоторые компьютерные эксперименты при повторении не дают идентичные результаты и в любом случае - лучше всегда использовать случайный порядок. Затраты на это минимальны, но это защитит вас от ряда проблем.

Итак, вернемся к солнечному водонагревателю. Рассматриваем четыре фактора:

A — количество солнечного света (инсоляция);
B — емкость теплоаккумулятора (объем бака);
C — расход воды через абсорбер;
D — прерывистость солнечного света (облачность).

С точки зрения влияние данных факторов рассматриваются две переменные результата:

$y_1$ — эффективность сбора энергии;
$y_2$ — эффективность передачи энергии.

Вы можете сразу определить, сколько будет проведено тестов, если у каждого фактора есть два уровня: низкий и высокий, то $2^4 = 16$.

Итак, было проведено 16 тестов, время составить код для расчета модели:

# Solar panel case study, from BHH2, p 230
# ----------------------------------------
A <- B <- C <- D <- c(-1, +1)
design <- expand.grid(A=A, B=B, C=C, D=D)
A <- design$A
B <- design$B
C <- design$C
D <- design$D

# y1 - collection efficiently
y1 <- c(43.5, 51.3, 35.0, 38.4, 44.9, 52.4, 39.7, 41.3, 41.3, 50.2, 37.5, 39.2, 43.0, 51.9, 39.9, 41.6)

# y2 - energy delivery efficiency
y2 <- c(82, 83.7, 61.7, 100, 82.1, 84.1, 67.7, 100, 82, 86.3, 66, 100, 82.2, 89.8, 68.6, 100)

model.y1 <- lm(y1 ~ A*B*C*D)
summary(model.y1)
paretoPlot(model.y1)

model.y2 <- lm(y2 ~ A*B*C*D)
summary(model.y2)
paretoPlot(model.y2)

Примечание. Причина, по которой запись $A \times B \times C \times D$ работает, заключается в принципе иерархии модели для R. Давайте рассмотрим простой пример: если вы написали только $A \times B$, то R автоматически включит в модель фактор A и фактор B. В конце концов, не может быть двухфакторного взаимодействия $A \times B$, если нет факторов A и B.

После исполнения кода нужно изучить полученные результаты. Для этого построим две отдельные линейные модели и диаграммы Парето (рис. 9): для эффективности сбора энергии y1 и для эффективности передачи энергии y2.

Рис. 9. Пример сравнения значимости факторов для рассчитанных моделей по диаграммам Парето.

Как вы помните, серые полосы обозначают отрицательное влияние факторв на отклик, а черные полосы — положительное влияние. Согласно полученной модели для эффективности сбора энергии ($y_1$) наибольшее влияние у факторов B и A, взаимодействия $A \times B$ и фактора C. Другие взаимодействия оказывают на результат более слабое влияние.

Мы можем наблюдать уменьшение отклика при увеличении фактора B. То есть, когда объем бака увеличивается, эффективность сбора снижается. Это самая важная переменная в системе.
Далее, фактор А (количество солнечного света), положительно влияет на эффективность сбора.
Как вы думаете, какого рода будет эффективное взаимодействие $A \times B$? Правильный ответ — высокий уровень для фактора A и низкий — для фактора B. Мы видим это из уравнения и диаграммы Парето. В этом случае выбор низкого уровня фактора B повышает результат и одновременно заставляет двухфакторное взаимодействие работать в нашу пользу.
фактор D слабо влияет на результат. Это полезный вывод, поскольку он показывает относительную нечувствительность к изменению облачности. Если бы в будущем нам предстояло провести дополнительные эксперименты, мы могли перестать учитывать фактор D. Аналогично, стремясь повысить эффективность сбора солнечной энергии y1, мы можем быть уверены, что облачность не будет играть значительную роль, по крайней мере, исходя из результатов анализа данной модели.

Таким образом, A, B и взаимодействие $A \times B$ — три наиболее влиятельных параметре модели. Попробуйте объяснить влияние других факторов для этой модели самостоятельно.

Теперь посмотрим на вторую переменную результата — эффективность передачи энергии $y_2$. Если изучить соответствующую диаграмму Парето, мы увидим следующее.

Огромное влияние фактора A.
Большое влияние двухфакторного взаимодействия $A \times B$.
Влияние факторов C и D не велико.

Объяснение - за вами.

Примечание. Вы могли заметить, что многие высокоуровневые взаимодействия (трех-, четырех- факторные и более) малы или равны нулю. Так бывает довольно часто и далее мы увидим как это можно использовать.

Примечание. На разобранном примере хотелось бы отметить важный момент. В случае модели $y_2$ влияние фактора B мало и вы можете прийти к выводу, что фактор B не важен. Но это не совсем верно. Мы не можем исключить из модели этот фактор, потому что взаимодействие $A \times B$ очень важно. Это означает, что влияние фактора A зависит от уровня фактора B и наоборот. Поэтому мы не можем игнорировать сам по себе мало значимый фактор B.

При рассмотрении подобного примера мы подходим к ключевому вопросу планирования экспериментов: можем ли мы одновременно оптимизировать оба результата $y_1$ и $y_2$? Каково было бы лучшее сочетание уровней факторов, дающее этот максимум?

2.8 Сокращение затрат на эксперименты

Прежде чем ответить на вопрос об оптимизации модели, нужно понимать как оптимизировать фактор затрат на сами эксперименты.

Как можно заметить, в зависимости от количества факторов количество экспериментов (а значит время и стоимость) увеличиваются в степенной зависимости. Давайте попробуем избавиться от этого ограничения.

До сих пор мы рассматривали так называемые полнофакторноые эксперименты, когда для построения модели проводилось изучения влияния каждого фактора. Другими словами, мы исследовали каждое изменение каждого фактора. Но как можно сократить количество экспериментов?

Это возможно с использование кратного 2 сокращения числа экспериментов - например, использование half-factor (полуфакторного) эксперимента. Это подразумевает сокращение количество проводимых экспериментов вдвое!

Естественно, у всего есть цена, и подобные действия приведут к сокращению информации. Но для выбора этого пути есть 2 значимые причины:

Стоимость каждого эксперимента может быть высока.
Нет уверенности в результатах эксперимента, которые мы получим (какие факторы окажутся значимыми, будут ли полученные данные оптимальными и т.д.).

Согласно мнению известного ученого George Box для первых экспериментов и работ должно быть выделено около 25 % общего бюджета и не более. Остальное понадобиться нам в процессе последующего исследования. Таким образом необходимо понимать, что наши первоначальные предположения не абсолютны и вполне могут оказаться ошибочными. А значит нужна страховка и возможность дополнительного проведения новых экспериментов.

Давайте изучим, к чему приведет сокращение проводимых опытов вдвое (half-factor) и как это сделать.

Существует специальная схема выбора значимых опытов (тестов) из нашего идеального полнофакторного эксперимента: выбор по открытому или закрытому контуру. Рассмотрим знакомый нам пример по очистке воды с точки зрения выбора половины тестов (рис. 10).

Рис. 10. Выбор значимых комбинаций для проведения half-factor эксперимента по одному из контуров (можно выбрать симметричный).

Примечание. Значения признаков изменены на A, B, C для большего удобства.

Обратите внимание, что такой выбор экспериментов подразумевает полное изменение факторов А и В, а фактор С выбирается как результат перемножения первых кодированных факторов (с сохранением знака, как на рис. 10).

Такой подход к проведению эксперимента позволяет нам выиграть джекпот, если один из факторов окажется не важным для модели. Тогда одно из направлений куба исчезнет и мы вдвое сократим необходимое количество экспериментов, а с проведенными ранее у нас получиться полнофакторный эксперимент… Профит!

Но это только одна сторона медали. Давайте посмотрим, какая модель у нас получится, если мы проводим полуфакторный эксперимент:

# Half-factor experiment
# ----------------------------------------
# full-factors for A and B
A <- c(+1, -1, -1, +1)
B <- c(-1, +1, -1, +1)
# C = AB
C <- c(-1, -1, +1, +1)

# y - purify efficiently
y1 <- c(30, 6, 4, 4)

water <- lm(y1 ~ A*B*C)
summary(water)

При выполнении можно обратить внимание, что все взаимодействия признаков обозначены как NA (not applicable) - это предсказуемый результат. Модели не хватает данных. Но и нам не понадобятся данные факторы. Сравним полученное уравнение с исходным:

$$ \hat{y} = 11.25 + 6.25x_A + 0.75 x_B - 7.25 x_C + 0.25 x_A x_B - 6.75 x_A x_C - 0.25 x_B x_C - 0.25 x_A x_B a_C $$

$$ \hat{y} = 11.0 + 6.0 x_A - 6.0 x_B - 7.0 x_C $$

Обратите внимание, что 3 из 4 коэффициентов весьма близки по значению, хотя коэффициент В предсказан неверно и у нас нет информации по взаимодействиям факторов.

Разберем подробнее, что же происходит при half-factorial эксперименте.

Мы уже описали логику выбора необходимых сочетаний факторов. Однако обобщенное представление о выборе коэффициентов для проведения half-factor или еще более сокращенных экспериментов мы можем получить из специальной таблицы (trade-of-table, рис. 11).

Рис. 11. Trade-of-table для выбора необходимых факторов при проведении half-factor эксперимента.

Или используя следующий вызов в R:

library(pid)
help(tradeOffTable)

Далее мы еще вернемся к изучению этой таблицы, а пока будем подсматривать в нее, чтобы выбирать как кодировать наши факторы.

Следующий интересный вопрос - что же представляют собой новые коэффициенты и почему они отличаются от полнофакторного эксперимента? Это ключевой момент для понимания. На самом деле - коэффициенты в half-factor эксперимента являются комбинацией элементов из полнофакторного эксперимента! Рассмотрим это на примере очистки воды.

При полнофакторном эксперименте мы имеем следующую систему уравнений:

Теперь проведем математические рассуждения и оставим только выбранные эксперименты:

Еще раз повторю - это не строгое математическое доказательство, данные рассуждения нужны нам, чтобы показать логику.

Из последнего вектора с коэффициентами мы не можем убрать ни один, поскольку каждый из них соответствует изменению фактора, т.е. длине матрицы X, которая остается неизменной. Отмечу, что такая матричная запись умножения не имеет смысла (необходимо, чтобы размерность матрицы $X$ соответствовала размерностям векторов $y$ и $b$). Однако она поможет нам с логикой рассуждений, ведь для приведения к корректному виду матричного умножения (и самой системы линейных уравнений) необходимо сократить размерность матрицы $Х$. Для этого обратим внимание, то столбцы этой матрицы на самом деле дублируются. Иными словами, части коэффициентов соответствует одинаковая кодировка оставшихся факторов. За этим скрывается одинаковое влияние исследуемых факторов, которое мы не сможем отличить друг от друга в нашем эксперименте (с математической точки зрения они будут идентичны).

Таким образом, если мы запишем реальную матричную систему для half-fraction эксперимента, то полученные коэффициенты на самом деле будут линейной комбинацией (aliasing, confounding) коэффициентов полнофакторного эксперимента:

$$ \begin{pmatrix} y_2 \\ y_3 \\ y_5 \\ y_8 \\ \end{pmatrix} = \begin{pmatrix} +1 & +1 & -1 & -1 \\ +1 & -1 & +1 & -1 \\ +1 & -1 & -1 & +1 \\ +1 & +1 & +1 & +1 \\ \end{pmatrix} \begin{pmatrix} b_0 = b_0 + b_{ABC} \\ b_A = b_A + b_{BC} \\ b_B = b_B + b_{AC}\\ b_C = b_C + b_{AB}\\ \end{pmatrix} $$

Иными словами, в наших новых коэффициентах помимо влияния “чистых” факторов A, B, C содержится влияние взаимодействия этих факторов. Этим и объясняется то, что программа выводит нам только 4 коэффициента и они отличаются от исходных коэффициентов полнофакторного эксперимента.

Примечание. Вернитесь к сравнению уравнений полнофакторного эксперимента и half-factor эксперимента и убедитесь, что новые коэффициенты на самом деле линейные комбинации истинных.

Таким образом мы сократили количество факторов, исключив из рассмотрения взаимодействия, но учли его в наших новых коэффициентах!

После того, как мы познакомились с full-factor и half-factor экспериментами, можно предложить 2 возможные цели эксперимента (и пути его планирования):

сканирование (screening) - когда мы допускаем сокращения информации о системе (например, не учитываем взаимодействия или получаем некоторые некорректные оценки параметров) и проводим сокращенные факторные эксперименты. Это делается с целью получения общих представлений о взаимодействиях в системе.
оптимизация (optimization) - проводит поиск оптимального значения отклика. При такой схеме не допускаются сокращения экспериментов и требуется проведение полнофакторного эксперимента (обычно базируется на сканирующем эксперименте).

Учитывая вышесказанное, перед оптимизацией всегда нужно проводить планирование и оценивать эффект от каждого фактора и их взаимодействия (сканирующие эксперименты). Вот несколько полезных предварительных умозаключений на примере очистки воды (полнофакторный эксперимент потребует 16 повторений, каждое из которые весьма затратно по средствам, при этом исследуются 3 фактора: A - температура, B - скорость перемешивания и C - химикат).

Важно правильно кодировать свои факторы при проведении half-factor эксперимента. Это позволит получать максимально приближенные к реальности коэффициенты. Например при приведенном кодировании можно сделать вывод, что $\hat{b_C} = b_C + b_{AB} \approx b_C$ поскольку можно предположить отсутствие взаимодействия между перемешиванием и температурой воды. Таким образом мы получаем четкое представление о влиянии выбора химиката на очистку воды.
Стоит использовать несколько кодировок и посмотреть на предполагаемые результаты half-factor экспериментов (выбрать наиболее интересные).
Всегда стоит сначала проводить half-factor эксперименты, оценить результаты, и только потом “допровести” полнофакторный эксперимент (если все устроит и понадобится дополнительная информация).

2.9 Построение карты эксперимента

На данном этапе мы рассмотрели все основные подходы к планированию эксперимента и научились оптимизировать трудозатраты. Теперь можно приступить к достижению основной цели данного курса - научиться оптимизировать эксперимент и построить полную карту планирования эксперимента. Но для этого необходимо разобрать еще несколько понятий.

2.9.1 Мешающие факторы (disturbances)

Я думаю все мы подсознательно понимаем значения данного термина. До сих пор мы рассматривали идеализированное представление об эксперименте и предполагали, что на результат влияют только учтенные факторы или их взаимодействие. Однако помимо этого существуют различные мешающие факторы - некоторые погрешности.

Можно классифицировать мешающие переменные по нескольким критериям:

известные или неизвестные нам;
которые мы можем контролировать и не можем контролировать;
которые мы можем измерить или не можем измерить.

Задача. Придумайте примеры для каждого из перечисленных случаев.

Во многих случаях мы не можем контролировать или измерить мешающее влияние. В таком случае нужно использовать методы статистической обработки данных (о них мы подробно поговорим в 3 главе). На данном этапе важно понимать, что для минимизации влияния мешающих факторов необходимо следовать 2 правилам.

Всегда проводите свои эксперименты в случайном порядке (обратите внимание, как мы составляем таблицы экспериментов). Это позволить обеспечить случайное влияние неучтенных факторов, а значит с ними можно будет работать как со случайными величинами и они не сместят наши измерения (хотя и добавят им разброса или другими словами - дисперсии).
Всегда записывайте дополнительные факторы, которые можете измерить.

Важным понятием является мешающее влияние, которое можно измерить, но нельзя контролировать - ковариации (covariates). Эти ковариации вполне могут влиять либо на измеряемый параметр, либо на один из учитываемых факторов. С такими мешающими факторами можно работать 2 путями:

Провести визуальный анализ влияния ковариаций на потенциальные выбросы в измеряемых величинах.
Добавить ковариации в модель в качестве фактора.

Другим типом мешающих факторов являются помехи (noise) - не измеримые и не контролируемые, но вносящие вклад в измерения.

О том, как обрабатывать помехи и случайные погрешности мы поговорим в главе № 3 (основы статистики). На данном этапе мы рассмотрим только ковариации и общие пути учета возможных погрешностей в экспериментах.

2.9.2 Блокировка мешающего фактора при расчете модели

В предыдущем разделе мы разобрали основные мешающие факторы и описали их поведение. Теперь нужно разобраться как работать с мешающими факторами при построении модели.

В качестве примера рассмотрим разработку мобильного приложения. У нас есть приложение, которое нужно разместить на рынке. Для этого, нужно провести эксперимент и понять, в каком случае оно будет иметь наибольший спрос. Руководством выделены следующие ресурсы:

тестовые группы из 2000 человек;
процент использующих приложение после 60 дней (наша измеряемая переменная $y$).

Факторы, которые мы планируем исследовать, приведены в табл. 5.

Таблица 5. Исследуемые факторы при выводе приложения на рынок.

	Low level (-)	Hight level (+)
A "Promotion"	1 free-in-app upgrade	30 days trial of all features
B "Message"	"CallApp" has your schedule available at your fingertips, on any device	"CallApp" features are configurable; only pay for the features you want
C "Price"	in-app purchase price is 89 $	in-app purchase price is 99 $

Но если провести мозговой штурм поставленной задачи, то можно выделить возможные мешающие факторы:

E: возраст пользователя
N: пол пользователя
S: тип интернет соединения пользователя (мобильный или wifi)
R: количество свободной оперативной памяти
F: доставляется ли рекламные сообщения рекламной сетью G или H
D: тип телефона (Android/Apple)

Как вы думаете, какие из приведенных факторов являются помехами (не измеримые и не контролируемые), какие ковариациями (измеримые, но не контролируемые), а какие - ни то ни другое?

При построении точно модели действует общее правило - фиксировать все, что возможно, и изменять только выбранные факторы. Но как тогда быть с факторами, которые мы можем контролировать, но у нас нет средств для проведения всех экспериментов или они кажутся нам не значимыми (nuisance factor)?

В случае случайных фактором (ковариаций или шума) мы должны использовать алгоритмы статистики (глава 3) и рандомизировать проведение эксперимента. Но если в нашей системе есть систематически мешающий фактор, который мы можем измерить и контролировать, то мы можем построить модель с минимальным влиянием данного фактора.

Например, в нашем случае одним из таких факторов предположительно является тип ОС - мы можем его измерить и контролировать. Здесь все зависит от того, имеет ли значение данный фактор для экспериментатора. Например, если мы хотим использовать приложение только на конкретной ОС - то фактор точно не имеет значения и стоит его просто зафиксировать. Но если мы хотим распространять приложение вне зависимости от ОС, то фиксировать данный фактор мы не можем - нужно обеспечить рандомизацию экспериментов и оценить влияние данного фактора на модель. Такая процедура называется “блокировкой” (blocking).

Примечание. Чтобы понять, нужно ли блокировать фактор, достаточно ответить себе на вопрос: “должна ли моя система или процесс успешно работать с разными значениями мешающего фактора в будущем”? Если да - нужно планировать эксперимент с блокировкой данного фактора. Ели нет - то у нас хорошая степень контроля над системой и мы можем избежать мешающей переменной.

Если необходимо изучить фактор и провести его блокировку, то основное правило для планирования эксперимента - рассматривать блокируемую переменную как дополнительный фактор. Допусти у нас имеется 3 фактора A, B, C и мы проводим полнофакторный эксперимент (8 экспериментов). Теперь добавим к нему мешающую переменную также с 2 возможными значениями (-1 и +1) - тогда мы получим half-factor эксперимент.

Вернемся к нашему примеру и проведем эксперимент по блокировки мешающей переменной - типом ОС. В результате мы получили, что Android пользователи дольше используют приложение, а Apple - меньше и наши результаты можно свести в табл. 6. Обратите внимание на выбор кодировки для блокируемой переменной.

Таблица 6. Блокировка мешающего фактора при выводе приложения на рынок.

	A "Promotion"	B "Message"	C "Price"	D = ABC "OS"	Outcome
1	-	-	-	- (Android)	y_1* = y_1 + g
2	+	-	-	+ (iOS)	y_2' = y_2 - h
3	-	+	-	+	y_3* = y_3 - h
4	+	+	-	-	y_4' = y_4 + g
5	-	-	+	+	y_5* = y_5 - h
6	+	-	+	-	y_6' = y_6 + g
7	-	+	+	-	y_7' = y_7 + g
8	+	+	+	+	y_8* = y_8 - h

А теперь немного математической магии! Исследуем проведенный эксперимент и убедимся, что у нас получилось заблокировать мешающую переменную при проведении half-factor эксперимента. Рассчитаем эффект от фактора А как среднюю абсолютную разность:

$$ A = \frac{1}{2} [\frac{(y_8^* - y_7') + (y_4' - y_3^*) + (y_6' - y_5^*) + (y_2^* - y_1')}{4}] $$

Заметим, что если раскрыть скобки в числителе, то эффекты от мешающего фактора (ОС) сократятся - а значит, мы учли в модели “чистое” влияние фактора А.

Это же будет работать и для других параметров и их взаимных влияний за исключением совокупного влияния ABC:

$$ ABC = \frac{1}{8} [-y_1 + y_2 + y_3 - y_4 + y_5 - y_6 - y_7 + y_8 -4g + 4h] $$

Мы только что разобрали наилучшую стратегию действия при блокировке мешающей переменной. В данном случае - это лучший из вариантов. Часто трехфакторное взаимодействие выражено слабо и мы можем им пожертвовать, чтобы свести влияние мешающей переменной на систему к минимуму.

2.9.3 Разбор линейных комбинация признаков и планирование сканирующих экспериментов

Казалось бы блокирование - частный случай планирования эксперимента, который нужно просто запомнить. Но это не так. Мы уже сталкивались с изучением проведения half-factor экспериментов и линейной комбинацией признаков и я надеюсь теперь вы убедились, что это очень полезный навык при изучении системы! Он позволяет нам экономить время и ресурсы при исследованиях. Для такого планирования существует системный подход и сейчас мы постараемся разобрать его.

Для этого нужно понимать как работают линейные комбинации признаков (в иностранной литературе это явление называется “псевдонимы”, aliasing). Лучше всего делать это на реальном примере.

Допустим, вы управляете автоклавом для выращивания бактерий. Такие системы часто используются для различных отраслей промышленности, в том числе и при создании современных минеральных удобрений с биологическим эффектом для почвы. Подобная система работает продолжительное время и дорога в обслуживании. Если вы обслуживаете данную систему, то для исследования 5 факторов может потребоваться до года (всего 32 эксперимента)! Допустим, наш бюджет может покрыть три месяца работы с установкой, а это 9 экспериментов. Для полнофакторного эксперимента это всего ли 3 фактора. Однако вовсе не обязательно сокращать количество факторов при таком количестве экспериментов. Мы можем провести исследование гораздо большего их количества (до 7)!

Это так называемое планирование сканирующего эксперимента (screening design). При этом мы не планируем построить точную модель или оптимизировать систему. Нам нужно лишь оценить значимость каждого из факторов для системы и понять как она работает. Какие факторы стоит исследовать для дальнейшей оптимизации.

Сократить количество экспериментов нам поможет стратегия частичного факторного эксперимента (part-factor experiment). В нашем случае для не более 9 экспериментов и 5 факторов - четвертичного факторного эксперимента (quarter-factor). Мы рассмотрим 5 факторов для 8 экспериментов (табл. 7).

Примечание. Если есть возможность, то можно провести 9 эксперимент для более точного анализа. Его рекомендуется проводить первым (своего рода базовая линия). Все численные факторы нужно принять в 0 положении (между -1 и +1), в случае категориальных - выбрать одно значение для всех (-1 или +1). Этот первый (пробный) эксперимент - отличный способ найти все подводные камни при проведении практической работы (ведь сложно сразу реализовать качественный эксперимент на практике). Если эксперимент будет неудачен - его можно выбросить, но если он получиться - он улучшит модель.

Таблица 7. Проведение quarter-factor эксперимента с дополнительным пробным экспериментом (9-ым).

Experiments	A "temperatire"	B "dissolved oxigen"	C "substrate type"	D = AB "agitation rate"	E = AC "pH"
1	-	-	-	+	+
2	+	-	-	-	-
3	-	+	-	-	+
4	+	+	-	+	-
5	-	-	+	+	-
6	+	-	+	-	+
7	-	+	+	-	-
8	+	+	+	+	+
9	+	0	0	0	+

После проведения практических работ и получения результатов, останется разобраться со значениями полученных коэффициентов: какие линейные комбинации реальных параметров полнофакторной модели в них зашифрованы (aliasing). Однако, если для half-fraction эксперимента данные коэффициенты можно было легко разобрать, то здесь понадобится определенный системный подход (чтобы понять, что же скрыто в коэффициентах).

Итак, исходя из trade-off-table (рис. 11), мы можем представить значения факторов D и E в соответствии со значениями других факторов для quarter-factor эксперимента (8 экспериментов для 5 признаков). Например для признака D:

$$ D = AB $$

Тогда мы можем работать с этим представлением как с матричной формой (перемножаются соответствующие вектора):

$$ \begin{pmatrix} + \\ - \\ - \\ + \\ + \\ - \\ - \\ + \\ \end{pmatrix} = \begin{pmatrix} - \\ + \\ - \\ + \\ - \\ + \\ - \\ + \\ \end{pmatrix} \begin{pmatrix} - \\ - \\ + \\ + \\ - \\ - \\ + \\ + \\ \end{pmatrix} $$

Умножим обе части уравнения на вектор D:

$$ DD = ABD $$

При этом

$$ DD = \begin{pmatrix} + \\ - \\ - \\ + \\ + \\ - \\ - \\ + \\ \end{pmatrix} \begin{pmatrix} + \\ - \\ - \\ + \\ + \\ - \\ - \\ + \\ \end{pmatrix} = \begin{pmatrix} + \\ + \\ + \\ + \\ + \\ + \\ + \\ + \\ \end{pmatrix} = I (identity) $$

Тогда:

$$ I = ABD $$

Аналогично мы можем получить формулу и для признака E: $E = AC => I = ACE$.

На основании полученных результатов и формируется наш систематический подход для анализа линейных комбинаций.

Прочитать генераторы для дополнительных факторов из таблицы: $D = AB$, $E = AC$.
Преобразовать генераторы к вектору идентичного вида: $I = ABD$ $I = ACE$.
Приравнять все полученные значения: $I = \dots$ для всех генераторов. В нашем примере мы получим: $I = ABD = ACE = (ABD)(ACE) = BCDE$.
Убедиться, что в уравнении $2^p$ сочетаний (где $p$ - степень изменчивости признака). В нашем случае это $2^2 = 4$ - верно ($I$ тоже считается).

Докажем уравнение в п. 3: $I = II = (ABD)(ACE) = AABCDE = (AA)BCDE = IBCDE = BCDE$

Задание. Повторите описанный вывод и план эксперимента для 6 факторов и бюджете для 15-20 экспериментов.

Настало время рассмотреть, как данные вычисления помогут нам понять линейные комбинации и “псевдонимы” на практике.

Допустим, мы построили модель для quarter-factor эксперимента и хотим узнать, какие взаимодействия содержатся в коэффициенте перед фактором B в полученной модели. Для этого нужно провести ряд нехитрых вычислений:

взять рассчитанное выражение для генераторов
умножить каждую из частей равенства на фактор B
упростить выражение, используя перестановки и правило идентичности ($AA = I, BB=I, \dots$)

$$ I = ABD = ACE = BCDE \\ IB = ABDB = ACEB = BCDEB \\ B = A(BB)D = ABCE = (BB)CDE \\ B = AID = ABCE = ICDE \\ B = AD = ABCE = CDE $$

Проведем анализ полученного выражения. Согласно полученным данным, фактор B будет связан (confounded, aliasing) со взаимодействиями между 2, 3 и 4 соответствующими факторами. Однако, учитывая малый вклад взаимодействий 3 порядка и выше можно упростить систему до:

$$ B = AD $$

Задание. Рассчитайте самостоятельно с какими факторами будут связаны новые факторы C, D и А?

Проведя аналогичные расчеты для прочих факторов нашего эксперимента, можно получить следующую таблицу линейных комбинаций для нашего quarter-factorial эксперимента с 5 факторами:

$$ A = BD = CE\\ B = AD \\ C = AE \\ D = AB \\ E = AC $$

Наиболее неявным будет результат для фактора А, поскольку он связан с 2 взаимодействиями сразу. Обычно за данный фактор принимают наименее важный параметр системы (от которого ожидают наименьшего влияния или который легко зафиксировать в будущем). Дополнительно, если фактор А оказывает слабое влияние на какой-либо из факторов, их взаимодействие будет мало и позволит нам явно оценивать какой-либо другой фактор.

Отсюда вытекает важное понятие - разрешение эксперимента (resolution of the design). Это наиболее точный уровень взаимосвязи факторов для данного плана эксперимента. В нашем случае разрешение равно 3 (т.е. признаки всегда связаны с двухфакторным взаимодействием).

Закономерный вопрос - можно ли получить лучшее разрешение для нашего эксперимента (т.е. получить линейную комбинацию не с двухфакторным взаимодействием, а с использованием взаимодействия в 3 и более факторов, чтобы можно было пренебречь данным влиянием)? И ответ - естественно! Но чтобы узнать сколько факторов и экспериментов должно быть в таких экспериментах, нужно воспользоваться римской цифрой в trade-of-table (рис. 11). Именно в данной таблице приведено обозначение разрешения и пути увеличения чувствительности эксперимента.

Для закрепления материала рассмотрим задачу по проведению эксперимента с 6 факторами в количестве от 15 до 20 экспериментов. Вот план действий:

Взять из таблицы значение генераторов для факторов при k=6 и 16 экспериментах (quarter-factoial эксперимент).
Преобразовать генераторы к виду $I = ABCE$ и $I = BCDF$.
Выписать уравнение для идентичности, исходя из правила $2^p = 2^2 = 4$ члена: $I = ABCE = BCDF = A(BB)(CC)DEF = ADEF$
Рассчитать взаимосвязи для каждого фактора quarter-factoial эксперимента:

$$ A = BCE = ABCDF = DEF \\ CD = ABDE = BF = ACEF \\ \dots $$

Обратите внимание, что для данного эксперимента наиболее точная линейная комбинация с 3ех факторным взаимодействием, и это отличный план эксперимента! Мы сможем получить точное определение влияния фактора A на систему.

Простой способ запомнить связь разрешения с факторным взаимодействием:

Если у вас разрешение 3, то 1 фактор VS 2ух факторное взаимодействие.
Если разрешение 4, то 1 фактор VS 3ех факторное взаимодействие и 2ух факторное VS 2ух факторное.
Разрешение 5 - 1 фактор VS 4х факторное взаимодействие, 3ех факторное взаимодействие VS 2ух факторное взаимодействие, 2ух факторное VS 3ех факторное.

Примечание. Небольшие практические советы. Как вы могли заметить, разрешение будет связано с точность информации о влиянии факторов на систему.

Разрешение 3: отлично подходит для проведения сканирования (screening). Например, при разработке нового продукта, выявления неполадок в процессе (при изменении цеха/производственной линии и т.п.).

Разрешение 4: используется для изучения и понимания системы.

Разрешение 5 и выше: используются для оптимизации процессов, изучения сложных эффектов, разработке высокоточных моделей. Весьма дороги!

Таким образом, при планировании начального эксперимента стоит придерживаться следующего алгоритма действия:

Определить количество исследуемых факторов и количество экспериментов (исходя из бюджета).
Взять вид генераторов из таблицы.
Выписать все уравнения для идентичности.
Убедиться, что уравнение идентичности содержит $2^p$ членов.
Рассчитать вид линейных комбинаций (aliasing pattern).
Являются ли выявленные взаимосвязи проблемой для системы? * Если да: переназначить названия факторов или выбрать другую схему эксперимента (начать планирование заново). * Если нет: можно начинать эксперимент.

Для начала исследования системы всегда используйте наибольшее число факторов при меньшем разрешении. Сканируйте систему и только потом отсеивайте факторы! Всегда используйте численное подтверждение незначимости фактора, а не просто догадки!

Пример. Рассмотрим сканирующий эксперимент для 7 факторов при 8 экспериментах (trade-of-table в помощь). Составим стандартную таблицу (табл. 8).

Таблица 8. Проведение сканирующего четверть-факторного эксперимента с дополнительным пробным экспериментом (9-ым).

Experiments	A	B	C	D=AB	E=AC	F=BC	G=ABC	y
1	-	-	-	+	+	+	-	320
2	+	-	-	-	-	+	+	276
3	-	+	-	-	+	-	+	306
4	+	+	-	+	-	-	-	290
5	-	-	+	+	-	-	+	272
6	+	-	+	-	+	-	-	274
7	-	+	+	-	-	+	-	290
8	+	+	+	+	+	+	+	255

Пройдем наш алгоритм:

Определить количество исследуемых факторов и количество экспериментов (исходя из бюджета) - сделано.

Взять вид генераторов из таблицы - сделано.

Выписать все уравнения для идентичности:

$$ I = ABD \\ I = ACE \\ I = BCF \\ I = ABCG $$

$$ I = ABD = ACE = BCF = ABCG = \\ BDCE = ACDF = CDG = ABEF = BEG = AFG = \\ DEF = ADEG = CEFG = BDFG = \\ ABCDEFG $$

Убедиться, что уравнение идентичности содержит $2^p = 2^4 = 16$ членов - сделано.

Рассчитать вид взаимосвязей (aliasing pattern). Разрешение нашего эксперимента = 3.

$$ A = BD = CE = FG \\ B = AD = CF = EG \\ C = AE = BF = DG \\ D = AB = CG = EF \\ E = AC = BG = DF \\ F = BC = AG = DE \\ G = CD = BE = AF $$

Является ли взаимосвязь приемлемой?

Для этого используем код RStudio:

A <- B <- C <- c(-1, +1)
design <- expand.grid(A=A, B=B, C=C)

# The 3 factors that form the base of our design
A <- design$A
B <- design$B
C <- design$C

# These 4 factors are generated, using the trade-off table relationships
D <- A*B
E <- A*C
F <- B*C
G <- A*B*C

# These are the 8 experimental outcomes, corresponding to the 8 entries
# in each of the vectors above
y <- c(320, 276, 306, 290, 272, 274, 290, 255)

# And finally, the linear model
mod_ff <- lm(y ~ A*B*C*D*E*F*G)

# It is better to uncomment and use this line instead:
# library(pid)   <-- best to use this!
# But this embedded R script does not have the "pid" library.
# So we will load the required function from an external server instead:
source('https://yint.org/paretoPlot.R')
paretoPlot(mod_ff)

# Now rebuild the linear model with only the 4 important terms
mod_res4 <- lm(y ~ A*C*E*G)
paretoPlot(mod_res4)

Результат построения модели приведен на рис. 12.

Рис. 12. Результат проведенного эксперимента.

Как можно заметить, факторы C, A, G - значимы (отрицательный знак), чуть менее значим фактор E (положительный знак). Факторы D, F, B - незначимы и их можно удалить (при условии, что вы достаточно сильно варьировали их, чтобы оказать влияние на результат). При этом, мы понимаем, что каждый фактор на самом деле дополнительно включает в себя линейные комбинации.

Таким образом мы можем удалить из рассмотрения 3 фактора B, D, F, поскольку их влияние весьма мало (даже с учетом дополнительных взаимодействий). Мы можем перестроить модель без учета этих факторов и не проводя дополнительных экспериментов (рис. 13).

Рис. 13. Результат проведенного эксперимента после удаления незначимых факторов.

Как мы можем убедиться, мы получили те же коэффициенты, что и до этого (из-за независимости столбцов матрицы факторов). Таким образом, мы можем удалить эти 3 фактора из рассмотрения. При этом мы сохранили 4 важных фактора которые предположительно влияют на модель и оценили двухфакторные взаимодействия, которые тоже оказывают влияние.

Примечание. Для тех, кто заинтересовался подобным планированием могу порекомендовать ознакомиться с дополнительными способами оптимизации экспериментов:

Plackett-Burman design (для проведения экспериментов, количество которых кратно 4).

“Definitive Screening Design” (тип оптимизационных критериев, например D-optimal designs). Могут быть очень гибкими.

2.9.4 Метод оптимизации поверхности отклика (response surface methods, RSM)

Мы достаточно подробно рассмотрели как можно блокировать мешающие и отсеивать не значимые признаки через правильное планирование и проведение сканирующих экспериментов. Время заглянуть за горизонт и понять, куда нужно двигаться после планирования и проведения факторного эксперимента. Именно за это отвечает метод поверхности отклика.

Но для начало нужно четко представлять зачем мы проводим свой эксперимент. В общем случае на это есть 5 причин:

Получение дополнительной информации и изучение системы - разобрали.
Выявления проблем - разобрали.
Построение предсказания (модели) - разобрали.
Оптимизация процесса - ?.
Наблюдение за системой чтобы убедиться, что сохраняется прирост производительности - догадались.

До этого, мы рассматривали первые 3 пункта и немного затронули 4-ый (как вы думаете, когда?). Для этого мы исследовали систему, чтобы выявить значимые факторы и исключить не значимые (проводили скрининг). Это способствовало лучшему пониманию системы. Цитируя George Box:

“Discovering the unexpected is more important than confirming the unknown” (обнаружить неожиданное важнее, чем подтвердить неизвестное).

Можно сказать, что мы сможем решить примерно следующую задачу босса: “как работает данная система”? Вы устраиваете мозговой штурм и определяете 5-6 факторов, которые связаны с данной задачей (проблемой). Используя факторное планирование эксперимента вы можете быстро определить значимые и не значимые факторы и в принципе построить модель, которая предсказывает результат.

И в настоящей главе мы пойдем дальше и научимся решать следующую задачу босса: “теперь понято, как работает система, а как мы можем ее оптимизировать”? Для этого, после изучения системы нам понадобится расширить диапазон изменения факторов.

Для простоты рассмотрим немного измененный и ставший классическим эксперимент с попкорном. Рассмотрим 2 фактора: А - время готовки и В - тип масла. Откликом будет количество не сгоревших, но лопнувших зерен (далее вы увидите почему важно правильно выбирать отклик). Наша задача - максимизировать отклик. Результаты полнофакторного эксперимента приведены на рис. 14.

Рис. 14. Результат полнофакторного эксперимента.

Как можно заметить, в нашем случае влияние масла практически не значимо по сравнению с влиянием времени. Таким образом мы можем свернуть наш квадрат до отрезка и модель будет чрезвычайно простой (фактор В и взаимодействие ВА приняты не значимыми):

$$ y = 90 + 15 x_A $$

Примечание. Отмечу, что все в мире относительно и масло конечно же влияет на наш отклик, но по сравнению со временем - влияет крайне не значимо.

Задача. Проведите данный расчет в RStudio самостоятельно с учетом обоих факторов и убедитесь в правильности предложенного упрощения.

Модель говорит нам, что при увеличении времени на 1 (т.е. от -1 до 0 и от 0 до +1, мы ведь кодируем время), количество не сожженных зерен увеличится на 15. И основная идея анонсированного метода оптимизационной поверхности как раз заключается в том, что эта модель говорит нам куда двигаться дальше. В нашем случае в сторону увеличения времени (рис. 15).

Рис. 15. Полученная модель для однофакторного "попкорн-эксперимента".

Примечание. Данный метод оптимизации используется только после исключения всех незначимых факторов! Это важно. Никогда не включайте в оптимизацию незначимые факторы.

Примечание. Построенная модель (эмпирическая модель) никогда не скажет нам что произойдет за пределами граничных значений (за пределами рассматриваемого диапазона факторов)! Нет никаких математических и логических оснований для этого. Чтобы получить прогноз, нам нужно использовать метод оптимизационной поверхности и только после проведения сканирующего эксперимента.

Для проведения дальнейшего исследования нам понадобиться учесть следующие задачи:

Разобраться как кодировать/декодировать физические единицы
Определиться с линейными и нелинейными моделями
Разобраться в степени доверия к моделями
Ввести понятие шума и ошибки для эксперимента
Понять как двигаться в сторону оптимума
Обосновать выбор каждого дополнительного теста

Итак, мы часто говорили о кодировании и использовали кодовые значения переменных (-1, 0 и +1). Время ввести формальные формулы для расчета.

При кодировании:

$$ \text{coded value} = \frac{\text{real value} - \text{center value}}{\frac{1}{2} range} \\ \text{center value} = \frac{\text{low value} + \text{high value}}{2} \\ \text{range} = \text{high value} - \text{low value} $$

При декодировании:

$$ \text{real value} = (coded value) \cdot \frac{1}{2} \text{range} + \text{center value} $$

Примечание. Советую вывести данные формулы самим с использованием кубических диаграмм. Все довольно наглядно и один раз попробовав, всегда сможете вывести заново при необходимости.

Следующей задачей стоит разбор линейных и нелинейных моделей. Существует множество факторов выбора вида модели и критериев их выбора для каждого конкретного случая. Однако правило одно и оно было прекрасно сформулировано by George Box:

all models are wrong, but some are useful… the practical question is, how wrong do they have to be, before they are not useful? (перевод за вами)

Таким образом неважно, какую модель мы выбираем, важно - с каким диапазоном и с какими допущениями (ошибками) мы работаем. Любая гладкая функция может быть представлена в линейном виде в достаточно коротком диапазоне.

Но тут мы сталкиваемся с критерием оценки “полезности” модели - ошибкой (погрешностью). Причиной данного явления является шум (noise). Это те факторы, которые мы не контролируем и не можем измерить в данном конкретном случае. Простым подтверждением является проведение нескольких экспериментов при одинаковых условиях - мы получим разные значения отклика. Более подробно о погрешностях и методах их учета (статистике) мы поговорим в отдельной главе данного курса. А необходимый минимум мы уже рассмотрели ранее. Сейчас вернемся к основному вопросу: когда модель перестает быть нам полезной? Предлагаю ответ - когда она становиться не точной, другими словами когда ее предсказания начинают сильно отклоняться от эксперимента и это отклонение превышает допустимую погрешность.

На приведенном примере с попкорном, мы первоначально предположили линейную модель для кодированных значений -1 и +1 и определили направления оптимизации. Время провести следующий эксперимент. Двигаемся в сторону максимизации отклика и проведем новый эксперимент для закодированного значения фактора +2 (рис. 16).

Рис. 16. Следующий эксперимент за пределами области определения модели. Оценка полезности.

Предсказанное нашей моделью значение составит 120 зерен (предполагаемое значение), а в результате эксперимента мы получили 113 зерен… Полезна ли наша модель? Чтобы ответить на данный вопрос рассчитаем полученную погрешность:

$$ error = \frac{120-113}{113} \cdot 100 \% = 6.2 \% $$

Таким образом, если мы допускаем погрешность в 6.2 %, то полезна. Но это довольно большая погрешность, сравним ее с изначальной принятой нами погрешностью (когда исключили фактор масла):

$$ error_{ref} = \frac{\frac{76-74}{75} + \frac{106-104}{105}}{2} \cdot 100 \% = 2.3 \% $$

Примечание. В первом случае мы рассчитали погрешность от экспериментального значения, поскольку считаем его более правильным. Во втором случае у нас нет наиболее верного значения, поэтому рассчитываем погрешность от среднего.

При сравнении с принятой погрешностью в 2.3 %, полученная погрешность в 6.2 % нас не устраивает. Время изменить модель.

Раз наша линейная модель перестала быть полезной - время разработать новую. Пойдем по одному из 2 возможных путей.

Провести в точке расхождения новый полнофакторный эксперимент;
Перейти к более сложной, нелинейной модели.

В нашем случае попробуем использовать более простой метод - модифицируем модель. Полный код с построением графиков приведен ниже

# Model for the popcorn system, ignoring factor B (oil type)
xA <- c(-1, -1,  +1,  +1)
y0 <- c(74, 76, 104, 106)
model.0 <- lm(y0 ~ xA)
summary(model.0)


# Plotting code: copy/paste and reuse this code as required
require("ggplot2")
raw_data <- data.frame(xA = xA, y = y0)
plot_data <- data.frame(xA = seq(-2, +5, 0.1))
plot_data$y <- predict(model.0, newdata=plot_data)
p <- ggplot(data=raw_data, aes(x=xA, y=y))  +
  geom_point(size=10) +
  xlab("Coded value for x_A") +
  scale_x_continuous(breaks=seq(-2,5,1)) +
  ylab("Outcome variable (number of unburned popcorn)") +
  scale_y_continuous(breaks=seq(60,170,10)) +
  theme_bw() +
  theme(axis.text=element_text(size=26), legend.position = "none") +
  theme(axis.title=element_text(face="bold", size=26))

p <- p + geom_line(data=plot_data, color="blue", size=1)
p
#ggsave("popcorn-linear-only.pdf", width=19.2, height=10.8, units="in")

# Now build the next model, model 1: y = 91.8 + 14.9 xA - 2xA^2
xA <- c(-1, -1,  +1, +1,  0,  +2)
y1 <- c(74, 76, 104, 106, 91, 113)
model.1 <- lm(y1 ~ xA + I(xA^2) )
summary(model.1)

predict(model.1, data.frame(xA=+1))

# Add these new model to the plot as a red line
plot_data <- data.frame(xA = seq(-1.5, +5, 0.1))
plot_data$y <- predict(model.1, newdata=plot_data)
p <- p + geom_point(aes(x=c(0), y=c(91)), shape=15, size=6)
p <- p + geom_point(aes(x=c(+2), y=c(113)), shape=17, size=6)
p <- p + geom_line(data=plot_data, color="red", size=1)
p
#ggsave("popcorn-linear-with-quadratic.pdf", units="in")

# Add the 7th and 8th point, and rebuild the model
xA <- c(-1, -1,  +1, +1,  0,   +2, +3.7, +5)
y2 <- c(74, 76, 104, 106, 91, 113,  116, 109)
model.2 <- lm(y2 ~ xA + I(xA^2))
summary(model.2)

plot_data <- data.frame(xA = seq(-1.5, +5, 0.1))
plot_data$y <- predict(model.2, newdata=plot_data)
p <- p + geom_point(aes(x=c(3.7), y=c(116)), shape=9, size=6)
p <- p + geom_point(aes(x=c(5.0), y=c(108)), shape=18, size=6)
p <- p + geom_line(data=plot_data, color="darkgreen", size=1)
p

Я специально привел довольно сложный код в котором рассмотрено несколько моделей и способ построения графика. Предлагаю Вам немножко потренироваться и разобраться что к чему (используйте RStudio или помощь в лекции №5В курса по планированию эксперимента).

В общем случае, при изменении модели на нелинейную мы добавили квадратичный член и получили новое представление общей модели (рис. 17).

Рис. 17. Усложнение модели.

Теперь погрешность нас устраивает и мы можем перейти к проведению следующего эксперимента. Для этого посчитаем, где должен находиться максимум (около 3.6 кодированных единиц, на реальные единица посчитайте сами).

При проведении нового эксперимента в предполагаемой точке максимума результат будет вполне удовлетворительный: 116 зерен против 118 по модели. Можно взять это значение за максимум.

Для подтверждения нашего предположения стоит провести дополнительный эксперимент около 5 кодированных единиц. При ожидаемом значении в 116, мы получили 109. Расхождение увеличилось, но тренд соответствует ожиданиям - максимум мы определили верно. Если хотите подстраховаться - можно перестроить модель по всем имеющимся данных (в коде это представлено) и посмотреть, как изменится положение максимума.

Таким образом мы рассмотрели простой пример оптимизации модели через последовательно проводимы эксперименты. Важно понимать, что перед проведением каждого последующего эксперимента мы должны понимать допустимую погрешность, выбрать шаг, рассчитать предполагаемое значение для выбранного шага и затем сравнить его с экспериментально полученным результатом. Затем - повторить цикл рассуждений.

2.9.5 Метод оптимизации поверхности отклика. Усложнение модели

Теперь, когда мы познакомились с основными понятиями и способами метода оптимизации поверхности отклика, можно двигаться в сторону усложнения и более реальных кейсов.

До сих пор, для метода оптимизационной поверхности мы использовали только один фактор. Такой подход называется COST (change one single thing) or OFAT (one factor at a time). Он прост, но абсолютно не дает представления о реальной картине.

Он дает ложное представление об оптимуме, поскольку не учитывает другие факторы и их взаимодействия.
Чем выше размерность эксперимента (количество факторов), тем больше шансов не приблизиться к реальному оптимуму.

Пример метода оптимизационной поверхности для случая с 2 факторами приведен на рис. 18.

Рис. 18. Оптимизационная поверхность и контурные линии.

В данном случае рассматривается прибыль в зависимости от цены на товар и высоты полки. Обратите внимание, что даже последовательное варьирование 2 факторов дало нам ложное представление об оптимуме для прибыли. Само же значение прибыли обозначено контурными линиями (линии при которые прибыль остается неизменной).

Проблема заключается в том, что установить контурную поверхность для отклика крайне затратно.

Для дальнейшего изучения мы будем использовать следующий случай. Нам нужно оптимизировать производство промышленной продукции. Наши факторы:

количество продукции в час (T, throughput);
цена единицы продукции (P, price).

Откликом будет прибыль ($profit = \text{all income} - \text{all expenses}$).

Допустим у нас есть некая точка отсчета (то, как работает цех сейчас) и мы проводим полнофакторный эксперимент вокруг нее (рис. 19).

Рис. 19. Первоначальный полнофакторный эксперимент.

Примечание. В рамках этой главы мы обсуждаем с вами множество параметров планирования эксперимента. Но довольно мало времени уделяем выбору диапазона для изменения фактора. Обычно эта задача является специфично для того или иного типа факторов. Но все же есть несколько общих рекомендаций для выбора диапазона изменений признаков.

Вы должны иметь возможность экспериментально определять разницу между высоким и низким уровнем фактора: * слишком узкий диапазон - вы будете измерять шум; * слишком широкий - высока вероятность нелинейности.

Не используйте значения близкие к экстремальным (исходное полотно на рис. 19, где цена ограничена здравым смыслом и рынком, а производительность - характеристиками системы).

Если совсем нет идей - берите 25% от экстремального размаха (абсолютный максимум - абсолютный минимум фактора). В нашем случае - это 10 единиц продукта в час (если считать от 300 до 350).

После проведения факторного эксперимента нам понадобятся изолинии, которыми мы пользовались для кубических диаграмм (исходный код):

library(pid)
manufacture(P=1.05, T=325)  # simulates a price of $1.05,
                            # and a throughput of 325 parts per hour
help(manufacture)           # Gives you more details

rm(list = ls())   # clear the workspace of all prior variables

P <- c(  0,  -1,  +1,  -1,  +1)
T <- c(  0,  -1,  -1,  +1,  +1)
y <- c(407, 193, 468, 310, 571)
mod.base.1 <- lm(y ~ P*T)
summary(mod.base.1)

# You will need the PID package to run this code.
# Run the following command once, then you can comment this out again
install.packages("pid")

# Load the PID package in R.
library(pid)
contourPlot(mod.base.1, "P", "T")

# predict the points, using the model:
predict(mod.base.1, data.frame(P=P, T=T))

# Second factorial: points 4, 5, 6, 7 and 8 (baseline)
# ----------------

P <- c(  0,  -1,  +1,  -1,  +1)
T <- c(  0,  -1,  -1,  +1,  +1)
y <- c(657, 571, 669, 620, 710)
mod.base.2 <- lm(y ~ P*T)
summary(mod.base.2)
contourPlot(mod.base.2, "P", "T")

# Predict directly from least squares model, for experiment 9
predict(mod.base.2, data.frame(T=0.75, P=1.5))

# Step further, out to point number 10
P_coded = (1.63 - 1.18)/(0.5*0.36)
T_coded = (339 - 334)/(0.5*8)
predict(mod.base.2, data.frame(P=P_coded, T=T_coded))

# Third factorial: around baseline of point 10; cp(1.63, 339) and range(0.36, 6)
# Add runs 11, 12, 13, and 14 around the baseline [video 5F uses this code]
P <- c(  0,  -1,  +1,  -1,  +1)
T <- c(  0,  -1,  -1,  +1,  +1)
y <- c(732, 715, 713, 733, 725)
mod.base.3 <- lm(y ~ P*T)
summary(mod.base.3)
contourPlot(mod.base.3, "P", "T", main="Regular design")

# Use only point 9 (and not run point 11): points 9, 10, 12, 13, and 14
# This could also have been considered a "botched design".
P <- c(  0,   -1,  +1,  -1,  +1)
T <- c(  0, -2/3,  -1,  +1,  +1)
y <- c(732,  717, 713, 733, 725)
mod.base.4 <- lm(y ~ P*T)
summary(mod.base.4)
contourPlot(mod.base.4, "P", "T",
            main="Botched design (with run 9, instead of 11)")

# You may absolutely include point 9, into the rest of the factorial
# to gain an extra degree of freedom.
P <- c(  0,  -1,  +1,  -1,  +1,  -1)
T <- c(  0,  -1,  -1,  +1,  +1,-2/3)
y <- c(732, 715, 713, 733, 725, 717)
mod.base.4.extra <- lm(y ~ P*T)
summary(mod.base.4.extra)
contourPlot(mod.base.4.extra, "P", "T",
            main="With an extra degree of freedom")

# Back to model 3: points 10, 11, 12, 13, 14
P <- c(  0,  -1,  +1,  -1,  +1)
T <- c(  0,  -1,  -1,  +1,  +1)
y <- c(732, 715, 713, 733, 725)
model.3 <- lm(y ~ P*T)
contourPlot(model.3,"P", "T", main="Factorial 3: using points 10 to 14")

# Let's use model.3: y = 723.6  - 2.5 x_P + 7.5 x_T  -1.5 x_T x_P
# and predict operation at point 15
predict(model.3, data.frame(P=-2/3, T=+2))

# Demonstrate curvature effects due to omitting the interaction term
P <- c(  0,  -1,  +1,  -1,  +1)
T <- c(  0,  -1,  -1,  +1,  +1)
y <- c(732, 715, 713, 733, 725)
model.5 <- lm(y ~ P + T)   # notice the model is different, but the
                           # coefficients are the same.
contourPlot(model.3, "P", "T", main="Contour plot WITH interaction term")
contourPlot(model.5, "P", "T", main="Contour plot with NO interaction term")

# This fictitious data forms a saddle (saddles do occur in practice!)
# Which side do you climb up? Top left, or bottom right? [answer: both!]
P <- c(  0,  -1,  +1,  -1,  +1)
T <- c(  0,  -1,  -1,  +1,  +1)
y.fake <- c(722, 715, 725, 740, 721)
model.6 <- lm(y.fake ~ P*T)
contourPlot(model.6, "P", "T", main="System with much stronger interaction")

# Create the central composite design quadratic model
# Start with the factorial points: 11, 12, 13, 14
P <- c(-1,   +1,  -1, +1)
T <- c(-1,   -1,  +1, +1)
y <- c(715, 713, 733, 725)

# Now append the 4 center points: 10, 16, 17, 22
P <- c(P,   0,   0,   0,   0)
T <- c(T,   0,   0,   0,   0)
y <- c(y, 732, 733, 737, 735)

# Then add the star (axial) points: 18, 19, 20, 21
P.exact <- c(P,     0, -1.41,     0, +1.41)
T.exact <- c(T, +1.41,     0, -1.41,     0)

# Now, the true location of the axial points isn't quite at +/- 1.41
# Let's be a little more precise (using the idea of "botched designs")
P.star.low  <- (1.38 - 1.63)/(0.5*0.36)
P.star.high <- (1.88 - 1.63)/(0.5*0.36)
T.star.low  <- (335 - 339)/(0.5*6)
T.star.high <- (343 - 339)/(0.5*6)
P <- c(P,           0, P.star.low,          0, P.star.high)
T <- c(T, T.star.high,          0, T.star.low,           0)
y <- c(y,         738,        717,        721,         710)

# Go fit the model with quadratic terms
model.7 <- lm(y ~ P*T + I(P^2) + I(T^2))
summary(model.7)
contourPlot(model.7,  "P", "T")

# Predict value of point 15 (actual value was $735)
predict(model.7, data.frame(P=-2/3, T=2))

# Predict the value of optimum
predict(model.7, data.frame(P=-0.22, T=+1.46))

Рекомендую разбить данный код на блоки и исполнить его (можете воспользоваться онлайн версией R).

Как уже говорилось, мы ввели дополнительную возможность - отрисовку контурных линий:

library(pid)
contourPlot(mod.base.1, "P", "T")

Полученные график с контурными линиями поможет нам выбрать направления для скорейшей оптимизации - перпендикулярно контурным линиям. Вот пример того, как выглядят реальные линии в нашем случае и построенные нами (рис. 20, редкий пример того, когда мы можем сравнить истинные и предполагаемые контурные линии - в реальной практике такого не встретишь).

Рис. 20. Метод построения поверхности отклика для максимизации прибыли производства. Сравнение контурных линий.

Итак, направление действительно выбрано верно. Всегда важно проверять экспериментальные значения на соответствие построенной модели. В крайнем случае, важно проверить хотя бы центральную точку. В идеале каждый из экспериментов следует повторить несколько раз, чтобы иметь представление об уровне шумов и повторяемости (но подробнее об этом в 3 главе).

Задание. Посчитайте относительные и абсолютные отклонения между построенной модели и экспериментальными данными.

После выбора направления нужно определиться с шагом для обоих факторов. Согласно нашей модели мы имеем уравнение:

$$ y = b_0 + b_P x_P + b_T x_T + b_{PT} x_P x_T \\ y = 390 + 134 x_P + 55 x_T + (-3.5) x_P x_T $$

Это значит, что при увеличении фактора P на 1 закодированную величину, профит увеличится на 134 единицы. В случае второго фактор - на 55 единиц. Тогда при одинаковом количестве шагов для факторов:

$$ \frac{b_T}{\Delta x_T} = \frac{b_P}{\Delta x_P} \\ \frac{\Delta x_P}{\Delta x_T} = \frac{b_P}{b_T} $$

Таким образом в общем случае, для нахождения оптимума необходимо:

Выбрать шаг для одного кодированного фактора ($\Delta x_T = 1$).
Найти соответствующее изменение для другого фактора ($\Delta x_P = \frac{b_P}{b_T} \cdot \Delta x_T = \frac{134}{55} \cdot 1 = 2.44$).
Преобразовать закодированные значения в реальные:

$$ \Delta P = \Delta x_P \cdot \frac{1}{2}(0.50) = 0.61 \$ \\ \Delta T = \Delta x_T \cdot \frac{1}{2}(10) = 5 \frac{parts}{hour} $$

Сделать шаги и установить место проведения следующего эксперимента:

$$ P^{(5)} = P^{(0)} + \Delta P = 0.75 + 0.61 = 1.36 \\ T^{(5)} = T^{(0)} + \Delta T = 325 +5 = 330 $$

Посчитать предполагаемое значение согласно модели:

$$ \hat{y} = 390 + 134x_P + 55x_T - 3.5 x_P x_T \\ \hat{y}^{(5)} = 390 + 134 \cdot 2.44 + 55 \cdot 1.0 - 3.5 \cdot 2.44 \cdot 1.0 = 765 $$

Однако при проведении эксперимента получилось значение в 669 долларов/час. Это сильное расхождение по обоим факторам (посчитайте, какое). Поэтому нужно спланировать новый факторный эксперимент в этой области, чтобы скорректировать направление. Есть несколько способов сделать это, основываясь на том где будет находиться полученная точка (эксперимент № 5).

Но наиболее экономичным является выбор, представленный на рис. 21.

Рис. 21. Метод построения поверхности отклика для максимизации прибыли производства. Следующий факторный эксперимент

Предлагаю вам самим подумать почему и продолжить логику рассуждения… Вы можете найти модель для данного эксперимента в интернете и реализовать любые свои задумки.

Итак, повторив рассуждения мы пришли к 9 эксперименту и выяснили, что расхождение с моделью составило: $\Delta = 732 - 717 = 15$ \$ и это вполне приемлемый результат (строго говоря для этого нам нужно иметь представление о допустимой погрешности, но пока можем действовать интуитивно).

Таким образом, мы можем продолжить путь в выбранном направлении. Выберем шаг для 10 эксперимента, используя нашу последовательность действий.

Выбрать шаг для одного кодированного фактора ($\Delta x_P = 2.5$).
Найти соответствующее изменение для другого фактора ($\Delta x_T = \frac{b_T}{b_P} \cdot \Delta x_P = \frac{22.5}{47} \cdot 2.5 = 1.2$).
Преобразовать закодированные значения в реальные:

$$ \Delta P = \Delta x_P \cdot \frac{1}{2}(0.50) = 0.45 \$ \\ \Delta T = \Delta x_T \cdot \frac{1}{2}(10) \approx 5 \frac{parts}{hour} $$

Сделать шаги и установить место проведения следующего эксперимента:

$$ P^{(10)} = 1.63 \\ T^{(10)} = 339 $$

Посчитать предполагаемое значение согласно модели:

$$ \hat{y} = 645 + 47x_P + 22.5 x_T - 2 x_P x_T \\ \hat{y}^{(5)} \approx 785 $$

Сравним с экспериментом (732). Это уже значимо, время перестроить модель.

Выберем 10 эксперимент в качестве новой базовой точки (0, 0). Диапазон для T возьмем немного меньше чем в предыдущем случае, поскольку:

мы приближаемся к оптимуму и важно не перейти через него;
предыдущие эксперименты говорят от уменьшении размаха, что также говорит о приближении к оптимуму.

Для фактора P оставим диапазон прежним, он не так велик, если сравнивать с общим размахом.

Отмечу, что выбор точного диапазона не так важен на практике, пока от позволяет приближаться к оптимуму. Это связано со статистической природой результатов эксперимента и тем, что в конце-концов, оптимум у нас один.

В результате новых экспериментов получим следующую картину (рис. 22).

Рис. 22. Метод построения поверхности отклика для максимизации прибыли производства. Следующий факторный эксперимент.

Не забывайте - все эксперименты в рамках факторного эксперимента проводятся в случайном порядке!

Если вы построите кубическую диаграмму с контурными линиями в RStudio, то заметите, что характер контурных линий изменился. Это явный признак изменения во влиянии признаков на отклик - сильно проявляется взаимодействие.

При этом вместо 11 эксперимента, мы могли бы использовать значение 9-ого, но с поправкой на кодировку (в данном случае не -1, а -2/3). Это называется планирование Боше (Botched design).

Задача. Используйте в коде расчет для полнофакторного эксперимента с 9 экспериментов вместо 11. Проверьте, получили ли вы ту же модель (не забудьте исправить значение кодировок)? Как Вы думаете, почему?

Кроме того, сама система координат часто имеет ограничения из-за которых приходится проводить несимметричные факторные эксперименты (поскольку оптимум часто находится на границе ограничений, рис. 23).

Рис. 23. Пример ограничений в системе, обеспечивающих ее несимметричность.

Но вернемся к нашему эксперименту. Взаимодействие факторов меняет форму контурных линий, но направление нам известно. Давайте сделаем следующий шаг из предположения, что изолинии линейны (эксперимент № 15, рис. 24).

Рис. 24. Метод построения поверхности отклика для максимизации прибыли производства. Следующий факторный эксперимент в предположении, что контурные линии линейны.

После проведения наших расчетов и получения экспериментальных данных разница составит: $\Delta = 742 - 735$. Это больше нашего порога в 7 \$. Предположение игнорировать нелинейность контурных линий провалилось. Нам нужна другая стратегия.

Отметим, что приближаясь к оптимуму контурные линии вероятно будут изменяться и могут иметь разный вид в зависимости от силы взаимодействия (рис. 25).

Рис. 25. Тип контурных линий в зависимости от взаимодействия факторов.

Другим критерием приближения к оптимуму является уменьшение спреда отклика ($ \approx \text{размах}$) между кодированными переменными в факторных экспериментах, даже если шаг выбирается адекватным (рис. 26).

Рис. 26. Зависимость спреда от приближения к оптимуму.

Примечание. Строго говоря, в случае сперда важно понимание статистики и уровня шумов в нашей системе. Мы должны быть уверены, что разница в спреде обусловлена не шумом.

Для установления уровня шумов в системе необходимо несколько раз повторить один и тот же эксперимент. Допустим мы повторили 10 эксперимент 3 раза и получили значения в 732, 733, 737, что даст нам спред в 5 $. Что меньше, чем 20 $. Это говорит о том, что мы все еще видим сигнал, а не шум.

Третьим параметром приближения к оптимуму является величина расхождение модели с экспериментом. Если изменения значимы - мы все-еще можем улучшать модель и двигаться к оптимуму.

Четвертым фактором, указывающим на близость к оптимуму является проявление невозможности аппроксимации линейной моделью “lack of fit”. Оптимум подразумевает точку перегиба.

Например, сравним различия для наших 3 факторных экспериментов.

Модель: $y = 390 + 134 x_P + 55 x_T - 3.5 x_P x_T$. Разница в базовой точке составила $\Delta = 407 - 390 = 17$. В сравнении с коэффициентами модели довольно не много (что говорит о маленькой степени “lack of fit”).
Модель: $y = 645 + 47 x_P + 22.5 x_T - 2.0 x_P x_T$. Разница в базовой точке составила $\Delta = 657 - 645 = 12$. Меньше, но уже ближе к коэффициентам модели (что говорит об усилении “lack of fit”).
Модель: $y = 724 - 2.5 x_P + 7.5 x_T - 1.5 x_P x_T$. Разница в базовой точке составила $\Delta = 734 - 724 = 10$. Уже сравнимо с коэффициентами модели, при этом уровень шума в 5 \$ говорит о том, что это все еще сигнал, хоть и весьма зашумленный (сильный эффект “lack of fit”).

Рис. 27. Демонстрация эффекта "lack of fit". На последнем полнофакторном эксперименте показаны 3 дополнительных эксперимента для определения уровня шумов.

В случае нашего эксперимента все говорит о том, что пора сделать модель нелинейной (добавить квадратный член). Для этого есть 2 варианта:

Добавить тест на стороне куба (face centered design, FCD) - применяется, когда мы не можем покинуть область куба.
Добавить тест за рамками куб (the “original” central composite design, CCD) - предпочтительней со статистической точки зрения.

Мы же с вами ограничимся общими правилами:

Провести последний полнофакторный эксперимент.
Провести дополнительный тест на расстоянии $\alpha = (2^k)^{0.25}$, где k - количество факторов.
Провести несколько измерений базовой точки (максимально варьируя условия, включая время начала анализа).

С точки зрения 2 факторов в нашем случае получится 5 дополнительных экспериментов “вокруг” полнофакторного, что позволит нам построить точную нелинейную модель (рис. 28).

Рис. 28. Построение нелинейной модели.

Теперь построим модель на основании полученных данных (время кода!) и рассчитаем отклонение. Предлагаю проделать это самостоятельно.

В результате 12 тестов: (4 факторных + 4 базовых точек + 4 дополнительных точек).

Модель: $y = 734.23 - 2.5 x_P + 6.97 x_T - 10.6 x_P^2 - 2.5 x_T^2 - 1.5 x_P x_T$
Мы получили хорошее предсказание в центре, которое говорит о малом эффекте “lack of fit”: $\Delta = 734.25 - 734 = 0.25$.
Мы получили хорошие предсказания для прочих точек.

Теперь представим полученные результаты в виде контурных линий и убедимся, что мы действительно рядом с оптимумом.

Рис. 29. Построение нелинейной модели. Контурные линии оптимума (рассчитанные и реальные).

Эксперимент № 18 находится практически в оптимуме и на этом можно закончить оптимизацию. Но если бы мы не попали в оптимум - надо было провести дополнительные эксперименты по построению нелинейной модели в предполагаемом центре оптимума.

Примечание. Оптимум может меняться со временем (это зависит от исследуемой системы). Поэтому есть специальные системы, которые отслеживают такие передвижения. Если вам интересно - почитайте про “Evolutionary Operation (EVOP)”.

Мы подошли к концу основной части данной статьи. Надеюсь мы узнали как планировать и проводить эксперименты с целью изучения и оптимизации системы. В следующих частях нас ждет более детальное знакомство со статистикой и линейной регрессией - основными инструментами анализа данных и построения моделей.

2.10 Заключение

В рамках настоящей главы мы познакомились с экспериментами, способами их планирования, проведения, построения моделей, анализа результатов и проведения оптимизации.

Подведем небольшое формальное заключение пройденного материала.

Существуют следующие задачи эксперимента:

Сканирование и изучение системы (измерительный процесс). Оценка значимых факторов изучаемого объекта, а также проверка некоторых гипотез, касающихся этих характеристик (например, влияет ли добавка некоторого компонента на прочность бетона и т.п.).
Задача регрессионного анализа. Установление функции отклика, т.е. статистически достоверной зависимости, связывающей отклик с факторами (построение математической модели изучаемого объекта). Это процесс разработки методики для анализа.
Корреляционный анализ. Определение степени взаимной статистической связи двух величин. Например, это оценка линейности градуировочного графика и т.д..
Экстремальный (оптимизационный) эксперимент. Нахождение оптимальных условий протекания процесса, т.е. определение значений факторов, при которых отклик является максимальным (или минимальным).

Основные стадии эксперимента на примере оптимизации системы (включает в себя большее количество стадий).

Постановка задачи (определение цели и задач эксперимента, оценка допустимых затрат времени и средств, установление типа задачи). 
Мозговой штурм задачи: оценка измеряемых и мешающих факторов, выбор переменной отклика системы (изучение литературы, опрос специалистов и т.п.).
Выбор способа решения и стратегии его реализации (типа факторного эксперимента). Корректирование сроков и бюджета.
Проведение сканирующего эксперимента при стандартных условиях эксплуатации системы. Обеспечение блокировки мешающих факторов. Оценка значимых и не значимых для модели факторов. Критическая оценка методики проведения экспериментов и полученной модели.
Реализация выбранного способа решения задачи (факторы, граничные условия, отклик и тип оптимизации, объем выборки, кратности повторения опытов и т. д.).
Проведение оптимизации методом оптимизационной поверхности. Анализ и интерпретация результатов, их представление для менеджеров и руководства (получение оценок интересующих экспериментатора величин и определение степени достоверности этих оценок, выражение результатов в конкретных и необходимых терминах).

Требования к фактору.

Управляемость - возможность придавать фактору любой уровень в области его определения и поддерживать этот уровень постоянным в течение всего эксперимента.
Однозначность - фактор не должен быть функцией других факторов (т.е. должен быть линейно независим).
Должен быть закодирован для правильной интерпретации полученной линейной модели. Выбранные для эксперимента количественные или качественные состояния фактора называются уровнями фактора (-1 и +1 в наших случаях). От числа уровней зависят объем эксперимента и эффективность оптимизации.

Зависимость числа экспериментов от числа факторов и количества их уровней имеет вид $N = p^k$, где $N$ – число опытов; $p$ – число уровней факторов; $k$ – число факторов.

Пространство, в котором строится поверхность отклика, называется факторным пространством. Оно задается координатными осями, по которым откладываются значения факторов и параметров оптимизации.

Истинным значением физической величины называется значение, которое идеальным образом отражало бы свойство объекта. Определить экспериментально его невозможно вследствие неизбежных погрешностей измерения.

Действительным значением физической величины называется значение, найденное экспериментальным путем и максимально близкое к истинному значению.

Измерением называется процесс нахождения значения физической величины опытным путем с помощью специальных технических средств.

Принцип измерений – совокупность физических явлений, на которых основано конкретное измерение.

Средство измерений – это техническое средство, предназначенное для измерений. Как правило с утвержденными метрологическими характеристиками (т.е. с данными, позволяющими оценить погрешность измерения).

Метод измерений – совокупность принципов использования определенного средства измерения.

Методика - конкретная последовательность действий (совокупность приемов) для измерения с использованием конкретного метода.

Погрешностью называется отклонение результата от истинного значения измеряемой величины. Т.к. истинное значение измеряемой величины неизвестно, то опираются на статистику. (при количественной оценке погрешности пользуются действительным значением физической величины).

2.11 Вопросы по разделу

Ваша компания изучает влияние рекламны сообщений для своего мобильного приложения (например, рассылка SMS, отображение рекламных сообщений в приложении). Вы должны возглавить это исследование. Выберите все категориальные переменные.
- Использование 120 или 140 знаков в сообщении.
- Отображение рекламы утром или вечером.
- Использовать синий фон с белым текстом или черный фон с желтым текстом.
- Отображение рекламы только людям в городской области или людям в загородной области.
В клиническом исследовании больных раком для выявления необходимой концентрации лекарства для химиотерапии исследователи варьируют:
- тип лекарства: А или В;
- недельная доза лекарства: 5 единиц/кг или 10 единиц/кг;
- частота применения: один раз в неделю или 3 раза в неделю.
Выберите все верные ответы.
- Тип лекарства - категориальный признак.
- Исследователи могли бы измерять количество пациентов, испытывающих побочные эффекты (например, тошноту). Это было бы дополнительным фактором.
- Недельная доза лекарства - количественная переменная.
- Если бы исследователи варьировали дозу дополнительной терапии, это также было бы фактором.
- Недельная доза - категориальный фактор.
Бегун на короткие дистанции тренируется на трассе 200 м. Тренировки проходят регулярно: иногда утром, иногда вечером. Спортсменка решает варьировать разный тип обуви: с шипами и без. При беге она также варьирует положения рук: высокое или низкое. Выберите правильные варианты ответов:
- Спортсменка должна провести 6 (2+2+2) эксперимента для полнофакторного исследования.
- В ее исследовании используется 3 фактора.
- Ботинки с шипами могут быть отрицательным значением фактора, а без шипов - положительным.
- Измеряемым откликом системы будет тип обуви для бега.
При проведении полнофакторного эксперимента с 2 факторами и 2 уровнями варьирования была построена модель: $\hat{y}=7+3x_A−4x_B+2x_Ax_B$. Факторами являются:
- А - поставщик сырья (низкий уровень - BASF, высокий уровень - DOW);
- B - температура плавления (низкий уровень $320^o C$, высокий: $340^o C$).
Откликом системы является шероховатость поверхности произведенного пластика, который хотят минимизировать. Какова будет предсказанная моделью шероховатость для сырья от BASF при $330^o$?
Укажите сколько значащих цифр при следующей записи чисел: 3700, 0.0708, 2.540, 4.0, 0.80, 290.
Записать:
- результат сложения 2.3 и 1.26;
- результат сложения 507 и 1.2 в научной форме;
- результат умножения 2.65 на 1.9;
- результат возведения в степень $35.3^2$.
Если экспериментально требуется определить сколько процентов вещества содержит раствор: 13 или 12 %, с какой точностью (в значащих цифрах) надо взвешивать?
Приведите результат вычислений с учетом значащих цифр. Для какого варианта Вы бы наименее доверяли точности результата (с учетом того, что последняя значащая цифра любого числа в формуле содержит его абсолютную величину)?
- $\frac{\frac{90.7 + 100.5}{62.42} + 5.04}{10.0}\\$
- $\frac{9.7 + 100.5}{100.42} \cdot 5.4\\$
- $(115 + 0.059) \cdot 0.05$

3. Сравнительные эксперименты. Статистическая практика

Мы рассмотрели наиболее важную часть настоящего курса - планирование эксперимента и анализ его результатов. Следующие два раздела будут посвящены более узкоспециализированным темам, которые являются областью статистики (раздел математики). Приведенные далее рассуждения и примеры будут нужны для понимания природы данных и степени достоверности полученных результатов. Без понимания основ статистического анализа невозможно работать в аналитической лаборатории и анализировать любые численные результаты. Эта и следующая части настоящей работы относятся скорее к области аналитики (с отсылками к аналитической химии) и в большей мере применимы для сравнения полученных результатов и оценки точности построенных моделей.

В настоящей главе “Сравнительные эксперименты. Статистическая практика” мы рассмотрим что же такое статистика, полученные нами результаты и как мы действительно можем сравнить их друг с другом.

Если говорить кратко, статистика - это наука о работе с данными (как числовыми, так и категориальными). Она обладает обширным математическим аппаратом и позволяет реально взглянуть на окружающие нас вещи, понять, что все в окружающем нас мире относительно и обладает измеримой достоверностью. Осознать это и принять статистику я считаю наиболее важной задачей любого ученого. Вы не сможете ее избежать).

По своей сути, все окружающие нас явления не являются постоянными и абсолютными. Даже проводя измерение одной и той же величины в одинаковых условиях мы получим немного отличающиеся значения. Шанс, получить то или иное значение называется вероятностью.

Понятие вероятности является ключевым понятием вообще для всего, что нас окружает. Особенно это значимо для науки и экспериментов. Любое явление и любой результат обладают вероятностью - возможностью возникновения того или иного события. И эта вероятность - измерима.

Проводя исследования, рассчитывая результат эксперимента или просто планируя свою деятельность, мы всегда работаем с вероятностью. Неважно насколько мы уверены в своем результате/поступке - он будет обладать вероятностными характеристиками. И одной из основных задач исследователя является установление вероятности с которой он получил те или иные результаты, расчет вероятности того, что эти результаты значимо или не значимо отличаются от предыдущих и т.д..

Все в окружающем нас мире работает по статистическим законам и представляет из себя вероятностные величины. Так давайте же познакомимся с реальным миром!

Примечание. Данный курс является вводным и многие понятия в нем сформулированы и доказаны “не строго” (с математической точки зрения), а так, чтобы вы могли их легче запомнить и использовать в повседневных научных исследованиях. Но если рассказанное вам понравится и будет полезным, прошу исследовать приведенную в конце курса литературу.

3.1 Некоторые вводные определения

Начнем мы наше знакомство с основных понятий статистики: генеральная совокупность (ГС) и выборка. Именно они являются основой дальнейшего изучения.

Генеральная совокупность - множество всех объектом (или значений измеряемых величин), в рамках которых мы хотели бы сделать тот или иной вывод (сравнить их с другой генеральной совокупностью, рассчитать истинное значение и т.д.). В нашем случае, это, например, все возможное количество измерений отклика системы при фиксированном значении факторов.

Для определения ГС хорошим подходом является задать себе вопрос: “на какое множество объектов вы бы хотели обобщить ваши результаты исследования?” - это и будет вашей генеральной совокупностью.

И все бы хорошо, но как правило, объем такого множества крайне большой и нельзя провести измерение/исследование всех объектов в нем. На этот случай надо специальным образом “взять” из ГС определенное количество объектов - выборку.

При таком подходе, мы можем исследовать выборку и обобщить наши результаты на генеральную совокупность (с определенной достоверностью).

Ключевым условием выборки является ее репрезентативность (представительность) - она должна быть как можно более точной моделью генеральной совокупности (отражала ее свойства). В основном, репрезентативность зависит от количества объектов в выборке и от способа получения данных объектов (помните, мы всегда готовили, что нужно рандомизировать проведение экспериментов? Только в этом случае полученные измерения, формирующие нашу выборку, будут представлять ГС). Для обеспечения репрезентативности существует несколько подходов:

Простая случайная выборка (simple random sample) - элементы ГС выбраны случайным образом.
Стратифицированная выборка (stratified sample) - элементы выборки берутся случайным образом из областей генеральной совокупности (страт). Сами области соответствуют каким-либо свойствам выборки (например пол участника, поставщик реагента и т.д.). Такой подход позволяет сохранить точное количественное распределение объектов с разными свойствами в ГС.
Групповая выборка (cluster sample). ГС делится на кластеры, которые по свойствам похожи между собой. Часто используется для экономии ресурсов и времени при формировании выборок (значения можно отбирать случайным образом не из всей ГС, а только из некоторых кластеров).

Примечание. В данном разделе мы принимаем тот факт, что выборка всегда отбирается из генеральной совокупности, но это не значит что мы всегда знаем какая это ГС. Например, если мы проведем 5 измерений одной и той же величины в нашем эксперименте, то мы получим выборку из ГС всех возможных измерений при наших условиях. Все условия для формирования выборок остаются действующими. Но в случае, когда мы не знаем ничего о ГС, будет работать только 1 подход (случайный выбор). Это как раз та причина, по которой эксперименты должны проводиться в случайном порядке и варьирование любых параметров должно также быть максимально случайным (спланированным, но случайным).

Но из чего в принципе может состоять выборка и генеральная совокупность, что такое объекты? С точки зрения статистики это просто набор свойств (скорее даже просто набор чисел). Т.е. говоря объект, мы подразумеваем то или иное свойство (или совокупность свойств). Синонимом свойства является фактор. Проблема в том, что не все эти свойства мы можем измерить и учесть (отсюда и появляется погрешность, зачастую мы даже не догадываемся о каком-либо влиянии). Но измеримые свойства бывают 2 видов.

Количественные (numeric) - которые можем измерить в численном виде и сравнит друг с другом. Они в свою очередь делятся на:

непрерывные (могут принимать любое значение в промежутке, например рост);
дискретные (принимают только определенные значения, например число детей в семье).

Качественные (категориальные, номинативные, categorical) - это те или иные свойства, которые на попали в 1-ую категорию (например цвет, пол, место жительство и т.д.). Обычно используются для разделения на группы и кодируются цифрами (но за этими цифрами нет физического смысла, нельзя применить математические операции).

Примечание. Иногда выделяют еще и 3 группу - ранговые (которые мы не можем измерить, но можем сравнить друг с другом, например, финалисты марафона). В основном ранги используются для расчета некоторых статистических параметров, а в практике работы с данными и интерпретации результатов используются крайне редко.

Стоит держать в голове, что из количественных переменных можно получить ранговые или категориальные (которые потом использовать, например, как качественные переменные для разбиения выборки на группы).

Задача. Предложите формулу для перевода количественной переменной “рост испытуемого” в ранговую и в категориальную.

С основным понятиями мы познакомились. Самое время перейти непосредственно к статистике и ее определениям.

3.2 Меры представления значений выборки или генеральной совокупности

За этим сложным термином скрывается всего лишь способ представления информации о выборке в виде одного числа. Именно этим занимается так называемая “описательная” статистика. На самом деле таких числе несколько, но благодаря им, мы можем получить представление обо всех данных в выборке и более того, в ГС.

Допустим, мы определились с нашим экспериментом, выбрали генеральную совокупность, провели эксперимент несколько раз и подготовили выборку. И что теперь?

Самое первое, что имеет смысл сделать - построить распределение измеренных величин в зависимости от объекта выборки - гистограмму. Визуализация - ключевая стадия понимания любых данных. Вспомните, мы строили графики Пито - тоже гистограмму, чтобы наглядно оценить влияние факторов на результат. Здесь примерно тоже самое, но строим мы гистограмму частот - как часто встречается тот или иной признак для выборки (рис. 30).

Рис. 30. Гистограммы для количественных (a) и качественных (b) переменных.

Код для генерации данных:

# Generate random normal disturbed numbers
x <- 50 + rnorm(200)
# Create Frequency Table Using the Random Numbers
h <- hist(x, breaks=20, plot=FALSE)
# Plot the Distribution, with its tails highlighted in a different color
plot(h, col=3, main='test normal data')

# Generate binary data
y <- rbinom(n=200, size=1, prob=0.3)
h2 <- hist(y, breaks=2, plot=FALSE)
plot(h2, col=4, main='test binary data')

И вот ведь удивительная штука, но если нет систематического воздействия на систему (т.е. все воздействия происходят случайным образом), то гистограмма численных свойств всегда будет иметь вид нормального распределения (как на рисунке 30 (a)). Это своего рода ключевое распределение для статистики. И важно всегда проверять действительно ли у вас получилось нормальное распределение, если хотите использовать стандартные способы описательной и сравнительной статистики.

Примечание. Как вы можете видеть, чем более сильно величина отклоняется от центра, тем реже встречаются такие значения. Или другими словами - тем меньше вероятность получить такое значение при проведении эксперимента.

Стоит помнить, что на практике мы можем получить распределение любого вида - все зависит от эксперимента и типа данных (можете поискать в интернете различные примеры распределений). Описательная статистика как раз и занимается нахождением величин, которые могут описать тип распределения.

3.2.1 Меры центральной тенденции

Если мы посмотрим на приведенные распределения данных и заходим описать их одним числом, то вероятно, это будет число, при котором у нас наибольшее количество результатов (т.е. центр). Сделать мы это можем 3 способами (меры центральной тенденции).

Мода (mode) - значение измеряемого признака, которое встречается максимально часто.
Медиана (median) - значение признака, которое делит упорядоченное множество данных пополам (или среднее двух центральных значений, если количество элементов четное).
Среднее (mean - среднее арифметическое) - сумма всех значений признака, деленная на количество измерений. Для выборки используется обозначение с подчеркиванием сверху ($\overline{x}$), а для генеральной совокупности - $\mu$.

На основании этих величин можно представить себе вид распределения и сравнить его с другими распределениями. Таким образом, у нас появилось первое конкретное число, с которым мы можем работать (описывать наш эксперимент и полученные результаты, а также сравнить их с прочими результатами).

Более того, описанные способы расчета центральной тенденции позволяют нам представить вид распределения (рис. 31).

Рис. 31. Пример распределений при разных значениях моды, медианы и среднего (взято с https://stats.stackexchange.com/).

Выводы попробуйте сделать сами. Но основной вывод: “если распределение симметрично, унимодально и не имеет выбросов - можем использовать любой вид представления центра”. И обычно это среднее (поскольку нормальное распределение встречается чаще всего, а среднее удобнее для математических расчетов и более информативно). Но всегда нужно проверять вид распределения, прежде чем использовать среднее как меру степени выраженности некоторого значения, иначе это может привести нас к неверным выводам (вот тут есть пару интересных примеров).

Задача. Подумайте, почему в среднем арифметическом значении содержится больше информации об объектах выборки. Для этого нужно вспомнить/найти/подумать над формулы расчета каждого из мер центральной тенденции.

В нашем случае мы ограничимся рассмотрением только среднего значения. Основные свойства среднего приведены ниже.

$M_{x+c} = M_x + c$. Если к каждому значению выборки прибавить константу, то среднее также увеличится на значение данной константы.
$M_{x \cdot c} = M_x \cdot c$. Аналогично 1-ому, но с умножением.
$\sum(x_i - M_x) = 0$. Сумма отклонений всех значений от среднего арифметического будет равна 0 (легко представить графически - т.к. среднее находиться посередине всех значений выборки).

Задача. Нарисуйте, как будет меняться вид распределения для 1-ого и 2-ого случая.

3.2.2 Меры изменчивости

Следующее, что приходит на ум при анализе распределения - ширина гистограммы или мера ее изменчивости. Вот некоторые примеры, как можно численно охарактеризовать данное свойство.

Размах (range) - расстояние между максимальным и минимальным значением. $R = X_{max} - X_{min}$. Несмотря на простоту, эта мера опирается только на 2 значения из всей выборки, что не очень представительно и информативно. К выбросам он не устойчив.
Дисперсия (variance) или средне квадратичное отклонение - насколько в среднем наши значения отклоняются от среднего по выборке. $D = \frac{\sum (x_i - \overline{x})^2}{N}$. Чтобы понять зачем нам тут нужен квадрат (избавились от отрицательных значений) - посмотрите на 3 свойство среднего. К тому же квадратичные функции гладкие и с ними очень удобно работать в математике. Однако квадрат величины не имеет для нас большого смысла - сложно сравнивать с реальными значениями.
Стандартное отклонение (СО, standard deviation, STD) - корень из дисперсии: $\sigma = \sqrt{D}$. Он показывает реальное среднее отклонение от среднего по выборке (в тех же единицах измерения). В основном используется именно СО.

При этом стандартное отклонение для выборки обозначается как $sd$, а для ГС: $\sigma$, и это неспроста. Дисперсии тоже отличаются: для выборки $D = \frac{\sum (x_i - \overline{x})^2}{n - 1}$, для ГС: $D = \frac{\sum (x_i - \overline{x})^2}{N}$. Число $n$ в знаменателе называется числом степеней свободы, т.е. количество независимых переменных в выборке, и оно меньше на единицу чем в ГС. Это вызвано тем, что выборка зависит от ГС и ее показателей (формальное обоснование оставим за сценой). Ведь по сути само понятие выборки нам нужно, чтобы на основании малого количества данных представить, что происходит на самом деле в генеральной совокупности.

Примечание. Число степеней свободы - значимый параметр в статистике и он не раз нам еще понадобится. Строго говоря - это количество факторов (элементов информации), которые могут варьироваться (которые мы можем изменять), при расчете того или иного параметра (в случае со СО выборки мы не можем варьировать среднее, поскольку оно связано с ГС, поэтому из количества переменных, мы вычитаем 1 значение, которое “можно найти, вычитанием остальных независимых элементов из среднего”).

Свойства дисперсии.

Не изменчивость формы распределения при добавлении константы:
- $D_{x+c} = D_x$
- $sd_{x+c} = sd_x$
Изменчивость данных увеличится при умножении данных на константу:

$D_{x \cdot c} = D_x \cdot c^2$
$sd_{x \cdot c} = sd_x \cdot c$

Опять же - всегда рекомендую строить графические примеры, чтобы понять почему так происходит.

Вот собственно и все основные численные характеристики распределения величин в выборках. Далее мы будем рассматривать вытекающие из них свойства и параметры, которые широко применяются в экспериментальной практике. Однако заключительной числовой характеристикой распределения являются его квантили.

3.2.3 Квантили распределения

Квантили - значения признаков, которые делят упорядоченные данные выборки на равное число частей. И да, медиана это один из квантилей - половинный квантиль (делит выборку на 2 равные части). Еще один частый пример квантилей - квартили. Это значения (3 точки), которые делят упорядоченные данные выборки на 4 части. Находятся аналогично медиане для разбитых ее участков.

А нужны нам эти точки для того, чтобы охарактеризовать распределение визуально. Они позволяют построит очень распространенный в статистике график представления результатов - box plot (ящик с усами), рис 32.

	Рис. 32 (a). Анатомия box plot.
	Рис. 32 (b). Примеры box plot с сайта https://media.nature.com и соответствующие им распределения.

С помощью данных графиком очень удобно сравнивать различные наборы экспериментальных данных. Вот пример кода на R для построения простого box plot:

# Generate random numbers
x <- 50 + rnorm(200)
# Boxplot
boxplot(x)

Поясним анатомию box plot. Линия внутри прямоугольника - медиана, верх и низ прямоугольника - 3 и 1 квартиль соответственно. Чем больше расстояние между 3 и 1 квартилем, тем больше вариативность нашего признака. При этом если медиана не по центр - распределение скошено. В свою очередь усы - это 1.5 межквартильных размаха (в них будет 50 % наблюдений). И если значения выходят за рамки этих усов, то они отображаются точками. Особо выбивающиеся значения стоит проверить на возможные выбросы.

Иногда усы на графике соответствуют максимальному и минимальному значению (другой способ отображения box plot, используется реже).

На этом действительно все с описанием распределений и время перейти к самой статистике. И основой ее являются нормальное распределение и центральная предельная теорема.

3.3 Статистика и сравнение данных

3.3.1 Нормальное распределение

Мы уже сталкивались с термином “нормальное распределение” и успели узнать, что это основное распределение в статистике. Большинство экспериментальных данных со случайной погрешностью подчиняется данному закону распределения (рис. 33). Но что значит распределение, помимо частотной гистограммы и числовых характеристик? В первую очередь - это закон, по которому распределяется вероятность получения тех или иных величин. Раз это закон, то существует выверенная математическая формула (формула Гаусса), согласно которой наши наблюдаемые значения отклоняются от среднего.

Рис. 33. Нормальное распределение.

Примечание. Прошу вас ненадолго задуматься, что практически все величины в нашем мире подчиняются нормальному распределению. Это удивительно! И объяснимо.

Свойства нормального распределения:

симметрично;
унимодально.

Как уже отмечалось, поскольку распределение подчиняется строгому закону, мы можем рассчитать сколько наблюдений будет соответствовать тем или иным участкам гистограммы (наше распределение). Кроме того, мы сможем проводить и обратную операцию: определять вероятность получения того или иного значения эксперимента на основании его нормального распределения. Это позволит нам понять, стоит ли доверять полученному результату и насколько вероятно, что полученное значение (или сет значений) принадлежит той или иной системе (т.е. тому или иному распределению).

В частности, вероятность встретить значение, которое бы отклонилось от среднего на $\pm 3 \sigma$ равняется 0.01 %, что очень маловероятно. Или другими словами 99 % наблюдений будут находиться в диапазоне $\pm 3 \sigma$ (на графике это выражается соответствующей площадью под кривой).

С определением нормального распределения мы разобрались. Осталось понять как мы будем сравнивать различные распределения друг с другом, ведь несмотря на описательную статистику, измеряемые величины могут отличаться на порядки - на одной шкале их не представишь…

Для этого нам понадобиться стандартизация. Мы будем использовать так называемое Z-преобразование (Z-score). В результате такого преобразования мы получим Z-распределение, где среднее = 0, а стандартное отклонение = 1.

Приведения нашего нормального распределения к стандартному виду (Z-score) осуществляется по формуле:

$$ Z_i = \frac{x_i - \overline{x}}{\sigma_x} $$

Задача. Используя свойства среднего и дисперсии, рассчитайте новые характеристики полученного распределения и убедитесь, что они действительно равны 0 и 1.

При таком преобразовании форма распределения не изменится, а значит важную информации о нем мы не потеряем (если не используем дисперсию как признак).

Z - преобразование часто используется, чтобы все наблюдения перевести в z - шкалу (M = 0, sd = 1) для упрощения работы с данными. Однако процедура стандартизации часто используется и при расчете вероятности отклонения измеренного значения от среднего в единицах стандартного отклонения (запомните этот подход, он нам еще пригодится).

С использованием стандартизации, были установлены одни из широко используемых практических правил статистики: правила двух и трех сигм.

$M_x \pm \sigma \approx 68 \%$ наблюдений;
$M_x \pm 2\sigma \approx 95 \%$ наблюдений;
$M_x \pm 3\sigma \approx 100 \%$ наблюдений.

Однако Z-score позволяет нам рассчитать вероятность для любого отклонения, что позволит нам не использовать данные приближенные правила, а непосредственно рассчитывать вероятности появления того или иного значения.

Допустим среднее выборки $\overline X = 150$, а стандартное отклонение $sd = 8$. Какой процент наблюдений превосходит значение в 154 (рис. 34)?

Рис. 34. Пример расчета процента наблюдений.

Для начала сделаем Z-преобразование для исследуемого значения: $Z = \frac{154-150}{8} = 0.5$. После этого мы можем воспользоваться специальным сайтом и найти интересующий процент такого или еще более экстремального значения (рис. 34).

Ответ: 30.9 % наблюдений.

Примечание. Будьте аккуратны при использовании таблиц для работы с z-значениями: часто для интересующего нас z-значения указывается процент наблюдений, который не превосходит указанное z-значение.

Для нахождения вероятности и решения собственных задач используйте следующие ресурсы:

таблицы z-значений:
- процент наблюдений, не превышающий указанное z-значение;
- процент наблюдений, превышающий указанное z-значение;
специальный сайт, позволяющим вычислить процент наблюдений в интересующем нас диапазоне (по умолчанию выставлено стандартное нормальное распределение M=0, sd=1).
Язык программирования R или Python (предлагаю самим найти в них соответствующие функции).

Примечание. При проведении ответственных вычислений используйте любые 2 источника, чтоб сверить свои ответы.

Примечание. Наиболее распространенные распределение непрерывных или псевдо-непрерывных величин:

распределение Гаусса (нормальный закон распределения случайной величины, наиболее широко распространено);

хи-квадрат ($\chi^2$);

распределение Фишера ($F$);

Распределение Стьюдента ($t$).

Наиболее распространенные распределения дискретных величин:

Бернулли (бинарное);

Пуассона.

Больше примеров и описаний можно найти здесь.

3.3.2 Центральная предельная теорема

Мы разобрались с характеристиками нормального распределения и как с ним работать. Действительно, наш мир - удивителен! И то, что нормальное распределение встречается в нем очень часто в любых проявлениях лишний раз подтверждает это утверждение. Но что действительно может “взорвать мозг”, так это основа основ статистики - центральная предельная теорема (ЦПТ):

Распределение средних значений выборок одинакового размера из одной генеральной совокупности будет всегда стремиться к нормальному распределению! (при достаточно большом объеме выборки)

Более строгая формулировка теоремы выглядит примерно так:

$$ X \sim F(x), \text{ } X^n = (X_1, X_2, ..., X_m) \Rightarrow \overline{X^m} \sim N(\mu_X, \frac{D_X}{n}) $$

где $X$ - ГС исходной величины $x$, с распределением $F(x)$, $X^n$ - множество из $m$ выборок c размером $n$, $N$ - нормальное распределение, $\mu_X$ - среднее ГС, $D_X$ - дисперсия ГС.

Примечание. Математическая формулировку можно озвучить следующим образом. При многократном извлечении $m$ выборок размером $n$ из генеральной совокупности $X$ с распределением $F(x)$, средним $\mu_X$ и дисперсией $D_X$, распределение выборочных средних $X^n = (X_1, X_2, ..., X_m)$ будет являться приблизительно нормальным со средним, равным среднему генеральной совокупности и с дисперсией, равной $\frac{D_X}{n}$.

Поскольку мы чаще будем пользоваться величиной стандартного отклонения:

$$ se = \sqrt{\frac{D_X}{n}} = \frac{\sigma_X}{\sqrt{n}} $$

Полученная величина называется стандартной ошибкой среднего (standard error).

Суть ЦПТ в том, что сумма достаточно большого количества слабо зависимых случайных величин, имеющих примерно одинаковые масштабы (ни одно из слагаемых не доминирует, т.е. не вносит в сумму определяющего вклада), имеет распределение, близкое к нормальному!

И как частный случай, если мы будем извлекать выборки из генеральной совокупности (неважно с каким распределением, при очень большом количестве выборок) и рассчитывать для них средние, то они распределятся нормально относительно среднего генеральной совокупности. И отклонение от среднего будет тем меньше, чем больше размеры извлекаемых выборок ($n$) или чем меньше изменчивость исходного признака ($\sigma_X$).

Проверить это вы можете на сайте с соответствующей моделью.

Примечание. Теорема Ляпунова объясняет широкое распространение нормального закона распределения и поясняет механизм его образования. Теорема позволяет утверждать, что всегда, когда случайная величина образуется в результате сложения большого числа независимых случайных величин (а наш мир так и устроен), дисперсии которых малы по сравнению с дисперсией суммы, закон распределения этой случайной величины оказывается практически нормальным законом распределения. А поскольку случайные величины всегда порождаются бесконечным количеством причин и чаще всего ни одна из них не имеет дисперсии, сравнимой с дисперсией самой случайной величины, то большинство встречающихся в практике случайных величин подчинено именно нормальному закону распределения.

Но самое приятное применение ЦПТ в том, что мы можем получить оценку истинного значения измеряемой величины по относительно небольшой выборке значений:

среднее генеральной совокупности - приближенное истинное значение;
среднее выборок - приближенное значение генеральной совокупности (по ЦПТ).

Таким образом, зная формулу распределения случайных величин в нормальном распределении и понимая, что все стремится к нормальному распределению (по ЦПТ), мы способны оценить насколько сильно новое измеренное значение отклонится от истинного (т.е. можем проводить измерения и сравнивать полученные результаты между собой действительно достоверно). На основании вероятности получить такое или еще более экстремальное значение, мы можем проводить статистическую проверку гипотез - основную операцию сравнения в статистике и выявлять статистически значимые различия.

Ограничивающим условием для ЦПТ в представленном виде является то, что в выборке должно быть более 30 значений, а сами выборки должны быть репрезентативны.

Пример. Используем на практике положения ЦПТ. Допустим, мы отобрали из генеральной совокупности только одну выборку размером 100 значений, характеристики выборки: среднее $\overline{X} = 3$ и СО $sd = 5$. Даже в таком случае мы можем оценить истинное значение через среднее всей генеральной совокупности, которое будет находиться в диапазоне среднего выборки со стандартной ошибкой среднего (мера изменчивости среднего):

$$ se = \frac{sd}{\sqrt{n}} = \frac{5}{\sqrt{100}} = 0.5 $$

Истинное значение c 99% процентной вероятностью находится в диапазоне $\overline{X} \pm 3\cdot se = 3 \pm 3 \cdot 0.5 = 3 \pm 1.5$. (см. правило 3 сигм). Более строгое обоснование будет дано далее.

Примечание. Если генеральная совокупность сильно отличается от нормального распределения, то чтобы получить нормальное распределение, хорошо описывающее распределение выборочного среднего, необходим размер выборки намного больше 30.

3.3.3 Доверительные интервалы

Говоря о ЦПТ мы уже немного коснулись сравнения данных. Однако для более строго понимания этого процесса необходимо понимать доверительные интервалы.

Мы уже рассмотрели пример, когда можно в определенной вероятностью предположить среднее ГС по одной выборки. И вы увидели, что в статистике (как и в реальном мире) нет абсолютных величин. Только интервалы и вероятность. Мы можем лишь оценить интервал, в который с определенной вероятностью попадет истинное значение - это и есть доверительный интервал среднего (для генеральной совокупности). А рассчитать такой интервал нам поможет ЦПТ и понятие квантилей с точки зрения стандартного Z-распределения.

Примечание. По своей сути Z-распределение показывает нам силу отклонения той или иной полученной величины от среднего в единицах стандартного отклонения выборки (внимательно изучите формулу для Z-score). А для оценки такого отклонения очень удобно использовать квантили, поскольку они делят шкалу распределения на равные отрезки относительно медианы (которая в случае нормального распределения совпадает со средним).

К настоящему моменту у нас на вооружение имеется 2 необходимых свойства:

Согласно ЦПТ распределения выборочных средних СО будет равно $se = \frac{sd_x}{\sqrt{n}}$.
При этом из понятий о квантилях и Z-распределения мы можем рассчитать, какой процент наблюдений окажется в том или ином интервале от среднего ГС. Для упрощения воспользуемся правилом сигм и предположим, что 95% объектов будут находиться в диапазоне $\mu \pm 1.96 se$.

Если взглянуть на это с другой стороны - со стороны выборочного среднего $\overline{X}$, то c 95 % вероятностью оно находиться в интервале $\mu \pm 1.96 se$. Это значит, что если бы мы взяли 100 выборок из ГС и рассчитали их средние, то для 95 выборок, эти средние также бы попали в данный интервал и если отложить от их среднего интервал $\pm 1.96 se$, то он включили бы в себя среднее генеральной совокупности.

Примечание. Для лучшего восприятия возьмите листочек бумаги, нарисуйте распредлеение ГС, доверительный интервал для 95 % вероятности и убедитесь в сделанных предположениях (отложив соответствующие интервалы от выборочных средних и наблюдая, попадает ли в них среднее ГС).

Вот и ответ как нам использовать доверительные интервалы для оценки среднего ГС (нашего “реального значения”). Использовав обратный подход к рассуждению о доверительном интервале мы показали, что среднее ГС будет с той же вероятностью находиться в диапазоне $\overline{X} \pm 1.96 se$, что и среднее выборки, находящееся в интервале $\mu \pm 1.96 se$ (для такого доверительного интервала вероятность составит 95 %).

Пример. Рассчитаем доверительный интервал, для выборки с $\overline{X} = 100$, $sd = 4$, $n=64$ в котором с 95 \% вероятностью находится среднее ГС.

$$ s = \frac{sd_X}{\sqrt{n}} = \frac{4}{\sqrt{64}} = 0.5\\ (\overline{X} - 1.96 se; \overline{X} + 1.96 se)\\ (100 - 0.98; 100 + 0.98) $$

Рассчитав такой интервал, мы можем быть на 95 % уверены, что он содержит в себе среднее генеральной совокупности (и предположительно, истинное значение). Это основная идея доверительных интервалов.

Примечание. Для большей уверенности мы могли бы использовать более широкий интервал, например $\pm 2.58 se$ для 99 % вероятности.

3.3.4 Идея статистического вывода, р-уровень значимости

До сих пор мы работали по сути с результатами одного эксперимента. Настало время расширить горизонты.

Помимо представления об истинном результате, в экспериментальной практике нас интересует возможность сравнить результаты двух и более экспериментов (установить, действительно ли две выборки отличаются между собой).

Для статистически обоснованного ответа на такие вопросы нам потребуется разобрать идею статистического вывода. И сделаем мы это на примере.

Пример. Допустим, срок выздоровления пациентов при лекарстве А составляет в среднем 20 дней. Мы испытываем новое лекарство В и получили выборку со следующими характеристиками: $N = 64$, $\overline{X} = 18.5$, $sd=4$. Действительно ли новое лекарство В работает лучше? Или мы получили просто допустимое отклонение от среднего одной ГС?

С одной стороны, среднее выборок отличается. Но мы теперь понимаем, что такой результат вполне мог быть получен случайно. Нам нужно оценить вероятность такого события и на основании полученных значений принять решение - отличается или нет.

В статистике для этого используется стандартный подход оценки статистических гипотез (названия гипотез всегда фиксированы).

$H_0$ - нулевая гипотеза. Всегда предполагает, что никакого воздействия нет. В нашем случае, предполагает, что новое средне принадлежат ГС (с $\mu = 20$ дней).

$H_1$ - альтернативная гипотеза. Всегда предполагает, что нулевая гипотеза не верна (в нашем случае это то, что мы хотим доказать).

Решение:

Предположим, что верна нулевая гипотеза $H_0$. Тогда, согласно ЦПТ, значение среднего исследуемой выборки (18.5) принадлежало бы ГС со средним 20 и ошибкой среднего $se = \frac{sd}{\sqrt{n}} = \frac{4}{\sqrt{64}} = 0.5$. Тогда нам нужно ответить на вопрос насколько далеко отклонилось выборочное среднее 18.5 от среднего ГС 20, в единицах стандартного отклонения (ошибки среднего в данном случае) - для этого вспоминаем Z-распределение.

$$ Z = \frac{\overline{X} - \mu}{se} = \frac{18.5 - 20}{0.5} = -3 $$

Это означает, что среднее выборки отклонилось от общего среднего на $-3$ сигмы. Вероятность такого или еще более экстремального отклонения можно посмотреть из таблиц для z-преобразования, или воспользоваться этим сайтом. В нашем случае вероятность составит $p = 0.003$, или 0.3 %.

В результате рассмотренного примера, мы установили, что 0 гипотеза верна с вероятность в 0.3 %. Тогда альтернативная гипотеза верна с вероятностью 99.7 %. Таким образом, мы можем отклонить нулевую гипотезу и завить, что наше лекарство действительно работает (но это не точно).

Величина достоверность 0 гипотезы (т.е. вероятность получить исследуемое значение как случайное отклонение от среднего ГС) обозначается как $p$ и называется уровнем значимости. По своей сути это такой уровень вероятности, при котором можно получить такие, или еще более экстремальные значения. Считается, что при $p < 0.05$ можно отклонять нулевую гипотезу и результат является статистически значимым (в некоторых случаях используют значение в 0.01).

Примечание. Существует понятие одностороннего и двустороннего p уровня значимости. Принято всегда рассматривать двусторонний уровень значимости, поскольку он позволяет дополнительно “застраховаться” от ложного результата (учитывает возможность отклонений в обе стороны). Однако, если сравниваемое значение физически не может существовать по другую сторону от среднего, тогда допускается использовать односторонний уровень значимости.

Расчет уровня значимости того или иного события, которое лежит в основе 0 статистической гипотезы является основой основ статистического анализа. Именно расчет уровня значимости для того или иного распределения (р-уровень значимости) лежит в основе различных статистических критериев, тестов и сравнений (поскольку p-уровень значимости является результатом этих действий). Благодаря этому показателю мы будем принимать те или иные статистические решения (отвергать или нет 0 гипотезу).

Обычно, нулевая гипотеза отклоняется, и различия считаются статистически достоверными, если p < 0,05. Однако часто в статистике используется более жесткий критерий достоверности различий (например, p < 0.01). Значение p-уровня значимости, которое выбирается, в качестве порога обозначается буквой $\alpha$. Например, если исследователь решил, что $\alpha = 0.05$, то и нулевая гипотеза будет отклоняться при условии, что p < 0,05. На протяжении курса мы будем отклонять нулевую гипотезу при условии, что p < 0,05 (кроме отдельно оговоренных случаев).

Примечание. Рекомендую ознакомиться с дополнительным материалом по р-уровню значимости: оригинал или интерпретация на русском.

Важно понимать, что любой статистический вывод подразумевает, что мы будем ошибаться. Существуют 2 типа ошибок:

Ошибки I рода: отклонили 0 гипотезу, хотя она была верна (т.е. наш результат - случаен).
Ошибки II рода: не отклонили 0 гипотезу, хотя была верна альтернативная.

Очень часто p-уровень значимости может выбираться чтобы минимизировать тот или иной вид ошибки.

Примечание. Использование доверительных интервалов зачастую рассматривают, как альтернативный способ проверки гипотез. В нашем случае, если значение 20 (предполагаемое среднее значение в генеральной совокупности) не будет принадлежать 95% доверительному интервалу, рассчитанному по выборочным данным, у нас будет достаточно оснований отклонить нулевую гипотезу. Проверьте, согласуются ли результаты двух этих подходов: рассчитайте 95% доверительный интервал для среднего значения, на примере с тестированием нового препарата.

3.3.5 Практика использования статистики для сравнения данных

Итак, мы разобрали с вами основные подходы к статистическому анализу данных и даже научились сравнивать среднее выборки и генеральной совокупности между собой.

Время разобрать несколько подводных камней, с которыми вы столкнетесь на практике, а также формальный подход к проведению сравнения выборок.

Первый закономерный вопрос: а что делать, если данных в нашей выборке меньше 30? Размер выборки очень важен, поскольку при недостатке значений ЦПТ перестает работать в том виде в котором мы ее изучили.

Стандартное отклонение выборки уже плохо представляет СО генеральной совокупности.
Средние значения наших выборок перестают формировать нормальное распределение.

Однако, сама форма распределения средних изменится не сильно. Оно продолжает быть симметричным и унимодальным колоколом. Но это распределение уже плохо описывается формулой Гаусса. Для него введено новое понятие - распределение Стьюдента” (t-распределение, рис. 35).

Рис. 35. t-распределение (Стьюдента).

У такого распределения характерны более “высокие хвосты”. Т.е. отклонения от среднего будут встречаться чаще. Именно такое распределение используется, когда число наблюдений в выборке невелико и/или $\sigma$ (СО ГС) нам неизвестно (а это почти всегда). Обобщая сказанное: t-распределение используется всегда, когда есть сомнения в нормальности распределения ГС. Или проще - почти всегда нужно использовать t-распределение.

Поскольку данное распределение работает с малым количеством измерений, для него крайне важно понятие степеней свободы ($df$), которое зависит от наблюдений в выборке ($n$).

$$ df = n - 1 $$

Чем больше количество степеней свободы (т.е. данных в выборке), тем больше t-распределение становиться похоже на нормальное. И это интересная особенность данного распределения - оно зависит от числа степеней свободы! Т.е. в отличие от жестко заданного нормального распределения (форма зависит только от $\overline{X}$ и $sd$), для t-распределения вероятности встретить те или иные значения будут меняться в зависимости от количества данных в выборке (форма зависит от $\overline{X}$, $sd$ и $df = n-1$).

Т.е., по сути, при одинаковом с Z-критерием расчете:

$$ t = \frac{\overline{X} - \mu}{\frac{sd}{\sqrt{n}}} $$

р-уровень значимости для этого значения будет другой (чтобы рассчитать данный уровень нужно также воспользоваться таблицами или сайтом)

Примечание. Важно! До настоящего момента мы использовали упрощенное представление о распределении средних по ЦПТ. С определенным допущением мы полагали, что оно подчиняется нормальному распределения при выборках с более чем 30 значениями и отклонение от среднего в единицах СО рассчитывали как:

$$ Z = \frac{\overline{X} - \mu}{\frac{\sigma}{\sqrt{n}}} $$

Строго говоря, это не так, поскольку в большинстве случаев нам не известна дисперсия ГС и сделать вывод о нормальности ГС мы не можем. В таком случае, мы обязаны всегда использовать t-распределение Стьюдента и рассчитывать p-уровень значимости для t критерия:

$$ t = \frac{\overline{X} - \mu}{\frac{sd}{\sqrt{n}}} $$

Для расчета вероятности получить такое отклонение случайно по t-распределению, нужно использовать специальные ресурсы.

Поэтому, правильнее будет сказать, что мы используем t - распределение не потому что у нас маленькие выборки, а потому что мы не знаем стандартное отклонение в генеральной совокупности. И в дальнейшем, на практике, мы всегда будем использовать t - распределение для проверки гипотез, если нам неизвестно стандартное отклонение в генеральной совокупности, необходимое для расчета стандартной ошибки (даже если объем выборки больше 30).

Пример. Время перейти к конкретным практическим примерам и посмотреть, как понимание ЦПТ и t-распредления поможет нам сравнить средние значения двух выборок с параметрами:

$$ \overline{X_1}, sd_1, n_1 \\ \overline{X_2}, sd_2, n_2 \\ $$

Подводный камень здесь заключается в том, что у нас нет ГС. Мы сравниваем 2 выборки из данной ГС. Поэтому для расчета нам понадобится так называемый парный t-тест (т.е. мы по сути проверяем, насколько сильно пересекаются доверительные интервалы исследуемых средних). Уже классический подход с гипотезами:

$$ H_0: \mu_1 = \mu_2 \\ H_1: \mu_1 \neq \mu_2 $$

Допустим, верна 0 гипотеза. Тогда, при многократном повторении эксперимента мы бы извлекали по 2 выборки из одной ГС и величина:

$$ \overline{X_1} - \overline{X_2} = 0 $$

При этом само распределение такой разности было бы t-распределением со средним = 0, а стандартное отклонение было бы равно:

$$ se = \sqrt{\frac{sd_1^2}{n_1} + \frac{sd_2^2}{n_2}} $$

т.е. вклад в общую ошибку среднего от средних 1 и 2 выборки был бы одинаков. Это разумно, поскольку мы предполагаем, что эти выборки принадлежат одной ГС.

При этом число степеней свобод для такого распределения будет равно:

$$ dF = n_1 + n_2 - 2 $$

что тоже весьма разумно, поскольку используются 2 выборки со своими степенями свободы.

Осталось рассчитать вероятность отклонения нашей разности, от предполагаемого 0 (аналогично расчету любого квантиля). Это и есть t-критерий:

$$ t = \frac{(\overline{X_1} - \overline{X_2}) - (\mu_1 - \mu_2)}{se} = \frac{(\overline{X_1} - \overline{X_2}) - 0}{\sqrt{\frac{sd_1^2}{n_1} + \frac{sd_2^2}{n_2}}} $$

Рассчитав соответствующее t-значение (т.е. насколько сильно отклоняется наш результат от предполагаемого среднего в единицах стандартного отклонения для t-распределения) и зная общее число степеней свободы, мы можем сравнить полученный результат с допустимым крайним значением (используем таблицы) или рассчитать p-уровень значимости для такого значения используя специальный сайт). Помним, что считаем вероятность получить такое отклонение в обе стороны!

Отметим, что при использовании критерия t-Cтьюдента необходимо учитывать соблюдение следующих требований:

Гомогенности дисперсий. Дисперсии сравниваемых выборок должны быть приблизительно одинаковы (иначе наше допущение об их равном вкладе не имеет смысла). Для проверки данного требования используются критерий Ильина или критерий Фишера.
При маленьком размере выборки (меньше 30) важно, чтобы распределение внутри выборки было нормальным (иначе не факт, что будет соблюдаться ЦПТ).

3.3.6 Графическое сравнение распределений

Помимо приведенных расчетов, мы можем использовать и графическое сравнение данных. Зачастую это удобно когда данных много и нужны быстрые выводы (наглядно, но вероятность совершить ошибку выше).

В начале остановимся на общих правилах представления результатов в статистике (да и в любой науке в принципе, рис. 36).

Всегда добавлять название (хотя бы в подписи к рисунку).
Подписывать оси.
Указывать меру изменчивости данных (другими словами - погрешность).

Рис. 36. Пример представления данных в виде гистограммы.

# Load ggplot2
library(ggplot2)

# create dummy data
data <- data.frame(
  name=letters[1:5],
  value=sample(seq(4,15),5),
  sd=c(1,0.2,3,2,4)
)

# Most basic error bar
ggplot(data) +
    geom_bar( aes(x=name, y=value), stat="identity", fill="skyblue", alpha=0.7) +
    geom_errorbar( aes(x=name, ymin=value-sd, ymax=value+sd), width=0.4, colour="orange", alpha=0.9, size=1.3)

Но признанным стандартом для статистики является box plot или его вариации (рис. 37).

Рис. 37. Пример представления данных в виде box plot.

# prepare the data from build in dataset
ozone <- airquality$Ozone
temp <- airquality$Temp

# gererate normal distribution with same mean and sd
ozone_norm <- rnorm(200,mean=mean(ozone, na.rm=TRUE), sd=sd(ozone, na.rm=TRUE))
temp_norm <- rnorm(200,mean=mean(temp, na.rm=TRUE), sd=sd(temp, na.rm=TRUE))

# You can read about them in the help section ?boxplot.
# Some of the frequently used ones are, main-to give the title, xlab and ylab-to provide labels for the axes, col to define color etc.
# Additionally, with the argument horizontal = TRUE we can plot it horizontally and with notch = TRUE we can add a notch to the box.

boxplot(ozone, ozone_norm, temp, temp_norm,
main = "Multiple boxplots for comparision",
at = c(1,2,4,5),
names = c("ozone", "normal", "temp", "normal"),
las = 2,
col = c("orange","red"),
border = "brown",
horizontal = TRUE
)

Лично мне нравится обозначать на графике box plot доверительный интервал и среднее (рис. 38).

Рис. 38. Пример представления данных в виде box plot со средним и доверительным интервалом для нормализованных данных.

# scale the data
ozone <- scale(airquality$Ozone)
temp <- scale(airquality$Temp)

# drop NA values
ozone <- ozone[complete.cases(ozone), ]
temp <- temp[complete.cases(temp), ]

# calculate statistics
n_o=length(ozone)
mm_o=mean(ozone)
dd_o=sd(ozone)
error_o <- qnorm(0.950)*dd_o/sqrt(n_o)

n_t=length(temp)
mm_t=mean(temp)
dd_t=sd(temp)
error_t <- qnorm(0.950)*dd_t/sqrt(n_t)

# calculate confidence interval
inf_o <- mm_o - error_o
sup_o <- mm_o + error_o

inf_t <- mm_t - error_t
sup_t <- mm_t + error_t

# draw boxplot
boxplot(ozone, temp,
main = "Multiple boxplots with conf.int.",
at = c(1,2),
names = c("ozone", "temp"),
las = 2,
# col = c("orange","red"),
border = "brown"
)
# draw mean and CI
lines(c(0.75,1.25), c(inf_o, inf_o), col=4)
lines(c(0.75,1.25), c(mm_o, mm_o), col=2, lwd=2)
lines(c(0.75,1.25), c(sup_o, sup_o), col=4)
lines(c(1.75,2.25), c(inf_t, inf_t), col=4)
lines(c(1.75,2.25), c(mm_t, mm_t), col=2, lwd=2)
lines(c(1.75,2.25), c(sup_t, sup_t), col=4)
legend("topleft", c("95% CI", "Mean"), lty=1, col = c(4, 2),bty ="n")

Анализируя подобные графики можно составить мнение об изменчивости данных и об их различии. Вы уже убедились, что именно на основе информации о распределении, можно провести сравнение полученных результатов. Особенно это полезно в случае доверительных интервалов - если средние в данные интервалы не попадают (одно в интервал другого), то можно уверенно сказать, что выборки значимо отличаются.

3.3.7 Проверка данных на нормальность

Проверка экспериментально полученных данных на соответствие нормальному распределению очень часто встречается в статистических задачах (мы уже сталкивались с вами с таким требованием при разборе t-теста). Это необходимо, чтобы мы могли работать с арифметическим средним как с мерой центральной тенденции (иначе мы не сможем использовать изученные ранее подходы).

Один из самых простых способов проверки - просто построить гистограмму частот и сравнить ее вид с нормальным распределением при том же среднем и дисперсии. Однако, у такого подхода есть существенный недостаток - у нас нет числового критерия, а значит мы не можем доверять нашим выводам.

Другой способ - сравнить p-уровни значимости (или соответствующие им квантили) для полученного экспериментально распределения и для нормального распределения с такими же параметрами (средним и СО). Такой график называется квантиль-квантиль графиком (qq plot, рис. 39). Особенно это удобно, когда в выборках мало данных и мы можем отобразить на графике каждое из них.

Рис. 39. Пример проверки на нормальность с помощью qq plot (больше примеров вы можете найти в интернете по запросу "qq plot with distribution example")

Вы можете построить данный график сами в MS Excel. В приведенной ссылке дано немного некорректное приближение для квантиля, но хорошее описание процедуры построения графика. Для более корректного приближенного расчета квантиля из ранга переменной используйте формулу: $\alpha = \frac{r - 1}{n - 1}$ (где $\alpha$ - квантиль в долях от 1, $r$ - ранг экспериментального значения в выборке, $n$ - общее количество значений.).

Примечание. Чтобы исключить путаницу, разберем процедуру построения qq plot:

Записываете все полученные данные для вашей выборки.

Упорядочиваете их по возрастанию.

Считаете для каждого значения его ранг (т.е. порядковый номер в зависимости от значения).

Используете ранг, чтобы вычислить квантиль в долях единицы для каждого значения (мы не будем вдаваться в подробности, но $\alpha$ - квантиль равен такому числу из распределения, что любая случайно взятая из выборки величина попадает левее этого числа с вероятностью $\le \alpha$). По сути ранг это и есть квантиль, поскольку ранг величины показывает насколько она сдвинута в распределении влево или вправо. Но чтобы получить квантиль, нужно абсолютное значение ранга перевести в относительную величину. Для этого нужно вычесть из ранга 1 (поскольку $\alpha \in [0, 1]$ и разделить все на общее количество значений - 1 (для нормировки самого высокого ранга на 100 %). Таким образом, $\alpha = \frac{r - 1}{n - 1}$.

Используя полученные значения квантилей рассчитать значение, соответствующие Z-распределению для данного квантиля.

Построить точечный график (scatterplot) “значения Z-распределения VS значения выборки” для каждого конкретного квантиля.

Таким образом, данные по оси 0Y соответствуют значениям экспериментального распределения без стандартизации (хотя можно встретить и стандартизованное представление). Данные по оси 0X соответствуют значениям стандартизованного нормального распределения (Z-распределения) с такими же средним и дисперсией. И каждое из данных по осям соответствует своему квантилю.

Интерпретировать график qq plot можно следующим образом:

Если точки находятся на прямой линии под $45^o$ (соответствует сравнению нормального распределения с нормальным), то наше распределение полностью соответствует нормальному.
Если точки выше или ниже линии - частота экспериментальных данных больше или меньше, чем у нормального распределения для данного квантиля (часть гистограммы будет выше или ниже, чем у нормального распределения в данной области, рис. 39 - обращайте внимание на знак значений для вашего распределения и Z-распределения).
0 на 0X qq-plot означает среднее значение и медиану (совпадают для Z-распределения).

Пример кода на R. Рекомендую запустить и изучить как t-распределение отличается от нормального

# random t-distribution data
x <- rt(100, df=4) + 20

# qq plot with comparison line
qqnorm(x, pch = 1, frame = FALSE)
qqline(x, col = "steelblue", lwd = 2)

Еще одно важное применение графического подхода - проверка на выбросы.

Выброс - это явно отклоняющееся значение, которое не принадлежит исследуемой выборке, но почему-то включено в нее (обычно экстремально большое или маленькое). Обычно, выбросы появляются вследствие человеческого фактора или грубой ошибке в эксперименте (например, забыли нагреть).

Такие значения нужно убирать из расчетов, иначе формулы начнут работать неверно (ведь они основаны на среднем значении, а оно очень чувствительно к выбросам).

Третьим способом проверки на нормальность распределения является специальные тесты (считаются более достоверными, чем графический способ):

Шапиро-Вилка;
Колмогорова-Смирнова.

Они также работают по принципу расчета р-уровня значимости и проверки статистических гипотез (0-ая - исследуемое распределение не отличается от нормального, альтернативная - отличается). Это как раз тот редкий случай, когда полученный маленький р-уровень значимости сообщает нам плохую новость (что исследуемое распределение значимо отличается от нормального).

В любом статистическом пакете (включая MS Exel или RStudio) эти тесты уже реализованы. Можете смело их применять и сравнивать полученный р-уровень значимости с выбранным вами критическим значением (например, 0.05).

Если же мы получили свидетельство того, что наше распределение значимо отличается от нормального, то сравнить средние мы все еще можем, но уже по другому критерию: критерию Манна-Уитни (Whitney U-test). Этот критерий переводит все наши данные в ранговую шкалу (как при расчете медианы) и сравнивает уже не средние, а средние ранги (по сути мы используем медиану для оценки, а не среднее). Такой критерий гораздо менее чувствителен к наличию отклонений от нормальности и к выбросам. Но он менее точен, чем t-критерий для нормальных распределений. Предлагаю вам самим поискать в интернете как применять эти тесты, поскольку в экспериментальной и лабораторной практике встречаться с ними вы будете крайне редко.

3.3.8 Анализ выборок

Помимо простого сравнения двух средних (с помощью t-критерия), часто необходимо провести анализ нескольких выборок. Просто применять попарное сравнением с помощью t-теста будет неверно, поскольку это приведет к так называемому эффекту множественных сравнений (но об этом мы поговорим позже).

В случае анализа 3 и более выборок мы должны применять дисперсионный анализ. В рамках этого курса мы разберем простейший случай однофакторного дисперсионного анализа, чтобы понять как он работает.

Довольно часто в практических задачах выборки для сравнения получаются при исследовании какого-либо категориального признака. Например, мы исследуем гранулометрический состав 3 типов промышленно производимых удобрений и пытаемся понять, влияет ли фактор типа удобрения на процент фракции менее 2 мм. Та переменная, которая будет разделять наши объекты на выборки (категориальная переменная с нескольким градациями) называется независимой переменной. А та количественная переменная, по которой мы сравниваем выборки, называется зависимая переменная. Другими словами мы сравниваем несколько распределений в зависимости от одного категориального фактора.

Допустим, у нас есть три группы измерений:

$$ \begin{matrix} No 1 & No 2 & No 3 \\ \hline 3 & 5 & 7 \\ 1 & 3 & 6 \\ 2 & 4 & 5 \\ \end{matrix} $$

Сформулируем гипотезы:

$$ H_0: \mu_1 = \mu_2 = \mu_3 \\ H_1: \text{ } !H_0 $$

Примечание. Математическая запись $!H_0$ говорит о том, что мы отрицаем нулевую гипотезу, т.е. хотя бы два средних из 3 не равны между собой (но мы ничего не говорим о том, какие это средние и т.д.). Обратите внимание, что 0 гипотеза говорит о средних ГС, т.е. предполагает, что все 3 выборки принадлежат одной ГС.

Для решения задачи, предположим, что верна 0 гипотеза. Тогда мы можем найти общее среднее для всех групп:

$$ \overline{\overline{X}} = \frac{3+1+2+5+3+4+7+6+5}{9} = \frac{36}{9} = 4 $$

и общую сумму квадратов (характеризует насколько высока изменчивость наших данных без учета разделения их на группы, Square Sum Total):

$$ SST = (3-4)^2 + (1-4)^2 + ... + (6-4)^2 + (5-4)^2 = 30 $$

Общее количество степеней свободы (исходя из предположения, что это одна выборка) составит:

$$ dF = N - 1 = 8 $$

Время задуматься из чего состоит общая изменчивость наших данных. Это всего 2 слагаемых.

Межгрупповые изменчивость и степень свободы, т.е. насколько сильно значения разнесены друг от друга если сравнивать между группами (Square Sum Between).

$$ SSB = \sum_m n_m \cdot (\overline{X_m} - \overline{\overline{X}})^2 = 3(2-4)^2 + 3(4-4)^2 + 3(6-4)^2 = 24 $$

$$ dF_B = c - 1 = 3-1 = 2 $$

где $m$ - номер группы, $c$ - количество групп.

Внутригрупповые изменчивость и степени свободы, т.е. насколько сильно значения разнесены внутри групп (Square Sum Within).

$$ SSW = \sum_m \sum_n (x_n - \overline{X}) =\\ [(3-2)^2 + (1-2)^2 + (2-2)^2] +\\ [(5-4)^2 + (3-4)^2 + (4-4)^2] +\\ [(7-6)^2 + (6-6)^2 + (5-6)^2] = \\ 2 + 2+ 2 = 6 $$

$$ dF_W = N - c = 9 - 3 = 6 $$

где $N$ - количество данных во всех 3 группах, $m$ - номер группы, $c$ - количество групп, $n$ - количество данных в одной группе.

Проанализируем рассчитанные результаты. Общегрупповая изменчивость $SST = SSB + SSW = 24 + 6 = 30$ и основная ее часть обусловлена межгрупповой изменчивостью. Можно предположить, что наши группы значительно различаются.

Рассчитаем формальный показатель, который позволит нам получить вероятность такого вывода: F критерий.

$$ F = \frac{\frac{SSB}{m-1}}{\frac{SSW}{N-m}} = \frac{\frac{24}{2}}{\frac{6}{6}} = 12 $$

Задача. Интерпретируйте значение F критерия на основании приведенной формулы.

Теперь нужно рассчитать вероятность такого события и подтвердить / опровергнуть 0 гипотезу. Если верна 0 гипотеза и наши выборки берутся из одного распределения, то их средние отличались бы от среднего ГС (а значит и друг от друга) случайно и крайне не значительно (согласно ЦПТ). При этом внутри выборок была бы своя изменчивость, которая больше в $\sqrt{n}$ раз, чем изменчивость между средними (согласно все той же ЦПТ).

Другими словами, $F$ критерий был бы меньше 1, а распределение (названное F-распределением или распределением Фишера) имело форму, представленную на рис. 40.

Рис. 40. F-распределение (изображение взято с en.wikipedia.org)

Примечание. Такая форма распределения вызвана тем, что большинство F-значений при соблюдении 0 гипотезы были бы очень маленькими.

Для нашего значения в 12 единиц, мы можем рассчитать вероятность по F-распределению аналогично предыдущим задачам с t-критерием. Используем таблицу или сайт с распределением.

Если вы воспользуетесь сайтом, то обратите внимание, что там используют одностороннее распределение, поскольку F не может принимать отрицательные значения (т.е. двусторонний критерий физически не существует).

И ответ. Вероятность получить отклонение в 12 единиц или более составляет 0.008, что значительно меньше порогового значения доверительной вероятности в $p=0.05$, а значит 0-ую гипотезу можно отклонить.

Примечание. Немного об обозначениях в дисперсионном анализе. Когда мы делим значение межгрупповой суммы квадратов на соответствующее число степеней свободы (число групп минус один), мы тем самым усредняем полученный показатель. Усредненное значение межгрупповой суммы квадратов называется межгрупповым средним квадратом.

$$ MS_{bg} = \frac{SSB}{df_{bg}} \\ df_{bg} = m - 1 $$

Отношение внутригрупповой суммы квадратов к соответствующему числу степеней свободы (число всех наблюдений минус число групп) — это внутригрупповой средний квадрат

$$ MS_{wg} = \frac{SSW}{df_{wg}} \\ df_{wg} = N - m $$

Поэтому формула F-значения (F-отношение) часто записывается как:

$$ F = \frac{MS_{bg}}{MS_{wg}} $$

Примечание. По своей сути дисперсионный анализ делает ту же работу, что и t-критерий - сравнивает 2 выборки с точки зрения их средних. Но его преимуществом является то, что сравнивать мы можем сразу несколько групп и как вы увидите далее, не только по одному фактору.

3.3.9 Множественное сравнение

Мы уже разобрали 2 основных критерия сравнений выборок: t и F критерии. И казалось бы, они выполняют одну и ту же работу: сравнивают выборки. Почему же нельзя использовать просто попарное сравнение и ограничиться этим? Поскольку такой подход вызовет эффект множественного сравнения. Именно по этой причине мы не можем взять t-критерий и начать просто сравнивать результаты (по парно).

Давайте смоделируем ситуацию, когда у нас есть генеральная совокупность и мы случайным образом извлекаем из нее выборки и попарно сравниваем их средние между собой.

false_alarm1 <- function(m, n, a) {
  # Создаем пустой дата фрейм с n наблюдениями (строками) и m выборками (столбцами)
  d <- data.frame(matrix(0, n, m))
  # Создаем матрицу возможных сочетаний переменных для будущего t-теста
  s <- combn(1:m, 2)
  # Создаем вектор с длинной 1000 для последующей записи 1000 извлечений выборок
  x <- vector("numeric", 1000)

  # Создаем собственную упрощенную версию t теста, которая возвращает только
  # p value (значительно ускоряет всю функцию), но можете воспользоваться и встроенной функцией
  t_test_pval <- function(x, y) {
    se <- sqrt((var(x) + var(y))/n)
    t_stat <- (mean(x) - mean(y))/se
    df <- n + n - 2
    pval <- 2*pt(abs(t_stat), df, lower.tail = F)
    pval
  }

  for (q in 1:1000) {
    d <- data.frame(apply(d, 2, function(i) rnorm(n)))
    # Заполняем пустой дата фрейм случайными выборками,
    # т.е. извлекаем из г.с. m-выборок
    for (i in 1:ncol(s)) {
      TEST <- t_test_pval(d[, s[1, i]], d[, s[2, i]])
      if(TEST < a) x[q] <- 1
      if(TEST < a) break
    }
}

x <- as.data.frame(table(x))
barplot(x$Freq, names.arg = c("No", "Yes"),
         col = c("Red", "Blue"),
         main = x$Freq[2]/1000*100,
         ylab = "Quantity",
         xlab = "significant differences",
         ylim = c(0,1000))
}

false_alarm1(2, 20, 0.05)

В результате 1000 кратного извлечения по 2 выборки из одной ГС при попарном сравнении средних мы получаем статистически значимое различие между 2 выборками из одной ГС в $\approx 5 %$ случаях совершенно случайно! И это при малом количестве извлекаемых выборок. Для 8 выборок потребуется произвести по $\frac{8 * (8-1)}{2} = 28$ сравнений. И если мы проведем эксперимент с попарным сравнением, то мы получим ложное статистически значимое различие уже в $\approx 52 %$ случаев! Проверьте это с помощью кода.

И чем больше попарных сравнений, тем больше ложных срабатываний!

Происходит это по тому, что чем больше попарных сравнений, тем больше шанс ошибиться. И тогда для каждого извлечения выборок с их попарным сравнением хотя бы одна ошибка, но произойдет, что приведет нас к ложному выводу для всей совокупности выборок.

Таким образом вредный совет: если вы ходите получить значимое различие - проведите один и тот же эксперимент 1000 раз и вы получите хотя бы одно значимое различие между данными разных подходов (рис. 41)…

Рис. 41. Пример эффекта множественного сравнения с https://xkcd.com.

Таким образом, при множественном сравнении нам необходимо корректировать порог р-уровня значимости, при котором мы принимаем решения. Это важно не только при попарном сравнении, но и в случае дисперсионного анализа при исследовании разных категориальных факторов. Поправки на множественное сравнение можно ввести разными путями.

Поправка Бонферони (популярная, но ее никто не любит) - предлагает пропорционально корректировать уровень значимости $\alpha$, при котором мы отвергаем 0 гипотезу пропорционально количеству парных сравнений $\alpha = \frac{\alpha}{n}$. Но проблема в том, что она очень грубая и мы можем очень сильно снизить порог отклонения 0 гипотезы (т.е. упустить реальные открытия).
Поправка Тьюки (Tukey HSD) - модифицирует t-критерий.
False Discovery Rate, etc.

Не стоит забывать и о ключевом приеме - грамотной обработке данных и планировании эксперимента. Нужно в 1-ую очередь правильно формулировать гипотезу и повторять сравнительные эксперименты для нее. Если она верна, то в большинстве случаем, вы найдете различия.

Более подробно о различных поправках предлагаю Вам посмотреть самим. Также за бортом осталась тема многофакторного сравнения и ANalysis Of VAriance (ANOVA), которая является логическим продолжением нашего подхода (неплохо написано в wiki). Если вам интересны эти темы и статистика в целом, предлагаю начать самостоятельное ознакомление с этих курсов на stepic.org:

3.4 Вопросы по разделу

Если мы провели исследование с целью выявить уровень знаний в области планирования эксперимента на 100 студентах кафедры химических технологий ЧГУ, то на какую совокупность мы можем распространить наши выводы?
Если объем выборки достаточно велик (больше 100), то является ли такая выборка репрезентативной.
Предположим, после лекции по статистике, один студент решил выяснить, как хорошо студенты психологического факультета разбираются в этом предмете. Он подготовил серию заданий и пригласил 30 своих друзей с факультета принять участие в тестировании. Исследователь утверждает, что он сформировал простую случайную выборку. Так ли это?
В каких случаях вместо среднего значения лучше использовать моду или медиану в качестве центральной тенденции?
Укажите, в какой из выборок наибольшее стандартное отклонение (задание решить без расчетов):
1. 1 3 2 4 5 7 1 8
2. 100 300 250 400 230 280 320 112
3. 15 10 13 7 28 31 20 32
Как соотносятся дисперсии двух выборок (постарайтесь решить данное задание не рассчитывая значения дисперсии, а ее свойствами):
- 1 3 5 6 6 7 9 11
- 5 7 9 10 10 11 13 15
Может ли стандартное отклонение принимать отрицательные значения?
Соотнесите распределения и ящики с усами (рис. q-1).

Рис. q-1.

Если отдельное наблюдение в нашей выборке равняется 1000, при условии, что выборочное среднее равняется 10, то:
- такое наблюдение в принципе не может принадлежать выборке со средним значением равным 10, так как в 100 раз больше, чем выборочное среднее, а вероятность такого события стремится к нулю;
- можно рассматривать как необычное (выброс), т.к. оно очень далеко отклоняется от среднего значения;
- чтобы судить о том, насколько необычным является это наблюдение для выборки, необходимо знать, чему равняется стандартное отклонение.
Считается, что значение IQ (уровень интеллекта) у людей имеет нормальное распределение со средним значением равным 100 и стандартным отклонением равным 15 (M = 100, sd = 15). Приблизительно рассчитайте какой процент людей обладает $IQ \ge 125$? А какой процент людей обладает $70 \ge IQ \le 112$?
Рассчитайте стандартную ошибку среднего при N = 100, если выборочное среднее равняется 10, а дисперсия 4.
Если мы рассчитали 95% доверительный интервал для среднего значения, то какие из следующих утверждений являются верными?
- Мы можем быть на 95% уверены, что истинное среднее значение принадлежит рассчитанному доверительному интервалу.
- Истинное среднее значение точно принадлежит рассчитанному доверительному интервалу.
- Истинное среднее значение точно превышает нижнюю границу 95% доверительного интервала.
- Если многократно повторять эксперимент, для каждой выборки рассчитывать свой доверительный интервал, то в 95 % случаев истинное среднее будет находится внутри доверительного интервала.
- Если многократно повторять эксперимент, то 95 % выборочных средних значений будут принадлежать рассчитанному нами доверительному интервалу.
Рассчитайте 99% доверительный интервал для следующего примера: $\bar{x}=10, sd=5, n=100$.
Выберете верные утверждения
- Чем меньше p уровень значимости, тем сильнее полученные различия.
- Если бы в исследовании мы получили p = 0.9, это означало бы, что верна нулевая гипотеза.
- Все утверждения неверны.
- Статистически значимый результат, всегда означает ценный и осмысленный результат.
- Если p уровень значимости равен 0.003, то вероятность того, что верна нулевая гипотеза (новый препарат не влияет на скорость выздоровления) также равняется 0.003.
Если в определенной ситуации весьма рискованно отклонить нулевую гипотезу, когда она на самом деле верна, то лучше использовать показатель $\alpha$:
- 0.001,
- 0.05,
- 0.1,
- 0.5?
Для выборки в 15 наблюдений при помощи t-теста проверяется нулевая гипотеза, что $\mu=10$. Рассчитанное t-значение = -2 (t = -2). Рассчитайте p-уровень значимости для такого события (можете использовать уже знакомый нам сайт, укажите в настройках, что вы работаете с t - распределением и выберите нужное число степеней свободы).
В первом эксперименте для сравнения двух средних $\bar{X_{1}}=17, \bar{X_{2}}=16$ применялся t-критерий Стьюдента, и эти различия оказались значимы (p = 0.001). Во втором исследовании, также при помощи t - критерия, сравнивались два средних $\bar{X_{1}}=17, \bar{X_{2}}=36$ и эти различия не значимы при p = 0.8. В чем может быть причина таких результатов?
- Возможно, во втором эксперименте больше объем выборок и меньше изменчивость исследуемого признака.
- Возможно, в первом эксперименте больше объем выборок и меньше изменчивость исследуемого признака.
- Ни размер выборки, ни изменчивость исследуемого признака не может быть причиной таких результатов.
Соотнесите распределения и qq-plot.

Рис. q-2.

Если для проверки нормальности распределения на выборке в 100 наблюдений мы применили Shapiro-Wilk test и получили p-уровень значимости, равный 0.001, то:
- распределение является бимодальным;
- распределение значимо отклоняется от нормального.

4. Построение точных моделей. Аналитическая практика

Пришло время заключительной части нашего курса - применение полученных знаний для построения точных моделей и градуировочных зависимостей, которые часто используются в аналитической химии. Однако для этого нам понадобится понимание новых тем статистического анализа: корреляции и регрессии.

4.1 Корреляция

Корреляция - степень взаимосвязи переменных. Насколько одна переменная статистически связана с другой. В нашем случае мы рассмотрим две переменный и разберемся что такое положительная и отрицательная корреляция и о чем нам может сказать коэффициент корреляции.

Надеюсь что смог вас убедить, что одним из самых простых способов что-либо понять является визуализация. Давайте рассмотрим следующие примеры взаимосвязи 2 величин (рис. 42).

Рис. 42. Примеры корреляции 2 величин (взято с сайта CQE Academy).

На осях графика обычно откладывают значения соответствующих переменных и оценивают их вид взаимосвязи (как изменение одной переменной будет сказываться на изменении другой переменной).

Например, на подобном визуальном анализе взаимосвязей основан довольно широко используемый в анализе больших массивов данных метод попарного сравнения признаков (рис 43).

Рис. 43. Пример использования попарного сравнения признаков для 3 типов объектов в data science.

Такой тип графиков называется диаграмма рассеяния (scetterplot) и многие статистические пакеты (включая R и MS Exel) обладают удобными механизмами их построения и показывают значения 2 переменных для каждого из исследованных объектов.

После того, как мы поняли и увидели корреляцию, нужно добавить объективности - ввести некий показатель, который оценивал бы в численном виде степень и вид взаимосвязи наших величин. И такой показатель есть - это коэффициент корреляции ($r$).

Давайте попробуем логически вывести данный коэффициент. Воспользуемся для этого связью 2 переменных (рис 44).

Рис. 44. Вывод коэффициента корреляции.

Обозначим на графике средние 2 признаков. Наша диаграмма рассеивания разбилась на 4 области, которые обозначают тип взаимосвязи в зависимости от кодированного значения признака (положительная или отрицательная). Анализируя количество данных в каждом квадрате мы можем выяснить знак корреляции.

Следующий шаг - рассчитаем отклонение каждого значения от среднего, сложим и усредним эти отклонения с учетом степеней свобод:

$$ (x_i - \overline{X})(y_i - \overline{Y}) \\ \sum_i (x_i - \overline{X})(y_i - \overline{Y}) \\ cov = \frac{\sum_i (x_i - \overline{X})(y_i - \overline{Y})}{N-1} $$

Полученный показатель называется ковариацией.

Обратите внимание, что знак этого произведения будет зависеть от того, в каком из 4 квадратов находятся наши данные. В нашем случае большинство из рассчитанных отклонений положительные, поскольку большая часть точек находится в I или III квадрате.

Полученный параметр показывает нам силу и тип взаимосвязи переменных: чем он больше, тем сильнее связаны переменные, а знак ковариации показывает нам направление связи.

Осталось добавить последний штрих: сделать нашу ковариацию универсальной для сравнения различных величин. Для этого нужна нормировка (чтобы уйти от абсолютных величин). Полученную ковариацию нужно разделить на величину изменчивости обоих признаков, т.е. на их стандартные отклонения:

$$ r_{xy} = \frac{cov}{\sigma_x \sigma_y} \in [-1; 1] $$

Задача. Как вы думаете, почему нужно уходить от абсолютных величин, чем это мешает нам в случае сравнения?

Таким образом мы получили коэффициент корреляции (или коэффициент корреляции Пирсона). Многие из вас знакомы с коэффициентом корреляции и представляли его слегка по другому, давайте произведем некоторые дополнительные вычисления:

$$ r_{xy} = \frac{cov_{xy}}{\sigma_x \sigma_y} = \\ \frac{\sum (x_i - \overline{X})(y_i - \overline{Y})}{(N-1)\sigma_x \sigma_y} = \\ \frac{\sum (x_i - \overline{X})(y_i - \overline{Y})}{(N-1)\sqrt{\frac{\sum (x_i - \overline{X})^2}{N-1}}\sqrt{\frac{\sum (y_i - \overline{Y})^2}{N-1}}} = \\ \frac{\sum (x_i - \overline{X})(y_i - \overline{Y})}{\sqrt{\sum (x_i - \overline{X})^2}\sqrt{\sum (y_i - \overline{Y})^2}} $$

Я думаю именно в таком виде вы могли быть знакомы с коэффициентом корреляции.

Посмотреть, как коэффициент корреляции влияет на связь величин вы можете на сайте.

На том же сайте приведена еще одна важная величина - коэффициент детерминации (или общей дисперсии, shared variance), который равен квадрату коэффициента корреляции и показывает какая часть изменчивости одной переменной может быть объяснена другой переменной (т.е. насколько сильно одна дисперсия зависит от другой): $R^2 \in [0; 1]$. Более подробны мы рассмотрим его в случае линейной регрессии.

Пример. Давайте используем коэффициент корреляции для проверки статистических гипотез на примере случайно сгенерированных данных. Пусть

$$ H_0: r_{xy}=0 \\ H_1: r_{xy} \neq 0 $$

Обратите внимание - мы сформулировали двунаправленную альтернативную гипотезу (т.е. не говорим в какую сторону направлена зависимость, просто говорим, что ее нет и выборки не связаны).

Рассчитаем р-уровень значимости на основании t-критерия для $dF = N-2$ степеней свобод (т.к. работаем с 2 переменными). Мы не будем подробно останавливаться на расчете, для него я рекомендую использовать специализированное ПО (в нашем случае RStudio):

N <- 50
x <- rnorm(n = N, mean = 0, sd  = 1)  # генерируем данные
y <- rnorm(n = N, mean = 0, sd  = 1)  # генерируем данные
plot(x, y, lwd=5)
cor.test(x, y)

Результатом будет примерно следующее (график изучите сами в RStudio):

data:  x and y
t = 1.2265, df = 48, p-value = 0.226
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.1093331  0.4317197
sample estimates:
      cor
0.1743197

Обратите внимание, что мы рассчитали коэффициент корреляции, t-статистику и р-уровень значимости для нее. На основании полученных данных нельзя отвергнуть 0 гипотезу, а значит данные действительно случайны (что и требовалось доказать).

Как вы думаете, если коэффициент корреляции равен 0,7, то такая взаимосвязь всегда будет статистически достоверна (p - уровень значимости обязательно будет меньше 0.05)?

Так вот нет. Высокая корреляция не обязательно означает статистически значимую взаимосвязь. Чтобы говорить о взаимосвязи, нужно иметь представление о степенях свободы (т.е. на скольких измерениях сделан подобный вывод). Если у нас df = 3, то есть, всего 5 наблюдений в каждой из выборок, то мы должны получить коэффициент корреляции, равный или больший, чем 0.98769, чтобы p-value стал меньше 0.05 и мы смогли утверждать о том, в ГС коэффициент корреляции не равен нулю (данные взяты из таблиц)! Того же вывода можно добиться изменяя число степеней свобод в коде R, приведенном выше. В любом случае, нам нужно рассчитывать р-уровень значимости и анализировать статистические гипотезы, чтобы быть уверенными в наличии взаимосвязи в ГС.

Примечание. Именно по этому в аналитической химии всегда требуются высокие коэффициенты корреляции. На основании малого количества данных (обычно 5 точек для градуировки) нам нужно сделать вывод обо всей генеральной совокупности (все возможные подобные эксперименты при данных условиях).

Условия применения коэффициента корреляции Пирсона.

Как и у любого другого статистического критерия, в нашем случае есть некоторые особенности и ограничения в применении критерия корреляции.

Характер взаимосвязи данных должен быть линейный и монотонный (можете подробнее поискать определения данных слов в википедии). Возможно, для этого придется разбивать вашу выборки на отдельные диапазоны - подвыборки (частый прием в аналитической химии).
Должны быть соблюдены следующие характеристики переменных: отсутствие выбросов и нормальность распределения (поскольку идея коэффициента корреляции связана со средним значением, а его представительность как центра очень чувствительна к этим условиям).
Всегда помните: корреляция не доказывает причинно-следственную связь! Выявление такой связи - задача не метода, а экспериментатора. Никакой статистический метод не установит причины. Он лишь покажет как факторы связаны друг с другом и может подтвердить значимость различий, а выводы - делайте сами.
Всегда помните о возможном наличии 3-ей переменной. Это такая переменна, которую мы не рассматриваем, но которая связана с 1 и 2 рассматриваемым признаком и обеспечивает их корреляцию (поищите в интернете “интересные корреляции” и подумайте, какая там может быть третья переменная. Или вот, статья на хабре).

Если с выполнением необходимых условий у нас проблемы, можем использовать некоторые непараметрические аналоги, например коэффициент корреляции Спирмана или тау Кендалла (переходят от реальных значений к ранжированным, т.е. к медиане, как мере центральной тенденции).

Коэффициент корреляции Спирмана:

$$ r_s = 1 - \frac{6 \sum_i d_i^2}{N(N^2-1)} $$

где $d$ - разность рангов.

Пример. Рассчитаем коэффициент корреляции Спирмана для следующих данных:

X	Y	rank X	rank Y	d^2
3	-1	1	1	0
5	4	2	4	4
7	4.5	3	5	4
9	8.5	4	7	9
10	12	5	10	25
11	8	6	6	0
11.5	9	7	9	4
12	9	8	8	0
14	18	9	12	9
17	17	10	11	1
30	1	11	2	81
32	2	12	3	81

Тогда $r_s = 0.23$, при $r = -0.1$, что все-таки лучше, чем ничего.

4.2 Регрессия с одной независимой переменной

Следующим шагом является построение линейной модели и оценка ее статистической значимости. Мы уже сталкивались с таким заданием при планировании и анализе эксперимента. Здесь мы приведем некоторые статистические особенности таких моделей и способа их построения. Для этого мы рассмотрим одномерный регрессионным анализ, который позволяет проверять гипотезы о взаимосвязи одной количественной зависимой переменной (отклик) и несколькими независимыми переменными (измеряемые значения). Но в нашем случае мы разберем самый простой и наиболее часто встречающийся вариант - простой линейной регрессией. С помощью этого метода можно исследовать взаимосвязь только двух переменных, но принцип работы и интерпретация результата будут аналогичны любой регрессии. Частным примером являются градиуровочные кривые (или уравнения связи) для аналитических методов (когда мы пытаемся найти концентрацию в зависимости от аналитического сигнала).

Вот несколько важных терминов:

зависимая переменная (отклик, располагается на оси 0Y) - для которой ищем уравнение (т.е. пытаемся рассчитать ее из эксперимента).
независимая переменная (фактор, предиктор, располагается на 0X) - та, которую измеряем в ходе эксперимента.
линия регрессии - линия, отображающая направление взаимосвязи и описывающая распределение данных (т.е., чтобы каждая точка была максимально близко к нашей линии при прохождение ее через центр облака точек).

Давайте попробуем рассчитать положение интересующей нас линии, которая покажет нам взаимосвязь 2 переменных. Общее уравнение прямой:

$$ y = b_0 + b_1 x $$

где $b_0$ - свободный член (intercept, отвечает за то место, где наша линия пересекает ось 0Y); $b_1$ - наклон, чувствительность (slope, отвечает за направление линии (верх/низ) и угол наклона линии).

Примечание. Рекомендую вернуться к 1 части планирования эксперимента и соотнести модели экспериментов с материалом по линейной регрессии.

Для нахождения коэффициентов (параметры линейной регрессии) используется уже упоминавшийся метод наименьших квадратов (МНК). Из названия следует, что этот метод минимизирует сумму квадратов отклонений (остатков) каждой точки от прямой.

Рис. 44. Принцип работы МНК для построения линейной регрессии.

Задача. Вспомните/подумайте почему мы используем квадрат остатков с точки зрения статистики?

Вывод формул мы оставим за кадров и напишем только конечные формулы для коэффициентов:

$$ b_1 = \frac{sd_y}{sd_x} \cdot r_{xy} \\ b_0 = \overline{Y} - b_1 \cdot \overline{X} $$

Задача. Проанализируйте коэффициенты с точки зрения входящих в них компонентов. Какой коэффициент и как отвечает за направление прямой и почему?

Таким образом, с использованием регрессии мы можем не только определить направление и силу взаимосвязи (это нам позволяет сделать и коэффициент корреляции), но и получить математическую модель, по которой потом будем строить предположения ($\hat{y}$) и сравнивать их с реальными данными ($y$).

Однако мы ведь все оцениваем критически, помните? Поэтому следующим логичным вопросом, после построения модели будет: “а на сколько статистически значимым будет взаимосвязь 2 наших величин?”

Как вы думаете, какой коэффициент отвечает за это? Правильно, $b_1$. Именно он отвечает за направление и угол наклона прямой (и в его формулу входит коэффициент корреляции).

Подтвердить это поможет простой мысленный эксперимент. Представим, что связь между величинами отсутствует (можете воспользоваться сайтом с моделью, чтобы проверить свои предположения). Тогда коэффициент корреляции будет равняться 0, а $b_0 = \overline{Y}$. И наша прямая пройдет параллельно оси 0Х.

Таким образом мы можем сформулировать статистическую гипотезу для проверки:

$$ H_0: b_1 = 0\\ H_1: b_1 \neq 0 $$

И снова мы можем использовать t-критерий, который говорит, что если верна 0 гипотеза, то при многократном выборе нашей выборки с 2 переменными из ГС полученные коэффициенты $b_1$ распределились бы относительно 0 по t-виду.

Таким образом: $t = \frac{b_1 - 0}{se(b_1)}$, а число степеней свобод будет $dF = n-2$ (как и в случае с коэффициентом корреляции). При этом, $se(b_1) = \sqrt{\frac{1}{n-2} \frac{\sum (y_i - \hat{y_i})^2}{\sum (x_i - \overline{x})^2}}$. Таким образом мы сможем рассчитать вероятность, зная коэффициент $b_1, se(b_1), dF$.

Примечание. При построении линейных моделей на практике обычно принимается, что переменные взаимосвязаны и зная одну, можно вычислить другую. В таком случае можно не проверять статистические гипотезы. Для этого мы используем сканирующие эксперименты.

Примечание. Приведу разбор формулы для расчета стандартной ошибки наклона (standard error of slope) поскольку найти его оказалось довольно сложно. Чтобы лучше понимать почему формула имеет именно такой вид, нужно ее преобразовать:

$$ se(b_1) = \sqrt{\frac{1}{n-2} \frac{\sum (y_i - \hat{y_i})^2}{\sum (x_i - \overline{x})^2}} =\\ \sqrt{\frac{1}{n-2} \frac{\sum (y_i - \overline{y})^2}{\sum (x_i - \overline{x})^2} \frac{\sum (y_i - \hat{y_i})^2}{\sum (y_i - \overline{y_i})^2}} = \\ \sqrt{\frac{1}{n-2}} \sqrt{\frac{\frac{1}{n-1} \sum (y_i - \overline{y})^2}{\frac{1}{n-1} \sum (x_i - \overline{x})^2 }} \sqrt{\frac{SS_{error}}{SS_{total}}} = \\ \sqrt{\frac{1}{n-2}} \sqrt{\frac{sd(y)^2}{sd(x)^2}} \sqrt{\frac{SS_{total} - SS_{model}}{SS_{total}}} = \\ \sqrt{\frac{1}{n-2}} \frac{sd_y}{sd_x} \sqrt{1- R^2} $$

Другими словами, стандартная ошибка для коэффициента наклона включает в себя отношение стандартных ошибок поеременных с учетом корня из степеней свободы, с поправкой на степень “объясненного отклонения”: $\sqrt{\frac{SS_{error}}{SS_{total}}}$ (какое количество отклонения от общей дисперсии данных наша модель смогла объяснить).

4.3 Коэффициент детерминации

В предыдущем разделе мы напрямую столкнулись с понятием “объясненной ошибки”. Кроме того, мы сталкивались с ним, когда изучали коэффициент корреляции.

Это понятие выражается коэффициентом $R^2$ - доля дисперсии зависимой переменной (Y), объясняемая регрессионной моделью и формула для его расчета:

$$ R^2 = 1 - \frac{SS_{res}}{SS_{total}} $$

где $SS_{res}$ - сумма квадратов остатков, а $SS_{total}$ - сумма квадратов общая (расстояние от наблюдения до среднего значения). Можете попробовать математически сравнить эту формулу и формулу для коэффициента корреляции.

По своей сути, коэффициент детерминации определяет отличие получившейся прямой от линии среднего значения (когда верна наша 0-ая гипотеза).

Тогда, если $R^2 \approx 1$, т.е. $SS_{total} >> SS_{res}$, то можно сказать, что практически 100% изменчивости нашей зависимой переменной (Y) обусловлены связью с независимой переменной X.

Примечание. Коэффициент детерминации и коэффициент корреляции не взаимосвязаны на логическом уровне. Каждый из них выполняет свою задачу, но в определенных условиях они связаны математически.

Не стоит забывать об ограничениях для применения одномерного регрессионного анализа:

линейная взаимосвязь X и Y;
нормальное распределение остатков;
гомоскадестичность - постоянная изменчивость остатков на всех уровнях независимой переменной. Другими словами - наши отклонения должны быть случайны и не содержать никакой систематической погрешности.

Вот примеры подобных проверок для регрессионной модели. Настоятельно рекомендую изучить все приведенные там случаи и повторить все у себя в RStudio (возьмите код на вооружение для собственных проектов).

Рекомендую поискать различные примеры применение регрессионного анализа и интерпретация результатов , например на курсах в ссылках.

4.4 Заключение

Итак, мы научились строить статистически обоснованную математическую модель и даже оценивать ее достоверность. Но какая же практическая польза от всего этого? Довольно простая - предсказание значений зависимой переменной внутри области работы модели.

Саму модель часто называют линией тренда, что говорит само за себя. И чтобы рассчитать предсказанное значение - нужно просто решить уравнение, при подстановке экспериментально полученного $x$.

Однако не стоит забывать о существующих ограничениях для линейного регрессионного метода.

Модель не несет в себе физического смысла и поэтому может выдавать абсолютно некорректные значения при определенных признаках X.
Линейность системы обычно сохраняется на небольших интервалах и за пределами их часто ведет себя по другому (именно по этому важно перестраивать модель и проводить новые эксперименты - смотри первую часть курса).
Модель определена только в диапазоне данных, по которым она строилась, и выходить за пределы этих данных крайне опасно.
Требование к исходным данным, перечисленные ранее.

Развитием рассмотренной линейной регрессии является множественная линейная регрессия, которая позволяет исследовать взаимосвязь одной зависимой и нескольких независимых переменных (как они влияют на нее и какой вклад вносят в модель). По факту - мы уже работали с этими моделями при планировании и анализе факторного эксперимента. На всякий случай освежим в памяти некоторые аспекты множественной регрессии.

Общий вид уравнения линейной множественной регрессии: $\hat{y} = b_0 + b_1 x_1 + b_2 x_2 + \dots$.
Метод наименьших квадратов также позволяет строить модели в n-мерном пространстве признаков. Но теперь остатки - это не расстояние до линии модели, а расстояние до плоскости модели или просто отклонение от n-1 мерной модели.
Необходимо предварительная проверка на мультиколлинеарность (мы должны использовать только независимые друг от друга признаки, иначе МНК не сможет работать по законам линейной алгебры). Для этого часто оценивают попарную взаимосвязь признаков (рис. 43).
Прочие требования для одномерной регрессии.
Для аналитически точных моделей нужно использовать число данных в общем случае в 3 раза больше, чем исследуемых факторов. Если этого не сделать - модель “переобучится”, т.е. она слишком хорошо настроится на тестовые данные, но предсказывать реальные данные будет плохо.
Важно использовать исправленный коэффициент детерминации $R^2$ (причина аналогична попарному сравнению).

Мы не будем подробно рассматривать данный подход со статистических позиций в настоящем курсе. Если вам интересно разобраться в этой и прочих не освещенных, но упомянутых темах - рекомендую вам изучить курсы, приведенные в списке литературы.

4.5 Вопросы по разделу

Если при исследовании взаимосвязи двух переменных коэффициент детерминации оказался равен 0.25 то
- Коэффициент корреляции равен 0.0625
- Коэффициент корреляции равен - 0.5
- Коэффициент корреляции равен 0.5
- Коэффициент корреляции равен 0.5 или -0.5
Укажите, на каких графиках значение коэффициента корреляции Пирсона приблизительно равняется нулю.

Рис. q-3.
Если по результатам исследования мы обнаружили значимую положительную корреляцию уровня преступности и уровня безработицы, то это означает, что:
- Результаты только корреляционного исследования не позволяют нам делать вывод о причинно - следственной связи.
- Безработица - причина преступности.
- Преступность - причина безработицы.
Исследователь решил выяснить, существует ли значимая корреляция между словарным запасом школьников и их физическими особенностями. В исследовании приняло участие 11 классов (с 1 по 11 класс, по 30 человек в каждом классе) некоторой школы. Оказалось, что существует значимая положительная корреляция этих двух показателей (r = 0.7, p < 0.05). Исследователь размышляет, какой вывод он может сделать, основываясь на этих данных:
- Доказано влияние роста на словарный запас.
- Доказано влияние словарного запаса на рост.
- Причиной данных результатов, вероятнее всего, является влияние третьей переменной (в каком классе учится школьник), если учесть этот показатель, то значимая взаимосвязь между ростом и словарным запасом не будет обнаружена.
Соотнесите графики, на которых изображена регрессионная прямая, и значения коэффициентов $b_1$ и $b_0$ в уравнении регрессии: $\hat{y} = b_{0} + b_{1} \cdot x$. ($b_1 > 0; b_0 > 0$, $b_1 > 0; b_0 < 0$, $b_1 < 0; b_0 > 0$).

Рис. q-4.
Укажите верные высказывания:
- Чем больше коэффициент детерминации, тем большая часть дисперсии зависимой переменной обусловлена взаимосвязью с независимой переменной.
- Если коэффициент детерминации равен нулю, то и коэффициент $b_0$ (intercept) также равен нулю.
- Если коэффициент детерминации равен нулю, то и коэффициент $b_1$ (slope) также равен нулю.
- Коэффициент детерминации может быть равен единице только в том случае, если корреляция между переменными положительная и равна 1.
В случае линейной взаимосвязи двух переменных распределение остатков:
- будет стремиться к нормальному со средним значением, приблизительно равным нулю;
- будет иметь несколько мод;
- будет обладать явно выраженной ассиметрией.
Если в нашей модели коэффициент $b_{1}$ оказался не равен нулю, означает ли это, что обнаружена статистически значимая взаимосвязь (p < 0.05) между исследуемыми переменными?
- Да, коэффициент $b_1$, не равный нулю, всегда означает, что мы отклоняем нулевую гипотезу
- Нет, коэффициент $b_1$, не равный нулю, не всегда означает, что мы отклоняем нулевую гипотезу
- Нет, коэффициент $b_1$ не отвечает за угол наклона регрессионной прямой, его значение никак не влияет на направление взаимосвязи
Основываясь на результатах исследования, укажите верные утверждения.

	Estimate	Std. Error	t value	p value
Intercept	58.70	6.452	9.100	0.000
Age	1.463	0.1023	14.30	0.000

В таблице представлены результаты исследования, посвященного взаимосвязи кровяного давления и возраста у людей в возрасте от 45 до 70 лет. Исследователи применили регрессионный анализ, где в качестве зависимой переменной выступало кровяное давление (pressure), а в качестве независимой переменной - возраст пациентов (age). Согласно полученным результатам, уравнение регрессии будет выглядеть следующим образом:

Pressure = 58.7 - 1.46*Age
Pressure = 1.46 - 58.7*Age;
Pressure = 1.46 + 58.7*Age;
Pressure = 58.7 + 1.46*Age.

Выберите все подходящие ответы из списка.

Обнаружена статистически значимая отрицательная взаимосвязь исследуемых переменных.
С каждым единичным положительным изменением независимой переменной (возраста), ожидаемые значения зависимой переменной (давления) уменьшаются на 58.7.
Обнаружена статистически значимая положительная взаимосвязь исследуемых переменных.
С каждым единичным положительным изменением независимой переменной (возраста), ожидаемые значения зависимой переменной (давления) увеличиваются на 1.46.

В данном исследовании коэффициент детерминации оказался равен 0.95. Как мы можем проинтерпретировать этот результат? Укажите все верные высказывания.

Коэффициент корреляции между нашими переменными близок к 1.
Коэффициент корреляции между переменными близок к 1 или к -1 (но для однозначного ответа недостаточно данных).
Коэффициент корреляции между нашими переменными близок к -1.
Все точки лежат практически на регрессионной прямой.
95 % изменчивости зависимой переменной (давление) объясняется нашей моделью.

Вообразим мысленный эксперимент. Мы решили исследовать взаимосвязь стоимости (зависимая переменная) и площади квартир (независимая) в городе N. Для этого сформировали выборку из 30 наблюдений и получили, что коэффициент детерминации равен 1 (все наши наблюдения лежат на регрессионной прямой). Означает ли это, что при помощи нашей модели мы можем абсолютно точно предсказывать любые значения стоимости не вошедших в наш анализ квартир, основываясь на их площади?
- Да, коэффициент детерминации, равный единице означает 100 \% по точности прогноз.
- Нет, столь сильная взаимосвязь наших переменных в выборке не означает, что все не включенные в анализ наблюдения также лягут на регрессионную прямую.
- Да, так это означает, что и в генеральной совокупности коэффициент корреляции между стоимостью и площади квартир равен 1.

Литература

Wordcloud of news or dialog from vk.com social network

2018-08-12T12:23:00+03:00

Greetings!

Let’s do a job like parsing reddit.com. It is devoted to accumulating and analyzing a news feed or dialogues in vk.com social network. The obtained information is used to create a database. In my case there are 2 goals:

to perform a one-time analysis of all my dialogues in the social network vk.com;
to analyze 200 news posts from my news feed every time I turn on my computer.

The goals set include a set of tasks:

to choose necessary libraries;
to find addresses for parsing and understand its logic;
to create a function for parsing the necessary information;
to organize accumulation of information;
offer a way of processing the received information and any useful result.

This theme is actual because of global distribution of algorithms of accumulation and analysis of big data. The received information can be used for surface analysis of own behavior and interests and also as an interesting avatar.

Fig. 1. Example of script result for my dialogues.

This work was supported by personal interest and excellent documentation vk.com, and do not forget about Google.

I shall specify some features:

the code is written, tested and works in Linux system Ubuntu 18.04 x64;
Python 2.7 and vk API are used.

At the beginning of each chapter you will find the code with comments. Some explanations also will be provided if necessary. Thus, let’s get down to business.

1. News feed analysis

1.1 Select of required libraries

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-

    from PIL import Image
    from os import path
    from wordcloud import WordCloud
    import pymorphy2
    import time
    import re
    import numpy as np
    import random
    import pandas as pd

    from nltk.corpus import stopwords
    from collections import Counter
    import re
    import vk


    # -31480508 pikabu - You can see it as group id in browser bar
    # -20629724 habrahabr
    # -34274053 moscow
    # -129636704 space (#ВКосмосе)
    # -77270571 geektimes
    # -46252034 naked science
    # -227 MSU

The absence of libraries for requesting web information (request, fake_user) is caused by the presence of a special “language” of communication with vk.com - API and its framework for python (i.e. adapted library).

As a useful action it is proposed to build cloud of the most frequently occurring words - for this purpose you also need python libraries (wordcloud, numpy), including for work with text (nltk, collection, pymorphy). Logic of work: you need to get information from the vk.com (through API), process it, add it to the database, save the database on disk, calculate the frequency of words in the database, build a cloud of words (useful result).

It should be pointed out that this code can be run directly from the command line without specifying an interpreter (because of #!/usr/bin/env python line). The second part of the header is necessary for correct work with the utf-8 and unicode (# -*- coding: utf-8 -*-).

1.2 Initializing API

To work with the API, we will need access, which is provided by vk.com. The token (a long and unique set of numbers and letters) is responsible for access. We will also need to initialize the session.

    access_token = "you_token_hear"
    session = vk.Session(access_token=access_token)
    vkapi = vk.API(session, v='5.71')

Note that you need to pay attention to the version of the API and what commands are present or changed in it (but this is on the future or if something breaks). And while it works - do not touch).

You can get a token by registering the application in the VK and sending a specific request in the browser address bar. You can find more information about this in official documentation. It is important to pay attention to the token validity period, user ID and access rights for the application.

Be careful! Do not allow other people’s applications to access your personal data!

1.3 Take information and make logs

    def log_write(feature, value=None):
        '''
        :param feature: name of logging feature
        :param value: the value of logging feature
        :return: None
        '''
        # Write data to log file
        f_log = open('/home/username/scripts/vk_log.txt', 'a')
        f_log.write(feature + value)
        f_log.close()


    def getLikes(user_id, cnt, vkapi):
        '''
        :param user_id: vk user id
        :param cnt: number of post in thousand
        :param vkapi: vk API object
        :return: posts data dictionary
        '''
        subscriptions_list = vkapi.users.getSubscriptions(user_id=user_id,extended=0)['groups']['items']
        # we form the list of id, which needs to be passed in the following method
        groups_list = ['-' + str(x) for x in subscriptions_list]
        # we form newsfeed
        all_newsfeeds = []
        newsfeed = None
        for c in range(cnt):
            if c == 0:
                kwargs = {
                    'filters': 'post',
                    'source_ids': ', '.join(groups_list),
                    'count': 100,
                }
                newsfeed = vkapi.newsfeed.get(**kwargs)
            else:
                next_from = newsfeed['next_from']
                kwargs = {
                    'start_from': next_from,
                    'filters': 'post',
                    'source_ids': ', '.join(groups_list),
                    'count': 100,
                }
                newsfeed = vkapi.newsfeed.get(**kwargs)
            all_newsfeeds.append(newsfeed['items'])
            time.sleep(1)
        # Process all news with its keys (json structure)
        all_keys = []
        for portion in all_newsfeeds:  # portion of news (100)
            for post in portion:  # each news in portion
                for key in post:
                    if key not in all_keys: all_keys.append(key)
        # set output dictionary structure
        post_data = {}
        for key in all_keys:
            post_data[key] = []
        # Collect data from newsfeeds
        for portion in all_newsfeeds:
            for post in portion:
                try:
                    for key in post_data:
                        if key in post:
                            post_data[key] += [post[key]]
                        elif key not in post:
                            post_data[key] += ['None']
                except KeyError as var:
                    pass
        return post_data

Thus, we wrote a function to get information about the last cnt*100 posts of %%username. And we made up a simple function for logging to know the status of program execution.

Now it’s a small thing to save the obtained information in the form of a matrix of “object-features” and process the texts.

1.4 Working with functions and accumulate the information

    # Start log file
    log_write('', str(time.asctime()) + '\t')

    user_id =  # your id (int)
    all_data = getLikes(user_id, 2, vkapi)  # Scan 2 * 100 = 200 news posts

    log_write('\t message download: ', str(len(all_data['text'])))

    # If need human-readable data
    # import datetime
    # for data in all_data['date']:
    #     print datetime.datetime.fromtimestamp(
    #         int(data)
    #     ).strftime('%Y-%m-%d %H:%M:%S')

    # Add data to exist df and save it
    len_old = 0
    len_new = 0
    try:
        final_df_new = pd.DataFrame.from_dict(all_data, orient='columns')
        final_df_old = pd.read_pickle('/home/username/scripts/vk_news_df')
        len_old = len(final_df_old.index)
        final_df_old = final_df_old.append(final_df_new, ignore_index=True)
        final_df_old.drop_duplicates(subset=['post_id'], inplace=True)
        final_df = final_df_old.copy()
        len_new = len(final_df.index)
    # write number of new mwssage into log file
        log_write('\t new news message: ', str(len_new - len_old))
    except IOError:
        # Create new file
        final_df = pd.DataFrame.from_dict(all_data, orient='columns')
        log_write('\t new news message: ', str(len(final_df.index)))

        # Save df to file
    final_df.to_pickle('/home/username/scripts/vk_news_df')

The logic of the work on creation and replenishment of the database is similar to the article about scientific news: get new information - check the possibility of open the save database - create a new Data Frame - merge two Data Frames - delete duplicated rows (by the id=news column) - save the updated database.

1.5 Processing and output of information

We are moving to the final stage - processing and output of information. We will process the last 200 news posts and output a cloud of the most frequently occurring words.

    news_to_process = 200
    ind_all = final_df.index
    all_text = final_df.loc[ind_all[-news_to_process:], ['text']]
    tag_re = re.compile(r'(<!--.*?-->|<[^>]*>)')
    # Remove well-formed tags, fixing mistakes by legitimate users
    # clear each post from tag and whitespaces
    all_text = [re.sub(' +',' ',tag_re.sub(' ', x[0])) for x in all_text.values]
    list_in = [all_text]
    list_out = ['']

    for t in range(len(list_in)):
        self_messages = list_in[t]
        str_data = ' '.join(self_messages)
        str_data = str_data.lower()
        def checkGood(symb):
            good1 = 'ёйцукенгшщзхъэждлорпавыфячсмитьбю'.decode('utf-8')
            good2 = u'ёйцукенгшщзхъэждлорпавыфячсмитьбю'
            if symb in good1:
                return True
            elif symb in good2:
                return True
            else:
                return False
        text = ''
        for i in str_data:
            if i == ' ' or i == '\n':
                text += ' '
            else:
                if checkGood(i):
                    text += i
                else:
                    text += ''
        text = re.sub(' +',' ', text)    
        str_data = text[:]
        # Normalize of word form
        morph = pymorphy2.MorphAnalyzer()
        text = ''
        for i in str_data.split(' '):
            p = morph.parse(i)[0]
            text += p.normal_form + ' '
        str_data = text[:]
        # Stop words check
        stop_words = stopwords.words('russian')
        stop_words.extend([u'что', u'это', u'так',
                           u'вот', u'быть', u'как',
                           u'в', u'—', u'к',
                           u'на', u'ок', u'кстати',
                           u'который', u'мочь', u'весь',
                           u'еще', u'также', u'свой',
                           u'ещё', u'самый', u'ул', u'комментарий',
                           u'английский', u'язык'])
        words = str_data.split(' ')
        w_before = len(words)
        words = [i for i in words if i not in stop_words]
        w_after = len(words)
        log_write('\t raw and tidy words: ', str([w_before, w_after]) + '\n')
        str_data = ' '.join(words)
        list_out[t] = str_data[:]

    str_news = list_out[0]
    # Create wordcloud
    alice_mask = np.array(Image.open("/home/username/scripts/gear2.png"))
    wc = WordCloud(background_color="white", mask=alice_mask, collocations=False)
    wc.generate(str_news)

    def grey_color_func(word, font_size, position, orientation, random_state=None, **kwargs):
        #50 shades of white
        return "hsl(0, 0%%, %d%%)" % random.randint(60, 100)

    default_colors = wc.to_array()
    wc2 = wc.recolor(color_func=grey_color_func, random_state=3)
    # store to file
    wc2.to_file("/home/username/conky/scripts/news_raw.png")

The logic of the code is as follows: Selection of all headings from the database - clearing text from html tags and extra spaces - processing of all text in a cycle - removal of all that is not letter* - repeated removal of extra spaces - morphologization of words (set it to “normal” form) - removal of “stop” words (most frequently occurring, such as articles, pronouns, etc.) - output of one big line of words and spaces between them.

Fig. 2. Example of the news analysis.

Finally, a small gift for Ubuntu users (and maybe not just for them, if you think about it). The resulting image can be translated into an image with a transparent background by a simple terminal command:

convert ~/news_raw.png -transparent black ~/news_ready.png

In the same way, you can organize automatic parsing of the site through the Autostart application:

    Menu — Startup Application — Add:
    Name: vk_news_reader
    Command: sh -c «sleep 600 && /FULL_PATH/vk_news.py»

Set a delay for execution in seconds, so that the system could connect to the Internet and execute the script (for execution you can specify «python /FULL_PATH/vk_news.py»).

2. Dialog analysis at vk.com

I think we’ve dealt with the first part. Now let’s move on to dialogue analysis. The general essence remains the same: vk API for information extraction - saving information on the hard disk - processing. All the logic and ideology remains the same, so I will give you the full code without any unnecessary explanations.

    import numpy as np
    import scipy
    import nltk
    import pandas as pd
    import seaborn
    import matplotlib as mpl
    import matplotlib.pyplot as plt
    from PIL import Image
    from os import path
    from wordcloud import WordCloud
    import pymorphy2
    import time
    import re
    import vk_log
    import pickle
    from collections import Counter


    session = vk.Session(access_token='you_token')
    vkapi = vk.API(session)

    friends = vkapi('friends.get')  # take list of all friends of user
    # friends = [1111111, 2222222, 33333333]  # also, we can manual set list of friends use they ID

    def get_dialogs(user_id):
        # Get dialog with user
        dialogs = vkapi('messages.getDialogs', user_id=user_id)
        return dialogs

    def get_history(friends, sleep_time=0.4):
        # Get all dialogues history
        all_history = []
        i = 0
        for friend in friends:
            friend_dialog = get_dialogs(friend)
            time.sleep(sleep_time)
            dialog_len = friend_dialog[0]
            friend_history = []
            if dialog_len > 200:
                # vk API condition: len <= 200
                resid = dialog_len
                offset = 0
                while resid > 0:
                    friend_history += vkapi('messages.getHistory',
                        user_id=friend,
                        count=200,
                        offset=offset)
                    time.sleep(sleep_time)
                    resid -= 200
                    offset += 200
                    if resid > 0:
                        print('--processing ', friend, ': ', resid,
                            ' of ', dialog_len, ' messages left')
                all_history += friend_history
            i +=1
            print('processed ', i, ' friends of ', len(friends))
        return all_history

    all_history = get_history(friends)

    # Save or load data
    pickle.dump(all_history, open("all_vk_history.p", "wb"))
    # all_history = pickle.load(open("all_vk_history.p", "rb"))

    interesting_id = user_id  # set interesting user id

    def get_messages_for_user(data, user_id):
        # Extract all message for set user
        user_messages = []
        my_messages = []
        for dialog in data:
            if type(dialog) == dict:
                if dialog['from_id'] == user_id:
                    m_text = re.sub("<br>", " ", dialog['body'])
                    user_messages.append(m_text)
                elif dialog['from_id'] == YOUR_ID:
                    m_text = re.sub("<br>", " ", dialog['body'])
                    my_messages.append(m_text)
        print 'Extracted', len(user_messages), ' user messages in total'
        print 'Extracted', len(my_messages), ' my messages in total'
        return user_messages, my_messages

    user_messages, my_messages = get_messages_for_user(all_history, interesting_id)

    list_in = [user_messages, my_messages]
    list_out = ['','']

    for t in range(len(list_in)):
        self_messages = list_in[t]
        str_data = ' '.join(self_messages)
        str_data = str_data.lower()

        def checkGood(symb):
            good1 = 'ёйцукенгшщзхъэждлорпавыфячсмитьбю'.decode('utf-8')
            good2 = u'ёйцукенгшщзхъэждлорпавыфячсмитьбю'
            if symb in good1:
                return True
            elif symb in good2:
                return True
            else:
                return False

        text = ''
        for i in str_data:
            if i == ' ' or i == '\n':
                text += ' '
            else:
                if checkGood(i):
                    text += i
                else:
                    text += ''
        str_data = text[:]

        morph = pymorphy2.MorphAnalyzer()
        text = ''
        for i in str_data.split(' '):
            p = morph.parse(i)[0]
            text += p.normal_form + ' '
        str_data = text[:]

        # Stop words check
        from nltk.corpus import stopwords
        stop_words = stopwords.words('russian')
        stop_words.extend([u'что', u'это', u'так', u'вот', u'быть', u'как', u'в', u'—', u'к', u'на', u'ок', u'кстати',
                          u'ещё', u'вообще', u'мб', u'чтоть', u'весь'])
        words = str_data.split(' ')
        words = [i for i in words if i not in stop_words]
        str_data = ' '.join(words)

        list_out[t] = str_data
        print len(str_data.split(' '))

    str_user = list_out[0]
    str_my = list_out[1]

    print 'Dict strong user: ', len(set(str_lisa.split(' '))) / float(len(str_user.split(' '))) * 100.0
    print 'Dict strong my: ', len(set(str_my.split(' '))) / float(len(str_my.split(' '))) * 100.0

    alice_mask = np.array(Image.open("IMAGE.jpg"))
    wc = WordCloud(background_color="black", mask=alice_mask)
    # generate word cloud
    wc.generate(str_lisa)

    # store to file
    wc.to_file("User.png")

    alice_mask = np.array(Image.open("IMAGE.jpg"))
    wc = WordCloud(background_color="black", mask=alice_mask)
    # generate word cloud
    wc.generate(str_my)

    # store to file
    wc.to_file("Me.png")

3. Conclusion.

I hope that as a result of reading you have skills of working with vk.com API, as well as with the processing of text information.

According to the presented code, all set tasks are solved and goals are achieved.

I hope that you will see ways to improve the shown solution and my solution will be useful for you. Thank you for being with us and have a nice day!

Облако слов из новостей или диалогов vk.com

2018-08-12T12:23:00+03:00

Приветствую!

Проведем похожую на парсинг reddit.com работу. Она посвящена накоплению и анализу новостной ленты или диалогов в vk.com. Полученная информация используется для создания базы данных. В моем случае поставлено 2 цели:

провести единовременный анализ всех моих диалогов в социальной сети vk.com;
анализировать 200 новостных постов из моей ленты при каждом включении компьютера.

Поставленные цели включают в себя набор задач:

выбрать необходимые библиотеки;
найти средства для получения информации и определиться с их логикой;
создать функцию для парсинга нужного количества информации;
организовать накопление информации;
предложить способ обработки полученной информации и какой-либо полезный результат.

Предложенная тема актуальна в связи с глобальным распространение науки накопления и анализа больших данных. Полученную информацию можно использовать для небольшого и поверхностного анализа собственного поведения и интересов, а так же в качестве интересного аватара.

Рис. 1. Пример выполнения скрипта для моих диалогов.

Подспорьем для данной работы послужил личный интерес и отличная документация vk.com, и не забываем про Google.

Обозначу еще несколько особенностей:

код написан, тестирован и работает в системе Linux Ubuntu 18.04 x64;
используются Python 2.7 и vk API.

В начале каждой главы будет приведен код с комментариями. В дальнейшем, если это необходимо - пояснения. Таким образом, перейдем непосредственно к делу.

1. Анализ новостной ленты

1.1 Выбор необходимых библиотек

#!/usr/bin/env python
# -*- coding: utf-8 -*-

from PIL import Image
from os import path
from wordcloud import WordCloud
import pymorphy2
import time
import re
import numpy as np
import random
import pandas as pd

from nltk.corpus import stopwords
from collections import Counter
import re
import vk


# -31480508 pikabu - You can see it as group id in browser bar
# -20629724 habrahabr
# -34274053 moscow
# -129636704 space (#ВКосмосе)
# -77270571 geektimes
# -46252034 naked science
# -227 MSU

Отсутствие библиотек для запроса веб информации (request, fake_user) вызвано наличием специального “языка” общения с vk.com - API и ее фреймворком для python (т.е. адаптированной библиотекой). В качестве полезного действия предлагается построить облако наиболее часто встречающихся слов — для этого тоже нужны свои библиотеки (wordcloud, numpy), в том числе и для работы с текстом (nltk, collection, pymorphy). Логика работы: необходимо получить информацию с сайта (через API), обработать ее и добавить в базу данных, сохраненную на диске, получить полезный результат.

Запуска кода возможен непосредственно из командной строки без указания интерпретатора (за счет явного указания #!/usr/bin/env python). Напомню, что вторая часть заголовка (# -*- coding: utf-8 -*-) нужна для корректной работы с форматом utf-8 и unicode.

1.2 Инициализируем API.

Для работы с API нам потребуется доступ, предоставленный сайтом vk.com. За доступ отвечает токен (длинный и уникальный набор цифр и букв). Также понадобится инициализация сессии.

access_token = "you_token_hear"
session = vk.Session(access_token=access_token)
vkapi = vk.API(session, v='5.71')

Отмечу, что нужно обращать внимание на версию API и какие команды в ней присутствуют или изменены (но это на будущей или если что-то сломается). А пока работает- не трогаем)

Получить токен можно зарегистрировав приложение в ВК и послав определенный запрос в адресной строке браузера. Подробнее об этом написано в официальной документации. Важно обращать внимание на срок действия токена, ID пользователя и права доступа для приложения.

Будьте внимательны! Не разрешайте чужим приложениям доступ к Вашим персональным данным!

1.3 Получение информации и создание логов.

Напишем функцию, для ведения логов и получения информации через API.

def log_write(feature, value=None):
    '''
    :param feature: name of logging feature
    :param value: the value of logging feature
    :return: None
    '''
    # Write data to log file
    f_log = open('/home/username/scripts/vk_log.txt', 'a')
    f_log.write(feature + value)
    f_log.close()


def getLikes(user_id, cnt, vkapi):
    '''
    :param user_id: vk user id
    :param cnt: number of post in thousand
    :param vkapi: vk API object
    :return: posts data dictionary
    '''
    subscriptions_list = vkapi.users.getSubscriptions(user_id=user_id,extended=0)['groups']['items']
    # we form the list of id, which needs to be passed in the following method
    groups_list = ['-' + str(x) for x in subscriptions_list]
    # we form newsfeed
    all_newsfeeds = []
    newsfeed = None
    for c in range(cnt):
        if c == 0:
            kwargs = {
                'filters': 'post',
                'source_ids': ', '.join(groups_list),
                'count': 100,
            }
            newsfeed = vkapi.newsfeed.get(**kwargs)
        else:
            next_from = newsfeed['next_from']
            kwargs = {
                'start_from': next_from,
                'filters': 'post',
                'source_ids': ', '.join(groups_list),
                'count': 100,
            }
            newsfeed = vkapi.newsfeed.get(**kwargs)
        all_newsfeeds.append(newsfeed['items'])
        time.sleep(1)
    # Process all news with its keys (json structure)
    all_keys = []
    for portion in all_newsfeeds:  # portion of news (100)
        for post in portion:  # each news in portion
            for key in post:
                if key not in all_keys: all_keys.append(key)
    # set output dictionary structure
    post_data = {}
    for key in all_keys:
        post_data[key] = []
    # Collect data from newsfeeds
    for portion in all_newsfeeds:
        for post in portion:
            try:
                for key in post_data:
                    if key in post:
                        post_data[key] += [post[key]]
                    elif key not in post:
                        post_data[key] += ['None']
            except KeyError as var:
                pass
    return post_data

Таким образом мы написали функцию для получения информации о последних cnt*100 постов %%username. Ну и составили простенькую функцию для ведения лога, что бы знать статус выполнения программы.

Теперь дело за малым — сохранить полученную информацию в виде матрицы «объекты-признаки» и обработать тексты.

1.4 Работа с функциями, накопление и обработка информации

# Start log file
log_write('', str(time.asctime()) + '\t')

user_id =  # your id (int)
all_data = getLikes(user_id, 2, vkapi)  # Scan 2 * 100 = 200 news posts

log_write('\t message download: ', str(len(all_data['text'])))

# If need human-readable data
# import datetime
# for data in all_data['date']:
#     print datetime.datetime.fromtimestamp(
#         int(data)
#     ).strftime('%Y-%m-%d %H:%M:%S')

# Add data to exist df and save it
len_old = 0
len_new = 0
try:
    final_df_new = pd.DataFrame.from_dict(all_data, orient='columns')
    final_df_old = pd.read_pickle('/home/username/scripts/vk_news_df')
    len_old = len(final_df_old.index)
    final_df_old = final_df_old.append(final_df_new, ignore_index=True)
    final_df_old.drop_duplicates(subset=['post_id'], inplace=True)
    final_df = final_df_old.copy()
    len_new = len(final_df.index)
# write number of new mwssage into log file
    log_write('\t new news message: ', str(len_new - len_old))
except IOError:
    # Create new file
    final_df = pd.DataFrame.from_dict(all_data, orient='columns')
    log_write('\t new news message: ', str(len(final_df.index)))

    # Save df to file
final_df.to_pickle('/home/username/scripts/vk_news_df')

Логика работы по созданию и пополнению базы данных аналогично статье про научные новости: «получение новой информации — проверка возможности открытия сохраненной базы данных — создание нового Data Frame — объединение двух Data Frames — удаление дублирующихся строк (по столбу id-новости) — сохранение обновленной базы данных».

1.5 Обработка и вывод информации

Переходим к завершающему этапу - обработке и выводу информации. Будем обрабатывать последние 200 новостных постов и выводить облако наиболее часто встречающихся слов.

news_to_process = 200
ind_all = final_df.index
all_text = final_df.loc[ind_all[-news_to_process:], ['text']]
tag_re = re.compile(r'(<!--.*?-->|<[^>]*>)')
# Remove well-formed tags, fixing mistakes by legitimate users
# clear each post from tag and whitespaces
all_text = [re.sub(' +',' ',tag_re.sub(' ', x[0])) for x in all_text.values]
list_in = [all_text]
list_out = ['']

for t in range(len(list_in)):
    self_messages = list_in[t]
    str_data = ' '.join(self_messages)
    str_data = str_data.lower()
    def checkGood(symb):
        good1 = 'ёйцукенгшщзхъэждлорпавыфячсмитьбю'.decode('utf-8')
        good2 = u'ёйцукенгшщзхъэждлорпавыфячсмитьбю'
        if symb in good1:
            return True
        elif symb in good2:
            return True
        else:
            return False
    text = ''
    for i in str_data:
        if i == ' ' or i == '\n':
            text += ' '
        else:
            if checkGood(i):
                text += i
            else:
                text += ''
    text = re.sub(' +',' ', text)    
    str_data = text[:]
    # Normalize of word form
    morph = pymorphy2.MorphAnalyzer()
    text = ''
    for i in str_data.split(' '):
        p = morph.parse(i)[0]
        text += p.normal_form + ' '
    str_data = text[:]
    # Stop words check
    stop_words = stopwords.words('russian')
    stop_words.extend([u'что', u'это', u'так',
                       u'вот', u'быть', u'как',
                       u'в', u'—', u'к',
                       u'на', u'ок', u'кстати',
                       u'который', u'мочь', u'весь',
                       u'еще', u'также', u'свой',
                       u'ещё', u'самый', u'ул', u'комментарий',
                       u'английский', u'язык'])
    words = str_data.split(' ')
    w_before = len(words)
    words = [i for i in words if i not in stop_words]
    w_after = len(words)
    log_write('\t raw and tidy words: ', str([w_before, w_after]) + '\n')
    str_data = ' '.join(words)
    list_out[t] = str_data[:]

str_news = list_out[0]
# Create wordcloud
alice_mask = np.array(Image.open("/home/username/scripts/gear2.png"))
wc = WordCloud(background_color="white", mask=alice_mask, collocations=False)
wc.generate(str_news)

def grey_color_func(word, font_size, position, orientation, random_state=None, **kwargs):
    #50 shades of white
    return "hsl(0, 0%%, %d%%)" % random.randint(60, 100)

default_colors = wc.to_array()
wc2 = wc.recolor(color_func=grey_color_func, random_state=3)
# store to file
wc2.to_file("/home/username/conky/scripts/news_raw.png")

Логика кода такая же, что и в статье про reddit, с той лишь разницей, что мы выбираем текст новостей и работаем с ним: очистка текстов от html-тэгов и лишних пробелов — удаление всего, что не буква - повторное удаление лишних пробелов — морфологизация слов (приведение к «нормальному» виду) — удаление стоп слов (наиболее часто встречающихся, таких как артикли, местоимения и т.д.) - построение одной большой строки из слов и пробелов и ее выдача - построение облака слов.

Рис. 2. Пример выполнения скрипта (анализ новостей).

Напоследок, маленький презент, для пользователей Ubuntu (а может и не только для них, если подумать) — полученное изображение можно перевести в изображение с прозрачным фоном, простой терминальной командой:

convert ~/news_raw.png -transparent black ~/news_ready.png

Так же, можно организовать автоматическое поступление новой информации, через автозапуск:

Menu — Startup Application — Add:
Name: vk_news_reader
Command: sh -c «sleep 600 && /FULL_PATH/vk_news.py»

Выставляем задержку на исполнение в секундах, что бы система успела подключиться к интернету и выполняем скрипт (для выполнения можно указать «python /FULL_PATH/vk_news.py»).

2. Анализ диалогов в vk.com

Думаю, с первой частью мы разобрались. Теперь перейдем к анализу диалогов. Общая суть остается прежней: vk API для добычи информации - сохранение информации на жестком диске - обработка. Вся логика и идеология остается прежней, так что приведу полный код без лишних пояснений.

import numpy as np
import scipy
import nltk
import pandas as pd
import seaborn
import matplotlib as mpl
import matplotlib.pyplot as plt
from PIL import Image
from os import path
from wordcloud import WordCloud
import pymorphy2
import time
import re
import vk_log
import pickle
from collections import Counter


session = vk.Session(access_token='you_token')
vkapi = vk.API(session)

friends = vkapi('friends.get')  # take list of all friends of user
# friends = [1111111, 2222222, 33333333]  # also, we can manual set list of friends use they ID

def get_dialogs(user_id):
    # Get dialog with user
    dialogs = vkapi('messages.getDialogs', user_id=user_id)
    return dialogs

def get_history(friends, sleep_time=0.4):
    # Get all dialogues history
    all_history = []
    i = 0
    for friend in friends:
        friend_dialog = get_dialogs(friend)
        time.sleep(sleep_time)
        dialog_len = friend_dialog[0]
        friend_history = []
        if dialog_len > 200:
            # vk API condition: len <= 200
            resid = dialog_len
            offset = 0
            while resid > 0:
                friend_history += vkapi('messages.getHistory',
                    user_id=friend,
                    count=200,
                    offset=offset)
                time.sleep(sleep_time)
                resid -= 200
                offset += 200
                if resid > 0:
                    print('--processing ', friend, ': ', resid,
                        ' of ', dialog_len, ' messages left')
            all_history += friend_history
        i +=1
        print('processed ', i, ' friends of ', len(friends))
    return all_history

all_history = get_history(friends)

# Save or load data
pickle.dump(all_history, open("all_vk_history.p", "wb"))
# all_history = pickle.load(open("all_vk_history.p", "rb"))

interesting_id = user_id  # set interesting user id

def get_messages_for_user(data, user_id):
    # Extract all message for set user
    user_messages = []
    my_messages = []
    for dialog in data:
        if type(dialog) == dict:
            if dialog['from_id'] == user_id:
                m_text = re.sub("<br>", " ", dialog['body'])
                user_messages.append(m_text)
            elif dialog['from_id'] == YOUR_ID:
                m_text = re.sub("<br>", " ", dialog['body'])
                my_messages.append(m_text)
    print 'Extracted', len(user_messages), ' user messages in total'
    print 'Extracted', len(my_messages), ' my messages in total'
    return user_messages, my_messages

user_messages, my_messages = get_messages_for_user(all_history, interesting_id)

list_in = [user_messages, my_messages]
list_out = ['','']

for t in range(len(list_in)):
    self_messages = list_in[t]
    str_data = ' '.join(self_messages)
    str_data = str_data.lower()

    def checkGood(symb):
        good1 = 'ёйцукенгшщзхъэждлорпавыфячсмитьбю'.decode('utf-8')
        good2 = u'ёйцукенгшщзхъэждлорпавыфячсмитьбю'
        if symb in good1:
            return True
        elif symb in good2:
            return True
        else:
            return False

    text = ''
    for i in str_data:
        if i == ' ' or i == '\n':
            text += ' '
        else:
            if checkGood(i):
                text += i
            else:
                text += ''
    str_data = text[:]

    morph = pymorphy2.MorphAnalyzer()
    text = ''
    for i in str_data.split(' '):
        p = morph.parse(i)[0]
        text += p.normal_form + ' '
    str_data = text[:]

    # Stop words check
    from nltk.corpus import stopwords
    stop_words = stopwords.words('russian')
    stop_words.extend([u'что', u'это', u'так', u'вот', u'быть', u'как', u'в', u'—', u'к', u'на', u'ок', u'кстати',
                      u'ещё', u'вообще', u'мб', u'чтоть', u'весь'])
    words = str_data.split(' ')
    words = [i for i in words if i not in stop_words]
    str_data = ' '.join(words)

    list_out[t] = str_data
    print len(str_data.split(' '))

str_user = list_out[0]
str_my = list_out[1]

print 'Dict strong user: ', len(set(str_lisa.split(' '))) / float(len(str_user.split(' '))) * 100.0
print 'Dict strong my: ', len(set(str_my.split(' '))) / float(len(str_my.split(' '))) * 100.0

alice_mask = np.array(Image.open("IMAGE.jpg"))
wc = WordCloud(background_color="black", mask=alice_mask)
# generate word cloud
wc.generate(str_lisa)

# store to file
wc.to_file("User.png")

alice_mask = np.array(Image.open("IMAGE.jpg"))
wc = WordCloud(background_color="black", mask=alice_mask)
# generate word cloud
wc.generate(str_my)

# store to file
wc.to_file("Me.png")

3. Заключение

Надеюсь, что в результате прочтения вы обрели навыки работы с vk.com API, а также с обработкой текстовой информации.

Согласно представленному коду, все поставленные задачи решены и цели достигнуты.

Надеюсь, что Вы увидите пути для доработки показанного решения и мое решение будет вам полезно. Спасибо, что были с нами и приятного дня!

Создаем свой рукописный шрифт

2018-10-13T12:00:00+03:00

Данная небольшая заметка расскажет об опыте создания рукописного шрифта. Его необходимость была обусловлена следующим личными фактором:

один очень важный мне человек попросил помочь с написанием конспектов (в 2018 году все еще остаются преподаватели, требующие рукописный конспект).

Далее включилось подсознание (что бы заставить себя работать) и появились следующие идеи:

захотелось создать такой шрифт для сохранения информации о людях;
шрифт для ведения личных заметок (придания большей персональности сайту или электронным письмам);
проверить, будет ли влиять такой шрифт на лучшее запоминание текстов и лучшему восприятию материала.

Итак, по тем или иным причинам, приступим. Основанием для работы послужила отличная заметка. Все работы проводились в операционной системе Ubuntu 18.04, за работоспособность в прочих системах не ручаюсь, хотя не вижу преград или сложностей чтобы попробовать (если это необходимо).

Для выполнения работы нам потребуется:

сканер;
принтер;
лист или два листа бумаги А4;
черная ручка или маркер;
программы:
GIMP;
Inskape;
FontForge
порядка 3 часов свободного времени.

1. Подготовка шаблона

В начале необходимо подготовить шаблон почерка для шрифта. Удобно использовать или миллиметровую бумагу или просто разлинованный с обратной стороны А4 (чтобы в дальнейшем линии не мешали работать с символами, но сами символы были структурированы, как будто в строке рукописного текста). Черной ручкой пишутся все необходимые символы для шрифта. Полученный материал сканируется в графическом формате (предположительно *.png или *.jpg), обрезается все лишнее и файл сохраняется для дальнейшей работы. Должно получиться что-то похожее не рис. 1.

Рис. 1. Пример рукописного шаблона для шрифта.

2. Предварительная обработка шаблона

Сканированное изображение открываем в графическом редакторе GIMP и изменяем его параметры контраста и яркости (Пункт меню Colors -> Brightness and Contrast). Стараемся получить наиболее контрастное и не зашумленное изображение. Для меня хорошо работали параметры яркости -50, контраст - максимум.

Копируем полученное изображение в Inskape. Далее, необходимо преобразовать его в векторный формат. Для этого используем функцию Path -> Trace Bitmap (при этом изображение должно быть выделено). Используем параметр Grays в области Multiple scans, выставляем количество Scans = 2, выбираем галочку remove background и нажимаем Ok. После преобразования (шрифт станет более “плавным”) закрываем это окошко. Теперь мы можем работать с изображением в векторном формате. Визуально должны отобразиться Nodes на изображении, так же с ними можно работать выбрав курсор с левого меню Edit paths by nodes (F2). В дальнейшем так мы и будем делать.

3. Копирование информации из шаблона

Для дальнейшей корректной работы нам потребуется выделить один символ. Для этого выделяем все ноды (F2 или обозначенный ранее курсор), после этого выделяем лишние (выделение стандартное, мышкой) и удаляем их (клавиша Del). Выделенными должны остаться только ноды одного символа. После этого нажимаем Ctrl+L (упрощаем и сглаживаем векторное отображение символа) и Ctrl+C - копируем его в буфер обмена.

4. Создание шрифта

Скопированный символ требуется добавить в маску шрифта, который мы будем создавать в программе FontForge. Открываем программу, выбираем New - появляется окно шрифта. Скопированный символ (в векторном формате) помещаем в соответствующую ячейку. Делается это двойным кликом на ячейке и Ctrl+V. На открывшемся полотне должен появится контур векторного символа. Теперь нужно привести его к нужному размеру и указать ширину.

В открывшемся окне Element -> Transformation (Ctrl+\\) указываем Scale X 1000 %, Y 1000 % (работало для меня, можете импровизировать). Далее выделяем мышкой весь символ и зажав желтый кружок перетаскиваем его в угол 0,0. Символ должен получиться ограниченным слева и снизу, иметь небольшое расстояние вверху (до линии). Как Вы уже возможно догадались, эти линии - границы отображения символа при печати. Дополнительная граница внизу - место для “хвостика” буквы. Если они уходит за дополнительную нижнюю границу при создании нового абзаца символ будет обрезан по эту границу (но просто при переходе на новую строку символы обрезаться не будут). Далее Metrics - Set Wight и устанавливаем ширину буквы (у меня около 400). Теперь наш символ готов и таким же образом нужно внести все остальные. Заполняем новыми символами столько ячеек, сколько нам необходимо для полноценного шрифта.

Не забываем периодически сохраняться (внутренний формат программы *.sfd)!

5. Генерирование шрифта

Программа FontForge предлагает множество возможных вариантов шрифтов и типов их сохранения. Наиболее полным является Unicode Full (типы выбираются во вкладке Encoding). Для меня вполне хватило типа ISO 8859-5 (Cyrillic). После заполнения необходимых символов, достаточно сгенерировать шрифт: File -> Generate Font (я выбирал более сглаженный тип шрифта ClearType *.ttf).

Все, получился файл с вашим собственным шрифтом. Осталось испытать его и получить желаемые результаты.

В системе Ubuntu шрифт нужно положить в папку ~/.local/share/fonts (или создать ее, если она отсутствует) и он станет доступным в окружении пользователя, например, в LibreOffice.

Create your own handwritten font

2018-10-13T12:00:00+03:00

This short note tell you about creation of handwritten font (tested by myself). The necessity of this task was caused by the following personal factor:

one very good person asked my help with notes writing (yes, there are some university teachers who ask handwritten notes in Russia in 2018).

Further, subconscious mind was On and next ideas was come up:

I want to create such fonts to preserve information about living people;
It will be a good font for myself notes (to make my site or e-mails more personally);
I want to test, if such a font will affect the best memorization of texts and a better perception of the material.

One way or another, shall we start? The basic article for this work is this note. Furthermore, all further works are doing in Ubuntu 18.04 OS (I didn’t test this approach is other OS, although I do not see any obstacles or difficulties to try it if necessary).

For this work we will need:

scanner;
printer;
one or two sheets of papers (Letter or A4);
black pen or marker;
programs:
GIMP,
Inskape,
FontForge;
about 3 hours of free time.

1. Template preparation

First, you should prepare a handwriting template for the font. It is handy to use either millimeter paper or simply the A4/Letter sheet (with lines on the back side, so that lines do not interfere with the characters). Next, a black pen is used to write all the necessary symbols for the font. The resulting material is scanned in graphical format (*.png or *.jpg for example). Unnecessary blank space is cut off and the file is saved for further work. Something similar to Fig. 1 should appear.

Fig. 1. Example of handwritten template.

2. Preliminary work with template

Scanned image is opened in graphical redactor GIMP and its contrast and brightness are modified (Menu bar Colors -> Brightness and Contrast). Try to prepare the most contrast and low-noises image (for me the -50 of brightness and maximum of contrast works good).

Further, copy resulting image to Inskape. First of all, our image need to convert to vector form. We can use function Path -> Trace Bitmap for it (and our image should be selected). Use Grays parameter in Multiple scans area and set Scans = 2. Next, set remove background checkbox and press Ok. After such iterations our font will be more smooth. Also, the Nodes must appear for image (you can work with them with select Edit path by nodes (F2) from left menu).

3. Copy information from template

For further working, we need to select only one symbol from our handwritten template (section No 1). For that, we need to select all nodes from section No 2 (F2), then select all unnecessary nodes with help of the mouse, and delete them (Del). Then, we must see, that only one symbol has nodes. Next, use Ctrl+L (for simplify and smooth the symbol image) and Ctrl+C for copy it to clipboard.

4. Font creation

Previously copied symbol is added to computer font template, which is created in FontForge program. Open the program and click New, which open the fonts window. Then, input copied vector character to its cell. Such action can be done with double click on cell and Ctrl-V magic. Further, the new symbol’s shape must appear inside computer font template. Now, we need to resize it and set width.

Open proper window (Element -> Transformation (Ctrl+\\)) and set Scale X 1000 %, Y 1000 % (its worked in my case, but you can improvise). Next, select the whole symbol with mouse and, with clicked Yellow circle, drag it to 0,0 angle (left bottom). So, the symbol should be limited to the left and the bottom, and have a small distance to the top line. As you probably have guessed, this lines is symbol borders for printing. Additional border at the bottom is the space for the “tail” of the letter. If it lower than this border, the letter will cut when the new paragraph is started (but for simple new line letter will not be cut). Further, select Metrics - Set Wight and set letter width (I set about 400). Well, we finished our first symbol, and next, we need to process others. Fill cells of computer font template as full, as you needed it.

Do not forget to saved your file time to time (to *.sfd inner format)!

5. Font generating

The FontForge program have a lot of fonts types (you can select type in Encoding menu). The Unicode Full is the most complete font type (and enormously big). As for me, the ISO 8859-5 (Cyrillic) font was good enough. After you filled all needed symbols to computer font template, we can generate our handwriting font with File -> Generate Font (also, I used additional option ClearType *.ttf).

Well, that’s it! You have your file with handwritten font and you can test it already!

For Ubuntu system you need to put this font to ~/.local/share/fonts folder (or create this folder first). Next, you can use your font in user environment (in LibreOffice for example).

Automation system of industrial control

2019-12-09T00:00:00+03:00

Automated and nondestructive industrial control

Warm greetings to all of you in this little blog article, which is tell about levels of automation system and control in industry. Some common words about automation and industry of mineral fertilizer will also be considered.

This short article represents a little translation of more detailed Russian version about sensors and nondestructive control. Time after time I will try to add more details and practice examples in this paper.

Also, I will be very grateful for any reviews and opinions about this theme and my style of writing. Please, do not hesitate to contact me with e-mails (Dm.Yunovidov@gmail.com) or comment button below.

So, shall we start?

1. Introduction

1.1 Intro and objectives

In this part of the article some main principles and determination in automation is presented. By the end of the chapter I’d like you to understand next:

definition of automation, control and information technology (IT);
connection between such things;
conception of ‘products life cycle’ and role of automation in it;
classification of industry facilities and automation system.

1.2 Engineer science and terminology

The engineer science is the discrete discipline with its own language, tasks and instruments (as well, as the other science like art, social, natural science, etc.). The main question for engineer is:

how can I solve this problem?

Such question lead us to the typical engineer definition of system as the black box (we do not now what inside and it did not bothered us, what is important - how we put it in work). The main subjects for us are input and output flow of this black box and how this flows relay to each other. It is very similar to programming. Each devise will give direct output from concrete input (fig. 1.1).

Fig. 1.1. The black box concept.

The other important feature of engineer science are special instruments (mainly for the visualization):

technical draws and specifications;
schemes;
block diagrams and programs;
technical and principal papers, etc..

I think, that you already know it and see it a lot…

Control, automation, robotization and sensors are the most important things for modern industry. Especially it is relevant for Industry 4.0 - yet another industry revolutions, which are newer stop (and it is amazing)! So, us you can see, the automation is always actual (beginning from the 18th century and uncle Ford).

Main problems of automation and control relay to mechanical system, automatic perception, navigation and design making system.

The separate problem is ‘chaos’ systems interpretation, which include a lot of non linear dynamic systems. In spite of linear dynamic systems (which we can interpreted with differential equations), the ‘chaotic’ dynamic system highly sensitive for external conditions and variations of system parameters. For such system interpretation widely use statistical methods: nonlinear multidimensional analysis, machine learning and other ‘big data analysis’. But, it is not the theme of this little course.

We studies automation system classification and the control, which is broadly speaking a simple check between set (desire) and real parameters in different industrial process. And when we see one, we say about defect in process or product. The process of search of defects itself name diagnostics.

For this purpose widely use a non destructive methods of control: visual (color, odor, shape, etc.), spectrophotometry (UV, Infrared, visible light or X-ray), ultrasound analysis, etc. But all of this complicated and hard-to-speak methods are based on sensors.

All of this sensors and methods of control are used for acquire information. There are a lot of date there, and we swim in big sea of different data, which we can use for control and diagnostics. Well, we are ourselves are data, which we can’t calculate properly.

Analyzed parameters (parameters of diagnostics) of object contain information about object condition and there are 3 types:

functional parameters of product - which characterize the exploitation of the product (maximum force, liquid pressure, acceleration/deceleration time, specific energy consumption, ets.);
structure parameters - which directly characterize the condition of specific part of the product (element position coordinates, corrosion, etc.);
associated process parameters - defined from external conditions and the processes which accompany a product (temperature, vibration, acoustic signals, level and a spectrum of noises, an error of processing, etc.) - are more widespread, our stop.

The control results are usually presented in the form of continuous functions from time ($K_J(t)$) with indication of permissible deviations (errors). The concept of sensitivity of the diagnostic parameter ($K$) to the state parameter ($Q$) is also important: $\frac{dK}{dQ}$.

Task. Let’s think how we can ‘see’ the sensitivity? Plot the figure $K_J(t) = aQ_J(t) + b$ (with random selected a, b and other parameters) and find the sensitivity.

There are also some type of control: hardware, software, manual or automated, specialized or universal. The very beginning of the concept of non-destructive testing and diagnostics usually refers to the time of X-rays discovery (November 1895), which allowed to detect a bones under the skin and metal object in a closed wooden box.

The accuracy of control system depends on the sensitivity and resolution of its components (incoming information channels) and the accuracy of statistical calculation (and algorithms). In addition, it depends on the calibration (the quality of used reference samples).

Furthermore, operator functions (peoples work) in many systems are main part of the process control and too complex for automation, and decision-making systems have not yet become widespread.

Thus, there are four important directions of development of automated control methods:

Training of methods and tools of analysis (intellectualization), as well as search for quality metrics.
Development of the unified system of quality control (standardization).
Improvement of diagnostics (hardware and software).
Standardization and implementation of control systems in the field (regulatory documentation).

The main idea of this article is research the 3rd part of this list. But for now, we concentrate about classification and terminology.

First of all, each system of control build on measuring - it is process of quantity determination in special units (and we need to compare it with something).

The industry - systematic activity that could be related to manufacture, service or trade (for this article we certainly use manufacture).

Automation - a set of technologies that provide the operation of machines and systems without significant human intervention (with some performance compare to manual operation).

Management and Control - a set of technologies that achieves desired outputs from set input for systems and machines.

Sensors - devices that provide information about process by measure, count, track, etc.

In this article we will mainly focus on the general concepts of automation in today’s industry and next, try to understand some instrumentation implementation of non-destructive testing. My area of professional activity includes providing control in the production of mineral fertilizers, and I will try to give more concrete examples from this industrial area (Fig. 1.2).

Fig. 1.2. Structure of mineral fertilizer production.

Task. For better understanding of terminology, try to explain all previous given statements (industry, automation, management and control and sensors) with your own example (like, in case of temperature control in ceramic furnace).

From the other hand, it is highly important to understand differences in automation system and control system:

Automation Systems may include Control Systems but the reverse is not true.
The main function of control systems is to ensure that outputs follow the set input (in number of set points). However, automation systems may have much more functionality (such as computing set points, monitoring, startup or shutdown the process, scheduling etc).

Furthermore, industrial automation systems makes extensive use of information technology (IT, Fig. 1.3). In the contrary, control system use IT much less.

Fig. 1.3. Major areas of IT in industrial automation systems.

Task. Try to find an practical example of using IT in automated system (Hint: Try using the internet)

However, industrial automation systems are different from IT:

Industrial automation systems involves a significant number of hardware technologies (instruments, sensors, motors, circuits for signal processing, etc.).
Low level automation systems use IT much less, working more with hardware, electronics and embedded computing (e.g. sensors and actuators).

1.3 Role and types of automation in industry

It is generally assumed that the main goals of using automation in industry are:

Reduction of manual control (minimization of error due to human factor);
increase of the economic effect of production (… profit).

The economic effect itself may express as:

$$Profit = (\frac{Price}{Unit} - \frac{Cost}{Unit}) \times Production\_Volume$$

Automation affects to the ratio of cost/unit (decrease the cost) and to the price/unit (increase the quantity). Thus, automation affects the economy from a position:

of scale (economy of scale) - reduction of costs per unit of production (because automation increase production volume and operational and time efficiency);
of objective (application, economy of scope) - when automation can provide ability to produce a wider range of products.

Typical product life cycle is shown in Fig. 1.4.

Fig. 1.4. Typical life cycle of the product.

At the first stage the idea of products is created on the base of research of the market, demands and assets. Then a manufacturing model is created, and the prototype of the product is made. After checking the performance and suitability of the prototype, the production is scaled up and assembled to ensure that the necessary resources and technologies are available for mass production. Next, direct mass production and product quality control are carried out. The produced product enters the market, from which comes the corresponding response (feedback); on the basis of which the production evolves (increases capacity or changes the product).

Task. Where can automation be used in this scheme and what advantages does it provide?

Tasks. Give examples of industries: where 1 - economy of scale is more important than economy of scope; 2 - the opposite and 3 - they are equal.

1.3.1 Type of production systems

Based on the previous determined scale and scope we can determined major type of production (fig. 1.5).

Fig. 1.5. Classification of production system.

Continuous flow process - the product produced “continuously” (it is not a discrete object). Volumes are large, the difference in products is relatively small (oil refining, cement production, steel industry, etc.).
Mass manufacturing of discrete production - large volumes of discrete objects, variation of products is rather limited (instrument making, automotive, frying pans production, etc.).
Series production (batch production) - produces a series of discrete or continuous products, differences between products are bigger then in previous one. The same set of equipment produces many types of products (but for each series/party a separate parameters are set - it is “recipe” of the batch) (pharmaceuticals, foundry, plastic molding, printing, etc.). This type also includes the production of mineral fertilizers (although for some technological schemes and facilities we can assume the mass production of discrete products).
Job shops (workshops) - a small number of discrete products, usually to order, any changes in the product are possible (prototyping, 3D printing, various workshops, etc.).

1.3.2 Type of automation system

Automatic systems can be categorized according to the flexibility and degree of integration into the manufacturing process.

Fixed automation - a fixed set of operating parameters for mechanized equipment. It is used to perform fixed and repetitive operations in order to produce more identical parts (used in continuous and mass production types, e.g.: paint shop conveyors, distillation, sample feed lines, etc.).
Programmable automation - change of operation sequence and configuration of machines by electronic controls. This scheme may require non-trivial programming (e.g. for different PLCs, usually used in batch production where the variety of working equipment is low and the variation of products is high; e.g. paper or steel mills, etc.).
Flexible automation - used in flexible manufacturing systems (FMS) that are constantly controlled by the computer (operators enter high level commands and lower level changes are made automatically; usually implement in batch and job shop production where there are many varieties of product and the workload varies from medium to low). Such systems usually use multi-purpose computers with numerical control (CNC), automobiles with automatic guidance (AGV, robotic systems) and others.
Integrated automation - complete automation of production where all processes are performed and coordinated by computer (Computer Integrated Manufacturing - CIM). In other words, it is full integration of technological and management operations using IT. Often it can also include a business management system too. So far, successful examples of such systems are very small and it is difficult to examine it (according to type of production).

Note that the scale and complexity of automated systems is growing from fixed to integrated automation. But remember that the type of automation must be chosen for each particular production and task (and investments in it must be justified economically).

For example, fixed automation is appropriate when:

The differences in product type are small (size, shape, number of parts, material).
There is a predictable and stable demand for a product within 2-5 years (and the production capacity is also stable).
The production volume per time is high.
Optimum productivity due to competition is required.

Flexible automation, on the other hand, is used in the following situations:

There are significant differences in product types (for one production system).
The product model life cycle is small (frequent improvements and design modifications that change production is required).
Production volumes are moderate and market demand is not so predictable.

Nevertheless, within the framework of nowadays industrial revolve ‘Industry 4.0’, productions are increasingly inclined to use serial production and to upgrade continuous and mass production for these purposes. As a result, flexible automation is becoming more and more popular.

Tasks. How we can determine which type of automation prevails in manufactures due to a technical inspection of it? For which factory would you recommend computer integrated manufacturing and why? Which type of automation would you recommend for production: * incandescent bulbs; * clothes; * textiles; * mineral fertilizers; * printing; * pharmaceuticals; * toys.

1.4 Exercises

Describe the role of automation in the overall profitability of the production system.
How does industrial automation help to save money and what types of savings it is?
Enter the query “automation history” on the Internet and read the links you like.
Study ISO 9001 “Quality management systems”. Which main criteria of quality management system you can find?
What are the alternative definitions for industry, automation and control?

2. Architecture of automation system in Industry

2.1 Intro & objections

In this section we try to understand main structure of automation control in industry. For the end of the section I wish you can:

show elements of industrial automation systems and its structure (levels of organization);
describe of connection between levels of organization (as well as name main technology of it);
give industrial examples for each of described levels;
can describe information flow between levels.

2.2 Architecture of automation system in Industry

Let’s view the structure of typical industries (fig. 2.1) and try to understand our place in it. Just image one of the typical facilities (JSC “Horns and Hooves” for example).

Fig. 2.1. Architecture of industry production. Pay attention for level markers.

The management (or product enterprise system) is placed on the 4th level (the upper one). This level include determined of economical, usability and other ‘high-level’ features of production and product. And it is not where we implement automation yet.

The next level is quality control of produced product (level 3) where it compare with regulatory documentations. It’s also done while people do it.

The supervisory control is on the 2nd level. We can say that this level connect people command with machinery instruction. This function is taken over by production operators together with the automatic process control system (room with large monitors in the factory). This level is also called an ‘supervisory control and data acquisition’ (SCADA) system.

Systems of automatic control, more precisely, systems of maintenance of the set parameters of quality (which are set by the control system and operators in level 2) occupy level 1. At this level, computers or logic controllers are often used. The automation by itself.

At the last, 0 level, there are sensors and actuators - devices for receiving and transmitting physical information about the process, which they provide to higher control levels.

Interaction between levels is provided by the integrated information-communication system of the plant or SCADA (for JSC “Apatit” it is the ‘PI System’).

Nowadays, robotic control systems are widespread (the system of 0 - 2 levels, interacting directly with the SCADA). Some example of the level communication in such system are shown on the fig. 2.2.

Fig. 2.2. Architecture of robotic system of granules size control in the mineral fertilizer facility.

This system was developed by me and my colleagues and is used to control the particle size distribution. A more detailed worked principle and signals are shown in Fig. 2.3.

Fig. 2.3. Signal and data flows for a robotic control system of particle size distribution. Dotted lines represent digital signals, the others represent analogue signals.

Note that the decision-making time and the amount of information embedded in a particular decision increases from 0 to 4 levels. In other words, the higher the level - the more common control terms are used (which means that it takes time and experience/database to decode them). Managers speak “make quality for the market”; the technical department transfers “make quality according to standard ISO 2х2”; quality management carry out analyses and transfer parameters to operators; they give commands to control system/facilities personal “to twist handles 1-2-3 in positions 3-2-1”; automatic control system (with the help of facilities personal) “twists the handles and keeps set parameters”; sensors and actuators “spin, measure and rumble” with transferring new information backwards. Something like that.

At first glance, our place is on the 0 and 1 levels of this system. However, the automation often include the 2nd level too (see the note about robotic systems, Fig. 2.2). However, this short article review the basic principle of it.

2.3 Level 0. Sensors and Actuators

The first control system is the sensor system (level 0, which is directly responsible for automation). It should give us accurate and sensitive information (signal) related to a physical value (e.g. temperature) (Figure 2.4). Special devices are responsible for that - sensors (gages). All this is necessary to make the required calculations at level 2 and to produce the new input (set new value) for technological process within the framework (to ensure, that overall quality if belong to ISO). The signal from/to level 0 is transmitted in the form of electric or pneumatic information and further is converted into an input parameter of the technological process if needed (heat, force, etc.). Thus, the functions of the sensor is to transmit the process signal and the functions of actuator is to receive the control signal and change the technological process.

Fig. 2.4. Sensors system (level 0).

sensing element - an element, whose physical/chemical/biological properties depend on the physical environment (direct or indirect contact). A typical example is the change in resistivity due to the heating of a resistance temperature detector (RTD).

Next comes the signal conditioning module (signal-conditioning element) which changes the character of the signal from the sensor (usually to electrical form: voltage, current, capacitance or inductance). This transformation depends mainly on the sensor (hence, this element is specific to the type of sensor). For example, for a RTD, a resistance change can be easily converted to voltage by including the RTD in Wheatstone’s bridge. Therefore, the bridge serves as a signal conditioning module. Such module can also be used for special functions not related to signal conversion (e.g. “ambient referencing” of thermocouples). Typically, analogue electronic circuits are used for these modules, which eventually produce electrical signals in the form of voltage or current over specific ranges.

The following module is the signal processing element, which is used to handle the electrical signal (generated by the first cascade) for filtration (noise elimination), diagnostics (sensor evaluation), linearisation (output linearly associated with the physical parameters of the medium), etc.. Therefore, the signal processing elements are usually more general in purpose.

The last module, the target signal-handling element, is usually universal too. It can perform various functions: data/signal display, recording, storage, process control feedback, etc.. Examples are temperature chart recorder, instrumentation tape recorder, digital display or analog-to-digital converter (ADC) etc.

Modern sensors also typically have the ability to digitally transmit data using serial, parallel or network protocols (RS 432, USB, Ethernet, etc.). These sensors are called “smart” and contain the embedded digital electronic signal processing circuits.

So, make the conclusion, the sensor converts physical signals (temperature, pressure, speed, etc.) into electrical or pneumatic forms of information, forming our input signals for hight level systems. But in order to make the control action (or implement the control signal), we need to convert it back to physical form. To do this we use actuator system (we are still at level 0).

These systems characterize the response of the devices, depending on the sensory signal received and the set points from higher levels (such as level 1 or 2).

Actuator - The switch of the logic signal to the physical signal. This systems are required to control production process (e.g. by regulating flows, product mass, etc.). Once again, these are systems, which inverse to sensors (actuators catch control signal, which is usually weak voltage and current and convert it). There are two ways to do such transformation. First, an actuator can convert a weak current into a physical phenomenon (torque, heat, flow). Secondly, it can amplify the energy of an incoming electrical signal and this signal can directly influence the production process. Thus, sensors and actuators are different devices: actuators are power devices, while sensors are mostly work with low current. Actuators are usually more energy-intensive and in most cases produces a movement (which is then converted into other forms of physical action). Nevertheless, the logic of work of actuators approximately corresponds to sensors (fig. 2.5). Similar to sensors, there are “smart actuators”.

Fig. 2.5. Main configuration of actuator system.

The signal processing element receives the command from the control system in electric form. This command can be processed in several ways. For example, filtering (to remove an incoming signal of a certain frequency, which may cause resonance) or amplification can be performed. Many actuators are closed loop control units with feedback (to ensure accurate triggering), and for this reason, the electronic signal processing module often contains the control system for the drive itself.

Next, the power amplifying element sometimes contains linear power amplification stages called “servo amplifiers”. In other cases, it may consist of motor power electronic circuits (for example, for motor driven actuators).

Variable conversion element performs the function of changing the nature of the signal generated by the electronic power amplification element (from electric to non-electrical form, usually in motion). Examples are hydroelectrically servo valves, stepper/servo motors, Current to Pneumatic Pressure converters, etc.

Energy conversion element which generally includes non-electrical power conversion elements are used to further increase power (usually by hydraulic or pneumatic mechanisms). Non-electrical variable conversion elements can then be used to convert a controlled variable to the desired form, often in several stages. Typical examples include conversion of movement to flow rate (flow valves), rotary to linear movement, flow rate to heat (using steam or hot liquids), etc.

Finally, actuators can be equipped with various supporting elements for lubrication/cooling/filtration, tanks, feedback sensors, display components, remote control as well as safety mechanisms and etc.

Summing up this section, level 0 systems can be displayed in general terms by an example of steam valve control (Fig. 2.6).

Fig. 2.6. Level 0 control system.

2.4 Level 1. System of automation control

Now we have the opportunity to go up to a higher level and consider the automatic control system (level 1). By such industrial control systems we mean the use of controller. This is a new element (usually electronic or pneumatic), which receives signals from operators (SCADA) and feedback from the industrial process (sensor), and sent new outputs signals for actuators (Fig. 2.7).

Fig. 2.7. Loop of automation control system (level 1).

This loop is also often called Automatic Control, Process Control, Feedback Control, etc. In this case, the purpose of the controller is to provide such input signals to the actuator, that the output signal (process parameter y(t)) follows the operator command r(t) as close as possible (both in value and time). Fig. 2.7 shows the general structure of the control loop with its components: the controller, drive, sensor and the process itself (the environment in which the process takes place). In addition, the signals are marked (existing at different points of the system). Described action include two main steps: a command (set point or reference signal) and external interference (noise).

Difficulties in achieving the set point are due to internal unavoidable noise (changing loads, induced currents, sensor noise) and external production factors (instability, uncertainty and variability in process dynamics).

Once again, pay attention to the new element - controller. Essentially it is an industrial automatic control system of level 1 (it is a link, which provides direct and feedback connection between levels 0 and 1).

Most industrial command signals for the controller are point signals (bite-sized) that indicate the desired process parameter (temperature, pressure, flow, level, etc.) and provide product quality. But the manufacturing process is a continuous process and time to time it is deviate from the set parameters, which may leads to a constant change in the feedback and then, to change in discrete control signal (e.g. in motion control the signal may constantly change depending on the size of the product). For this reason, the choice of feedback signals for the controller (e.g. P, PI or PID), the choice of control loop structure (normal feedback loop, cascade loop or feedforward) and the choice of controller gains are strictly necessary. Usually such controller configurations are well known for a particular class of processes, but some of them need to be calibrated from time to time. This is called controller tuning.

Note. A PID controller continuously calculates an error value $e(t)$ as the difference between a desired setpoint and a measured process variable and applies a correction based on proportional, integral, and derivative terms (denoted P, I, and D respectively), hence the name.

One device can operate as a controller in one or more control cycles (single-loop/multi-loop controller). Today, many loop controllers complement typical control concepts (such as PID) by offering adaptive control and fuzzy logic algorithms to improve controller response and performance. PID-controls and self-tuning at startup are among the most important features. Other required and common features include the ability to interact with a decision making system or SCADA, peer-to-peer networks (such as Fieldbus, DeviceNet), and support for manual control if automation failure.

The software is also an important factor, and it is used to configure, monitor and auto-tune controllers. The controllers are also commonly directly paired with process sensors (thermocouples, thermistors, etc.). While most modern complex controllers are electronic, there are also pneumatic options.

In many cases, the control does not affect analogue variables: switches (on/off switches), motors, valves, etc and this is the sequential/logic control (e.g. in the control of supply and assembly machinery lines to coordinate the supply of parts, equipment change, trimmer of metal, etc.).

Moreover, there are many industrial actuators that operate on a similar scheme (have a limited set of commands). For example, conveyor belt motors does not use the analog control, instead the motor-starter actuation system use three modes: start, stop and production is used.

Similarly, there are many sensors operating in a discrete mode too (limit switch, pressure switch, photo switch etc.). These sensors do not reflect a specific process variable, but rather a finite range of values into which the variable falls.

In the conclusion, modern controllers, which are widely used for sequence control in transmission lines, robotics, process control and many other automation systems are programmable logic controllers (PLC). The PLC is a specialized industrial microprocessor-based real-time computing system (mini-computer).

Note. Regular programmable logic controller consists of:\ * a processor unit (CPU) which interprets inputs, executes the control program stored in memory and sends output signals, * a power supply unit which converts AC voltage to DC (12 or 24 V commonly), * a memory unit storing data (8 bits, 64 bits etc.), * an input and output interfaces to receives/sends data from/to external devices (digital or analogue), * a communications interface to receive and transmit data from/to PLCs.

PLCs require programming device which is used to develop and later download the created program into the memory of the controller (sometimes it’s computer).

Modern PLCs even contain a real-time operating system, such as OS-9 or VxWorks.

Task. Is the Arduino is ‘pure’ PLC. Why, or why not?

2.5 Level 2. Supervisory controls

That leaves the last of the levels, which is partly in our area of responsibility. Level 2 - Supervisory Control (Figure 2.8). This level of control is higher than the automatic controllers of level 1 (which control only a small subsystem).

Fig. 2.8. Facilities control system from SCADA point of view (level 2).

Decision-making control usually takes on the following functions:

Sets control points for important process variables (depending on the nature of the product, volume and type of production) - it has a strong influence on process control, energy, quality and efficiency.
Performance monitoring/diagnostics - checks sensors, actuators and process parameters for errors (results are saved).
Start/stop/emergency - special discrete and continuous control models designed to respond to operator commands and diagnostic events (such as detected errors).
Reconfiguration/settings monitoring - structural or parametric adjustment of the control loops. This is performed either in response to operator commands or in response to diagnostic events.
Graphical interface - operator interface for manual operation and correction.

These systems are dependent on the type of controlled process (as opposed to Level 1, which is usually unified). Usually such systems are mix of hardware and software algorithms and they are very expensive.

Consider CNC machine driver control system. Find out possible set points and describe functionalities according to level 2.

2.6 Other control levels

Let us briefly consider the functions of Level 3 (production control):

Process planning: availability of resources, their optimal use and processing.
Maintenance management: the decision-making processes associated with the detection and deployment of complicated operations.
Inventory management: decision-making processes related to the monitoring and deployment of raw materials, finished goods, etc.
Quality management: assessment, documentation and quality management.

In the factory, this level is the responsibility of the chief technologist department and the quality control management (laboratories).

2.7. Conclusion

In this chapter we have considered the general features of the production management system. We have briefly described each of the levels and made basic diagrams.

The time and informativeness of the solutions increase as the level increases. At the lowest level, the control system is faster (one sensor) and at the higher levels - is slower (many sensors and processes). Over the management level, the information is aggregated over a certain period of time (days or week, maybe even slower). Each of describe levels is connected via a communication protocol (for low level this is CANBus, Fieldbus, etc. network), and all this communications forms a single SCADA system.

2.8 Section Tasks

Draw the block diagram of a typical sensor.
Draw the block diagram of a typical actuator.
Consider the electro-hydraulic actuator of the valve. Examine and identify the actuator subsystems and describe it.
Draw a block diagram of the level 1 of industrial control system.
Consider a position control system with motor drive in CNC machine. Determine the main feedback encoders in the system. Identify the main sources of noises. What main differences between this system and conveyor drive system?
Identify the main difference between the serial/logic control system and analogue control systems.
Provide an example of industrial discrete sensors and industrial discrete actuators.
State the three main functions of the supervisory control system.
Describe the three main functions of the production control system.
Examine and clarify specific activities to control production at any typical plant. Draw an automation pyramid and define levels.

3. References

My conferences

2018-08-02T00:00:00+03:00

This note brings together the main conferences in which I participated. The names of works and materials to them are given.

Table of Contents (TOC)

2nd Congress of Analysts of Russia, 2013, Moscow, Russia
VIII All-Russian Conference on X-ray spectral analysis, 2014, Irkutsk, Russia
3rd Congress of Analysts of Russia, 2017, Moscow, Russia
11th Winter symposium on chemometrics (WSC11), 2018, Saint Petersburg, Russia
5th International Congress on Microscopy & Spectroscopy (INTERM), 2018, Oludeniz, Turkey
I All-Russian Conference with International Participation “Mathematical and Computer Modeling in Materials Science”, 2019, Cherepovets, Russia
3rd International Conference on Information Processing and Control Engineering (ICIPCE), 2019, Moscow, Russia
International Scientific and Practical Conference of NIUIF JSC: 100 years of development of science and production, 2019, Cherepovets, Russia
III All-Russian Conference on Analytical Spectroscopy with International Participation, 2019, Tuapse, Russia
3rd International Conference on Automation, Control and Robots (ICACR), 2019, Prague, Czech Republic
Night of the Science, 2019, Kirovsk, Russia
The 4th International Conference on Mechanical, System and Control Engineering (ICMSC), 2020, Kazan, Russia

1. 2nd Congress of Analysts of Russia, 2013, Moscow, Russia

1.1 Poster report.

D.V. Yunovidov, A.T. Rebrikova, K.V. Oskolok, V.V. Sokolov X-ray fluorescence determination of technologically important elements in extraction phosphoric acid // The Second Congress of Russian Analysts. Moscow. Russia. 2013. Thesis. P. 289. (In Russ.)

1.2 Poster report.

D.V. Yunovidov, A.T. Rebrikova, K.V. Oskolok, V.V. Sokolov The technique of a virtual experiment for quantitative X-ray fluorescence analysis of extraction phosphoric acid // The Second Congress of Russian Analysts. Moscow. Russia. 2013. Thesis. P. 290. (In Russ.)

2. VIII All-Russian Conference on X-ray spectral analysis, 2014, Irkutsk, Russia

2.1 Poster (in Russ.).

D.V. Yunovidov, S.Z. El-Salim, K.V. Oskolok The technique of virtual experiment and its application for quantitative X-ray fluorescence analysis of extraction phosphoric acid // VIII All-Russian Conference on X-ray Spectroscopy. Irkutsk. Russia. 2014. Thesis. P. 140. (In Russ.)

2.2 Report (in Russ.).

D.V. Yunovidov, S.Z. El-Salim, K.V. Oskolok Reconstruction of the spectrum of a homogeneous system from time dependences of line intensities in the nascent and developing heterogeneous system using the example of extraction phosphoric acid // VIII All-Russian Conference on X-ray Spectroscopy. Irkutsk. Russia. 2014. Thesis. P. 139. (In Russ., presentation style are removed on purpose).

3. 3rd Congress of Analysts of Russia, 2017, Moscow, Russia

3.1 Poster (in Russ.).

D.V. Yunovidov, V.V. Sokolov, A.S. Bakhvalov Use of the NPKS spectrum of fertilizers to assess the significance of the stages of sample preparation for X-ray fluorescence analysis // Third Congress of Russian Analysts. Moscow. Russia. 2017. Thesis. P. 243. (In Russ.)

4. 11th Winter symposium on chemometrics (WSC11), 2018, Saint Petersburg, Russia

Fig. 1. Certificate.

4.1 Poster.

D. Yunovidov, V. Sokolov, A. Bahvalov Big data analysis and comprehensive analytical control of fertilizers // 11 Winter School of Chemometrics (WSC 11). Saint Petersburg. Russia. 2018. Thesis.

5. 5th International Congress on Microscopy & Spectroscopy (INTERM), 2018, Oludeniz, Turkey

Fig. 2. Certificate.

5.1 Poster.

Yunovidov D., Sokolov V., Bahvalov A. Optical addition to X-ray Fluorescence Analysis of Mineral Fertilizers // INTERM 2018. 5th International Congress on Microscopy & Spectroscopy. Oludeniz. Turkey. April 24 - 30. 2018. Thesis.

Article.

6. I All-Russian Conference with International Participation "Mathematical and Computer Modeling in Materials Science", 2019, Cherepovets, Russia

Fig. 3. Certificate

6.1 Report (in Russ.).

D.V. Yunovidov Multidimensional classification method of industrially produced mineral fertilizers for the representation of the “manufacturer–quality” model // Mathematical and computer modeling in material science. Cherepovets. Russia. 2019. Theses.

6.2 Poster (in Russ.).

M.N. Nadezhin, D.V. Yunovidov, V.A. Shabalov, V.V. Sokolov Modeling and estimation of the relation between the granulometric composition and various parameters of the mineral fertilizer production according to the scheme of the drum-granulator-dryer (on the example of di ammonium phosphate) // Mathematical and computer modeling in the materials science. Cherepovets. Russia. 2019. Theses.

6.3 Poster (in Russ.).

E.E. Sidorova, D.V. Yunovidov, V.V. Sokolov Granulometric composition as a parameter of modeling the technological process of mineral fertilizers production according to the scheme drum-granulator-dryer // Mathematical and computer modeling in materials science. Cherepovets. Russia. 2019. Theses.

7. 3rd International Conference on Information Processing and Control Engineering (ICIPCE), 2019, Moscow, Russia

Fig. 4. Certificates.

7.1 Report.

Speech.

Article.

8. International Scientific and Practical Conference of NIUIF JSC: 100 years of development of science and production, 2019, Cherepovets, Russia

Fig. 5. Certificate.

8.1 Report (in Russ.).

D.V. Yunovidov Modern methods of the automated express control at the analysis of quality of mineral fertilizers // International scientific-practical conference of JSC “NIUIF”: 100 years of development of science and production. Cherepovets. Russia. 2019. Theses.

8.2 Report (in Russ.).

D.V. Yunovidov Modern methods of analysis of mineral fertilizers, raw materials and semi-products // International scientific-practical conference of JSC “NIUIF”: 100 years of development of science and production. Section of Analytical Chemistry. Cherepovets. Russia. 2019. Theses.

9. III All-Russian Conference on Analytical Spectroscopy with International Participation, 2019, Tuapse, Russia

9.1 Poster (in Russ.).

D.V. Yunovidov, E.E. Sidorova, M.N. Nadezhin, V.V. Sokolov Optical quality control of industrial processing of mineral fertilizers with conditioning additives // III All-Russian Conference on Analytical Spectroscopy with international participation. Krasnodar. Russia. 2019. Theses.

9.2 Poster (in Russ.).

D.V. Yunovidov Classification and regression analysis of mineral fertilizer brands // III All-Russian Conference on Analytical Spectroscopy with International Participation. Krasnodar. Russia. 2019. Theses.

10. 3rd International Conference on Automation, Control and Robots (ICACR), 2019, Prague, Czech Republic

Fig. 6. Certificate.

10.1 Report.

Speech.

Article.

11. Night of the Science, 2019, Kirovsk, Russia

11.1 Report (in Russ.).

D.V. Yunovidov History and modern times of NIUIF // Night of the Science, Kirovsk, Russia. 2019.

12. The 4th International Conference on Mechanical, System and Control Engineering (ICMSC), 2020, Kazan, Russia