Статьи Методики
  Расчеты Советы Справочник История

ОЦЕНКА ОШИБКИ АНАЛИЗА. НОВЫЕ ПРЕДЛOЖЕНИЯ

© Киселев M.М., 2017 (z-consult@yandex.com)

 

При расчетах ошибки анализа хорошим тоном являются статистические расчеты с выявлением доверительного интервала. Это, естественно, подразумевает тот факт, что ошибка считается преимущественно случайной.

Размышления на эту тему приводят к логичному вопросу: что мы называем случайной ошибкой? Поскольку материалистический подход в химии преобладает, то ошибку всегда определяет изменение условий опыта (температура, кривая рука лаборанта, примеси). Из этого следует, что случайной ошибкой можно назвать ошибку, которая наступает вследствие частых и неконтролируемых изменений условий химической реакции. Если же условия меняются не так часто, как хотелось бы, то можно ли называть новую ошибку случайной по отношению к ошибке, которая часто себя проявляет?

Например, мы проводили определения в один день. На следующий день мы подумали над результатами и решили доделать работу, не обращая внимание на то, что частота появления и величина ошибок изменились (за всем не уследишь). Так можно ли в этом случае посчитать случайную ошибку определения методами математической статистики, не развернув при этом большое исследование. Без сомнения можно. Другой вопрос: можно ли верить тому, что рассчитали? С верой в этом деле обстоит довольно сложно, так как результат будет мешаниной из различных видов и величин ошибок. Величине доверительного интервала при этом не очень хочется доверять, так как он предполагает в большинстве случаев нормальное распределение результатов анализа, а это еще надо доказать.


Как тогда рассчитать ошибку анализа? Назовем ошибку анализа просто ошибкой, причем будем считать, что эта ошибка является суммой ошибок всех видов, а не только случайных. Разумным следствием этого шага будет оценка точности анализа максимальной погрешностью измерений:

Δmax = Δxmax- Δxmin,

где
Δxmax, Δxmin - максимальная и минимальная величины результатов параллельных измерений.
Тогда результат анализа будет гарантированно находится в границах от

xср - Δmax  до   xср + Δmax
или
xср ± Δmax

где xср - среднее арифметическое.

Почему следует считать отклонение результата анализа от среднего, используя максимальную ошибку, а не, например, половину ее величины? Дело в том, что мы не считаем погрешность только случайной. В связи с этим истинное значение результата анализа не обязательно будет равно среднему арифметическому, поэтому можно гарантированно оценить максимальную погрешность только разностью Δxmax- Δxmin.
Положительный момент вышеупомянутого подхода к оценке ошибки анализа состоит в том, что расчеты существенно упрощаются. (Одно понятие среднеквадратичной ошибки вызывает легкую панику у химиков, которые привыкли использовать 4 арифметические операции.)


Однако, есть и негативные моменты (на первый взгляд). Величина ошибки существенно увеличится, что сначала будет очень раздражать, умаляя Ваши прежние успехи. Однако, надо смело взглянуть правде в глаза. Фактически никто глубоко не исследует случайный характер ошибки, так как доказательство нормального распределения случайной ошибки займет уйму времени и сил. (Это вам не 50 раз монету подкидывать!) Отсюда следует, что обычно нет доказательства тому, что многократное повторение анализа приведет к существенному уменьшению погрешности анализа. Если это так, то лучше уж ошибку переоценить, чем недооценить.


Есть еще один неприятный момент. Если ошибка не носит характер случайной, то все полученные параллельные результаты считаются пригодными для расчета. Это положение нельзя игнорировать, исключая результаты анализа, которые нам не нравятся. Как же тогда быть с неверным глазомером лаборанта? Иными словами, что делать с редким результатом, обладающим большой ошибкой? Его так просто не отбросишь! Можно предложить следующий подход. Пусть из 20 измерений одно явно вываливается. Его можно не учитывать в расчетах, но тогда надо честно сказать, что в расчете ошибки принимало участие 95% процентов результатов анализа.


Понятно, что оценивая погрешность результатов той или иной методики, надо как можно больше набрать данных. При этом условия измерений действительно должны быть различными, но в прогнозируемых границах. Например, рассчитывать на анализ в условиях тайфуна не стоит, а вот контролировать возможное изменение состава анализируемой среды пробы надо обязательно. При этом нет нужды класть половину жизни на множество параллельных измерений, так как хватит 3-4 измерений в каждой пробе, но c новыми условиями в каждой серии измерений. Общее количество измерений при этом не должно быть малым, если мы хотим оценить точность разрабатываемой методики анализа.


Теперь рассмотрим очень известную задачу о сравнении результатов анализа двух разных лабораторий: является ли различие настолько велико, чтобы считать существенным вклад систематических расхождений между результатами анализа. Для решение этой задачи нам нужно доказать, что расхождения между результатами анализа не должны превышать суммы максимальных ошибок:

|xср,1 - xср,2| ≤ Δmax,1 + Δmax,2

Однако, возможны варианты. Например, если ошибка одного анализа Δmax была рассчитана на основе большего количества данных, то можно применить другое условие:

|xср,1 - xср,2| ≤ 2Δmax

Нарушение вышеупомянутых условий неизбежно ведет к выводу о том, что вклад упущенной из внимания систематической ошибки в результат анализа высок.

 

Перейдем к теме оценки погрешности параметров линейных калибровочных графиков типа

y = ax + b,

где
a, b – параметры прямой линии.
Начнем с оценки погрешности расчета параметра а с помощью величины максимального отклонения Δmaxy. Максимальным отклонением будем считать абсолютную сумму 2-х максимальных отклонений (отрицательного и положительного) ординат точек от ординат точек на прямой линии.
Пусть есть некий массив точек, который надо аппроксимировать прямой линией. Несложные размышления приводят к тому, что максимальное отклонение параметра а будет в том случае, если ординаты крайних точек будут иметь разные знаки отклонения Δmaxy. Вычислим максимальную погрешность вычисления параметра Δmaxa:

a + Δmaxa = |ymaxmaxy - (yminmaxy)|
xmax- xmin
Δmaxa = maxy .
xmax- xmin

 

При таком положении дел ошибка вычисления параметра b может быть оценена следующим образом:

y = (a + Δmaxa)*xср + (b + Δmaxb);
Δmaxb =- Δmaxa · xср,

где

xср = xmax + xmin  
2


Для удобства будем оперировать только положительными величинами ошибок:

Δmaxb = Δmaxa · xср.


Однако этот способ расчета ошибки не всегда указывает на ее максимальную величину. Например, если величины xmax и xmin имеют разные знаки, то вычисленная ошибка явно не будет максимальной. Лучше оценить в этом случае максимальную ошибку следующим образом:

Δmaxb = Δmaxy.


Так какой способ расчета применить в этом случае? Можно поступить следующим образом: оценить ошибку b двумя способами. Какая величина получится больше, та ошибка величины b и будет максимальной.

Полезно рассмотреть случай, когда b=0. Поскольку величина наклона прямой определяется главным образом последней точкой, то ошибка наклона может быть рассчитана следующим образом:

Δmaxa = maxy .
xmax