Систематическая ошибка отбора. Большая энциклопедия нефти и газа

Систематическая ошибка -- это систематическое (неслучайное, однонаправленное) отклонение результатов исследований от истинных значений. Выделяют несколько основных видов систематических ошибок.

Систематическая ошибка, обусловленная нарушением правил подбора пациентов (selection bias). Она чаще всего возникает на этапе формирования исследуемых групп в результате отбора для включения в исследование лиц, которые не являются репрезентативными для общей совокупности больных. Эта систематическая ошибка создаётся в результате того, что сравниваемые группы испытуемых различаются не только по основным признакам, но и по другим факторам, влияющим на результат исследования, т.е. участники фактически отбираются из разных популяций.

Пример: в том случае, когда в качестве группы контроля используются ранее набранные больные, а методика их обследования с течением времени претерпела изменения, наступает хронологическое смещение.

Пример: в исследование включаются добровольцы, сами откликнувшиеся на объявление об исследовании.

Систематическая ошибка отбора может приводить в ИСК к формированию контрольной группы, плохо сопоставимой с основной группой. Например, при формировании контрольной группы из больных с другим заболеванием вмешиваются привходящие факторы, связанные с этой болезнью. С другой стороны, если контрольная группа формируется из общей популяции, то результаты могут оказаться несопоставимыми с основной группой, например, по возрасту и полу. Для предотвращения этой ошибки нужно подбирать пациентов попарно в контрольную и основную группы по нескольким признакам, потенциально влияющим на изучаемые показатели. Другой вариант предотвратить ошибку - использовать несколько контрольных групп.

Ошибка подбора, более характерная для ИСК, может возникать и в РКИ, если, например, из контрольной группы теряются самые тяжелые пациенты.

Систематическая ошибка, возникающая при измерении, вследствие неудачно выбранного метода оценки результатов исследования. Подобная ошибка появляется тогда, когда пациенты в сравниваемых группах обследуются неодинаково (разные методы диагностики, частота обследований) или используются нестандартизованные схемы получения данных и субъективные оценки.

Субъективная оценка в большинстве случаев даёт завышенный результат по сравнению с оценкой независимого эксперта и/или объективными методами.

Пример: ошибка вследствие различия в степени подробности сбора анамнеза в группах больных и здоровых.

Пример: рентгенологи, если проводят оценку рентгенограмм, зная дополнительную информацию о пациенте, могут более пристально и критически оценивать «контрольных» пациентов, по сравнению с «получающими активное лечение».

Систематическая ошибка, обусловленная действием вмешивающихся факторов (confounding), проявляется тогда, когда изучаемые факторы взаимосвязаны, и одни из них искажают эффекты других. Это может произойти из-за систематической ошибки при отборе, под действием случайности или из-за реального взаимодействия факторов, что должно учитываться при анализе результатов исследования.

Пример: при проведении исследования влияния потребления овощей на возникновение заболевания, не была учтена разная распространенность второго фактора риска (например, курения) в сравниваемых группах.

Систематическая ошибка, обусловленная эффектом плацебо . «Эффект пустышки» - систематическое улучшение состояния пациентов при имитации лечения. Если в контрольной группе проводится лечение, внешне не отличимое от активного в группе вмешательства, то разница между этими группами исключает эффект плацебо.

В ходе наблюдения за больными у них наблюдается улучшение состояния. Часть этого эффекта объясняется естественным течением болезни, часть - неспецифическим влиянием лечения (эффект плацебо), а разница между группами соответствует дополнительной пользе, приносимой активным лечением. РКИ специально планируются так, чтобы отсеять все эффекты, за исключением собственно эффекта активного лечения.

Рисунок 1. Выявление эффекта активного лечения по сравнению с плацебо

Способы устранения систематических ошибок

Наиболее частыми источниками погрешностей при проведении КИ являются ожидания исследователей и испытуемых, влияние которых можно уменьшить путём использования стандартных способов контроля с использованием: анамнез лечение плацебо

грамотного отбора испытуемых в контрольные группы;

метода «ослепления» (маскирование вмешательства);

рандомизации (со стратификацией или без неё) при формировании различных групп испытуемых;

методов статистического моделирования.

Испытания с самоконтролем - для экспериментальной и контрольной групп привлекается один объект, например, пациент в отдельные дни получает лечение, в другие - плацебо.

Перекрестное испытание - одни пациенты выбираются для экспериментальной группы, другие - для контрольной; после остановки лечения в новом периоде группа лечения становится контрольной, а контрольная - группой лечения. При обобщенном рассмотрении результатов получается, что каждый пациент был сам себе контролем.

Рисунок 2. Источники систематических ошибок и методы борьбы с ними

Испытания с подобранным контролем - проводятся путём подбора контроля к каждому случаю так, чтобы они не отличались ни по одному из подозреваемых факторов. Это позволяет избежать различий между группами, связанных с известными факторами, которые не интересны в данном исследовании. Например, при изучении связи болезни с особенностями питания путем подбора контрольных лиц можно исключить влияние на здоровье дохода и курения. При подборе сравниваются различия не между всеми случаями и контролем, а совокупность различий внутри отдельных пар.

Метод маскирования вмешательств («слепое» исследование, ослепление)

Немаскируемый (открытый) метод выполнения РКИ - испытуемый и исследователь знают о лечении, которое получает испытуемый. При этом, например, испытуемый в контрольной группе может начать лечиться другими средствами и разница между группами исчезнет.

Простой слепой метод - испытуемый не знает, какое лечение он получает. Метод чреват ошибками, связанными с тем, что врач и другие медицинские работники будут относиться по-разному к ведению пациентов, получающих активное лечение и плацебо (старое и новое вмешательство).

Двойной слепой метод - исследователь и пациент не знают, какое лечение получает он или группа.

Тройной слепой метод - исследователь, пациент и руководители КИ, организующие исследование и анализирующие его результаты, не знают, какое лечение получает группа.

Рандомизация - способ распределения испытуемых в группы в случайной последовательности - с использованием таблицы случайных чисел или иного правильного метода. Рандомизация - обязательное свойство правильного проведения КИ, которое в таком случае называется рандомизированным. Использование случайных чисел гарантирует, что вероятность попадания в конкретную группу лечения одинакова для всех испытуемых. Рандомизация используется не только при проведении КИ, но и при проведении исследований на экспериментальных животных.

В настоящее время РКИ стали стандартом клинических испытаний. Разработаны разные методы рандомизации -рандомизация пациентов по группам, парная рандомизация, факторная, адаптивная и ряд других.

Рисунок 3. Схематическое изображение РКИ

Правильными методами рандомизации являются использование таблиц случайных чисел и компьютерных программ, а также иногда бросание монеты, т.е. методы, которые генерируют случайную последовательность распределения пациентов по группам.

Однако надо отметить, что, несмотря на всеобщее признание, суть рандомизации нередко понимают неверно и вместо случайного распределения испытуемых прибегают к упрощенным способам (по алфавиту, датам рождения, дням недели и т.д.) и даже допускают произвольное распределение в группы. Подобная «псевдорандомизация» не даёт ожидаемых результатов.

Стратификация - используется с целью обеспечения равного распределения испытуемых по группам лечения с учетом факторов, существенно влияющих на исход, например, возраста, длительности болезни и т.д. Иными словами, например, пациенты-мужчины рандомизируются независимо от женщин. Стратификация гарантирует одинаковое распределение указанных факторов в группах лечения.

Статистическое моделирование - применяется для оценки силы связи и эффекта воздействия с одновременным учётом действия множества переменных. Наиболее распространенным методом статистического моделирования вероятности качественных событий (госпитализация, смерть) является множественная логистическая регрессия.

Все ошибки, которые имеют место при прямых измерениях, можно разделить на три основные категории: систематические, случайные и грубые погрешности (или промахи).
1. Систематические ошибки - это ошибки, которые постоянно вносятся в измерения, которые часто известны заранее и от которых можно основном избавиться, если тщательно продумать эксперимент.

Систематические погрешности включают в себя методические и инструментальные (приборные) погрешности измерений. Методические погрешности называются недостатками применяемого метода измерений, несовершенством теории физического явления и неточностью расчетной формулы, используемой для нахождения величины; что измеряется.
Суть таких ошибок легко понять из следующих примеров.
а) В чашечно ртутном барометре при том же атмосферном давлении ртуть в трубке устанавливается на разной высоте при различных температурах окружающей среды. При измерении давления с помощью такого барометра допускается систематическая ошибка, причина которой - разница в коэффициентах линейного расширения ртути и латуни, из которой изготовлена шкала. Эта ошибка легко может быть подсчитана и исключена.
б) Электроизмерительные приборы, термометры, весы и многие другие приборов вносят систематические ошибки в измерения, если в них смещена нулевая точка.
в) Систематические ошибки могут быть связаны со свойствами самого объекта измерения. Эти ошибки нельзя учесть заранее, но при рациональном проведении измерений такие ошибки могут быть переведены в разряд случайных.
Пример. В работе по определению коэффициента поверхностного натяжения жидкости приходится измерять диаметр капилляра, в разных местах может быть различным. Ошибку можно уменьшить, измеряя диаметр различных участков капилляра и взяв среднее из полученных измерений. Таким образом, эта систематическая ошибка перейдет в разряд случайных.
2. Случайные ошибки заранее устранить нельзя. Эти ошибки связаны с субъективными особенностями наблюдателя, с несовершенством измерительных приборов, с изменениями окружающих условий во время опыта. Случайные ошибки одинаково вероятны, как в сторону увеличения, так и в сторону уменьшения значения величины, что измеряется. Уменьшить их влияние можно многократным повторением измерений, а в некоторых случаях изменением условий опыта.
Пример. При определении коэффициента внутреннего трения жидкости по методу Стокса необходимо знать скорость падения шарика известного диаметра в данной жидкости. Эта скорость? определяется по времени t, за который шарик при равномерном движении проходит в жидкости известную расстояние s:.
Предположим, что s в нашей установке порядка 20 - 30 см, а t измерениями равен 40-50 секунд. Если для определения размеров s и t, взять сантиметровый масштаб линейки и часы с минутной стрелкой, то явно наши измерения будут очень грубые. На первый взгляд кажется, что точность измерения величины? будет непрерывно повышаться с увеличением точности используемых измерительных приборов - масштабной линейки и секундомера. Однако это будет иметь место только до некоторого момента, начиная с которого последующее увеличение точности приборов перестанет уменьшать ошибку измерения скорости, обусловленное в данном случае ошибкой, что делается наблюдателем (всегда существует некий разрыв во времени между моментом прохождения шариком соответствующей деления шкалы и моментом нажатия кнопки секундомера). При таких условиях эксперимента дальнейшего уменьшения ошибки в измерении? можно достичь только путем увеличения числа измерений и обработки их результатов (тщательного анализа проделанных измерений).
Стоит заметить, что точность определения? по значениям s и t может быть увеличена за счет изменения условий опыта.
Например, очевидно, что при увеличении в несколько раз расстоянии s, во столько же вместе увеличится и время t и несмотря на то, что ошибка, что делается при их измерении, остается прежней по абсолютной величине, влияние этой ошибки при определении скорости уменьшается.
Известно, что любой измерительный прибор или инструмент имеет свою предельную точность, обусловленную его конструкцией и качеством изготовления. При правильном выборе условий эксперимента и грамотного использования прибора случайный разброс результатов измерений, проведенных с помощью этого прибора, должен быть значительно меньше предельной ошибки, обусловленной конструкцией и указанной в паспорте прибора. Чтобы убедиться в этом в каждом конкретном случае, необходимо сделать несколько измерений, найти среднюю ошибку (по правилам, указанным ниже) и сравнить ее с паспортной. Если случайный разброс действительно окажется значительно меньше паспортной ошибки, в дальнейшем можно измерения проделывать один раз и считать ошибку соответствии с паспортными данными прибора.
Часто для сравнения точности измерений с точностью прибора бывает необходимо проделать большое число измерений. Если при этом в измерениях наблюдается воспроизведения в пределах точности прибора, то при исчислении погрешности следует учитывать только точность прибора.
Если случайные ошибки даже при большом числе измерений значительно превышают паспортную погрешность прибора (например, при изменчивости состояния окружающей среды, невозможности точно произвести отсчет и т.п.), и устранить причины этих отклонений невозможно, можно заменить прибор менее точным, отвечающего конкретным условиям эксперимента.
При выборе метода оценки погрешности измерений необходимо прежде всего осознать, идет ли речь о случайной погрешности измерений (случайном разбросе), либо об ошибке, внесенную приборами. Если решающую роль играют случайные ошибки, применяются статистические методы обработки результатов измерений. Если ошибка опыта определяется точностью приборов, подсчитывается предельная ошибка метода.
Стоит заметить, что размер средней случайной ошибки указывает лишь на качество измерений, но не характеризует точность метода, потому что результат может содержать систематическую ошибку.
Расчет случайных погрешностей делается методами теории вероятностей и математической статистики.
3. Грубая ошибка или промах - это погрешность, существенно превышает ожидаемую при данных условиях. Она может быть сделана в результате неправильной записи показаний прибора, ошибки экспериментатора с электроинструментом (например, при измерении длины линейкой один из концов предмета оказался не совмещенным с нулевой делением), может быть связана с неисправностью измерительной аппаратуры или с резким изменением условий измерений. Иногда промахи можно обнаружить, повторяя измерение в несколько отличных условиях, или анализируя результаты (как будет показано далее). Обнаружены промахи нужно исключить и в случае необходимости провести новые измерения.

Систематическая ошибка – это смягченное выражение, заменяющее слова «ошибка экспериментатора».

Систематические ошибки остаются, как правило, постоянными на протяжении всей серии опытов. Величина их может быть и известной, и неизвестной заранее. Например, курс шхуны «Пилигрим» содержал неизвестную Дику Сэнду, но известную Негоро систематическую ошибку.

Систематические погрешности могут быть обусловлены различными причинами:

· ограниченной точностью изготовления прибора (погрешностью прибора). Шкала линейки может быть нанесена неточно (неравномерно); взвешивание может производиться с помощью неточных гирь; положение нуля термометра может не соответствовать нулевой температуре; капилляр термометра может иметь разное сечение в разных участках шкалы; стрелка амперметра может не располагаться на нуле в отсутствие электрического тока через прибор;

· такие ошибки часто возникают из-за того, что реальная установка в чем-то отличается от идеальной, или условия эксперимента отличаются от предполагаемых теорией, а поправки на это несоответствие не делаются. Систематическая погрешность возникает при измерении массы, если не учитывается действие выталкивающей силы воздуха на взвешиваемое тело и на разновесы; при измерениях объема жидкости или газа, если не учитывается тепловое расширение; при калориметрических измерениях, если не учитывается теплообмен прибора с окружающей средой. Другими примерами эффектов, которыми может быть обусловлена обсуждаемая ошибка, являются термо-ЭДС в контактах, сопротивление подводящих проводов, «мертвое» время счетчиков частиц;

· систематические ошибки могут быть обусловлены также неправильным выбором метода измерений. Например, мы совершим такую ошибку, определяя плотность какого-то материала посредством измерений объема и веса образца, если этот образец содержит внутри пустоты, например, пузыри воздуха, попавшие туда при отливке;

· мы допускаем систематическую погрешность, округляя численную величину до какого-либо приближенного значения, например, полагая π = 3, π = 3.1, π = 3.14 и т. д. вместо π = 3.14159265…

При наличии скрытой систематической погрешности результат, приведенный с незначительной ошибкой, будет выглядеть вполне надежным, хотя на самом деле он является неверным.

Классическим примером может служить опыт Милликена по измерению элементарного электрического заряда e . В этом эксперименте требуется знать вязкость воздуха. Милликен взял заниженную величину вязкости и получил

e = (1.591 ± 0.002)∙10 - 19 Кл.

В настоящее же время принято значение

e = (1.60210 ± 0.00002)∙10 - 19 Кл.

Долгое время величины ряда других атомных констант, таких, как постоянная Планка и число Авогадро, базировались на значении элементарного электрического заряда e , полученном Милликеном, и, следовательно, содержали ошибку, превышающую 0.5 %.

Систематические ошибки не поддаются математическому анализу, и поэтому их нужно выявить и устранить . Если удается обнаружить причину и найти величину сдвига (например, вес вытесненного телом воздуха при точном взвешивании), то систематическую погрешность можно исключить введением поправки к измеренному значению. Однако общих рецептов и универсальных правил, позволяющих обнаружить систематические ошибки конкретного измерения, не существует Выявление, оценка и устранение таких ошибок требует опыта, догадки и интуиции экспериментатора. Нужно тщательно продумывать методику опытов и придирчиво выбирать аппаратуру. Иногда систематическую ошибку, обусловленную измерительным прибором, можно уменьшить, используя более точный прибор, желательно, другого типа. Наиболее действенный способ обнаружения систематических ошибок – это сравнение результатов измерений одной и той же величины, выполненных принципиально разными методами.

Случайная ошибка

Случайные ошибки проявляются в разбросе отсчетов при повторении измерений в одних и тех же доступных контролю условиях.

Величина случайных ошибок различна даже для измерений, выполненных одинаковым образом. Случайные ошибки происходят вследствие меняющихся от измерения к измерению неконтролируемых причин, действие которых неодинаково в каждом опыте и не всегда может быть учтено. Даже при взвешивании одними и теми же гирями мы, вообще говоря, будем получать разные значения веса. Источниками ошибок могут быть, например, колебания воздуха, воздействующие неодинаково на чашки весов; пылинка, осевшая на одну из чашек; нагревание одной половины коромысла от приближения руки взвешивающего; разное трение в правом и левом подвесах чашек и множество других причин, которые практически невозможно учесть. При измерениях периода колебаний маятника с помощью секундомера скажутся погрешности моментов пуска и остановки секундомера, ошибка в величине отсчета, небольшая неравномерность движения маятника вследствие трения. Случайные погрешности вызываются также сотрясениями здания. В опытах по измерению скорости радиоактивного распада ядер сама определяемая величина определена лишь статистически, как некоторое среднее значение, и флуктуации числа распадов в равные промежутки времени будут наблюдаться даже при идеально точной аппаратуре.

Проделав измерения и используя методы обработки, основанные на теории ошибок, можно дать оценку случайной ошибки и указать вероятность, с которой истинное значение измеряемой величины находится внутри некоторого доверительного интервала.

Случайную ошибку можно уменьшить путем многократного повторения измерений.

Промах

Следует особо выделить такой вид ошибок, как грубый просчет, или промах. Под промахом понимается ошибка, сделанная вследствие неверной записи показаний прибора, недосмотра экспериментатора, или вызванная неисправностями аппаратуры. Например, неправильно записанный отсчет, замыкание электрической цепи являются промахами, которых следует по возможности избегать.

В качестве примера промаха при взвешивании можно привести запись веса 100.20 г вместо 1000.20 г. При измерениях длины метровой линейкой промах может появиться, если один из концов измеряемого предмета окажется совмещенным не с нулевым делением линейки, а, скажем, с делением 10 см.

Если серия из небольшого числа измерений содержит грубую ошибку – промах, то наличие этого промаха может сильно исказить как среднее значение <x > измеряемой величины, так и погрешность измерения D.x . Поэтому такой промах необходимо исключить из окончательного результата. Обычно промах имеет значение, резко отличающееся от других данных. Иногда промах удается выявить, повторив измерение.

Для устранения промахов нужно соблюдать аккуратность и тщательность в работе и записи данных. Как правило, грубые ошибки могут быть обнаружены, поэтому результаты таких измерений следует отбрасывать.

Систематической погрешностью называется составляющая погрешности измерения, остающаяся постоянной или закономерно меняющаяся при повторных измерениях одной и той же величины. При этом предполагается, что систематические погрешности представляют собой определенную функцию неслучайных факторов, состав которых зависит от физических, конструкционных и технологических особенностей средств измерений, условий их применения, а также индивидуальных качеств наблюдателя. Сложные детерминированные закономерности, которым подчиняются систематические погрешности, определяются либо при создании средств измерений и комплектации измерительной аппаратуры, либо непосредственно при подготовке измерительного эксперимента и в процессе его проведения. Совершенствование методов измерения, использование высококачественных материалом, прогрессивная технология - все это позволяет на практике устранить систематические погрешности настолько, что при обработке результатов наблюдений с их наличием зачастую не приходится считаться.

Систематические погрешности принято классифицировать в зависимости от причин их возникновения и по характеру их проявления при измерениях.

В зависимости от причин возникновения рассматриваются четыре вида систематических погрешностей.

1. Погрешности метода, или теоретические погрешности, проистекающие от ошибочности или недостаточной разработки принятой теории метода измерений в целом или от допущенных упрощений при проведении измерений.

Погрешности метода возникают также при экстраполяции свойства, измеренного на ограниченной части некоторого объекта, на весь объект, если последний не обладает однородностью измеряемого свойства. Так, считая диаметр цилиндрического вала равным результату, полученному при измерении в одном сечении и в одном направлении, мы допускаем систематическую погрешность, полностью определяемую отклонениями формы исследуемого вала. При определении плотности вещества по измерениям массы и объема некоторой пробы возникает систематическая погрешность, если проба содержала некоторое количество примесей, а результат измерения принимается за характеристику данного вещества -вообще.

К погрешностям метода следует отнести также те погрешности, которые возникают вследствие влияния измерительной аппаратуры на измеряемые свойства объекта. Подобные явления возникают, например, при измерении длин, когда измерительное усилие используемых приборов достаточно велико, при регистрации быстропротекаюших процессов недостаточно быстродействующей аппаратурой, при измерениях температур жидкостными или газовыми термометрами и т.д.

2. Инструментальные погрешности, зависящие от погрешностей применяемых средств измерений.. Среди инструментальных погрешностей в отдельную группу выделяются погрешности схемы, не связанные с неточностью изготовления средств измерения и обязанные своим происхождением самой структурной схеме средств измерений. Исследование инструментальных погрешностей является предметом специальной дисциплины - теории точности измерительных устройств.

3. Погрешности, обусловленные неправильной установкой и взаимным расположением средств измерения, являющихся частью единого комплекса, несогласованностью их характеристик, влиянием внешних температурных, гравитационных, радиационных и других полей, нестабильностью источников питания, несогласованностью входных и выходных параметров электрических цепей приборов и т.д.

4. Личные погрешности, обусловленные индивидуальными особенностями наблюдателя. Такого рода погрешности вызываются, например, запаздыванием или опережением при регистрации сигнала, неправильным отсчетом десятых долей деления шкалы, асимметрией, возникающей при установке штриха посередине между двумя рисками.

По характеру своего поведения в процессе измерения систематические погрешности подразделяются на постоянные и переменные.

Постоянные систематические погрешности возникают, например, при неправильной установке начала отсчета, неправильной градуировке и юстировке средств измерения и остаются постоянными при всех повторных наблюдениях. Поэтому, если уж они возникли, их очень трудно обнаружить в результатах наблюдений.

Среди переменных систематических погрешностей принято выделять прогрессивные и периодические.

Прогрессивная погрешность возникает, например, при взвешивании, когда одно из коромысел весов находится ближе к источнику тепла, чем другое, поэтому быстрее нагревается и

удлиняется. Это приводит к систематическому сдвигу начала отсчета и к монотонному изменению показаний весов.

Периодическая погрешность присуща измерительным приборам с круговой шкалой, если ось вращения указателя не совпадает с осью шкалы.

Все остальные виды систематических погрешностей принято называть погрешностями, изменяющимися по сложному закону.

В тех случаях, когда при создании средств измерений, необходимых для данной измерительной установки, не удается устранить влияние систематических погрешностей, приходится специально организовывать измерительный процесс и осуществлять математическую обработку результатов. Методы борьбы с систематическими погрешностями заключаются в их обнаружении и последующем исключении путем полной или частичной компенсации. Основные трудности, часто непреодолимые, состоят именно в обнаружении систематических погрешностей, поэтому иногда приходится довольствоваться приближенным их анализом.

Способы обнаружения систематических погрешностей. Результаты наблюдений, полученные при наличии систематических погрешностей, будем называть неисправленными и в отличие от исправленных снабжать штрихами их обозначения (например, Х1, Х 2 и т.д.). Вычисленные в этих условиях средние арифметические значения и отклонения от результатов наблюдений будем также называть неисправленными и ставить штрихи у символов этих величин. Таким образом,

Поскольку неисправленные результаты наблюдений включают в себя систематические погрешности, сумму которых для каждого /-го наблюдения будем обозначать через 8., то их математическое ожидание не совпадает с истинным значением измеряемой величины и отличается от него на некоторую величину 0, называемую систематической погрешностью неисправленного среднего арифметического. Действительно,

Если систематические погрешности постоянны, т.е. 0 / = 0, /=1,2, ..., п, то неисправленные отклонения могут быть непосредственно использованы для оценки рассеивания ряда наблюдений. В противном случае необходимо предварительно исправить отдельные результаты измерений, введя в них так называемые поправки, равные систематическим погрешностям по величине и обратные им по знаку:

Таким образом, для нахождения исправленного среднего арифметического и оценки его рассеивания относительно истинного значения измеряемой величины необходимо обнаружить систематические погрешности и исключить их путем введения поправок или соответствующей каждому конкретному случаю организации самого измерения. Остановимся подробнее на некоторых способах обнаружения систематических погрешностей.

Постоянные систематические погрешности не влияют на значения случайных отклонений результатов наблюдений от средних арифметических, поэтому никакая математическая обработка результатов наблюдений не может привести к их обнаружению. Анализ таких погрешностей возможен только на основании некоторых априорных знаний об этих погрешностях, получаемых, например, при поверке средств измерений. Измеряемая величина при поверке обычно воспроизводится образцовой мерой, действительное значение которой известно. Поэтому разность между средним арифметическим результатов наблюдения и значением меры с точностью, определяемой погрешностью аттестации меры и случайными погрешностями измерения, равна искомой систематической погрешности.

Одним из наиболее действенных способов обнаружения систематических погрешностей в ряде результатов наблюдений является построение графика последовательности неисправленных значений случайных отклонений результатов наблюдений от средних арифметических.

Рассматриваемый способ обнаружения постоянных систематических погрешностей можно сформулировать следующим образом: если неисправленные отклонения результатов наблюдений резко изменяются при изменении условий наблюдений, то данные результаты содержат постоянную систематическую погрешность, зависящую от условий наблюдений.

Систематические погрешности являются детерминированными величинами, поэтому в принципе всегда могут быть вычислены и исключены из результатов измерений. После исключения систематических погрешностей получаем исправленные средние арифметические и исправленные отклонения результатов наблюдении, которые позволяют оценить степень рассеивания результатов.

Для исправления результатов наблюдений их складывают с поправками, равными систематическим погрешностям по величине и обратными им по знаку. Поправку определяют экспериментально при поверке приборов или в результате специальных исследований, обыкновенно с некоторой ограниченной точностью.

Поправки могут задаваться также в виде формул, по которым они вычисляются для каждого конкретного случая. Например, при измерениях и поверках с помощью образцовых манометров следует вводить поправки к их показаниям на местное значение ускорения свободного падения

где Р - измеряемое давление.

Введением поправки устраняется влияние только одной вполне определенной систематической погрешности, поэтому в результаты измерения зачастую приходится вводить очень большое число поправок. При этом вследствие ограниченной точности определения поправок накапливаются случайные погрешности и дисперсия результата измерения увеличивается.

Систематическая погрешность, остающаяся после введения поправок на ее наиболее существенные составляющие включает в себя ряд элементарных составляющих, называемых неисключенными остатками систематической погрешности. К их числу относятся погрешности:

Определения поправок;

Зависящие от точности измерения влияющих величин, входящих в формулы для определения поправок;

Связанные с колебаниями влияющих величин (температуры окружающей среды, напряжения питания и т.д.).

Перечисленные погрешности малы, и поправки на них не вводятся.

Систематическая ошибка - ошибка исследования, не связанная с выборкой. Она может быть вызвана концептуальными или логическими ошибками, неправильной интерпретацией ответов, а также статистическими, арифметическими, табуляционными, кодовыми или отчетными ошибками.Систематические ошибки подразделяется на: случайные(дают оценки, отличные от истинного значения; они могут приводить к отклонениям и в большую, и в меньшую сторону и имеют при этом случайный характер) и неслучайные(приводят к односторонним отклонениям, для них характерна тенденция к смещению выборочного значения относительно параметра совокупности). Недостатки систематических ошибок: - не так часты, но и не настолько подконтрольны, как ошибки в выборке;- в систематических ошибках, как направление, так и величина ошибки могут оказаться совершенно непредсказуемыми, в отличие от выборок, где ошибки в выборке при использовании вероятностных методов могут быть оценены; - приводят к смещению выборочного значения относительно параметра совокупности;- влияют на достоверность выборочных оценок. Особенно критичными ошибки становятся при работе с широкомасштабными, хорошо продуманными вероятностными выборками, т.к. при увеличении эффективности проектирования выборки и уменьшении выборочной дисперсии, эффект систематических ошибок усиливается. Чем эффективнее составлена выборка, тем большую роль играют систематические ошибки и тем меньшим смыслом обладают вычисления по определению доверительного интервала, в основе которых лежат обычные формулы. Систематические ошибки делятся на два основных типа: ошибки, связанные с неполучением данных (ошибки ненаблюдения), и ошибки наблюдения. Ошибки ненаблюдения возникают вследствие невозможности получения данных от части элементов обследуемой совокупности и быть вызваны тем, что часть обследуемой совокупности не была представлена в выборке, или же элементы, отобранные для включения в выборку, не представили данных. Ошибки наблюдений возникают вследствие некорректной информации, полученной от элементов выборки, они могут возникнуть и на стадии обработки данных или формулирования итогового вывода.

48.Понятие и сущность ошибок ненаблюдения. Существуют два типа ошибок ненаблюдения: ошибки неохвата( систематическая ошибка, являющаяся следствием того, что определенные части или целые блоки генеральной совокупности не были включены в основу выборки) и ошибки неполучения данных. Неохват может стать источником серьезных неточностей, при этом ошибка неохвата относится только к ошибочно выпавшим из рассмотрения частям совокупности. Таким образом, проблема неохвата имеет отношение к основе выборки.Ошибка перебора может возникать из-за возникновения повторов в сводке элементов выборки.Ошибки неохвата:1) относятся к разряду систематических ошибок и потому не входят в стандартные стат. зависимос. ;2) как правило, не могут быть устранены посредством увеличения объема выборки;3) могут иметь существенный размер;4) могут быть уменьшены при осознании их наличия с помощью улучшения основы выборки и принятия ряда специальных мер, позволяющих до определенной степени компенсировать остаточное несовершенство основы. Ошибка неполучения данных – систематическая ошибка, порождаемая отсутствием информации о некоторых элементах, которые должны были войти в состав выборки. Для того, чтобы оптимизировать и стандартизировать практику исследований предлагается определение доли ответивших(отношение количества проведенных с респондентами интервью к количеству приемлемых респондентов в выборке). Различают две главные причины ошибки неполучения данных - это отсутствие и отказ от интервью. Отсутствие – систематическая ошибка, возник. вследствие неполучения ответов от заранее определенных респондентов, отсутствующих дома в момент звонка регистратора.Отказы от интервью – систематическая ошибка, возникающая вследствие того, что часть респондентов отказывается принимать участие в обследовании. Доля отказов зависит часто от особенностей респондентов, организаций, осуществляющих финансовое обеспечение обследования, обстоятельств контакта, темы обследования и искусства интервьюера.Стратегии, рекоменд. для корректировки ошибки:1. Увеличение доли первичных ответов (улучшение условий проведения интервью и углубленное обучение интервьюеров).2. Повторные попытки.3. Экстраполяция получ.информации(оценка возможного эффекта, обусловленного неполучением данных, и соответствующая коррекция результатов исследования).Частичное неполучение данных состоит в том, что респондент, согласившийся принять участие в опросе, не хочет или не может ответить на некоторые вопросы из-за специфики их формы или содерж. или вследствие нежелания обременять себя поиском инф.

49.Понятие и сущность ошибок наблюдения

Ошибка сбора – систематическая ошибка, возникающая при сборе данных.Человек отказ отвечать на одни и дает неправильные ответы на другие вопросы интервьюера - ошибками пропуска и ошибками свидетельства. Поведенческие факторы . Биографические данные, мнения, позиции, намерения респондента могут являться источниками ошибок. Существуют 3 модели поведения интервьюеров , которые приводят к появлению ошибок: ошибки при формулировке вопросов и неумение задавать уточняющие вопросы, ошибки при записи ответов, подтасовка данных.Достоверность:

1) Метод опроса - проверяется соответствие использованного метода заданному (например, действительно ли проводился персональный, а не телефонный опрос).

2) Поставленные вопросы - проверка того, не были ли выпущены из рассмотрения важные вопросы (демографического или классификационного характера).

3) Демонстрация продукции - проверка того, действительно ли была произведена потребная для проведения опроса демонстрация продукта или информационного листа.

4) Знакомство респондента с интервьюером - проверка того, не занимался ли интервьюер опросом своих знакомых или друзей.

5) Реакция на проведение опроса - проверка «качества» работы интервьюера.

Офисные ошибки . Систематические ошибки могут возникать не только при сборе информации. Они могут появляться при редактировании, кодировании, составлении таблиц и анализе данных.

Суммарные ошибки. Частные ошибки, складываясь, приводят к ошибке суммарной, которая и должна интересовать исследователей.

При работе с ошибками сбора данных можно воспользоваться схемой Кана- Кэннела

интервьюер респондент

Характеристики: Характеристики: теже что и у интер-ра

Возраст Психологические факторы:теже

Образование Поведенческие факторы:

Ответы на вопросы

(адекватные – неадекватные)

(точные – неточные)

Социально-экономический статус

Национальность,Религиозная принадлежность,Пол и т.д.

Психологические факторы: Восприятие,Позиция,Намерения,мотивы

Поведенческие факторы: Ошибки при вопросах,Ошибки при распределении типа респондентаОшибки мотивации,Ошибки при записи ответов

Личные особенности (характеристики). личные особенности могут серьезно повлиять на ответы. Психологические факторы . результаты работы интервьюеров имеют обусловленность их взглядами, позициями и стремлениями.

50.Редактирование данных. Редактирование включает в себя просмотр и, если необходимо, исправление каждой анкеты или формы регистрации наблюдений. Просмотр и внесение исправлений выполняются в 2 стадии: полевое редактирование и централизованное офисное редактирование.

Полевое редактирование - это предварительное редактирование, которое строится таким образом, чтобы обнаружить наиболее бросающиеся в глаза пропуски и неточности данных.

Оно также полезно для контроля поведения персонала полевых сил и внесения ясности. Полевое редактирование выполняется как можно скорее после того, как анкета заполнена. В этом случае проблемы могут быть устранены прежде, чем проводивший сбор информации будет расформирован. Полевое редактирование обычно выполняется руководителем полевых работ.

Централизованное офисное редактирование - всеобъемлющая проверка и коррекция заполненных форм сбора данных, включая принятие решения о том, что с этими данными делать.

Чтобы обеспечить логическую последовательность обработки материалов, лучше всего предоставить все носители собранных данных одному человеку. Если эту работу приходится делить по соображениям ее объема и имеющегося времени, подразделы должны определяться по частям анкеты, а не по респондентам. То есть, один редактор должен редактировать часть «А» всех анкет, а другой - часть «В».

В отличие от полевого, централизованное офисное редактирование в меньшей степенизависит от последующих процедур, и в большей - от степени полноты данных. При анализе необходимо решить, каким образом будут обрабатываться носители собранных данных, содержащие неполные ответы, явно неправильные ответы и ответы.

Вернувшиеся заполненные анкеты целиков. В некоторых окажутся пропущенными целые разделы. Другие будут оставленными без ответа отдельные позиции. Анкеты, в которых пропущены целые разделы, не должны отбрасываться автоматически. Тщательное редактирование анкеты иногда показывает, что ответ на какой-то вопрос очевидно неправилен.

При анализе необходимо не пропустить заполненные анкеты, которые неудачны с точки зрения интереса респондента. Свидетельства отсутствия интереса могут быть и очевидными, и очень трудно распознаваемыми.

51. Кодирование данных. Код-е – технический прием, с помощью которого данные распределяются по категориям. Прием связан со спецификацией альтернативных категорий или классов, в которые должны помещаться ответы, а самим классам должны назначаться кодовые номера.

I этап код-я заключается в специфицировании категорий или классов, к которым будут относиться ответы. Выбор ответов должен быть взаимоисключающим и исчерпывающим, чтобы каждый ответ логически попадал в одну категорию. Код-е закрытых вопросов и большинства средств балльной оценки не сложно; потому что оно устанавливается при конструировании самой анкеты. Код-е открытых вопросов более сложно и более дорогое, т.к. приходится определять подходящие категории на базе ответов, которые не всегда предсказуемы. Если анкет слишком много, и необходимо использовать для кодирования анкет нескольких кодировщиков, дополнительной проблемой может стать возникновение несоответствия в самом кодировании. Поэтому для получения логической последовательности обработки данных, эту работу необходимо разделять по задачам, а не в равных долях делить анкеты между кодировщиками.

II этап код-я касается назначения кодовых номеров классов. Принято, для обозначения классов использовать цифры, а не буквы. Когда для анализа данных предполагается использовать компьютер, кодирование необходимо выполнять таким образом, чтобы данные оказывались готовыми для ввода в машину, поэтому полезно обеспечить наглядность ввода посредством многоколонной записи. Когда вопрос допускает множество ответов, допускать отдельные колонки для кодирования каждого варианта ответа.

Необходимо использовать ровно столько колонок поля, назначаемого для переменной, сколько необходимо для полного охвата всех ее возможных значений. Кроме того, любому полю должна назначаться не более чем одна переменная.Рекомендуется применять стандартные коды для «отсутствия информации». Так, все ответы «не знаю» должны кодироваться цифрой 8, «нет ответов» - цифрой 9, а «не применялось» обозначаться как 0. Лучше, если во всем исследовании для каждого из этих типов «нет информации» используется один и тот же код.

Завершающий этап код-я состоит в подготовке книги кодов , которая содержит общие инструкции, указывающие, каким образом была закодирована каждая позиция данных. В ней перечисляются коды каждой переменной и категории, включенные в каждый код.

52.Табулирование данных. Табулирование заключается просто в подсчете количества событий, которые попадают в различные категории. Табулирование может принимать форму простой табуляции, или перекрестной табуляции . Простая табуляция - подсчет количества событий, которые попадают в каждую категорию, когда категории базируются на одной переменной.Перекрестная табуляция - подсчет количества событий, которые попадают в каждую из нескольких категорий, когда категории базируются на двух и более переменных, рассматриваемых одновременно.Одномерная табуляция используется в следующих целях:

1. для определения степени безответности позиций анкеты является важной проблемой в большинстве исследований. Когда степень безответности большая, исследование в целом становится сомнительным и возникает необходимость пересмотреть его цели и методы. Возможно использование нескольких стратегий. - Оставить позиции пустыми и описать их количество как отдельную категорию. -Исключать событие с утраченной позицией при анализе с использованием соответствующей переменной. -Подставить значения утраченных позиций анкеты. 2. для локализации грубых ошибок . Грубая ошибка– ошибка, которая возникает при редактировании, кодировании, клавиатурном наборе или табулировании данных.3. для локализации посторонних значений- наблюдение, настолько отличающееся по величине от остальных наблюдений, что возникает необходимость обрабатывать его как особое значение.4. для определения эмпирического распределения рассматриваемой переменной. Лучше всего представить в виде гистограммы.5. для расчета итоговых статистик.

Перекрестная табуляция является важным механизмом для изучения связей внутри и между переменными. В перекрестной табуляции выборка делится на подгруппы. Связь между двумя переменными в пределах категорий размера семьи, называется условной таблицей , позволяющей обнаружить условную связь между переменными.Условные таблицы, построенные на основе одной регулируемой переменной, называются условными таблицами первого порядка . Таблицы, составленные с использованием двух регулируемых переменных, называются условными таблицами второго порядка .В настоящее время табулированные результаты чаще представляются в виде баннеров. Баннер – это последовательныйряд перекрестных табуляций между критерием и несколькими факторными переменными, оформленный в виде единой таблицы.

53.Традиционный, классический метод анализа документов и его составляющая.Традиционный анализ – это цепочка умственных, логических построений, направленных на выявление сути анализируемого материала с определенной, интересующей исследователя точки зрения в каждом конкретном случае. Основным недостатком этого анализа является субъективность. В традиционном анализе различают внешний и внутренний анализ. Внешний анализ – это анализ контекста документа и тех обстоятельств, которые сопутствовали его появлению. Цель внешнего анализа – установить вид документа, его форму, время и место появления, автора и инициатора, какие цели преследовались при его составлении, степень надежности и достоверности, каков его контекст. Внутренний анализ – это исследование содержание документа. Отдельные виды документов из-за своей специфики, требуют специальных методов анализа и привлечения для их выполнения специалистов других областей знаний. Юридический анализ. Он применяется для всех видов юридических документов. Его специфика заключается в том, что разработан особый словарь терминов, в котором значение каждого слова строго однозначно определено.Психологический анализ. Он применяется при оценке отношения автора к какому-либо политическому, экономическому или социальному явлению. На основе таких исследований можно получить представление о формировании общественного мнения, общественных установок и т.д.

54. Формализованный, количественный (контект-анализ) и его состав-е . Его называют часто количественный метод анализа документов (контент-анализ).Суть этих методов сводится к тому, чтобы найти легко подсчитываемые признаки, черты, свойства документа, которые отражали бы определенные существенные стороны содержания. Тогда качественное содержание делается измеримым, становится доступным для точных вычислений.Контент-анализ – это техника выделения заключения проводимого с помощью объективного и систематического выявления соответствующих характеристик текста задачам исследования. Существуют общие принципы, когда применяется контент-анализ:1. Когда требуется высокая степень точности или объективности анализа.2. При наличии большого по объему и несистематизированного материала.3. Когда категории, важные для целей исследования, характеризуются определенной частотой появления в изучаемых документах.Основными направлениями использования контент-анализа являются:

1. Выявление и оценка характеристик текста как индикаторов определенных сторон изучаемого объекта;2. Выявление причин, породивших сообщение; 3. Оценка эффекта воздействия сообщения (например, рекламного).Требование объективности анализа предполагает решение ряда проблем, связанных:1. с выработкой категорий анализа. Категории анализа – это понятие, в соответствии с которыми будут сортироваться единицы. Требования, предъявляемые к категориям:- должны быть исчерпывающими, - взаимоисключаемыми, - надежность.2.С выделение единиц анализа. Единицей анализа (смысловой или качественной) является та часть содержания, которая выделяется как элемент, подводимый под ту или иную категорию. Индикаторами могут быть:- относящиеся к теме слова и словосочетания;- термины;- имена людей;- названия организаций;- географические названия;- пути решения экономических проблем, 3. с выделение единиц счета. Единицы счета обладают разной степенью точности измерения, а так же разным временем, уходящим на кодировку материала, попавшего в выборку. В практике методом контент-анализа были выделены общие единицы счета, отвечающие различным исследовательским требованиям.1.Время – пространство. 2.Появление признаков в тексте

3.Частота появления. При разработке программы маркетинговых исследований необходимо четко определить, какого рода характеристики объекта подвергаются изучению, и в зависимости от этого оценивать документы с точки зрения их адекватности, надежности, достоверности.

Адекватность документа определяется как степень, в которой он отражает интересующие исследователя характеристики объекта.

Надежность оценивается сопоставлением всех данных содержания с какими-то другими данными. Здесь возможны несколько вариантов проверки:

1.Сравнение содержания документов , исходящих из одного источника. Такое сравнение может проводиться:а) во времени б) в различных ситуациях

в) в различных аудиториях .2.Метод независимых источников , т.е. выбираются характеристики из нескольких различных источников информации. Затем различия в характеристиках сравниваются с различиями в содержании сообщений.Оценка достоверности данных документа проводится путем последовательного перебора источников встречающихся в документе ошибок. Источники ошибок можно разделить на две категории:

Случайные (например, опечатки в статистических данных) -систематические.

Систематические ошибки делятся на сознательные и несознательные

Сознательные ошибки часто определяются теми намерениями, которыми руководствуется автор при составлении документа.