Для связи в whatsapp +905441085890

Методы параметрической статистики — Параметрические методы оценки

Процедура Роббинса-Монро

Пусть f(x) — некоторая неизвестная функция, значения которой можно измерить в любой точке x E1. Функция f(x) монотонна, непрерывна и имеет единственный корень f(x)=0 в точке x0. Задача состоит в том, чтобы разработать план эксперимента так, чтобы xsx0 при s. Наблюдения ys=f(xs) статически независимы. Тогда мы имеем

ys+1(xs,)=f(xs)+g(s+1,xs,(s+1,))

где (s,) — последовательность независимых случайных величин, определенных на некотором вероятностном пространстве (,U,P) — элементарные случайные события, причем M{g(s,x,)}=0 для любого xE1. Для решения этой задачи Роббинса-Монро предлагается следующая процедура

xs+1=xs+sfs+1(xs,),

где x0 — произвольное число. Последовательность положительных чисел s удовлетворяет условиям Роббинса-Монро.

Первое из этих условий необходимо для сходимости xs к x0 при s даже в отсутствие случайных ошибок. Другими словами, s не должно быть слишком маленьким. С другой стороны, s не должно быть слишком большим, иначе случайные ошибки нарушают эту сходимость, поэтому второе условие (1.4.5) должно быть выполнено.

Теорема 1.1. Пусть выполнены неравенства:

1) sup f(x)(x-x0)<0 >0,

<x-x0<-1,

2) f2(x)+M{g2(s,x,)}0 — константа.

Тогда, если для любого xE1 выполняются условия Роббинса-Монро, то процесс xs, определяемый (1.4.4), сходится с вероятностью 1 при s к корню уравнения f(x)=0, т.е. к x0 и

P{lim xs=x0}=1.

Можно также показать, что xs сходится к x0 в среднем.

Алгоритм Литвакова.

Алгоритм Литвакова позволяет найти близкое к оптимальному значение вектора параметров с помощью следующей процедуры

с неоптимальным .

Его суть заключается в следующем.

Пусть дана обучающая выборка объема . Предполагая и , где a — некоторая константа, проводим итерационный процесс вычислений по формуле на n-м шаге, находим , которое принимаем за новое начальное условие, и процесс вычислений продолжаем на той же выборке.

В результате получаем оценку . Продолжая этот процесс k раз, находим оценку . Результат Литвакова состоит в том, что оценка для достаточно большого к (точнее ) приближает . Во многих практических задачах k не превышает 5.

Алгоритм Кестена

Известно, что скорость сходимости рекуррентных вероятностных алгоритмов типа at определяется знаком мощности — следствием влияния помех. Если бы помех не было, то она была бы и скорость сходимости в этом случае возрастает и определяется по экспоненциальному закону.

Суть алгоритма Кестена заключается в том, что вдали роль помех в измерениях мала и разность будет иметь постоянный знак, а вблизи знак уже существенно зависит от помех и будет меняться. Поэтому в алгоритме Кестена не меняется, когда разность уже не меняет своего знака, и меняется, если знак меняется.

Для определения разности необходимо как минимум два наблюдения. Поэтому они выбираются произвольно (обычно равны единице). Дальнейшее определение подчиняется правилу

где — целочисленная функция, определяемая выражением

где z — произвольный аргумент.

Методы параметрической статистики - Параметрические методы оценки
Методы параметрической статистики — Параметрические методы оценки

Параметрические методы оценки

Здесь мы рассматриваем стохастические аппроксимации непараметрического типа. Их главной отличительной особенностью от известных является отсутствие шага выбора конкретной формы аппроксимирующего полинома с точностью до вектора параметров.

Непараметрические аппроксимации основаны на соответствующих оценках функции плотности вероятности, введенных Парзеном Э. в 1962 году.

Непараметрическая оценка функции плотности вероятности

Пусть xi. — статистически независимые наблюдения случайной величины x, распределенной с плотностью вероятности p(x). Естественно связать с каждой точкой дельта-функцию , тогда статистика

оказывается несмещенной оценкой p(x) .

Действительно, давайте вычислим M{p(x)}:

Поскольку p(x1)=p(x2)=…=p(xn), и

= =…=

Следовательно,

Применяя известное свойство е-функции, получаем и это означает, что данная оценка несмещенная, но ее нельзя использовать в конкретных расчетах, поэтому естественно «размазать» е-функцию в окрестности точки

где она уже не является дельта-функцией, а переходит в последнюю при n>?

Тогда оценка pn (x) примет вид

где интегрирующая с квадратом функция F такова, что

Ts(z)<?

а параметр Cn (коэффициент нечеткости) удовлетворяет условиям:

Cn>0, n=1,2…,

Непараметрическая оценка кривой регрессии

Пусть имеются статистически независимые наблюдения двух случайных величин (x,y)=(x1,y1),…,(xp,yup), распределенных с неизвестной плотностью вероятности P(x,y). Предполагается, что p(x)>0 x(x). При аппроксимации неизвестных стохастических зависимостей y от x часто используется регрессия y на x:

непараметрическая оценка которой, как известно, имеет вид

Эту оценку можно получить, подставив в нее непараметрическую оценку двумерной функции плотности вероятности P(x,y) и при условии, что

Выполнение последнего условия предполагается в дальнейшем.

В первой части практической работы необходимо получить аппроксимацию зависимости, используя параметрические методы оценивания.

Функция, для которой необходимо получить аппроксимацию, известна заранее — 1)y=0.35*cos(0.5x) — пробный эксперимент; 2)y=sin(0.5x). Исходя из зависимости, необходимо сгенерировать выборку, с помощью которой собственно и нужно оценить параметры для аппроксимации.

Практические результаты

В качестве аппроксимации была выбрана следующая зависимость — . Хотелось бы отметить, что, поскольку зависимость известна заранее и кривая похожа на прямую линию на заданном интервале, то параметр оценки всего один. Это сделано в первую очередь для лучшего понимания процесса.

Не случайно для аппроксимации выбрана несовпадающая структура, это вносит некоторые помехи в выборочные значения.

В данной работе использовалась процедура Робинса-Монро, которая была оптимизирована с помощью алгоритмов Литвакова и Кестона. В результате этой оптимизации параметр не влияет на оценку параметра . Доказательством чего является процесс сходимости при различных .

1)y=0.35*cos(0.5x) — пробный эксперимент

В качестве приближения была выбрана следующая зависимость

Если выборка составляет n=100

Увеличим выборку (n=400):

Аппроксимация становится лучше.

В качестве приближения возьмем —

Со сходимостью по параметрам, но если выбрана неправильная структура, то модель может быть не адекватна реальному объекту или процессу, требуется знание структуры.

2)y=sin(0.5x)

В качестве приближения была выбрана следующая зависимость —

Обсервационное эпидемиологическое исследование исследование без преднамеренного вмешательства со стороны исследователя

1) Описание является первым этапом любого эпидемиологического исследования и отвечает на вопросы «кто?», «где?» и «когда?» заболел. Оно выявляет временные тенденции в заболеваемости, сезонность («когда?»), распределение заболевших по месту жительства, рождения, работы, получения медицинских услуг («где?»), полу, возрасту, национальности, семейному и социально-экономическому положению («кто?») и т.д. Однако для того, чтобы ответить на вопрос «почему?», одних описаний уже недостаточно. Необходимы аналитические или экспериментальные исследования, которые используются для подтверждения или исключения гипотез о наличии причинно-следственных связей. Для изучения заболеваемости непосредственно используются:

Одномоментное исследование — обследование населения (в целом или отдельных групп) в определенный момент времени с целью изучения распространенности (превалентности) того или иного заболевания.

Изучение частоты встречаемости заболеваний в популяции может быть основной целью данного вида исследования, поэтому его также часто называют «prevalence-study». Однако one-study также может быть частью другого типа исследования.

Источниками информации в данном типе исследования являются как опросы, так и медицинские обследования населения.

Достоверность полученной информации определяется:

  • наличием стандартных диагностических критериев для определения случая — все врачи, участвующие в исследовании, должны использовать единые подходы к диагностике (что считается нормой, каким должен быть сдвиг лабораторных показателей, какие симптомы должны обязательно присутствовать и т.д.)
  • качество анкеты (особое внимание уделяется формулировкам вопросов);
  • количественная и качественная репрезентативность выборки.

Когортное исследование, направленное на определение частоты новых случаев (заболеваемости) в исследуемой популяции.

В этом случае формируется когорта — группа людей без признаков заболевания на момент исследования, и в течение определенного периода наблюдения регистрируются новые случаи того или иного заболевания.

Время наблюдения может составлять от нескольких дней (при острых заболеваниях) до нескольких десятков лет (при изучении заболеваний с длительным латентным периодом). В качестве источников информации могут быть использованы данные из медицинских карт, истории болезни, интервью, медицинских осмотров.

2) Несмотря на то, что в литературе когортные исследования часто называют «проспективными», они могут быть и ретроспективными. В этом случае когорта условно формируется «в прошлом» — это могут быть люди, которые работали в определенной компании или жили в определенном районе в N-ом году. С помощью стандартных методов — выписок из медицинских карт, записей актов гражданского состояния и опросов — выявляются изменения в состоянии их здоровья, которые уже произошли к моменту начала исследования. Ретроспективные когортные исследования удобны тем, что экономят много времени.

Определение распространенности и заболеваемости новых случаев в популяции может быть как основной целью исследования, так и промежуточной. В последнем случае разница в уровнях заболеваемости в двух или более исследуемых группах используется как доказательство влияния этиологического фактора или как критерий эффективности различных лечебно-диагностических мероприятий и профилактических программ. В частности, когортные исследования чаще всего направлены не только и не столько на регистрацию первичной заболеваемости, сколько на поиск причин и факторов риска, т.е. на доказательство этиологических гипотез.

Эпидемиологические исследования могут быть однократными, проспективными или ретроспективными. До настоящего времени изучение заболеваемости населения не проводилось по единой методике, что затрудняет сравнение показателей заболеваемости. Однако любой показатель заболеваемости должен отвечать следующим требованиям:

  • быть надежным;
  • объективным;
  • чувствительным (реагировать на изменения);
  • точным.

Основные критерии и показатели эпидемиологичсекого анализа

Рандомизированное контролируемое исследование — это исследование, в котором участники, включенные в исследование, случайным образом распределяются на основную и контрольную группы.

Контролируемое исследование — это всегда проспективное исследование, а также экспериментальное исследование (исследователь оказывает воздействие). Экспериментирование в медицине получило широкое распространение сравнительно недавно. Важность контролируемых испытаний невозможно переоценить. Благодаря рандомизации группы различаются только по изучаемому признаку, что позволяет преодолеть главный недостаток обсервационных исследований.

В отличие от ретроспективного обсервационного исследования, в проспективном исследовании до его завершения никто не знает, к чему оно приведет. Это снижает риск непроизвольного манипулирования. Возможно, именно по этой причине контролируемые исследования часто приводят к выводу о неэффективности того или иного метода лечения, тогда как обсервационное исследование, наоборот, доказывает его эффективность.Оценка эпидемиологической ситуации и эффективности профилактических и противоэпидемических мероприятий проводится с помощью ряда показателей, которые являются общими для многих инфекций, а по способу их получения относятся к статистическим. Под термином «эпидемиологические показатели» следует понимать качественные или количественные характеристики эпидемических явлений. Эпидемиологические показатели рассчитываются на определенную популяцию (на 1 000, 10 000, 100 000 и т.д.), поэтому они являются относительными величинами, а именно интенсивными показателями. Важнейшим критерием эпидемического процесса является заболеваемость инфекционными болезнями за определенный период. При анализе заболеваемости дополнительно используют такие показатели, как инфекционность (число зараженных на 100, 1000 и т.д. обследованных), заболеваемость (число выявленных больных на 100 или 1000 обследованных), болезненность (число больных активными и неактивными формами болезни на 10 000 населения). В ходе анализа часто возникает необходимость выяснить структуру заболеваемости, долю различных форм или тяжесть течения болезни, оценить результаты лабораторного обследования и т.д. Этим задачам отвечает экстенсивный показатель — удельный вес, который характеризует распределение целого на его оставшиеся части и выражается в процентах. Общее количество принимается за 100%. Например, при исследовании качества воды из 95 проб 60 оказались без кишечной палочки, 30 — с ее допустимым содержанием, 5 — с высоким уровнем кишечной палочки, удельный вес составляет 63,2; 31,6 и 5,2 соответственно. Из обширных показателей наиболее широко используются следующие:

Для более полного представления об эпидемической ситуации изучается такой параметр, как индекс очаговости. Он рассчитывается как отношение всех случаев, зарегистрированных в очагах данного заболевания, к количеству очагов, например, если в 9 очагах зарегистрировано 27 случаев, то индекс очаговости равен 3,0 (27:9). В оптимальном случае в каждом очаге должен быть один пациент; соответственно, индекс очагов равен 1. Показатель госпитализации выражается в процентах и определяется следующим образом:

Коэффициент эпидемиологической эффективности относится к практической ценности профилактических мероприятий (вакцинация, фагирование, профилактика гамма-глобулином). Иногда используется коэффициент эпидемиологической эффективности. Эти критерии рассчитываются по формулам:

где a — заболеваемость в контрольной группе; b — в контрольной группе. Индекс эффективности показывает, во сколько раз уровень заболеваемости в тестовой группе ниже, чем в контрольной. Коэффициент эффективности показывает, на сколько процентов уровень заболеваемости в тестовой группе ниже уровня заболеваемости в контрольной группе. Все рассмотренные эпидемиологические показатели обработаны с использованием методов статистического анализа.

Интенсивные, экстенсивные показатели

В процессе эпидемиологического анализа также приходится постоянно оперировать такими статистическими понятиями, как интенсивные и экстенсивные показатели, средние величины и т.д.

Экстенсивный показатель — это доля определенного варианта признака, который в той или иной разновидности встречается во всех изучаемых случаях. Обычно он выражается в процентах. Экстенсивные показатели взаимозависимы: если в исследуемой группе психически больных людей (то, что все лица, составляющие группу, психически больны, является признаком) случаи шизофрении (диагноз — вариант этого признака) составляют 60 96, то на другие заболевания придется 40%.

Интенсивность — это мера частоты встречаемости конкретного признака среди тех случаев, в которых этот признак может присутствовать или отсутствовать. Если мы говорим, что распространенность шизофрении в популяции составляет 1 на 1000 человек, то это интенсивный показатель. Он не зависит от других интенсивных показателей: в популяции может быть столько же пациентов с другими заболеваниями, сколько здоровых людей, и распространенность шизофрении не изменится.

Среднее значение (точнее, среднее арифметическое) — одно из наиболее часто используемых в эпидемиологических исследованиях понятий. Мы говорим о средней длительности пребывания пациента на койке, среднем количестве посещений диспансера в день, средней продолжительности ремиссии и множестве других средних величин.

Статистическое распределение количественных характеристик отдельных случаев, относящихся к такому явлению, всегда является так называемым гауссовым, или нормальным. Если для характеристики каких-то данных желательно использовать среднее значение, следует проверить, соответствует ли распределение этих данных нормальному; если да, то использование среднего значения оправдано, оно имеет смысл: именно среднее значение определяет главную причину изучаемого явления. Часто, однако, при такой проверке выясняется, что данные распределены иначе. В частности, длительность многих психопатологических состояний имеет экспоненциальное (а не нормальное) распределение, что свидетельствует о случайном характере количественной характеристики каждого отдельного наблюдения. Среднее значение в таких случаях не имеет никакого содержания. Именно поэтому в ядерной физике не используется термин «среднее время распада ядер» радиоактивного вещества, а говорится о «периоде полураспада», то есть времени, за которое распадается половина всех имеющихся ядер. Аналогичным образом, продолжительность психопатологических синдромов не должна характеризоваться средними значениями. В эпидемиологии под статистическим наблюдением понимают научно организованный сбор (по единой программе) и обработку данных, например, о проявлениях эпидемического процесса того или иного инфекционного заболевания. Этот метод используется в эпидемиологии для количественного изучения инфекционной заболеваемости, деятельности лечебно-профилактических учреждений, а также для оценки эффективности профилактических и противоэпидемических мероприятий. Статистический метод всегда используется в сочетании с другими методами, часто носит вспомогательный характер, т.е. служит для обработки материалов, полученных в эпидемиологических исследованиях. Поскольку многие факторы (детерминанты) эпидемического процесса часто не поддаются строгому учету и контролю, а иногда носят случайный характер, использование методов математической статистики при обработке и интерпретации результатов исследований позволяет извлечь максимум информации и оценить степень ее достоверности.

На странице курсовые работы по психологии вы найдете много готовых тем для курсовых по предмету «Психология».

Читайте дополнительные лекции:

  1. Метод самонаблюдения — Развитие метода интроспекции (самонаблюдения)
  2. Развитие мышления
  3. Основы педагогики в психологии
  4. Психодиагностика. Психологический диагноз и прогноз
  5. Жан Пиаже, швейцарский психолог
  6. Психология подростка
  7. Психология экстремальных ситуаций и состояний
  8. Влияние личностных качеств на выбор профессии
  9. Внимание и творчество
  10. Современная когнитивная психология