Дом  ->  Семья  | Автор: | Добавлено: 2015-05-28

Статистический анализ рождаемости в Москве

Что есть наука «статистика»?

Без статистики ориентироваться в море цифр так же сложно, как выбираться из густого леса, двигаясь наугад и рассчитывая на удачу.

Слово «статистика» происходит от латинского термина «STATUS» - состояние, положение. Впервые этот термин немецкий учёный Ахенваль применил в середине XVIII века для описания состояния государства. Статистика же как наука возникла в Англии в XVIII веке в трудах «политических арифметиков». Предметом исследования статистики могут стать любые массовые явления и процессы в общественной жизни. Можно сказать, что «статистические данные» или «данные статистики» и есть те цифры, которые характеризуют количественные аспекты массовых явлений, процессов или состояний.

В настоящее время слово «статистика» употребляется в трёх значениях:

– статистика есть общественная наука, которая изучает количественную сторону общественных массовых явлений в неразрывной связи с их качественной стороной;

– статистика есть сбор цифровых статистических данных, характеризующих то или иное общественное явление или процесс (статистическая технология);

– статистика есть сами цифры, характеризующие эти явления и процессы.

Наука статистика включает в себя:

  • общую теорию статистики, излагающую общие принципы и методы статистической науки;
  • статистику народного хозяйства, изучающую статистическими методами народное хозяйство в целом. Её подчас называют экономической статистикой;
  • различные отраслевые статистики, изучающие статистическими методами различные отрасли народного хозяйства: промышленность, сельское хозяйство, транспорт, торговлю, коммунальную сферу, медицину, демографию и другие.

Основные задачи статистики

Статистические методы широко применяются в различных областях знаний — в математике, физике, биологии, астрономии, медицине и на стыке различных наук. Назначение статистики — установление закономерностей изучаемых явлений, выяснение причин их возникновения, изучение взаимосвязей между явлениями и процессами. Связи могут быть временными, корреляционными, пространственными и все их изучает статистика. Закономерность проявляется только при достаточно большом числе наблюдений. Это основное положение закона больших чисел открытого Я. Бернулли, на котором зиждется вся статистика и который выражает диалектику случайного и необходимого. Для демонстрации закона биолог Гальтон сконструировал очень простой ящик с застеклёнными передними стенками. По внутренней стенке верхней части ящика естествоиспытатель вбил гвозди, в нижнюю часть вмонтировал перегородки. Через отверстие в крышке сыпали мелкую дробь. Каждая дробинка, встречая препятствия, имела шансы при падении отклониться от срединного направления в любую сторону. При малом количестве дробин никакой закономерности не выявлялось. При большом числе дробин не менее 50,0% из них всё-таки попадали в середину дна ящика, подтверждая закон свободно падающего тела. Так происходит и при массовом статистическом наблюдении — основная закономерность проявляется лишь при достаточно большом числе наблюдений. На основе закона больших чисел П. Лаплас разработал теорию вероятности, которая гласит, что вероятность какого-либо события равна отношению числа наступивших событий к числу всех возможных событий.

Математические методы как основа для статистических исследований

Статистика возникла на базе математики и широко использует математические методы для оценки размеров общественных явлений или их взаимоотношения между собой. Выборочный метод основан на математической теории вероятности и законе больших чисел. Методы обработки вариационных и динамических рядов, измерение корреляционных связей между явлениями и методы математического моделирования также основаны на математических приёмах для расчетов.

Описательная статистика в медицине

Насколько важна в жизни наука статистика разберем на примере приёмов описательной статистики, часто используемой в медицинской практике.

Анализ рождаемости в Москве в 2000 – 2009 г. г.

В качестве демонстрации изменений изучаемого признака проанализируем показатели рождаемости в Москве за последние 10 лет, начиная с 2000года. Количество родившихся в 2000 году детей примем за базисный уровень. Для этой цели лучше всего подходит метод построения интервального динамического ряда, характеризующего признак (число рождений) за определённый период времени, в данном случае за год. Применяемые здесь формулы дают возможность оценить увеличение или уменьшение уровня сравниваемого периода относительно базисного уровня (базисные показатели) или предшествующего периода (цепные показатели). Для нас наиболее интересным представляется вычисление цепных показателей: абсолютный прирост (убыль), темп роста в процентах, темп прироста (убыли) в %, абсолютное значение 1% прироста. На практике обычно ограничиваются первыми двумя из перечисленных показателей.

Абсолютный прирост (убыль) вычисляется следующим способом:

ΔУрцеп = Уi – Уi-1, где:

Уi – уровень сравниваемого периода,

Уi-1 – уровень предшествующего периода.

Для вычисления среднего абсолютного прироста (убыли) используется формула: где :

– базисный уровень динамики,

– конечный уровень динамики, n — число участников.

Темп роста (индекс роста) – это отношение величины показателя в настоящий момент времени к величине этого показателя в прошедший момент времени, выраженное в процентах. Темп роста является показателем интенсивности изменений уровня ряда и вычисляется так:

Демографические данные

Московского городского статистического управления

родившихся н/д* 10,3

здоровые 32,9 32,6

больные 61,9 63,0

с отклонениями 2,8 3,0

прочих случаев 2,4 1,5

Колебания (по горизонтали) математических значений в различных группах детей здесь настолько малы, что признаются статистически несущественными, отсюда можно сделать вывод, что никаких достоверных изменений в распределении исследуемого контингента по группам «здоровый - больной» не произошло. Степень достоверности выявлялась двухсторонним критерием Стьюдента. Далее мы будем ориентироваться на показатели 2008года.

В результате расчётов было выяснено, что в различные группы здоровья (с I по V) в разные годы входит разное количество детей и что это количество напрямую зависит от возраста.

группы здоровья % средняя

1 год 2 года 3 года 1 – 3 года

I 41,5 47,3 42,7 43,8±0,2

II 51,0 46,1 50,5 49,2±2,2

III 5,5 4,8 5,0 5,1±0,3

IV 0,3 0,4 0,4 0,4±0,1

V 0,2 0,3 0,9 0,5±0,3

не установлена 1,5 1,1 0,5 1,0 ± 0,4

Всего: 100,0

группы здоровья % средняя,%

4 года 5 лет 6 лет 4 – 6лет

I 41,7 40,2 39,8 40,6±0,7

II 51,2 52,7 52,9 52,3±08

III 5,3 5,6 5,8 5,6±0,2

IV 0,6 0,4 0,4 0,5±0,1

V 0,2 0,2 0,2 0,2±0,0

не установлена 0,9 1,0 0,9 -

Всего: 100,0

группы здоровья % средняя,%

7 лет 8 лет 9 лет 10лет 7 - 10лет

I 39,3 33,6 33,3 32,3 34,6±2,7

II 52,1 56,2 55,6 55,2 54,8±1,6

III 7,0 8,7 9,8 11,0 9,1±1,5

IV 0,5 0,4 0,4 0,4 0,43±0,1

V 0,2 0,1 0,1 0,2 0,2±0,1

не установлена 0,9 1,0 0,9 0,9 -

Всего: 100,0

Увеличение числа детей, имеющих первую группу здоровья на втором году жизни (в процентном соотношении 47,3%), в сравнении с первым годом (41,5%), статистически достоверно (р<0,001). Данная ситуация объясняется достоверным снижением ко второму году жизни числа детей, имеющих некоторые диагнозы периода новорождённости, например, «мышечная дистония», «чрезмерно возбудимый ребенок», «задержка этапов развития у младенца» и т. д.

Достоверно также и уменьшение числа детей с первой группой здоровья к третьему году (42,7%) по сравнению со вторым годом жизни (р<0,001), так как на третьем году жизни достоверно растёт число детей с патологией костно-мышечной системы и болезнями дыхательных путей. Также статистически достоверны по годам колебания числа детей со второй группой здоровья (р<0,001).

Рост числа детей с V группой здоровья на третьем году жизни, по сравнению с первым и вторым годами, объясняется декомпенсацией некоторых пороков развития, приобретёнными заболеваниями крови и злокачественными новообразованиями, но, в целом, статистически несущественен (Uр<1,29).

К 6 году жизни достоверно снижается кол-во детей с I группой здоровья за счёт достоверного роста числа детей, имеющих II группу здоровья уже в сравнении с детьми трехлетнего возраста (р<0,001). Колебания по III, IV и V группам здоровья в этом возрастном интервале недостоверны (Up<1,29).

В динамике в исследуемой популяции в интервале с 7 до 10 лет достоверно снизилось число детей с 1 группой здоровья (на 7,0%) и выросло число детей со 2 и 3 группами здоровья (на 3,1% и 4,0% соответственно, во всех случаях р<0,001).

Между 11 и 14 годами жизни отмечается дальнейшее достоверное уменьшение числа детей с I группой здоровья (р<0,001) за счёт достоверного роста числа детей со II и III группами (по IV и V группам здоровья колебания недостоверны, в обоих случаях Up<1,29).

Между 14 и 18 годами вновь отмечается снижение числа детей, имеющих I группу здоровья, с одновременным ростом числа детей со II группой (р<0,001). Параллельно достоверно растёт число детей с III группой здоровья. Колебания по IV и V группам недостоверны (в обоих случаях Up<1,29).

Обобщая вышесказанное, отметим, что, начиная со 2 года жизни, количество детей, имеющих I группу здоровья (41,6%), неуклонно снижается в каждом трёхлетнем интервале и в 15 – 18 лет не превышает 21,2 ± 0,9%.

Достоверное увеличение числа детей со III группой здоровья отмечается в 7 – 10 лет и продолжается до 18 лет.

Для упрощения анализа данных и большей наглядности в статистике успешно используется метод «усреднения величин», когда оценка полученных данных рассматривается за больший период, нежели первоначально заявлено. Так, например, процентное выражение числа детей, здоровье которых оценивается как соответствующее первой группе в возрасте 4 – 6 лет выше, чем в возрасте от 7 до 10 лет и почти в два раза выше, чем в подростковом возрасте.

Группы здоровья, %

возраст, лет группы 1-3 4-6 7-10 11 – 14 15 – 18

I 43,8 ± 0,2 40,6 ± 0,7 34,6 ± 2,7 28,7 ± 1,4 21,2 ± 0,9

II 49,2 ± 2,2 52,3 ± 08 54,8 ± 1,6 55,3 ± 0,5 56,6 ± 2,1

III 5,1 ± 0,3 5,6 ± 0,2 9,1 ± 1,5 14,3 ± 1,5 20,0 ± 1,3

IV 0,4 ± 0,1 0,5 ± 0,1 0,4 ± 0,1 0,5 ± 0,07 0,9 ± 0,2

V 0,5 ± 0,3 0,2 ± 0,0 0,2 ± 0,1 0,2 ± 0,04 0,3 ± 0,04

не установлена 1,0 ± 0,4 0,9 ± 0,1 0,9 ± 0,1 0,9 ± 0,07 1,0 ± 0,1

Медицинские группы для занятия физической культурой медицинские группы для % средняя,%

занятия физич. культурой 7 лет 8 лет 9 лет 10лет 7 - 10лет основная 81,6 79,9 79,1 77,0 79,4±1,7

подготовительная 13,8 15,8 16,3 18,0 16,0±1,5

специальная 1,9 2,3 2,6 2,9 2,4±0,4

не установлена 2,7 2,0 2,0 2,1 2,2±0,3

Всего: 100,0

В возрасте 7 лет процентное отношение числа детей, занимающихся физической культурой в основной группе, достигает 81,6%, в подготовительной – 13,8%, в специальной – чуть менее 2,0%. Снижение числа детей, занимающихся физической культурой в основной группе к 10 годам, по сравнению с 7-летним возрастом (на 4,6%), статистически достоверно, равно как и рост числа детей, занимающихся в подготовительной группе (на 2,2%), в обоих случаях р<0,001. Процентные колебания занимающихся в специальной группе статистически несущественны (Up<1. 29).

К 11 годам число занимающихся в основной группе, в сравнении с 7летними, достоверно снижается (р<0,001) и в процентном выражении составляет 75,8%. Напротив, число детей, занимающихся в подготовительной и специальной группах, к 11 году жизни достоверно растет (р<0,001 в первом и р<0,05 во втором случае).

медицинские группы % средняя,%

(физкультурные) 11 лет 14 лет 16 лет 18лет с 11 до 18 11 - 18лет основная 75,8 68,8 62,2 61,1 +14,7 67,0 ± 5,9

подготовительная 19,1 24,8 30,6 28,0 +8,9 25,6 ± 4,3

специальная 3,2 4,4 5,4 8,2 +5 5,3 ± 1,9

не установлена 1,8 2,0 1,8 2,7 +0,9

Всего: 100,0

В процентном выражении снижение числа детей от 11 до 18 лет, занимающихся в основной группе, достигает 15,0% и является статистически существенным, равно как и рост числа детей, занимающихся в подготовительной группе (в обоих случаях р<0,001). Увеличение числа детей, занимающихся физкультурой в специальной группе в возрастном интервале 11 – 18 лет, также достоверно (р<0,001).

В данном примере, благодаря статистике, мы наглядно убеждаемся в том, что состояние здоровья московских школьников ухудшается с возрастом.

Исследование физических возможностей школьников

В природе и в обществе все процессы и явления взаимосвязаны. Количественные связи проявляются в функциональной и корреляционной формах. Функциональная связь возникает, когда каждому значению одного признака соответствует строго определённое значение другого признака (это правило срабатывает в физико-химических явлениях). Корреляционная связь возникает в случаях, когда каждому значению одного признака соответствуют несколько значений другого признака. Эта связь характерна для социально-гигиенических и медико-биологических явлений. С помощью математических формул исследователи выявляют наличие или отсутствие корреляции между какими-либо явлениями и определяют её направленность. В зависимости от направления действия корреляционная связь может быть прямой или обратной. При прямой связи направление изменения результативного признака совпадает с направлением изменения признака-фактора, т. е. с увеличением факторного признака увеличивается и результативный или наоборот, происходит их синхронное уменьшение. Существуют и обратные связи, когда при увеличении факторного признака результативный уменьшается или наоборот. По аналитическому выражению связи могут быть прямо- и криволинейными. При прямолинейной связи происходит непрерывное возрастание или убывание результативного фактора, при криволинейной изменение результативного признака происходит неравномерно или его направление меняется на противоположное. Математически уравнение прямолинейной связи представляется уравнением прямой, графически – прямой линией (линейная связь), криволинейная связь описывается гиперболами, параболами и т. д. Кроме таблиц и графиков корреляция может быть представлена коэффициентом корреляции. Обычно для расчётов применяется метод Пирсона:

Возможно применение более грубого, приближенного рангового метода Спирмена:

На уроке физкультуры перед нами была поставлена задача: определить достоверность взаимосвязи между показателями веса и числом отжиманий от пола у 11 исследуемых школьников с помощью нормированного коэффициента корреляции Пирсона.

Хi (Хi–Хср) (Хi–Хср)2 Уi (Уi-Уср) (Уi-Уср)2 (Хi–Хср)*(Уi-Уср)

55 2 4 9 1 1 2

50 -3 9 7 3 9 -9

49 -4 16 3 7 49 -28

47 -6 36 4 6 36 -36

54 1 1 6 4 16 4

59 6 36 6 4 16 24

48 -5 25 11 -1 1 5

62 9 81 7 3 9 27

56 3 9 21 -11 121 -33

50 -3 9 15 -5 25 15

55 2 4 20 -10 100 -20

Хср=53 Σ(Хi-Хср)2=230 Уср=10 Σ(Уi-Уср)2 =383 Σ(Хi–Хср)*

(Уi-Уср)=-49

Тогда согласно формуле Пирсона коэффициент корреляции равен -0,15. Это означает, что между данными выборок наблюдается прямая отрицательная связь, то есть с увеличением веса тела снижается количество отжиманий от горизонтальной поверхности. Если число коррелируемых пар невелико (n≤30), то при оценке зависимости можно воспользоваться следующей градацией:

• 0,7 < r < 0,99 – сильная зависимость;

• 0,5 < r <0,69 – средняя зависимость;

• 0,2 < r < 0,49 – слабая зависимость.

Полученный коэффициент корреляции меньше нижней границы в 0,2, соответствующей слабой зависимости. Отсюда следует, что выявленная тенденция недостоверна.

Статистические методы в экономике

Зачастую у специалистов экономического профиля возникает необходимость уловить тенденцию развития страны, региона, отрасли или национальной экономики в целом, а главное, сравнить закономерности и интенсивность развития этих тенденций во времени. Для решения подобного рода задач также используются показатели роста и прироста как и те, что мы уже применили при расчётах демографических показателей движения населения Москвы. Этот специальный комплекс расчётов даёт возможность анализировать экономические процессы «в четвёртом измерении» - во времени.

Рассмотрим следующий пример: ассортимент фирмы по продаже игрушек включает 5 модификаций электрической железной дороги, которые отличаются друг от друга размером и количеством вагонов, а, следовательно, и ценой. Необходимо определить, как изменился за месяц объём продаж по всем видам электрических железных дорог вместе. Нам известны индивидуальные по каждому виду железных дорог индексы прироста продаж за месяц. Умножив объём продаж в январе на индекс прироста объёма продаж за месяц по каждому виду игрушек, мы найдём величины прироста продаж по каждому виду, а после их суммирования — величину прироста объёма продаж по всем видам железных дорог за месяц. Отнеся эту величину к общей сумме продаж в январе, мы получим индекс прироста общего объёма продаж за месяц. Формулу темпа роста (индекса роста), темпа прироста (индекса прироста) мы уже приводили в разделе «Описательная статистика в медицине». Для наглядности расчётов некоторые формулы приведем повторно.

Индексы роста и прироста могут быть базисные и цепные. При расчёте базисных индексов роста данные за некоторый момент времени принимаются за базу, а индексы роста определяются путём деления показателей в каждый момент времени на показатель в момент времени, принятый за базу. При расчёте цепных индексов роста производится деление значения показателя в последующий момент времени на соответствующий показатель в предыдущий момент времени. Выведем формулы для базисных и цепных индексов роста, где tx — некоторый момент времени, ax — значение некоторого показателя в момент наблюдения tx. Тогда расчёт базового индекса будем проводить по формуле:

Формула для расчёта цепного индекса следующая:

Из цепных индексов можно получить базисные. Если необходимо получить базисный индекс какого-либо показателя в момент t5 к этому показателю в t1, а соответствующих показателей нет, но есть цепные индексы, то можно вывести формулу:

Аналогично, из базисных индексов можно получить цепные. Если даны базисные индексы x-го и x - 1го периодов к одной и той же базе, то где: xj - значение j-ого элемента группы в исходный момент времени;

Ij — индивидуальный индекс роста j-ого элемента группы (в долях); j = 1,. ,N;

N — количество элементов в группе.

Рассмотрим, что представляет собой индекс группы. Как видно из формулы, в числителе индекса группы стоит сумма объёмов продаж в феврале, рассчитанная как сумма объёмов продаж в январе, умноженных на индекс роста продаж за месяц (в рассмотренном нами примере эта формула несколько модифицирована, так как в условии даны не индексы роста, а индексы прироста объёмов продаж). В знаменателе — январская сумма объёмов продаж. При этом элементами ряда распределения являются индивидуальные индексы по каждому виду продукции (в нашем примере — железных дорог), ведь среднюю именно этих величин мы пытаемся найти. Объём продаж в январе является в данной формуле частотами, так как это то количество денег, которое росло темпами, представленными элементами ряда распределения (в нашем примере — индивидуальными индексами роста объёмов продаж).

Рассмотренный сейчас принцип действителен не только для данного конкретного примера, он действует во всех случаях, когда необходимо определить средний индекс по группе при известных индексах каждого из элементов этой группы.

Приведённые примеры убеждают нас в том, что статистика — чрезвычайно нужная наука. Однако именно эта наука подвергается беспощадной критике. Бытует мнение, что «есть ложь, большая ложь и статистика». В приведённом выражении статистика представляется как высшая степень ложности, и, к сожалению, так думают очень многие. Однако, не следует «обвинять» статистику в тех грехах, которые она не совершала, а необходимо разобраться и грамотно использовать её методы в современной жизни, современной науке, современном бизнесе.

Комментарии


Войти или Зарегистрироваться (чтобы оставлять отзывы)