Математическая статистика. Группировка и анализ статистических данных
Математическая статистика - это раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. При этом статистическими данными называются сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками. Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении статистических данных - результатах наблюдений.
Первая задача математической статистики – указать способы сбора и группировки статистических сведений.
Вторая задача математической статистики – разработать методы анализа статистических данных, в зависимости от целей исследования.
Т.е. задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных практических выводов.
Типы статистических данных.
Статистические данные представляют собой наблюдаемые или измеряемыезначение одного или нескольких признаков обследуемой совокупности объектов. Различают качественные и количественные признаки. Количественные признаки могут быть непрерывными (вес, рост, цена) или дискретными (кол-во детей, комнат, продажа т/в в день).
Качественные признаки: пол, семейное положение, цвет глаз, кирпичный дом.
Качественные признаки: номинальные (классификационные) и ординальные
(порядковые).
Говорят, что соответственные признаки измеряют в номинальной или порядковой шкале.
Признак измеряемый в номинальной шкале принимает одно значение из конечногочисла установленных градаций: пол (м/ж), цвет, марка автомобиля и прочие. Часто пользуются, например, в социологических опросах. Таблицы данных записываются в виде таблиц сопряженности. Значения качественных признаков, измеряющихся в ординальной шкале, могу быть упорядочены. Примеры: тестовые баллы, школьные оценки, качество условий жизни (очень хорошее, хорошее, удовлетворительное, плохое, российское). Для представления таких признаков используется ранг, т.е. число, которое сопоставляет номеру признака в ряду. Для обработки данных, представленных в ординальной и номинальных шкалах, разработаны специальные методы, например, ранговая корреляция, можно проводить проверку гипотез о виде распределений, дисперсионный анализ и пр.
Представление данных в виде гистограмм, полигонов и эмпирических функций распределения дает информацию о распределении генеральной совокупности. Но часто требуется охарактеризовать генеральную совокупность по количественным показателям, которые определяют положение центра распределения, рассеяние (разброс) данных, ассиметрию. Это дает возможность сравнить одну совокупность данных с другой.
Вопросы к конспектам
Найдите разность среднего арифметического и медианы этого набора.
I II III IV V VI VII
42 34 35 32 36 33 38
Определите средний товарный запас хлопчатобумажных тканей за 1 полугодие.