Используются для сравнения нескольких величин. Метод сравнения. Виды диаграмм и примеры их использования

ТЕХНОЛОГИЧЕСКАЯ КАРТА ЗАНЯТИЯ №35

№ этапа Этапы занятия Время Деятельность преподавателя Деятельность студента Приложения
Организационный момент 2 мин. Приветствует студентов, проверяет их готовность к уроку Приветствует преподавателя, готовится к уроку
Сообщение плана урока 1 мин. Сообщает план урока
Контроль знаний 20 мин. Проводит опрос по предыдущей теме Отвечает. Слушает. Дополняет.
4. Сообщение новой темы, целей, мотивации, плана изложения новой темы 3 мин. Сообщает тему лекции, цели, мотивирует необходимость изучения данной темы. Сообщает план изложения новой темы. Слушает.
5. Изложение нового материала. 30 мин. Изложение новой темы с использованием мультимедийной презентации Слушает. Записывает.
6. Закрепление темы 20 мин. Выполнение заданий Отвечает. Дополняет.
7. Подведение итогов 2 мин. Комментирует и выставляет оценки.
8. Домашнее задание 2 мин. Сообщает домашнее задание

Занятие «Деловая графика.

Построение, редактирование, форматирование диаграмм»

В программе Excel термин диаграмма используется для обозначения всех видов графического представления числовых данных. Построение графического изображения производится на основе ряда данных. Так называют группу ячеек с данными в пределах отдельной строки или столбца. На одной диаграмме можно отображать несколько рядов данных.

Диаграмма представляет собой вставной объект, внедренный на один из листов рабочей книги. Она может располагаться на том же листе, на котором находятся данные, или на любом другом листе (часто для отображения диаграммы отводят отдельный лист). Диаграмма сохраняет связь с данными, на основе котоҏыҳ она построена, и при обновлении этих данных немедленно изменяет свой вид.

Для построения диаграммы обычно используют Мастер диаграмм , запускаемый щелчком на кнопке Мастер диаграмм на стандартной панели инструментов Часто удобно заранее выделить область, содержащую данные, которые будут отображаться на диаграмме, но задать эту информацию можно и в ходе работы мастера

Тип диаграммы. На ᴨȇрвом этаᴨȇ работы мастера выбирают форму диаграммы. Доступные формы ᴨȇречислены в списке Тип на вкладке Стандартные . Для выбранного типа диаграммы справа указывается несколько вариантов представления данных (палитра Вид ), из котоҏыҳ следует выбрать наиболее подходящий. На вкладке Нестандартные отображается набор полностью сформированных типов диаграмм с готовым форматированием. После задания формы диаграммы следует щелкнуть на кнопке Далее .

Выбор данных. Второй этап работы мастера служит для выбора данных, по которым будет строиться диаграмма. Если диапазон данных был выбран заранее, то в области предварительного просмотра в верхней части окна мастера появится приблизительное отображение будущей диаграммы. Если данные образуют единый прямоугольный диапазон, то их удобно выбирать при помощи вкладки Диапазон данных. Если данные не образуют единой группы, то информацию для обрисовки отдельных рядов данных задают на вкладке Ряд . Предварительное представление диаграммы автоматически обновляется при изменении набора отображаемых данных.

Оформление диаграммы. Третий этап работы мастера (после щелчка на кнопке Далее ) состоит в выборе оформления диаграммы. На вкладках окна мастера задаются:

* название диаграммы, подписи осей (вкладка Заголовки );

* отображение и маркировка осей координат (вкладка Оси );

* отображение сетки линий, параллельных осям координат (вкладка Линии сетки );

* описание построенных графиков (вкладка Легенда );

* отображение надписей, соответствующих отдельным элементам данных на графике (вкладка Подписи данных );

* представление данных, использованных при построении графика, в виде таблицы (вкладка Таблица данных ).

В зависимости от типа диаграммы некоторые из ᴨȇречисленных вкладок могут отсутствовать.

Размещение диаграммы. На последнем этаᴨȇ работы мастера (после щелчка на кнопке Далее ) указывается, следует ли использовать для размещения диаграммы новый рабочий лист или один из имеющихся. Обычно этот самый выбор важен только для последующей ᴨȇчати документа, содержащего диаграмму. После щелчка на кнопке Готово диаграмма строится автоматически и вставляется на указанный рабочий лист.

Редактирование диаграммы. Готовую диаграмму можно изменить. Она состоит из набора отдельных элементов, таких, как сами графики (ряды данных), оси координат, заголовок диаграммы, область построения и прочее при щелчке на элементе диаграммы он выделяется маркерами, а при наведении на него указателя мыши -- описывается всплывающей подсказкой Открыть диалоговое окно для форматирования элемента диаграммы можно через меню Формат (для выделенного элемента) или через контекстное меню (команда Формат ) Различные вкладки открывшегося диалогового окна позволяют изменять параметры отображения выбранного элемента данных. Если требуется внести в диаграмму существенные изменения, следует вновь воспользоваться мастером диаграмм. Для этого следует открыть рабочий лист с диаграммой или выбрать диаграмму, внедренную в рабочий лист с данными. Запустив мастер диаграмм , можно изменить текущие параметры, которые рассматриваются в окнах мастера, как заданные по умолчанию.

Чтобы удалить диаграмму, можно удалить рабочий лист, на котором она расположена (Правка Удалить лист ), или выбрать диаграмму, внедренную в рабочий лист с данными, и нажать клавишу DELETE

Построение диаграмм

Практически во всех современных табличных "процессорах имеются встроенные средстваделовой графики. Для этого существуетграфический режим работы табличного процессора. В графическом режиме можно строить диаграммы различных типов, что придает наглядность числовым зависимостям.

Диаграмма -- это средство наглядного графического изображения информации, предназначенное для сравнения не скольких величин или нескольких значений одной величины, слежения за изменением их значений и т.п.

Большинство диаграмм строятся в прямоугольной системе координат. По горизонтальной оси Х откладываются значения независимой ᴨȇременной (аргумента), а по вертикальной оси Y -- значения зависимой ᴨȇременной (функции). На один рисунок может быть выведено одновременно несколько диаграмм.

При графической обработке числовой информации с помощью табличного процессора следует:

1) указать область данных (блок клеток), по которым будет строиться диаграмма;

2) определить последовательность выбора данных (по строкам или по столбцам) из выбранного блока клеток.

При выборе по столбцам Х - координаты берутся из крайнего левого столбца выделенного блока клеток. Остальные столбцы содержат Y- координаты диаграмм. По количеству столбцов определяется количество строящихся диаграмм. При выборе по строкам самая верхняя строка выделенного блока клеток является строкой Х - координат, остальные строки содержат Y- координаты диаграмм.

Рассмотрим диаграммы 5 различных типов. В разных книгах они носят разные названия. Будем их называть: круговые диаграммы, столбчатые, ярусные, линейные и областные (или диаграммы площадей). На самом деле типов диаграмм гораздо больше, но эти -- самые распространенные.

I. Круговая диаграмма служит для сравнения нескольких величин в одной точке. Она особенно полезна, если величины в сумме составляют нечто целое (100%).

Пример 1. Незнайка торгует канцелярскими товарами: блокнотами, карандашами и тетрадями. Будем считать, что за день он продал 2 блокнота, 13 карандашей и 45 тетрадей.

Построить круговую диаграмму, показывающую, какой товар покупался в течение дня чаще всего.

Рассмотрим последовательность действий табличного процессора, при построении круговой диаграммы. Круговая диаграмма, как и следует из названия, располагается на круге. Круг -- 360 градусов. Суммарное количество проданных товаров составляет 60 штук. Значит, на 1 штуку товара приходится 360:60=б градусов. Пересчитаем “товар в градусы”: 13-ти блокнотам будет соответствовать 2*6 = 12 градусов; 13-ти карандашам -- 13*6 = 78 градусов; 45-ти тетрадям -- 45*6 = 270 градусов. Оста лось разбить круг на три сектора -- 12, 78 и 270 градусов.

Решение. Выделим блок клеток А1:ВЗ, содержащий данные для графической обработки. Данные располагаются в столбцах. Первый столбец А1:АЗ выделенного блока является столбцом названий секторов; второй столбец В1:ВЗ выделенного блока содержит числовые данные диаграммы. Круговая диаграмма будет выглядеть следующим образом:

Круговая диаграмма не всегда обесᴨȇчивает необходимую наглядность представления информации. Во-ᴨȇрвых, на одном круге может оказаться слишком много секторов. Во-вторых, все сектора могут быть примерно одинакового размера. Вместе эти две причины делают круговую диаграмму малополезной.

II. Столбчатая диаграмма служит для сравнения нескольких величин в нескольких точках. Значит, нужен другой инструмент, диаграмма другого типа. Это --столбчатые диаграм-мы.

А В С D Е F G
Пн Вт Чт Пт Сб Bc

Столбчатые диаграммы (как и следует из названия) состоят изстолбиков. Высота столбиков определяется значениями сравниваемых величин. В нашем случае высота столбика будет определяться количеством газет, которое Незнайка продавал за день. Каждый столбик привязан к некоторойопорной точке. В нашем случае опорная точка будет соответствовать одному дню недели.

Решение. Выделим блок клеток A1-G2, содержащий данные для графической обработки. Данные располагаются в строках. Первая строка A1:G1 выделенного блока является строкой Х координат (опорные точки); вторая строка A2.G2 выделенного блока содержит Y координаты (высоты столбиков) диаграммы.

Указать заголовок диаграммы: “Незнайка торгует газетами”. Столбчатая диаграмма будет выглядеть следующим образом:

Пример 3. Теᴨȇрь рассмотрим более сложную задачу, для решения которой круговую диаграмму в принциᴨȇ использовать нельзя. Это задача, в которой требуется несколько раз сравнить несколько величин. Пусть вместе с Незнайкой газетами торговали Торопыжка и Пончик. Их усᴨȇхи в торговле отражены в следующей таблице (для удобства добавим сюда и Незнайку):

А В С D Е F G Н
Пн Вт Ср Чт Пт Сб
Незнайка
Торопыжка
Пончик

Построить столбчатую диаграмму, на которой будут отображены данные сразу обо всех трех продавцах. По-прежнему высота столбца будет символизировать количество газет. По прежнему у нас будет 7 опорных точек -- по одной для каждого дня недели. Разница с предыдущей диаграммой будет в том, что теᴨȇрь в каждой опорной точке будут стоять не один столбик, а три -- по одному для каждого продавца. Все столбики одного продавца будут закрашены одинаково.

Решение. Выделим блок клеток А1:Н4, содержащий данные для графической обработки. Данные располагаются в строках. Первая строка выделенного блока является строкой Х координат (опорные точки); следующие три строки выделенного блока содержат Y координаты (высоты столбиков) диаграммы. Указать заголовок диаграммы: “Торговля газетами”.

III. Линейная диаграмма служит для того, чтобы проследить за изменением нескольких величин при ᴨȇреходе от одной точки к другой.

Пример 4. Построить линейную диаграмму, отражающую изменение количества проданных газет в течение недели (см. Пример 3). Построение линейной диаграммы аналогично построению столбчатой. Но вместо столбиков просто отмечается их высота (точками, черточками, крестиками -- неважно) и полученные отметки соединяются прямыми линиями (диаграмма -- линейная). Вместо разной штриховки (закраски) столбиков используются разные отметки (ромбики, треугольники, крестики и т.д.), разная толщина и типы линий (сплошная, пунктирная и пр.), разный цвет.

IV. Ярусная диаграмма позволяет наглядно сравнить суммы нескольких величин в нескольких точках, и при этом показать вклад каждой величины в общую сумму.

Пример 5. Составленные нами диаграммы “Торговля газетами” (и столбчатая, и линейная) интересны в ᴨȇрвую очередь продавцам газет, демонстрируют усᴨȇшность их работы. Но кроме продавцов в торговле газетами заинтересованы и другие лица. Например, издателю газеты нужно знать не только то, сколько экземпляров газеты продал каждый из продавцов, но и сколько они продали все вместе. При этом сохраняется интерес и к отдельным величинам, составляющим общую сумму. Возьмем таблицу продажи газет (см. Пример 3) и построим для нее ярусную диаграмму.

Порядок построения ярусной диаграммы очень напоминает порядок построения диаграммы столбчатой. Разница в том, что столбики в ярусной диаграмме ставятся не рядом друг с другом, а один на другой. Соответственно меняются правила расчета вертикального и горизонтального размера диаграммы. Вертикальный размер будет определяться не наибольшей величиной, а наибольшей суммой величин. Зато количество столбиков всегда будет равняться количеству опорных точек: в каждой опорной точке всегда будет стоять ровно один многоярусный столбик.

2

Я слушал лекцию по измерению производительности компьютера, и профессор дал аналогию с измерением производительности самолетов. Он показал таблицу, которая содержала различные параметры различных летательных аппаратов, таких как:

Aircrafts: Passenger Capcity Speed Concord 132 1350 mph DC9 146 544 mph

тогда он задавал вопросы от студентов, что «Насколько быстрее Конкорд по сравнению с DC9 ?». Затем он объяснил это более чем в 2 раза. Мой вопрос: почему он использовал Дивизион для сравнения двух значений, а не вычитания? Я знаю его очень фундаментальный вопрос, но, пожалуйста, извините мою некомпетентность за это.

0

Иногда вам приходится использовать соотношение для описания явлений, например, вероятность выигрыша игры. Иногда это необязательно, как в вашем случае. Вы можете найти это интересно: https: //en.wikipedia.org/wiki/Relative_change_and_difference - NoChance 06 мар. 16 2016-03-06 17:40:56

  • 2 ответа
  • Сортировка:

    Активность

0

Я разместил тот же вопрос на Dr.Maths и получил следующий ответ, который, на мой взгляд, более точный и подробный.

Ask yourself which would be more meaningful to you: The Concord is 806 mph faster than the DC9. The Concord is 2.5 times as fast as the DC9. If you have no idea how fast the DC9 is, the first statement would be nearly meaningless -- you can"t tell whether it"s just a small improvement (from, say 100,000 mph to 100,806 mph!) or a huge improvement (from 10 mph to 816 mph). I"m exaggerating to make a point: interpreting the significance of the number depends on having at least some knowledge of related numbers. The ratio, on the other hand, requires no such knowledge. Also, and perhaps even more important, the ratio will be the same regardless of the units used. We don"t need to know whether the speeds were measured in mph or kph or inches per second. In effect, the ratio amounts to using the DC9 itself as a unit of measurement -- the Concord flies at 2.5 DC9"s. The same is probably true in comparing computer speeds. Who knows, these days, what is a good speed? But anyone can tell that twice as fast is a lot better. This is something we can visualize a lot better than nanoseconds or gigabytes!

1

Рассмотрите ситуацию - я съел $1000$ яблок. Мой друг съел яблоки на $1050$ .

Два statements- Мой друг съел $50$ яблок больше, чем я от разницы, Мой друг съел $1,05$ раз количество яблок, как мне из соотношения.

Рассмотрим другую ситуацию, когда я ел $100$ яблоки и мой друг $105$

Два заявления будет Мой друг съел $5$ яблоки больше, чем меня и
Мой друг съел $1,05$ раза больше яблок, как мне

Третий Я ел с ситуациями $1$ яблоко, мой друг ел $51$

два заявления - Мой друг съел $50$ яблок более-й МЭ и
Мой друг съел $51$ раз количество яблок, как мне

Заключение - Нам нужно как разность и отношение четко знать ситуацию. Однако мы используем разные вещи в разных сценариях, которые, как я надеюсь, ясны из приведенного выше примера.

Сравнение является универсальным методом познания, и оно используется в экономическом анализе очень часто, как в качестве самостоятельного приема, так и в составе других методов.

Сравнение - это сопоставление изучаемого объекта с уже изученным для нахождения черт сходства либо различий между ними. С помощью сравнения выявляется общее и особенное в экономических явлениях, устанавливаются отличия или изменения в уровне и состоянии исследуемых объектов, изучаются тенденции и закономерности их развития.

С помощью сравнения решаются следующие основные задачи:

Выявление причинно-следственных связей между явлениями;

Проведение доказательств или опровержений;

Классификация и систематизация явлений.

В анализе чаще всего используются следующие разновидности сравнений:

1. Сравнение фактических значений показателей отчетного периода (отчетной даты) с данными прошлых периодов (предыдущих дат). Это дает возможность оценить направление и скорость изменения изучаемых показателей и определить тенденции и закономерности развития экономических процессов. Этот тип сравнений называют временным сравнительным анализом .

2. Сопоставление фактического уровня показателей с плановым . Такое сравнение необходимо для оценки степени выполнения плана, выявления неиспользованных резервов.

3. Сравнение фактических значений показателей с утвержденными нормами и нормативами . Такое сравнение, широко используемое в практике аналитической работы, необходимо для контроля соблюдения установленных нормативов, выявления экономии или перерасхода ресурсов, для оценки степени эффективности их использования и для определения утерянных возможностей.

4. Сравнение уровня показателей изучаемого объекта со значениями показателей других объектов . Например, уровень рентабельности анализируемой фирмы можно сравнить с уровнем рентабельности фирмы-конкурента или с уровнем рентабельности лучшей в данной сфере деятельности фирмы. Сравнения этого типа позволяют выявлять и перенимать положительный опыт; они используются в конкурентной борьбе. Сравнение разных объектов называется пространственным (или межхозяйственным ) сравнительным анализом .

5. Сравнение показателей исследуемой организации со среднеотраслевыми данными . Такое сравнение используется для более полной и объективной оценки уровня развития организации, изучения общих и специфических факторов, определяющих результаты ее хозяйственной деятельности.

6. Сравнение параллельных и динамических рядов показателей. Сравнение этого типа используется в экономическом анализе для определения формы и направления связи между разными показателями. С этой целью значения одного из показателей необходимо расположить в возрастающем или убывающем порядке и посмотреть, как в связи с этим изменяются другие исследуемые показатели: возрастают они или убывают и в какой степени.


7. Сравнение разных вариантов планов, проектов, управленческих решений для выбора оптимального варианта.

8. Сравнение значений показателей до и после реализации плана , проекта, управленческого решения для оценки их качества.

Описанные в предыдущей главе горизонтальный, вертикальный и трендовый анализ также являются по своей сути сравнениями. Горизонтальный и трендовый анализ - это временной сравнительный анализ, а вертикальный анализ - это сравнение части и целого, сравнение отдельных частных показателей с итоговым с целью выявления вклада этих показателей в общий итог.

Сравнение двух и более значений одного и того же показателя называется одномерным . Таковым является, например, сравнение курса ценной бумаги на разные даты. При наличии шкалы такое сравнение не вызывает затруднений: все сравниваемые значения можно проранжировать в порядке возрастания, определить лучшее и худшее значения и т. д.

Сравнение двух и более значений двух и большего количества показателей называется многомерным . По результатам такого сравнения бывает трудно сделать однозначный вывод. Например, необходимо сравнить два предприятия и выявить, какое из них лучше, по двум показателям: по рентабельности и по производительности труда. Если рентабельность выше у первого предприятия, а производительность труда лучше на втором, непонятно, как же определить лучшее из них.

Чтобы избежать неоднозначности выводов, многомерное сравнение нужно свести к одномерному. Для этого используются специальные методы, называемые методами расчета комплексной оценки . Суть этих методов - в замене нескольких показателей, по которым проводится сравнение, одним показателем (комплексной оценкой).

Коэффициентный метод (метод расчета относительных величин)

В экономическом анализе очень широко применяется так называемый коэффициентный метод. Коэффициент - это относительный показатель, безразмерная величина, он является результатом деления одного абсолютного показателя на другой. Абсолютные показатели в экономике чаще всего являются результатом учета (бухгалтерского, статистического и т. д.). Путем деления одного абсолютного показателя на другой можно сопоставить их величины, определить долю одного показателя в другом, определить расход ресурса на каждую единицу получаемого экономического результата и т. д.

Название «коэффициентный метод» не совсем точное, так как на самом деле в его рамках рассчитываются не только коэффициенты , но и другие относительные величины: процентные соотношения , индексы и такие размерные величины , как фондоотдача, производительность труда и пр. Более точное название метода - «метод расчета относительных величин».

Выше перечислены разновидности относительных величин по форме . По содержанию различают относительные величины динамики, уровня выполнения плана, структуры, координации, интенсивности и эффективности .

Динамику, то есть изменение показателей во времени, характеризуют относительные величины динамики : индексы, темпы роста и прироста. Например, индекс инфляции характеризует уровень покупательной способности денег в один момент времени по отношению к другому. Методы расчета и использование показателей динамики подробно будут описаны ниже, в разделе о методах экономической статистики.

Относительная величина уровня выполнения плана рассчитывается как отношение фактического значения показателя к запланированному и, таким образом, характеризует уровень выполнения плана по какому-либо показателю (назовем его П). Как правило, такая величина выражается в процентах:

Относительные величины структуры используются, чтобы рассчитать вклад какого-либо частного показателя в общий итог, оценить значимость отдельных составляющих по отношению ко всему объекту. Например, коэффициент мобильности характеризует долю оборотных активов в общей сумме активов организации (которые, как известно, складываются из оборотных и внеоборотных активов):

Кроме долей, структуру можно характеризовать показателями удельного веса (они выражаются в процентах).

Относительные величины координации характеризуют соотношение между двумя частными показателями, входящими в общий итог. Они позволяют определить, во сколько раз один показатель больше или меньше другого, или установить равенство между ними. Например, коэффициент финансового риска представляет собой соотношение между величинами заемного и собственного капитала организации и характеризует, во сколько раз заемный капитал больше собственного:

Относительные величины интенсивности применяются, в основном, для макроэкономического анализа. Они характеризуют степень распространенности какого-либо явления или уровень развития какого-либо процесса. Это, например, такие показатели, как уровень смертности, безработицы или заболеваемости гриппом. Эти показатели рассчитываются в человеках на 1 тыс. населения.

Относительные величины эффективности наиболее востребованы в экономическом анализе. Они представляют собой отношение величины экономического эффекта к величине (или затратам) ресурса, который был использован для достижения эффекта:

Соответственно, их значение характеризует величину эффекта в пересчете на единицу ресурса. В качестве экономического эффекта может выступать сумма дохода, объем продукции, сумма прибыли и т. д. Наиболее известны такие показатели эффективности, как показатели рентабельности или показатели отдачи ресурсов (фондоотдача, материалоотдача и т. д.). Например, материалоотдача - это объем продукции, произведенной с каждой единицы затрат материальных ресурсов. Она рассчитывается следующим образом:

Расчет любой относительной величины - это, по сути, сравнение двух абсолютных величин. Таким образом, коэффициентный метод - это развитие метода сравнения.

В предыдущих заметках были описаны процедуры проверки гипотез о числовых и категорийных данных: , несколько , а также , позволяющего изучать один или . В настоящей заметке мы рассмотрим методы проверки гипотез о различиях между долями признака в генеральных совокупностях на основе нескольких независимых выборок.

Для иллюстрации применяемых методов используется сценарий, в котором оценивается степень удовлетворенности постояльцев отелей, принадлежащих компании Т. С. Resort Properties. Представьте себе, что вы - менеджер компании, владеющей пятью отелями, расположенными на двух курортных островах. Если гости удовлетворены обслуживанием, велика вероятность, что они вернутся на следующий год и порекомендуют своим друзьям остановиться именно в вашем отеле. Чтобы оценить качество обслуживания, постояльцев просят заполнить анкету и указать, довольны ли они гостеприимством. Вам необходимо проанализировать данные опроса, определить общую степень удовлетворенности запросов постояльцев, оценить вероятность того, что гости приедут вновь в следующем году, а также установить причины возможного недовольства некоторых клиентов. Например, на одном из островов компании принадлежат отели Beachcomber и Windsurfer. Одинаково ли обслуживание в этих отелях? Если нет, как эту информацию можно использовать для улучшения качества работы компании? Более того, если некоторые постояльцы заявили, что больше к вам не приедут, какие причины они указывают чаще других? Можно ли утверждать, что эти причины касаются лишь конкретной гостиницы и не относятся ко всей компании в целом?

Здесь использованы следующие обозначения: X 1 - количество успехов в первой группе, X 2 - количество успехов во второй группе, n 1 X 1 - количество неудач в первой группе, n 2 X 2 - количество неудач во второй группе, X = X 1 + X 2 - общее количество успехов, n X = (n 1 X 1 ) + (n 2 X 2 ) - общее количество неудач, n 1 - объем первой выборки, n 2 - объем второй выборки, n = n 1 + n 2 - суммарный объем выборок. Представленная таблица имеет две строки и два столбца, поэтому она называется факторной таблицей 2×2. Ячейки, образованные пересечением каждой строки и столбца, содержат количество успехов или неудач.

Проиллюстрируем применение таблицы сопряженности признаков на примере сценария, описанного выше. Предположим, что на вопрос «Вернетесь ли вы в следующем году?» утвердительно ответили 163 из 227 постояльцев отеля Beachcomber, и 154 из 262 постояльцев отеля Windsurfer. Существует ли статистически значимая разность между степенью удовлетворенности постояльцев отелей (представляющая собой вероятность того, что постояльцы вернутся в следующем году), если уровень значимости равен 0,05?

Рис. 2. Факторная таблица 2х2 для оценки качества обслуживания постояльцев

В первой строке указывается количество постояльцев каждого отеля, заявивших о своем желании вернуться в следующем году (успех); во второй строке – количество постояльцев, выразивших недовольство (неудача). Ячейки, расположенные в столбце «Итого», содержат общее количество гостей, планирующих вернуться в отель в следующем году, а также общее количество гостей, недовольных обслуживанием. Ячейки, расположенные в строке «Всего», содержат общее количество опрошенных постояльцев каждого отеля. Доля постояльцев, планирующих вернуться, вычисляется путем деления количества постояльцев, заявивших об этом, на общее количество опрошенных гостей данного отеля. Затем для сравнения вычисленных долей применяется χ 2 -критерий.

Чтобы проверить нулевую и альтернативные гипотезы Н 0: р 1 = р 2 ; Н 1: р 1 ≠ р 2 используем тестовую χ 2 -статистику.

Критерий «хи-квадрат» для сравнения двух долей. Тестовая χ 2 -статистика равна сумме квадратов разностей между наблюдаемым и ожидаемым количеством успехов, деленных на ожидаемое количество успехов в каждой ячейке таблицы:

где f 0 - наблюдаемое количество успехов или неудач в конкретной ячейке таблицы сопряженности признаков, f e

Тестовая χ 2 -статистика аппроксимируется χ 2 -распределением с одной степенью свободы.

Или неудач в каждой ячейке таблицы сопряженности признаков, необходимо понимать их смысл. Если нулевая гипотеза является истинной, т.е. доли успехов в двух генеральных совокупностях равны, выборочные доли, вычисленные для каждой из двух групп, могут отличаться друг от друга лишь по случайным причинам, причем обе доли являются оценкой общего параметра генеральной совокупности р . В этой ситуации статистика, объединяющая обе доли в одной общей (средней) оценке параметра р , представляет собой общую долю успехов в объединенных группах (т.е. равна общему количеству успехов, деленному на суммарный объем выборок). Ее дополнение, 1 – , представляет собой общую долю неудач в объединенных группах. Используя обозначения, смысл которых описан в таблице на рис. 1. можно вывести формулу (2) для вычисления параметра :

где – средняя доля признака.

Чтобы вычислить ожидаемое количество успехов f e (т.е. содержимое первой строки таблицы сопряженности признаков), необходимо умножить объем выборки на параметр . Чтобы вычислить ожидаемое количество неудач f e (т.е. содержимое второй строки таблицы сопряженности признаков), необходимо умножить объем выборки на параметр 1 – .

Тестовая статистика, вычисленная по формуле (1), аппроксимируется χ 2 -распределением с одной степенью свободы. При заданном уровне значимости α нулевая гипотеза отклоняется, если вычисленная χ 2 -статистика больше χ U 2 , верхнего критического значения χ 2 -распределения с одной степенью свободы. Таким образом, решающее правило выглядит следующим образом: гипотеза H 0 отклоняется, если χ 2 > χ U 2 , в противном случае гипотеза Н 0 не отклоняется (рис. 3).

Рис. 3. Критическая область χ 2 -критерия для сравнения долей при уровне значимости α

Если нулевая гипотеза является истинной, вычисленная χ 2 -статистика близка к нулю, поскольку квадрат разности между наблюдаемой f 0 и ожидаемой f е величинами в каждой ячейке очень мал. С другой стороны, если нулевая гипотеза Н 0 является ложной и между долями успехов в генеральных совокупностях существует значимая разница, вычисленная χ 2 -статистика должна быть большой. Это объясняется разностью между наблюдаемым и ожидаемым количеством успехов или неудач в каждой ячейке, которая увеличивается при возведении в квадрат. Однако вклады разностей между ожидаемыми и наблюдаемыми величинами в общую χ 2 -статистику могут быть неодинаковыми. Одна и та же фактическая разность между f 0 и f e может оказать большее влияние на χ 2 -статистику, если в ячейке содержатся результаты небольшого количества наблюдений, чем разность, соответствующая большему количеству наблюдений.

Для того чтобы проиллюстрировать χ 2 -критерий для проверки гипотезы о равенстве двух долей, вернемся к сценарию, описанному в ранее, результаты которого приведены на рис. 2. Нулевая гипотеза (Н 0: р 1 = р 2) утверждает, что при сравнении качества обслуживания в двух отелях доли постояльцев, планирующих вернуться в следующем году, практически одинаковы. Для оценки параметра р , представляющего собой долю гостей, планирующих вернуться в отель, если нулевая гипотеза является истинной, используется величина , которая вычисляется по формуле

Доля гостей, оставшихся недовольными обслуживанием = 1 – 0,6483 = 0,3517. Умножая эти две доли на количество опрошенных постояльцев отеля Beachcomber, получаем ожидаемое количество гостей, планирующих вернуться в следующем сезоне, а также число отдыхающих, которые больше не остановятся в этом отеле. Аналогично вычисляются ожидаемые доли постояльцев отеля Windsurfer:

Да - Beachcomber: = 0,6483, n 1 = 227, следовательно, f e = 147,16.
Да - Windsurfer: = 0,6483, n 2 = 262, следовательно, f e = 169,84.
Нет - Beachcomber: 1 – = 0,3517, n 1 = 227, следовательно, f e = 79,84.
Нет - Windsurfer: 1 – = 0,3517, n 2 = 262, следовательно, f e = 92,16.

Расчеты представлены на рис. 4.

Рис. 4. χ 2 -статистика для отелей: (а) исходные данные; (б) факторная таблица 2х2 для сравнения наблюдаемого (f 0 ) и ожидаемого (f e ) количества постояльцев, удовлетворенных и не удовлетворенных обслуживанием; (в) вычисление χ 2 -статистики при сравнении доли постояльцев, удовлетворенных обслуживанием; (г) расчет критического значения тестовой χ 2 -статистики

Для расчета критического значения тестовой χ 2 -статистики применяется функция Excel =ХИ2.ОБР(). Если уровень значимости α = 0,05 (вероятность, подставляемая в функцию ХИ2.ОБР есть 1 –α), а χ 2 -распределение для факторной таблицы 2×2 имеет одну степень свободы, критическое значение χ 2 -статистики равно 3,841. Поскольку вычисленное значение χ 2 -статистики, равное 9,053 (рис. 4в), превышает число 3,841, нулевая гипотеза отклоняется (рис. 5).

Рис. 5. Определение критического значения тестовой χ 2 -статистики с одной степенью свободы при уровне значимости α = 0,05

Вероятность р того, что нулевая гипотеза верна при χ 2 -статистикие равной 9,053 (и одной степени свободы) рассчитывается в Excel с помощью функции =1 – ХИ2.РАСП(9,053;1;ИСТИНА) = 0,0026. р -значение, равное 0,0026, - это вероятность того, что разность между выборочными долями постояльцев, удовлетворенных обслуживанием в отелях Beachcomber и Windsurfer, равна или больше 0,718 – 0,588 = 0,13, если на самом деле их доли в обеих генеральных совокупностях одинаковы. Таким образом, существуют веские основания утверждать, что между двумя отелями есть статистически значимая разница в обслуживании постояльцев. Исследования показывают, что количество гостей, удовлетворенных обслуживанием в отеле Beachcomber, больше количества постояльцев, планирующих снова остановиться в гостинице Windsurfer.

Проверка предположений, касающихся факторной таблицы 2×2. Для получения точных результатов на основе данных, приведенных в таблице 2×2, необходимо, чтобы количество успехов или неудач превышало число 5. Если это условие не выполняется, следует применять точный критерий Фишера .

При сравнении процента клиентов, удовлетворенных качеством обслуживания в двух отелях, критерии Z и χ 2 приводят к одинаковым результатам. Это можно объяснить существованием тесной связи между стандартизованным нормальным распределением и χ 2 -распределением с одной степенью свободы. В этом случае χ 2 -статистика всегда является квадратом Z-статистики. Например, при оценке степени удовлетворенности гостей мы обнаружили, что Z -статистика равна +3,01, а χ 2 -статистика - 9,05. Пренебрегая ошибками округления, легко убедиться, что вторая величина является квадратом первой (т.е. 3,01 2 = 9,05). Кроме того, сравнивая критические значения обеих статистик при уровне значимости α = 0,05, можно обнаружить, что величина χ 1 2 равная 3,841, является квадратом верхнего критического значения Z-статистики, равного +1,96 (т.е. χ 1 2 = Z 2). Более того, р -значения обоих критериев одинаковы.

Таким образом, можно утверждать, что при проверке нулевой и альтернативной гипотез Н 0: р 1 = р 2 ; Н 1: р 1 ≠ р 2 критерии Z и χ 2 являются эквивалентными. Однако, если необходимо не просто обнаружить различия, но и определить, какая доля больше (р 1 > р 2), следует применять Z-критерий с одной критической областью, ограниченной хвостом стандартизованного нормального распределения. Далее будет описано применение критерия χ 2 для сравнения долей признака в нескольких группах. Необходимо отметить, что Z-критерий в этой ситуации применять невозможно.

Применение χ 2 -критерия для проверки гипотезы о равенстве нескольких долей

Критерий «хи-квадрат» можно распространить на более общий случай и применять для проверки гипотезы о равенстве нескольких долей признака. Обозначим количество анализируемых независимых генеральных совокупностей буквой с . Теперь таблица сопряженности признаков состоит из двух строк и с столбцов. Чтобы проверить нулевую и альтернативные гипотезы Н 0: р 1 = р 2 = … = р 2 , Н 1: не все р j равны между собой (j = 1, 2, …, c ), используется тестовая χ 2 -статистика:

где f 0 - наблюдаемое количество успехов или неудач в конкретной ячейке факторной таблицы 2*с , f e - теоретическое, или ожидаемое, количество успехов или неудач в конкретной ячейке таблицы сопряженности признаков при условии, что нулевая гипотеза является истинной.

Чтобы вычислить ожидаемое количество успехов или неудач в каждой ячейке таблицы сопряженности признаков, необходимо иметь в виду следующее. Если нулевая гипотеза является истинной и доли успехов во всех с генеральных совокупностях равны, соответствующие выборочные доли могут отличаться друг от друга лишь по случайным причинам, поскольку все доли представляют собой оценки доли признака р в общей генеральной совокупности. В этой ситуации статистика, объединяющая все доли в одной общей (или средней) оценке параметра р , содержит больше информации, чем каждая из них в отдельности. Эта статистика, обозначаемая символом , представляет собой общую (или среднюю) долю успехов в объединенной выборке.

Вычисление средней доли:

Чтобы вычислить ожидаемое количество успехов f e в первой строке таблицы сопряженности признаков, необходимо умножить объем каждой выборки на параметр . Чтобы вычислить ожидаемое количество неудач f e во второй строке таблицы сопряженности признаков, необходимо умножить объем каждой выборки на параметр 1 – . Тестовая статистика, вычисленная по формуле (1), аппроксимируется χ 2 -распределением. Количество степеней свободы этого распределения задается величиной (r – 1)(c – 1) , где r - количество строк в факторной таблице, с - количество столбцов в таблице. Для факторной таблицы 2*с количество степеней свободы равно (2 – 1)(с – 1) = с – 1 . При заданном уровне значимости α нулевая гипотеза отклоняется, если вычисленная χ 2 -статистика больше верхнего критического значения χ U 2 , присущего χ 2 -распределению с с – 1 степенями свободы. Таким образом, решающее правило выглядит следующим образом: гипотеза Н 0 отклоняется, если χ 2 > χ U 2 (рис. 6), в противном случае гипотеза отклоняется.

Рис. 6. Критическая область χ 2 -критерия для сравнения с долей при уровне значимости α

Проверка предположений, касающихся факторной таблицы 2*с. Для получения точных результатов на основе данных, приведенных в факторной таблице 2*с , необходимо, чтобы количество успехов или неудач было достаточно большим. Некоторые статистики полагают, что критерий дает точные результаты, если ожидаемые частоты превышают 0,5. Более консервативные исследователи требуют, чтобы не более 20% ячеек таблицы сопряженности признаков содержали ожидаемые величины, которые меньше 5, причем ни одна ячейка не должна содержать ожидаемую величину меньше единицы. Последнее условие нам представляется разумным компромиссом между этими крайностями. Чтобы удовлетворить это условие, категории, содержащие небольшие ожидаемые величины, следует объединить в одну. После этого критерий становится более точным. Если по каким-либо причинам объединение нескольких категорий невозможно, следует применять альтернативные процедуры.

Для того чтобы проиллюстрировать χ 2 -критерий для проверки гипотезы о равенстве долей в нескольких группах, вернемся к сценарию, описанному в начале главы. Рассмотрим аналогичный опрос, в котором принимают участие постояльцы трех отелей, принадлежащих компании Т. С. Resort Resources (рис. 7а).

Рис. 7. Факторная таблица 2×3 для сравнения количества постояльцев, удовлетворенных и не удовлетворенных обслуживанием: (а) наблюдаемое количество успехов или неудач – f 0 ; (б) ожидаемое количество успехов или неудач – f e ; (в) вычисление χ 2 -статистики при сравнении долей постояльцев, удовлетворенных обслуживанием

Нулевая гипотеза утверждает, что доли клиентов, планирующих вернуться в следующем году, во всех отелях практически одинаковы. Для оценки параметра р , представляющего собой долю гостей, планирующих вернуться в отель, используется величина р̅ = Х / n = 513 / 700 = 0,733. Доля гостей, оставшихся недовольными обслуживанием, равна 1 – 0,733 = 0,267. Умножая три доли на количество опрошенных постояльцев в каждом из отелей, получаем ожидаемое количество гостей, планирующих вернуться в следующем сезоне, а также число клиентов, которые больше не остановятся в этом отеле (рис. 7б).

Чтобы проверить нулевую и альтернативные гипотезы используют тестовую χ 2 -статистику, вычисленную с помощью ожидаемых и наблюдаемых величин по формуле (1) (рис. 7в).

Критическое значение тестовой χ 2 -статистики определяется по формуле =ХИ2.ОБР(). Поскольку в опросе принимают участие постояльцы трех отелей, χ 2 -статистика имеет (2 – 1)(3 – 1) = 2 степени свободы. При уровне значимости α = 0,05 критическое значение χ 2 -статистики равно 5,991 (рис. 7г). Так как вычисленная χ 2 -статистика, равная 40,236, превышает критическое значение, нулевая гипотеза отклоняется (рис. 8). С другой стороны, вероятность р того, что нулевая гипотеза верна при χ 2 -статистикие равной 40,236 (и двух степенях свободы) рассчитывается в Excel с помощью функции =1-ХИ2.РАСП() = 0,000 (рис. 7г). р -значение равно 0,000 и меньше уровня значимости α = 0,05. Следовательно, нулевая гипотеза отклоняется.

Рис. 8. Области принятия и отклонения гипотезы о равенстве трех долей при уровне значимости, равном 0,05, и двух степенях свободы

Отклоняя нулевую гипотезу при сравнении долей, указанных в факторной таблице 2*с , мы можем утверждать лишь, что доли постояльцев, удовлетворенных обслуживанием в трех отелях, не совпадают. Для того чтобы выяснить, какие доли отличаются от других, необходимо применять иные методы, например процедуру Мараскуило.

Процедура Мараскуило позволяет сравнивать все группы попарно. На первом этапе процедуры вычисляются разности p s j – p s j ’ (где j j ) между с(с – 1)/2 парами долей. Соответствующие критические размахи вычисляются по формуле:


При общем уровне значимости α, величина представляет собой квадратный корень из верхнего критического значения распределения «хи-квадрат», имеющего с – 1 степеней свободы. Для каждой пары выборочных долей необходимо вычислить отдельный критический размах. На последнем этапе каждая из с(с – 1)/2 пар долей сравнивается с соответствующим критическим размахом. Доли, образующие конкретную пару, считаются статистически значимо разными, если абсолютная разность выборочных долей |p s j – p s j | превышает критический размах.

Проиллюстрируем процедуру Мараскуило на примере опроса постояльцев трех отелей (рис 9а). Применяя критерий «хи-квадрат», мы убедились, что между долями постояльцев разных отелей, собирающихся вернуться в следующем году, существует статистически значимая разница. Поскольку в опросе участвуют постояльцы трех отелей, необходимо выполнить 3(3 – 1)/2 = 3 попарных сравнений и вычислить три критических размаха. Для начала вычислим три выборочных доли (рис. 9б). При общем уровне значимости, равном 0,05, верхнее критическое значение тестовой χ 2 -статистики для распределения «хи-квадрат», имеющего (с – 1) = 2 степени свободы определяется по формуле =ХИ2.ОБР(0,95;2) = 5,991. Итак, = 2,448 (рис. 9в). Далее, вычислим три пары абсолютных разностей и соответствующие критические размахи. Если абсолютная разность больше ее критического размаха, то соответствующие доли считаются значимо разными (рис. 9г).

Рис. 9. Результаты выполнения процедуры Мараскуило для проверки гипотезы о равенстве долей удовлетворенных постояльцев трех отелей: (а) данные опроса; (б) выборочных доли; (в) верхнее критическое значение тестовой χ 2 -статистики для распределения «хи-квадрат»; (г) три пары абсолютных разностей и соответствующие критические размахи

Как видим, при уровне значимости, равном 0,05, степень удовлетворенности постояльцев отеля Palm Royal (p s2 = 0,858) выше, чем у постояльцев отелей Golden Palm (p s1 = 0,593) и Palm Princess (p s3 =0,738). Кроме того, степень удовлетворенности постояльцев отеля Palm Princess выше, чем у постояльцев отеля Golden Palm. Эти результаты должны заставить руководство проанализировать причины таких различий и попытаться определить, почему степень удовлетворенности постояльцев отеля Golden Palm значительно ниже, чем у постояльцев других отелей.

Используются материалы книги Левин и др. Статистика для менеджеров. – М.: Вильямс, 2004. – с. 708–730

Из всех типов операторов отношения чаще всего используются операторы сравнения – для определения относительного порядка двух величин.

Меньше (<). Результат оператора < равен true , если первый операнд меньше, чем второй операнд; в противном случае он равен false .

Больше (>). Результат оператора > равен true , если его первый операнд больше, чем второй операнд; в противном случае он равен false .

Меньше или равно (<=). Результатом оператора <= является true , если первый операнд меньше или равен второму операнду; в противном случае результат равен false .

Больше или равно (>=). Результат оператора >= равен true , если его первый операнд больше второго или равен ему; в противном случае он равен false .

Эти операторы позволяют сравнивать операнды любого типа. Однако сравнение может выполняться только для чисел и строк, поэтому операнды, не являющиеся числами или строками, преобразуются. Сравнение и преобразование выполняется следующим образом:

Если оба операнда являются числами или преобразуются в числа, они сравниваются как числа.

Если оба операнда являются строками или преобразуются в строки, они сравниваются как строки.

Если один операнд является строкой или преобразуется в строку, а другой является числом или преобразуется в число, оператор пытается преобразовать строку в число и выполнить численное сравнение. Если строка не представляет собой число, она преобразуется в значение NaN и результатом сравнения становится false .

Если объект может быть преобразован как в число, так и в строку, интерпретатор JavaScript выполняет преобразование в число. Это значит, например, что объекты Date сравниваются как числа, т. е. можно сравнить две даты и определить, какая из них более ранняя.

Если оба операнда не могут быть успешно преобразованы в числа или строки, операторы всегда возвращают false.

Если один из операндов равен или преобразуется в NaN, то результатом оператора сравнения является false.

Имейте в виду, что сравнение строк выполняется строго посимвольно, для числовых значений каждого символа из кодировки Unicode. В некоторых случаях стандарт Unicode допускает кодирование эквивалентных строк с применением различных последовательностей символов, но операторы сравнения в JavaScript не обнаруживают этих различий в кодировках; предполагается, что все строки представлены в нормализованной форме. Обратите внимание: сравнение строк производится с учетом регистра символов, т. е. в кодировке Unicode (по крайней мере, для подмножества ASCII) все прописные буквы «меньше» всех строчных букв. Это правило может приводить к непонятным результатам. Например, согласно оператору < строка "Zoo" меньше строки "aardvark".

При сравнении строк более устойчив метод String.localeCompare(), который также учитывает национальные определения «алфавитного порядка». Для сравнения без учета регистра необходимо сначала преобразовать строки в нижний или верхний регистр с помощью метода String.toLowerCase() или String.toUpperCase().

Операторы <= (меньше или равно) и >= (больше или равно) определяют «равенство» двух значений не при помощи операторов равенства или идентичности. Оператор «меньше или равно» определяется просто как «не больше», а оператор «больше или равно» – как «не меньше». Единственное исключение имеет место, когда один из операндов представляет собой значение NaN (или преобразуется в него); в этом случае все четыре оператора сравнения возвращают false .