Недавно мы рассказали про правило Парето — то самое правило 20/80, когда 20% усилий дают 80% результата. Вот короткая версия:
- Распределение — это когда мы берём все данные и раскладываем их по какому-то выбранному значению.
- Распределение Парето — это распределение данных с двумя параметрами: вероятностью и самим распределением данных.
- В бытовом понимании распределение Парето говорит, что 20% какого-то действия, товара, продукта или чего-то ещё дают 80% пользы, денег или чего-то другого нужного.
- На самом деле распределение Парето — это математическая формула со множеством параметров. В зависимости от специфики данных правило 20/80 может быть и правилом 30/70, 10/90 и любых других комбинаций. Смысл в том, чтобы найти связь между меньшим значением и большим результатом.
- Числа в сумме не обязательно должны давать 100 — это просто красивая форма записи правила Парето. На самом деле часто бывает, что 22% усилий даёт 89% результата.
Давайте проверим на практике, как оно работает и можно ли его применить для анализа реальных данных.
Что делаем
Представим, что у нас есть лавка по продаже овощей и фруктов и четыре поставщика, которые привозят нам товар. В течение месяца мы заполняли данные в Экселе по проданному товару от каждого поставщика. Теперь мы хотим выяснить, на какие товары нам лучше всего сделать ставку в будущем. Чтобы это узнать, применим правило Парето и посмотрим, скажет ли оно нам что-нибудь или нет.
Таблица с результатами продаж за месяц выглядит так — её нужно будет привести в порядок и проанализировать:

Собираем общие значения выручки
Сейчас все данные в таблице разбросаны по разным строкам: морковь, например, есть в третьей, пятой и восьмой ячейке. Для анализа это не годится — данные нужно просуммировать заранее по каждой группе товаров. Используем для этого инструмент «Сводная таблица» в разделе «Вставка»:

В появившемся окне перетаскиваем поле «Название» в строки, а поле «Выручка» — перетаскиваем в значения. После этого у нас появится просуммированная таблица, где каждый продукт встречается только один раз:

Теперь отсортируем выручку по убыванию: нам важно получить в начале списка самые большие числа. Для этого щёлкаем в любом месте таблицы, переходим в раздел «Данные» и выбираем сортировку по убыванию:

Итог: отсортированная таблица по выручке в порядке уменьшения. Уже видно, что морковь и картофель идут впереди с большим отрывом:

Добавляем рост выручки в процентах
Чтобы понять вклад каждой позиции в рост выручки, нам нужен ещё один столбец — он покажет, на сколько процентов этот товар увеличил общую выручку (это называется накопленная процентная выручка). Добавим его в ту же таблицу, просто перетащив выручку второй раз в раздел со значениями. После этого в таблице появится дубликат предыдущего столбца:

Теперь превратим это в накопленные проценты. Для этого щёлкаем правой кнопкой мыши по новому столбцу и выбираем «Дополнительные вычисления» → «Дополнительные параметры»:

В появившемся окне переключаемся на «Дополнительные вычисления», выбираем в выпадайке «% от суммы с нарастающим итогом в поле» и выбираем поле «Название»:

Теперь всё как нужно: последний столбец показывает, на сколько увеличилась выручка после продажи каждой позиции:

Строим график Парето
Одна из задач графика Парето — показать, есть ли среди данных те, которые оказывают наибольшее влияние на общую картину. Проще говоря — есть ли в самом начале небольшое число данных, которые дают максимальный вклад в итоговый результат. Иногда может оказаться так, что таких данных нет или влияние не такое сильное, как мы думали.
Чтобы построить график Парето, щёлкаем в любом месте таблицы и на вкладке «Вставка» выбираем Гистограммы → Парето:

После этого у нас сразу появляется график Парето. Видно, что правило 80/20 здесь не сработает — чтобы получить 80% выручки, нужно реализовать половину товаров:

А вот если мы посмотрим на 65%, то увидим, что ⅔ прибыли составляет выручка от продажи ⅓ товаров. Это меньше половины, на них проще сосредоточиться, поэтому лучше выбрать именно первые 4 товара для увеличения выручки:

Что в итоге
Теперь несколько выводов по итогам эксперимента:
- Не все данные можно распределить по правилу Парето.
- Даже если получится распределить, необязательно это будет 20/80 — там могут быть любые значения.
- Если в наборе данных есть несколько значений, которые выделяются среди остальных, их можно использовать для правила Парето и определить процент значений, на которые они влияют. В нашем случае это морковь, картофель, слива и свёкла — они дают 65% всей выручки.