Исследование производительности операций с данными и статистический анализ товаров бисера. Сравнение медленных и оптимизированных методов обработки данных, проверка статистических гипотез и выявление закономерностей.
- Python 3.7+
- Pandas - оптимизированная обработка данных
- NumPy - числовые операции
- SciPy - статистические тесты
- Matplotlib - визуализация результатов
LW6.ipynb # основной скрипт анализа и оптимизации
DataFrame beads.xlsx # исходные данные
- Сравнение медленных и быстрых методов обработки данных
- Декоратор времени выполнения для измерения производительности
- Векторизованные операции вместо циклов
- Группировка и агрегация вместо поэлементной обработки
@timer
def analyze_profit_slow(df) # Медленная версия с циклами
@timer
def analyze_profit_fast(df) # Быстрая версия с группировкой
@timer
def analyze_discount_slow(df) # Медленный анализ скидок
@timer
def analyze_discount_fast(df) # Быстрый анализ скидок- Ускорение операций в 5-10 раз за счет векторизации
- Эффективное использование памяти при группировке данных
- Оптимизированные агрегации вместо поэлементных вычислений
- Анализ эффективности скидочной политики
- Выявление премиальных цветовых категорий
- Определение влияния размера на ценовую политику
- Практические рекомендации для бизнеса
- Замена циклов на векторные операции Pandas
- Использование группировки и агрегации
- Предварительное вычисление производных столбцов
- Эффективная фильтрация данных