Seminární práce z předmětu Zpracování velkých dat
Jednoduchá HTML dokumentace projektu zaměřeného na analýzu poptávky, konverzí a dostupnosti zboží.
GeekLair.cz je specializovaný e-shop zaměřený na prodej mangy, sběratelských figurek a souvisejícího merchandise z oblasti anime, her a popkultury.
Hlavními uživateli výstupů jsou vedení e-shopu, marketingový manažer, category manager a datový analytik. Cílem datového produktu je podpořit rozhodování nad poptávkou, konverzním výkonem a dostupností zboží.
Podíl návštěv e-shopu, které vedly k objednávce.
Vzorec: počet objednávek / počet sessions × 100
Jednotka: %
Baseline: [doplnit skutečnou hodnotu z notebooku]
Cílová hodnota: [doplnit cílovou hodnotu]
Frekvence vyhodnocení: denně, týdně
Interpretace: Tato metrika ukazuje, jak efektivně e-shop proměňuje návštěvnost na objednávky. Po doplnění výsledků upřesnit, zda je hodnota stabilní, rostoucí, nebo naopak kolísá v čase.
Průměrná hodnota jedné objednávky.
Vzorec: celkové tržby / počet objednávek
Jednotka: Kč
Baseline: [doplnit skutečnou hodnotu z notebooku]
Cílová hodnota: [doplnit cílovou hodnotu]
Frekvence vyhodnocení: týdně, měsíčně
Interpretace: Tato metrika vyjadřuje obchodní hodnotu nákupního košíku. Po doplnění výsledků upřesnit, zda průměrná hodnota objednávky vykazuje stabilní vývoj a které kategorie ji nejvíce ovlivňují.
Podíl situací, kdy zákazník projevil zájem o produkt, který nebyl skladem.
Vzorec: počet nedostupných interakcí / počet všech relevantních interakcí × 100
Jednotka: %
Baseline: [doplnit skutečnou hodnotu z notebooku]
Cílová hodnota: [doplnit cílovou hodnotu]
Frekvence vyhodnocení: denně, týdně
Interpretace: Tato metrika ukazuje provozní problém související s nedostupností zboží. Po doplnění výsledků upřesnit, zda je nedostupnost významná a ve kterých kategoriích nebo obdobích je nejvyšší.
products, sessions, orders, order_items, inventory_daily, product_interactions a campaigns.calendar a google_trends..duckdb.Pipeline: generování dat / příprava vstupů → uložení do CSV → načtení do DuckDB → čištění → obohacení → agregace → výpočet KPI → vizualizace v notebooku → shrnutí v HTML stránce.
| Dataset | Typ | Rozsah | Granularita | Primární klíč | Licence / původ |
|---|---|---|---|---|---|
| products | syntetická | doplnit | 1 produkt | product_id | vygenerováno pro projekt |
| sessions | syntetická | doplnit | 1 session | session_id | vygenerováno pro projekt |
| orders | syntetická | doplnit | 1 objednávka | order_id | vygenerováno pro projekt |
| order_items | syntetická | doplnit | 1 položka objednávky | order_item_id | vygenerováno pro projekt |
| inventory_daily | syntetická | doplnit | 1 produkt za 1 den | date, product_id | vygenerováno pro projekt |
| product_interactions | syntetická | doplnit | 1 interakce | interaction_id | vygenerováno pro projekt |
| campaigns | syntetická | doplnit | 1 kampaň | campaign_id | vygenerováno pro projekt |
| calendar | doplňková | doplnit | 1 den | date | připraveno pro projekt |
| google_trends | doplňková | doplnit | datum + keyword | date, keyword | připraveno pro projekt |
Podrobná EDA je zpracována v Jupyter Notebooku. Na HTML stránce jsou uvedeny pouze klíčové tabulky, grafy a stručná interpretace hlavních zjištění.
graf_sessions.pngCo graf ukazuje: vývoj návštěvnosti e-shopu v čase.
Text k doplnění: Graf ukazuje, že počet sessions se v průběhu sledovaného období [zvyšoval / snižoval / kolísal]. Nejvyšší návštěvnost byla zaznamenána [doplnit období nebo datum], zatímco nejnižší [doplnit období nebo datum]. Tento vývoj naznačuje [doplnit interpretaci, například vliv sezónnosti nebo kampaní].
graf_orders.pngCo graf ukazuje: vývoj obchodního výkonu vyjádřený počtem objednávek.
Text k doplnění: Počet objednávek se v čase [vyvíjel podobně jako sessions / lišil od vývoje sessions]. Nejvyšší počet objednávek připadl na [doplnit datum nebo období]. Ve srovnání s návštěvností lze pozorovat, že [doplnit, zda nárůst sessions vedl i k nárůstu orders].
graf_conversion_rate.pngCo graf ukazuje: efektivitu, s jakou e-shop proměňuje návštěvy v objednávky.
Text k doplnění: Conversion Rate se pohybovala přibližně mezi [doplnit minimum] a [doplnit maximum] %. V období [doplnit] byla metrika [vyšší / nižší], což může souviset s [doplnit, například kvalitou návštěvnosti, kampaněmi nebo dostupností zboží].
graf_aov.pngCo graf ukazuje: změny průměrné hodnoty objednávky v čase.
Text k doplnění: Average Order Value dosahovala během sledovaného období hodnot kolem [doplnit orientační úroveň] Kč. Výkyvy v této metrice naznačují, že zákazníci v některých obdobích nakupovali [dražší / levnější] produkty nebo větší počet položek. Výraznější změna byla zaznamenána [doplnit datum nebo období].
graf_stockout_rate.pngCo graf ukazuje: míru situací, kdy zákazník narazil na nedostupný produkt.
Text k doplnění: Stockout Rate se ve sledovaném období pohybovala kolem [doplnit orientační úroveň] %. V datech je patrné, že nedostupnost zboží byla [stabilní / proměnlivá] a nejvyšší byla v období [doplnit]. To může znamenat [doplnit dopad na výkon e-shopu].
graf_revenue_categories.pngCo graf ukazuje: porovnání kategorií podle celkových tržeb.
Text k doplnění: Nejvyšší tržby generovala kategorie [doplnit], následovaná kategorií [doplnit]. Naopak nejslabší výkon vykazovala kategorie [doplnit]. Z obchodního pohledu to naznačuje, že firma by se měla více zaměřit na [doplnit doporučení].
Do budoucna by bylo možné rozšířit projekt o automatizované přepočty KPI, pravidelné generování reportů nebo pokročilejší predikce poptávky. Generativní AI může být využita například při návrhu datového modelu, přípravě dokumentace nebo automatizaci textových shrnutí výsledků. Současně je nutné zachovat kontrolu nad správností interpretace a nepřebírat výstupy AI bez ověření.
Tuto část upravit podle skutečného rozdělení práce v týmu.
Doplnit konkrétní verze nástrojů, pokud je budete uvádět.
Generativní AI byla použita při návrhu struktury projektu, formulaci KPI, návrhu analytických dotazů, přípravě textových částí a tvorbě kostry HTML dokumentace. Výstupy byly průběžně kontrolovány, upravovány a ověřovány podle skutečně připravených dat a požadavků zadání.
Co doplnit: sem lze přidat stručný popis konkrétních promptů, způsob ověření výstupů a rozlišení toho, co bylo převzato a co bylo ručně upraveno.