Forenklet dataanalyse med ChatGPT

Martin

For oss som jobber med markedsføring og salg er det avgjørende å raskt kunne analysere og visualisere data. Med fremveksten av AI, spesielt verktøy som ChatGPT, har det åpnet seg en ny mulighet for dataanalyse – nemlig å kunne «snakke» til dataene dine. Dette gjør hele prosessen raskere og mer intuitiv. Tenk deg å kjøre en spørring og umiddelbart se en graf som gjenspeiler innsiktene du leter etter. Du kan finjustere spørsmålene dine, få oppdaterte resultater med mer presis tilbakemelding, og alt dette uten å måtte sette opp komplekse filtre eller bruke tid på å bygge detaljerte rapporter fra bunnen av.

I dette innlegget skal jeg se litt på hvordan ChatGPT lar deg "prate" med dataene dine, noe som gjør komplekse oppgaver enklere og mer effektive. I tillegg skal jeg demonstrere disse mulighetene ved hjelp av et demo-datasett som er skreddersydd for dette blogginnlegget, som du kan laste ned og eksperimentere med selv.

Husk personvern

Når du bruker AI-modeller som ChatGPT, er det viktig å være bevisst på personvern. Unngå å dele sensitive opplysninger som personopplysninger, navn, og kontaktinformasjon ukritisk.

For å gjøre dataanalysen mer personvernvennlig, bør du aktivere funksjoner som "ikke lagre historikk" i ChatGPT, og unngå å delta i modellens datatrening, spesielt hvis du bruker en privat konto. For bedrifter kan det være hensiktsmessig å sette opp enterprise-kontoer, hvor det er avtalt at data ikke deles med OpenAI for modelltrening. Selv da bør man være forsiktig med å dele de mest sensitive dataene.

Eksempler på visualiseringer / analyse med ChatGPT

Her har jeg lastet ned og tilpasset et knippe demo-data som jeg har tenkt til å bruke som grunnlag for alle de kommende eksemplene. Her er det bare å laste ned og teste, om du ønsker å eksperimentere selv.

Demo-dataen inneholder helt standard info for alle ordrelinjer til selskapet de siste 2-3 årene, med blant annet ordrelinjer, sum, produktkategorier, ordrestatus mm.

Ved å laste opp datasettet til ChatGPT, kan vi stille enkle spørsmål rundt dataen, samt få ut visualiseringer og innsikter ut ifra hva det er vi lurer på ved dette selskapets salgstall.

Her har jeg spurt ChatGPT om å vise meg selskapets salgstrend over tid og lastet opp demofilen over.

Untitled (2)

Det som skjer da er at ChatGPT først laster inn dataen, leser over de første linjene i alle kolonnene for å forstå konteksten, og så går den i gang med å strukturere dataen, rense / finne feil om nødvendig, og bygge en visualisering ut ifra det du har spurt om.

ChatGPT leser først inn dataen du har lastet opp, og tolker kolonnenavn og et utdrag av dataen din.

Untitled (3)

Videre analyserer ChatGPT dataen og visualiserer den i henhold til det du har bedt den om å gjøre. 

Untitled (4)

Så viser ChatGPT output’en av koden, som i dette tilfellet er et linjediagram.

Bilde1-Sep-09-2024-01-06-02-4530-PM

Tips: Ved å trykke på “Switch to interactive chart”, får du muligheten til å utforske datapunktene selv, ved å holde musepekeren over ulike felter på diagrammet.

Untitled (5)-1

Her er det samme linjediagrammet i interaktivt format:

Untitled (6)

Du kan også fortsette å utforske samme graf, dersom du ønsker å f.eks. splitte den grafen du ser over her basert på en gitt parameter. I dette tilfellet lurer jeg på hvordan salgstrenden ser utfor de ulike produktkategoriene selskapet har. Da er det bare å følge opp med neste spørsmål:

Untitled (7)

output (2)

Untitled (8)

Videre kan vi fortsette med spørringer og utforske datasettet mer i dybden. Hvis vi f.eks. lurer på hvilke land dette selskapet hovedsakelig har solgt til de siste årene, er det bare å spørre:

Prompt: Kan du gi meg et stolpediagram som viser distribusjonen av salg på tvers av ulike land?

Untitled (9)

Og om vi lurer på distribusjon basert på størrelse på salg?

Prompt: Kan du gi meg et stolpediagram som viser distribusjonen av salg på tvers av ulik deal size?

Untitled (10)

Og om vi lurer på hvordan salget gjennomsnittlig fordeler seg igjennom månedene i året?

Prompt: Kan du gi meg et linjediagram som viser salgstrender for hver måned i året, aggregert for alle årene i datasettet?

Untitled (11)

Og om vi lurer på hvilke kunder som handler mest hos selskapet?

Prompt: Gi meg et stolpediagram over de 10 største kundene til selskapet, basert på totalsum de har handlet for.

Untitled (15)

Hvis vi lurer på hvor stor andel av salgene som fordeler seg på ulike ordrestatuser?

Prompt: Gi meg et kakediagram som viser distribusjonen av alle ordre etter ordrestatus (f.eks “Shipped”, “Cancelled”, “On hold” etc.)

Untitled (12)

Tips: Når du har valgt “interactive chart”, kan du også endre farge på hvert datapunkt i visualiseringen.

Untitled (13)

 

Prediksjonsanalyse med ChatGPT

Men, hva om man kunne se inn i fremtiden og gi prediksjon et forsøk? Dette kan ChatGPT også hjelpe deg med. 

Så hvis vi tar utgangspunkt i salgstrend linjediagrammet vi hadde tidligere, så kan vi be ChatGPT gjøre en prediksjonsanalyse, for eksempel en ARIMA eller SARIMA analyse. I dette eksempelet har jeg valgt SARIMA da den tar høyde for sesongbaserte variasjoner og forsøker å gi et bilde av dette i dataen. Verdt å merke seg at denne typer analyser bør tas med en klype salt, da den virkelige verden ofte er mer kaotisk, uforutsigbar og inneholder langt fler variabler enn det du har data på. Men, det kan fortsatt være en god pekepinn om man ser det i kontekst.

Prompt: Basert på linjediagrammet for salgs trender for tidligere år, kan du forsøke å predikere salgstrender for resten av 2024 tom. 31. Desember med en SARIMA modell? Marker gjerne med en rød linje der prediksjonen begynner.

Untitled (16)

Untitled (14)

Gitt at man følger samme vekstkurve som for tidligere perioder, vil man dermed kunne se at man potensielt kan nå over 7 mill. USD i november for dette demo selskapet, mot 6,7 i fjor og 4,5 året før der. Det er ikke alltid ChatGPT får denne modellen til å fungere på første forsøk. Dersom du står fast og den ikke får til å lage prediksjonen, kan du lime inn dette kode-eksempelet og si følg den samme metoden så tar den det ofte på første forsøk.

Prompt blir da følgende:

Kan du prøve å predikere de resterende månedene av 2024 med SARIMA prediksjonsmodellen? Her er en kodesnutt som har fungert tidligere, bruk samme metode:

"# Predict sales through the end of December 2024 using the SARIMA model forecast_steps = 5 + 2 # 5 months already predicted + 2 more months (November and December) forecast_sarima_extended = model_fit_sarima.get_forecast(steps=forecast_steps).predicted_mean # Create a new index for the extended prediction period extended_index_sarima_extended = pd.date_range(start=monthly_sales.index[0], periods=len(monthly_sales) + forecast_steps, freq='M') # Combine historical and predicted sales extended_sales_sarima_extended = np. concatenate([monthly_sales.values, forecast_sarima_extended]) # Plot the historical and predicted sales using SARIMA plt.figure(figsize=(12, 6)) plt.plot(extended_index_sarima_extended, extended_sales_sarima_extended, marker='o', linestyle='-', color='b', label='Historical and Predicted Sales (SARIMA)') plt.axvline(x=monthly_sales.index[-1], color='r', linestyle='--', label='Prediction Start') plt.title('Monthly Sales Trend with SARIMA Prediction through December 2024') plt.xlabel('Month') plt.ylabel('Sales') plt.grid(True) plt.legend() plt.xticks(rotation=45) plt.tight_layout() plt.show()"

Last gjerne ned demo-datasettet, test ut funksjonalitetene, og opplev selv hvordan ChatGPT kan forenkle måten du analyserer og visualiserer data på. Lykke til!

 

 

 

Temaer:

data AI
Martin Åkra's photo

Av: Martin Åkra

Martin har en bachelor i digital markedsføring og en mastergrad i informasjonssystemer ved Høyskolen Kristiania. Utdanningen er rettet mot de som ønsker å utvikle seg som brobyggere mellom de tekniske mulighetene IT gir og forretningsbehov til bedrifter.