Finne og telle de mest hyppige verdiene

Behovet for å finne de høyeste og laveste verdiene i enhver virksomhet er åpenbart: de mest lønnsomme produktene eller verdifulle kundene, de største forsendelsene eller forsendelsene, og så videre.

Men sammen med dette, noen ganger må du se i dataene ikke for toppen, men for de hyppigst forekommende verdiene, som, selv om det høres likt ut, faktisk ikke er det samme. I forhold til en butikk kan dette for eksempel være et søk etter de mest kjøpte varene, fremfor de mest lønnsomme, eller det hyppigst forekommende antall varer i en bestilling, minutter i en samtale osv.

I en slik situasjon vil problemet måtte løses litt annerledes, avhengig av hva vi har med å gjøre – tall eller tekst.

Finne de vanligste tallene

Anta at vi står overfor oppgaven med å analysere tilgjengelige data om salg i en butikk for å fastslå det hyppigst forekommende antall kjøpte varer. For å bestemme det hyppigste tallet i et område, kan du bruke funksjonen FASHION (MODUS):

Det vil si at i følge vår statistikk kjøper kjøpere oftest 3 stk. varer.

Hvis det ikke er én, men flere verdier samtidig som forekommer det samme maksimale antallet ganger (flere moduser), kan du bruke funksjonen for å identifisere dem MOTE.NSK (MODE.MULT). Den må legges inn som en matriseformel, dvs. velg flere tomme celler på en gang, slik at det er nok til alle moduser med margin og skriv inn =MODA.NSK(B2:B16) i formellinjen og trykk på hurtigtasten Ctrl + Shift + Enter.

Ved utgangen får vi en liste over alle mods fra dataene våre:

Det vil si at etter våre data å dømme, tar de ofte ikke bare 3, men også 16 stykker. varer. Vær oppmerksom på at det bare er to moduser i våre data (3 og 16), så resten av cellene som er tildelt "i reserve" vil være med #N/A feil.

Frekvensanalyse etter bånd med FREKVENS-funksjonen

Hvis det er nødvendig å analysere ikke heltall, men brøktall, ville det være mer riktig å ikke evaluere antall identiske verdier, men at de faller inn i de spesifiserte områdene. For eksempel må vi forstå hvilken vekt som oftest kjøpes av varene for å velge riktige traller og emballasjeposer i riktig størrelse for butikken. Med andre ord, vi må finne ut hvor mange tall som faller inn i intervallet 1..5 kg, hvor mange i intervallet 5..10 kg, osv.

For å løse et lignende problem kan du bruke funksjonen FREKVENS (FREKVENS). For det må du forberede celler på forhånd med intervaller (lommer) av interesse for oss og deretter velge et tomt celleområde (G2: G5) en celle større enn lommeutvalget (F2: F4) og angi det som en matriseformel ved å trykke på kombinasjonen på slutten Ctrl + Shift + Enter:

Frekvensanalyse med pivottabell med gruppering

En alternativ løsning på problemet: lag en pivottabell der du legger vekten av kjøp i radområdet, og antall kunder i verdiområdet, og deretter bruker du gruppering – høyreklikk på vektverdiene og velg kommandoen Gruppe (Gruppe). I vinduet som vises, kan du angi grensene og grupperingstrinnet:

... og etter å ha klikket på knappen OK få en tabell med en telling av antall treff fra kjøpere i hvert grupperingsområde:

Ulemper denne måten:

  • grupperingstrinnet kan bare være konstant, i motsetning til funksjonen FREKVENS, hvor lommer kan spesifiseres absolutt alle
  • pivottabellen må oppdateres når kildedataene endres (ved å klikke med høyre museknapp – Oppdater), og funksjonen beregnes automatisk på nytt

Søk etter den mest forekommende teksten

Hvis vi ikke har med tall å gjøre, men med tekst, vil tilnærmingen til løsningen være fundamentalt annerledes. Anta at vi har en tabell med 100 rader med varer som selges i en butikk, og vi ønsker å finne ut hvilke varer som ble kjøpt oftest?

Den enkleste og mest åpenbare løsningen vil være å legge til en kolonne ved siden av funksjonen ANTALL.HVIS (COUNTIF)for å telle antall forekomster av hvert element i kolonne A:

Deretter sorterer du selvfølgelig den resulterende kolonnen i synkende rekkefølge og ser på de første linjene.

Eller legg til en kolonne med ener til den opprinnelige listen og bygg en sammendragstabell basert på den resulterende tabellen, og tell det totale antallet enere for hvert produkt:

Hvis det ikke er mye kildedata og du i utgangspunktet ikke vil bruke pivottabeller, kan du bruke matriseformelen:

La oss bryte det ned bit for bit:

  • ANTALLHVIS(A2:A20;A2:A20) er en matriseformel som etter tur ser etter antall forekomster av hvert produkt i området A2:A100 og produserer en matrise med antall repetisjoner ved utgangen, dvs. faktisk, erstatter tilleggskolonnen
  • MAX – finner det største antallet i rekken av forekomster, dvs. det mest kjøpte produktet
  • MATCH – beregner ordenstallet til raden i tabellen der MAKS fant det største tallet
  • INDEX – returnerer fra tabellen innholdet i cellen med tallet funnet av MATCH

  • Teller antall unike verdier i en liste
  • Trekke ut unike elementer fra en duplikatliste
  • Gruppering i pivottabeller

Legg igjen en kommentar