Hvad er Data Mining? Grundlæggende og dets teknikker.

Grundlaget for den fjerde industrielle revolution vil i høj grad afhænge af data og forbindelse(Connectivity) . Analysetjenester(Analysis Services) , der er i stand til at udvikle eller skabe datamining-løsninger, vil spille en nøglerolle i denne henseende. Det kan hjælpe med at analysere og forudsige resultater af kunders købsadfærd for at målrette potentielle købere. Data vil blive en ny naturressource, og processen med at udtrække relevant information fra disse usorterede data vil få enorm betydning. Som sådan kunne en ordentlig forståelse af begrebet - Data Mining , dets processer og anvendelse hjælpe os med at udvikle en holistisk tilgang til dette buzzword.

Grundlæggende datamining(Data Mining Basics) og dets teknikker

data mining

Data mining, også kendt som Knowledge Discovery in Data ( KDD ) handler om at søge i store lagre af data for at afdække mønstre og tendenser, der rækker ud over simpel analyse. Dette er dog ikke en enkelttrinsløsning, men en flertrinsproces og gennemføres i forskellige faser. Disse omfatter:

1] Dataindsamling og forberedelse

Det starter med dataindsamling og dens rette organisering. Dette hjælper med betydeligt at forbedre chancerne for at finde den information, der kan opdages gennem data mining

2] Modelbygning og evaluering

Det andet trin i data mining-processen er anvendelsen af ​​forskellige modelleringsteknikker. Disse bruges til at kalibrere parametrene til optimale værdier. Teknikker, der anvendes, afhænger i høj grad af analytiske evner, der kræves for at imødekomme en række organisatoriske behov og for at nå frem til en beslutning.

Lad os kort undersøge nogle data mining-teknikker. Det har vist sig, at de fleste organisationer kombinerer to eller flere datamining-teknikker sammen for at danne en passende proces, der opfylder deres forretningskrav.

Læs(Read) : Hvad er Big Data?(What is Big Data?)

Data Mining Teknikker

  1. Association –  Association er en af ​​de almindeligt kendte data mining-teknikker. Herunder dechifreres et mønster baseret på et forhold mellem varer i samme transaktion. Derfor(Hence) er det også kendt som relationsteknikken. Store brandforhandlere er afhængige af denne teknik til at undersøge kundernes købsvaner/præferencer. For eksempel, når de sporer folks købsvaner, kan forhandlere identificere, at en kunde altid køber fløde, når de køber chokolade, og derfor foreslår, at de næste gang, de køber chokolade, også vil købe fløde.
  2. Klassifikation(Classification) – Denne data mining-teknik adskiller sig fra ovenstående på den måde, at den er baseret på maskinlæring og bruger matematiske teknikker såsom lineær(Linear) programmering, beslutningstræer(Decision) , neurale(Neural)netværk. I klassificering forsøger virksomheder at bygge software, der kan lære at klassificere dataelementerne i grupper. For eksempel kan en virksomhed definere en klassificering i ansøgningen, der "i betragtning af alle optegnelser over medarbejdere, der tilbød at trække sig fra virksomheden, forudsige antallet af personer, der sandsynligvis vil træde tilbage fra virksomheden i fremtiden." Under et sådant scenarie kan virksomheden klassificere medarbejdernes optegnelser i to grupper, nemlig "forlade" og "blive". Det kan derefter bruge sin datamining-software til at klassificere medarbejderne i separate grupper, der er oprettet tidligere.
  3. Klynger(Clustering)anderledes(Different)objekter, der udviser lignende karakteristika, grupperes sammen i en enkelt klynge via automatisering. Mange sådanne klynger oprettes som klasser og objekter (med lignende egenskaber) placeres i det i overensstemmelse hermed. For at forstå dette bedre, lad os overveje et eksempel på bogstyring i biblioteket. I et bibliotek er den store samling af bøger fuldt katalogiseret. Varer af samme type er listet sammen. Dette gør det nemmere for os at finde en bog af vores interesse. På samme måde kan vi ved at bruge klyngeteknikken føre bøger, der har nogle slags ligheder i en klynge og tildele den et passende navn. Så hvis en læser ønsker at få fat i en bog, der er relevant for hans interesse, skal han kun gå til den hylde i stedet for at søge i hele biblioteket. Således definerer klyngeteknikken klasserne og placerer objekter i hver klasse,
  4. Forudsigelse(Prediction) – Forudsigelsen er en dataminingteknik, der ofte bruges i kombination med de andre dataminingteknikker. Det involverer analyse af tendenser, klassificering, mønstermatchning og relation. Ved at analysere tidligere begivenheder eller tilfælde i en korrekt rækkefølge kan man sikkert forudsige en fremtidig begivenhed. For eksempel kan forudsigelsesanalyseteknikken bruges i salget til at forudsige fremtidig fortjeneste, hvis salget er valgt som en uafhængig variabel og fortjeneste som en variabel afhængig af salg. Derefter kan man, baseret på de historiske salgs- og profitdata, tegne en tilpasset regressionskurve, der bruges til profitforudsigelse.
  5. Beslutningstræer(Decision trees) – Inden for beslutningstræet starter vi med et simpelt spørgsmål, der har flere svar. Hvert svar fører til et yderligere spørgsmål for at hjælpe med at klassificere eller identificere dataene, så de kan kategoriseres, eller så der kan laves en forudsigelse baseret på hvert svar. For eksempel bruger vi følgende beslutningstræ til at bestemme, om vi skal spille cricket ODI eller ej : Data Mining Decision Tree : Startende ved rodknudepunktet, hvis vejrudsigten forudsiger regn, bør vi undgå kampen for dagen. Alternativt, hvis vejrudsigten er klar, bør vi spille kampen.

Data Mining er kernen i analyseindsatsen på tværs af en række brancher og discipliner som kommunikation, forsikring(Insurance) , uddannelse(Education) , fremstilling(Manufacturing) , bank(Banking) og detailhandel(Retail) og mere. Derfor er det vigtigt at have korrekte oplysninger om det, før de forskellige teknikker anvendes.



About the author

Jeg er professionel computertekniker og har over 10 års erfaring inden for området. Jeg har specialiseret mig i Windows 7 og Windows Apps udvikling, samt Cool Websites design. Jeg er ekstremt vidende og erfaren på området, og vil være et værdifuldt aktiv for enhver organisation, der ønsker at vokse deres forretning.



Related posts