Data Mining vs OLAP
Ob qho tib si cov ntaub ntawv mining thiab OLAP yog ob qho tib si kev lag luam txawj ntse (BI) technologies. Kev txawj ntse kev lag luam yog hais txog cov txheej txheem hauv computer los txheeb xyuas thiab rho tawm cov ntaub ntawv tseem ceeb los ntawm cov ntaub ntawv lag luam. Cov ntaub ntawv mining yog thaj chaw ntawm computer science uas, cuam tshuam nrog kev nthuav tawm cov qauv nthuav tawm los ntawm cov ntaub ntawv loj. Nws muab ntau txoj hauv kev los ntawm kev txawj ntse, kev txheeb cais thiab kev tswj hwm database. OLAP (online analytical processing) raws li lub npe qhia yog muab tso ua ke ntawm txoj hauv kev los nug ntau qhov chaw databases.
Data mining tseem hu ua Knowledge Discovery in data (KDD). Raws li tau hais los saum no, nws yog thaj chaw ntawm kev tshawb fawb hauv computer, uas cuam tshuam nrog kev rho tawm cov ntaub ntawv yav dhau los tsis paub thiab nthuav tawm los ntawm cov ntaub ntawv nyoos. Vim qhov kev loj hlob ntawm cov ntaub ntawv, tshwj xeeb tshaj yog nyob rau hauv cov cheeb tsam xws li kev lag luam, cov ntaub ntawv mining tau dhau los ua cov cuab yeej tseem ceeb heev los hloov cov ntaub ntawv loj no rau hauv kev lag luam txawj ntse, vim tias phau ntawv rho tawm ntawm cov qauv tau dhau los ua tsis yooj yim rau ob peb lub xyoo dhau los. Piv txwv li, tam sim no nws tau raug siv rau ntau yam kev siv xws li kev txheeb xyuas kev sib raug zoo, kev dag ntxias thiab kev lag luam. Cov ntaub ntawv mining feem ntau cuam tshuam nrog plaub yam haujlwm hauv qab no: kev sib koom ua ke, kev faib tawm, kev rov qab los, thiab kev koom ua ke. Clustering yog txheeb xyuas cov pab pawg zoo sib xws los ntawm cov ntaub ntawv tsis tsim nyog. Kev faib tawm yog cov cai kawm uas tuaj yeem siv rau cov ntaub ntawv tshiab thiab feem ntau yuav suav nrog cov kauj ruam hauv qab no: ua ntej ntawm cov ntaub ntawv, tsim qauv, kev kawm / kev xaiv thiab kev ntsuam xyuas / validation. Regression yog nrhiav kev ua haujlwm nrog qhov yuam kev tsawg heev rau cov qauv ntaub ntawv. Thiab lub koom haum tab tom nrhiav kev sib raug zoo ntawm kev sib txawv. Cov ntaub ntawv mining feem ntau yog siv los teb cov lus nug xws li dab tsi yog cov khoom tseem ceeb uas yuav pab kom tau nyiaj ntau xyoo tom ntej hauv Wal-Mart.
OLAP yog chav kawm ntawm cov kab ke, uas muab cov lus teb rau ntau cov lus nug. Feem ntau OLAP yog siv rau kev lag luam, kev siv nyiaj txiag, kev kwv yees thiab kev siv zoo sib xws. Nws mus yam tsis tau hais tias cov ntaub ntawv siv rau OLAP tau teeb tsa rau cov lus nug nyuaj thiab ad-hoc nrog kev ua tau zoo hauv siab. Feem ntau cov matrix yog siv los tso saib cov zis ntawm OLAP. Cov kab thiab kab yog tsim los ntawm qhov ntev ntawm cov lus nug. Lawv feem ntau siv cov kev sib sau ua ke ntawm ntau lub rooj kom tau txais cov ntsiab lus. Piv txwv li, nws tuaj yeem siv los nrhiav kev muag khoom ntawm xyoo no hauv Wal-Mart piv rau xyoo tas los? Dab tsi yog qhov kev kwv yees ntawm kev muag khoom hauv lub quarter tom ntej? Yuav hais li cas txog qhov sib txawv los ntawm saib qhov feem pua ntawm kev hloov pauv?
Txawm hais tias nws pom tseeb tias cov ntaub ntawv mining thiab OLAP zoo ib yam vim tias lawv ua haujlwm ntawm cov ntaub ntawv kom tau txais kev txawj ntse, qhov sib txawv tseem ceeb los ntawm qhov lawv ua haujlwm ntawm cov ntaub ntawv. OLAP cov cuab yeej muab ntau qhov kev tshuaj xyuas cov ntaub ntawv thiab lawv muab cov ntsiab lus ntawm cov ntaub ntawv tab sis qhov sib txawv, cov ntaub ntawv tsuas yog tsom rau qhov sib piv, qauv thiab cuam tshuam hauv cov ntaub ntawv. Qhov ntawd yog OLAP kev pom zoo nrog kev sib sau ua ke, uas ua rau poob rau kev ua haujlwm ntawm cov ntaub ntawv ntawm "ntxiv" tab sis cov ntaub ntawv mining sib haum rau "kev faib". Lwm qhov sib txawv tseem ceeb yog tias thaum cov ntaub ntawv mining cov cuab yeej ua qauv cov ntaub ntawv thiab xa rov qab cov kev cai ua tau zoo, OLAP yuav ua cov txheej txheem sib piv thiab kev sib piv nrog rau kev lag luam qhov ntev ntawm lub sijhawm.