发布网友
共2个回答
热心网友
你的理解错误啦,数据挖掘并不完全等于ETL,ETL是指数据的抽取、转换、加载,这只是数据挖掘的一部份。ETL相当于数据挖掘的预处理,预处理完后,后面才接着数据挖掘真正的方法,比较说分类,或是预测。
数据挖掘的英文为DATA MINING,而你说的DATA MINER应该是数据挖掘工具吧?现阶段用的比较好的是IBM 旗下的一个软件,还有SPSS旗下的CLIMENTINE。具体的软件在现阶段还是比较少的。
热心网友
ETL属于数据仓库的范畴!ETL是数据仓库中源系统数据的整合。
数据挖掘(DATA MINING)中的数据准备不是数据仓库中的数据准备!其中包括有变量的选择、创建组合变量、回归,变量离散化等工作。
数据挖掘区别于OLAP和统计学。数据挖掘趋向于发现数据集合中更加深层的规律和趋势,有复杂的数学模型理论,比如人工神经网络、模糊数学、贝叶斯理论等等。
现在主流的有:SAS、SPSS公司。
当让也有开源工具:WEKA。