您的位置  > 互联网

weka中文版32位/64位官网最新版下载下载

WEKA中文版官方介绍

WEKA的全称是怀卡托智能分析环境(for)。 Weka也是新西兰一种鸟的名字,WEKA的主要开发者来自新西兰。

Weka是一款开源、非商业免费的数据挖掘软件,它集成了大量的计算机学习算法,可以承担数据挖掘任务,包括数据预处理、分类、回归、聚类、关联规则和新的交互等。 界面上的可视化。 数据挖掘软件 Weka 的技术基于这样的假设:数据被组织成单个文件或关联,其中每个数据点都用许多属性进行注释。

Weka 使用 Java 的数据库链接功能来访问 SQL 数据库并处理来自数据库的查询结果。 其主要用户界面是也支持相同功能的命令行,或基于组件的知识流界面。 如果你想自己实现数据挖掘算法,可以看一下Weka的接口文档。 在Weka中集成自己的算法,甚至学习其方法来实现自己的可视化工具,并不是一件很困难的事情。

WEKA背景知识

WEKA 将分类()和回归()都放在“”选项卡中。 有一个原因。

在这两个任务中,都有一个目标属性(输出变量)。 我们希望根据样本(WEKA 中称为实例)的一组特征(输入变量)来预测目标。 为了实现这一目标,我们需要一个训练数据集,其中每个实例的输入和输出都是已知的。 通过观察训练集中的示例,可以构建预测模型。 通过这个模型,我们可以新输出未知实例进行预测。 模型的质量是通过其预测的准确性来衡量的。

在WEKA中,要预测的目标(输出)称为Class属性,它应该是来自分类任务的“类”。 一般来说,如果Class属性是分类类型,我们的任务称为分类,如果Class属性是数值类型,我们的任务称为回归。

WEKA中文版参数设置

现在我们计划挖掘那些支持度在10%到100%之间、提升值超过1.5且提升值排在前100名的关联规则。我们将“”和“”分别设置为0.1和1,“”为提升、“”为 1.5,“”为 100。将其他选项保留为默认值。 “确定”然后点击“”中的“开始”开始运行算法,数据集汇总和挖掘结果显示在右侧窗口中。

以下是已发现的 5 条最重要的举重规则。

找到的最佳规则:

1. 年龄= =YES =YES 113 ==> = 61 conf:(0.54) <lift:(4.05)> lev:(0.08) [45] 转换:(1.85)

2. = 80 ==> 年龄= =是 =是 61 会议:(0.76) < 提升:(4.05)> 水平:(0.08) [45] 转换:(3.25)

3. = =是63 ==>年龄= =是:(0.97)<提升:(3.85)>水平:(0.08)[45]转换:(15.72)

4.年龄= =是151 ==> = =是:(0.4)<提升:(3.85)>水平:(0.08)[45]转换:(1.49)

5. 年龄= =是 151 ==> = 76 会议:(0.5) < 提升:(3.77)> 水平:(0.09) [55] 转换:(1.72)

对于每个挖掘的规则,WEKA 列出了四个相关性指标。

命令行模式

我们还可以使用命令行来完成挖矿任务,在“CLI”模块中输入如下格式的命令:

java weka..-t -path"bank-data-final.arff

算法完成。 注意“-t”参数后面的文件路径不能包含空格。

之前我们用过

-N 100 -T 1 -C 1.5 -D 0.05 -U 1.0 -M 0.1 -S -1.0 在命令行中使用这些参数得到的结果与之前使用 GUI 得到的结果相同。

我们还可以添加“-I”参数来获取不同项数的频繁项集。 我使用的命令如下:

java weka.. -N 100 -T 1 -C 1.5 -D 0.05 -U 1.0 -M 0.1 -S -1.0 -I -td:"weka"bank-data-final.arff

挖掘结果如上所示,应类似于此文件。