# 1 启动 WEKA
WEKA中新的菜单驱动的 GUI 继承了老的 GUI 选择器(类 weka.gui.GUIChooser) 的功能。它的MDI(`多文档界面`)外观,让所有打开的窗口更加明了。
![](https://box.kancloud.cn/2016-01-22_56a1c4ae86b6f.png)
这个菜单包括六个部分。
1\. Program
![](https://box.kancloud.cn/2016-01-22_56a1c4ae9a0d8.png)
+ LogWindow 打开一 个日志 窗口 ,记录 输出 到 stdout 或 stderr 的内容。在 MS Windows 那样的 环境中,WEKA 不是从一个终端启动,这个就比较有 用。
+ Exit 关闭WEKA。
2\. Applications 列出 WEKA 中主要的应用程序。
![](https://box.kancloud.cn/2016-01-22_56a1c4aea7bad.png)
+ Explorer 使用 WEKA 探索数据的环境。(本 文档的其它部分将详细介绍这个环境)
+ Experimenter 运行算法试验、管理算法方案 之间的统计检验的环境。
+ KnowledgeFlow 这个环境本质上和 Explorer 所支持的功能是一样的,但是它有一个可以拖放 的界面 。它 有一个 优势 ,就是 支持 增量学习(incremental learning)。
+ SimpleCLI 提供了一个简单的命令行界面,从而可以在没有自带命令行的 操作系统中直接执行 WEKA 命令。
3\. Tools 其他有用的应用程序。
![](https://box.kancloud.cn/2016-01-22_56a1c4aebc98e.png)
+ ArffViewer 一个 MDI 应用程序,使用电子 表格的形式来查看 ARFF 文件。
+ SqlViewer 一个 SQL 工作表, 用来通过JDBC 查询数据库。
+ EnsembleLibrary 生 成 集 成 式 选 择(Ensemble Selection)[5] 所需设置的界面。
4\. Visualization WEKA 中数据可视化的方法。
![](https://box.kancloud.cn/2016-01-22_56a1c4aed51e8.png)
+ Plot 作出数据集的二维散点图。
+ ROC 显示预先保存的 ROC 曲线。
+ TreeVisualizer 显示一个有向图,例如一个决策树。
+ GraphVisualizer 显示 XML、BIF 或 DOT 格式的图片,例如贝叶斯网络(Bayesian network)。
+ BoundaryVisualizer 允许在二维空间中对分类器的决策边界进行可视化。
5\. Windows 所有已打开的窗口都列在这里。
![](https://box.kancloud.cn/2016-01-22_56a1c4aee2a1d.png)
+ Minimize 最小化所有当前的窗口。
+ Restore 还原所有最小化过的窗口。
6\. Help WEKA 的在线资源可以从这里找到。
![](https://box.kancloud.cn/2016-01-22_56a1c4aef2eeb.png)
+ Weka homepage 打开一个浏览器窗口,显示 WEKA 的主页。
+ Online documentation 链接到 WekaDoc 维基文档 [4]。
+ HOWTOs, code snippets, etc. 通用的 WekaWiki [3],包括大量的例子, 以及开发和使用 WEKA 的基本知识(HOWTO)。
+ Weka on Sourceforge WEKA 项目在 Sourceforge.net 的主页。
+ SystemInfo 列出一些关于 Java/WEKA 环境的信息,例如 CLASSPATH。
+ About 不光彩的`About`窗口。
如果从终端启动 WEKA,会有一些文字在终端窗口中出现。这些文字是可以忽略的, 除非某些东西出错了——这时它可以帮助找到错误的原因。(LogWindow 也可以显示那 些信息。)
这份文档也 可以从在线 的 WekaDoc Wiki [4] 中找到,它 将集中阐述 如何使用 Explorer,而不会逐个解释 WEKA 中的数据预处理工具和学习算法。要获得关于各种筛选 器(filter)和学习算法的更多信息,可参考 Data Mining [2] 一书。
- 1 启动 WEKA
- 2 WEKA Explorer
- 2.1 标签页
- 2.2 状态栏
- 2.3 Log 按钮
- 2.4 WEKA 状态图标
- 3 预处理
- 3.1 载入数据
- 3.2 当前关系
- 3.3 处理属性
- 3.4 使用筛选器
- 4 分类
- 4.1 选择分类器
- 4.2 测试选项
- 4.3 Class 属性
- 4.4 训练分类器
- 4.5 分类器输出文本
- 4.6 结果列表
- 5 聚类
- 5.1 选择聚类器(Clusterer)
- 5.2 聚类模式
- 5.3 忽略属性
- 5.4 学习聚类
- 6 关联规则
- 6.1 设定
- 6.2 学习关联规则
- 7 属性选择
- 7.1 搜索与评估
- 7.2 选项
- 7.3 执行选择
- 8 可视化
- 8.1 散点图矩阵
- 8.2 选择单独的二维散点图
- 8.3 选择实例
- 参考文献