💎一站式轻松地调用各大LLM模型接口,支持GPT4、智谱、星火、月之暗面及文生图 广告
# 3.3 处理属性 在 Current relation 一栏下是 Attributes(属性)栏。有四个按钮,其下是当前关系中的属性列表。该列表有3列: 1\. No.. 一个数字,用来标识数据文件中指定的各属性的顺序。 2\. 选择框. 允许勾选关系中呈现的各属性。 3\. Name. 数据文件中声明的各属性的名称。 当点击属性列表中的不同行时,右边 Selected attribute 一栏的内容随之改变。这 一栏给出了列表中当前高亮显示的属性的一些描述: 1\. Name. 属性的名称,和属性列表中给出的相同。 2\. Type. 属性的类型,最常见的是分类型(Nominal)和数值型(Numeric)。 3\. Missing. 数据中该属性缺失(或者未指定)的实例的数量(及百分比)。 4\. Distinct. 数据中该属性包含的不同值的数目。 5\. Unique. 唯一地拥有某值的实例的数目(及百分比),这些实例每个的取值都和 别的不一样。 在这些统计量的下面是一个列表,根据属性的不同类型,它显示了关于这个属性中储存 的值的更多信息。如果属性是分类型的,列表将包含该属性的每个可能值以及取那个值的 实例的数目。如果属性是数值型的,列表将给出四个统计量来描述数据取值的分布—最小 值、最大值、平均值和标准差。在这些统计量的下方,有一个彩色的直方图,根据直方图 上方一栏所选择的 class 属性来着色。(在点击时,该栏将显示一个可供选择的下拉列表。) 注意仅有分类型的 class 属性才会让直方图出现彩色。最后,若点击 Visualize All 按钮, 将在一个单独的窗口中显示数据集中所有属性的直方图。 回到属性列表,开始时所有的选择框都是没有被勾选的。可通过逐个点击来勾选/取消。 以上的4个按钮也可用于改变选择: 1\. All. 所有选择框都被勾选。 2\. None. 所有选择框被取消(没有勾选)。 3\. Invert. 已勾选的选择框都被取消,反之亦然。 4\. Pattern. 让用户基于 Perl 5 正则表达式来选择属性。例如,用 *_id 选择所有名 称以 _id 结束的属性。 选中了想要的属性后,可通过点击属性列表下的 Remove 按钮删除他们。注意可通 过点击位于 Preprocess 面板的右上角的 Edit 按钮旁的 Undo 按钮来取消操作。