## 问题描述
泰坦尼克海难是20世纪人间十大灾难之一。在1912年4月15日,载着1316号乘客和891名船员的豪华巨轮“泰坦尼克号”与冰山相撞而沉没。船难发生后,究竟有多少人葬身海底呢?各方面的统计不一。有些消息来源说是1635人,美国调查庭说是1517人,英国调查庭说时1490人,而英国贸易局则说是1503人。
我们现在得到了部分的数据,具体数据见
https://github.com/cystanford/Titanic_Data
数据集格式为csv,一共两个文件:
train.csv:训练数据集,包含特征信息和存活与否的标签
test.csv: 测试数据集,只包含特征信息
现在请用**决策树分类**对训练集进行训练,并针对测试集中的乘客进行生存预测,并告知分类器的准确率。
在测试集中,包括了以下字段,具体描述为:
| 字段 |描述 |
| --- | --- |
|PassengerId | 乘客编号 |
|Survived | 是否幸存 |
|Pclass | 船票等级 |
|Name | 乘客姓名 |
|Sex | 乘客性别 |
|SibSp |亲戚数量(兄妹、配偶数) |
|Parch|亲戚数量(父母、子女数)|
|Ticket|船票号码|
|Fare|船票价格|
|Cabin|船舱|
|Embarked|登陆港口|