机器学习作业及参考答案

一. 选择题(12 分)
1. (选择题, 3 分) 在两个变量的回归分析中, 作散点图是为了:
A. 直接求出回归直线方程
B. 直接求出回归方程
C. 根据经验选定回归方程的类型
D. 估计回归方程的参数
2. (选择题, 3 分) 假设你正在训练一个逻辑回归分类模型, 下列哪个陈述是对的?
A. 在模型中引入正则化总是导致训练集上的性能相等或更好
B. 在模型中添加许多新特性有助于防止训练集过拟合
C. 在模型中引入正则化总是导致不在训练集中的示例具有相同或更好的性能
D. 在模型中添加一个新特性总是导致训练集上的性能相等或更好。
3. (选择题, 3 分) 下列的哪个说法是正确的? :
A. 使用过大的λ值会导致你的假设过度拟合数据; 这可以通过减少λ来避免。
B. 使用非常大的λ值不会损害预测函数的性能; 我们不将λ设置为太大的唯一原因是避免数
值问题。
C. 考虑一个分类问题。 添加正则化可能导致您的分类器在训练集中不正确地分类一些训练
样本(在不使用正则化时, 它已经正确地分类了, 即。 λ=0 时)
D. 由于 Logistic 回归输出值为 0≤hθ(X)≤1, 其输出值范围无论如何只能通过正则化稍微“缩小”,
因此正则化通常对其没有帮助。
4. (选择题, 3 分) 在下列哪一组图中, 你认为预测函数在训练集中过拟合和欠拟合?

二. 简答题(68 分)
5. (12 分) 基于模型的机器学习包括哪些步骤步骤?
6. (12 分) 考虑一个分类问题。 添加正则化可能导致您的分类器在训练集中不正确地分
类一些训练样本(在不使用正则化时, 它已经正确地分类了, 即。 λ=0 时) , 这时应该怎么
做?
7. (16 分) 假设你有一个训练好的逻辑回归分类器, 并且它输出一个新的样本, 预测为
0.2 的结果。 这表示我们的估计 P(y = 0 | x,θ)和 P(y =1| x,θ)分别为多少?

答案获取请查看全文

隐藏内容 需要支付:¥10

未经允许不得转载!机器学习作业及参考答案