2018年(273)
分类: 大数据
2018-07-05 15:17:57
在本教程中,你将学习测试问题及如何在 Python 中使用 scikit-learn 进行测试。
完成本教程后,你将知道:
如何生成多类分类预测测试问题
如何生成二进制分类预测测试问题
如何生成线性回归预测测试问题
让我们开始吧。
教程概述
本教程被分成了 3 个部分,他们分别是:
1. 测试数据集
2. 分类测试问题
3. 回归测试问题
测试数据集
开发和实现机器学习算法时的一个问题是如何知道你是否已经正确实现了他们——它们似乎在有 bug 时也能工作。
测试数据集是小型设计问题,它能让你测试、调试算法和测试工具。它们对于更好地理解算法响应超参数变化的行为方面也很有用。
下面是测试数据集的一些理想特性:
它们可以快速、容易地生成。
它们包含「已知」或「理解」的结果来和预测进行比较。
它们是随机的,每次生成时都允许在同一个问题上随机变化。
它们很小、容易在而二维中实现可视化。
它们可以被增大。
我建议在开始一个新的机器学习算法或开发一个新的测试工具时使用测试数据集。scikit-learn 是一个用于机器学习的 Python 库,它提供了生成一组测试问题的函数。