本文讨论了机器学习问题的类别,以及机器学习领域中使用的术语。
null
机器学习问题的类型
机器学习问题有多种分类方法。在这里,我们讨论最明显的问题。 1.基于学习系统可用的学习“信号”或“反馈”的性质
- 监督学习 :计算机由“老师”给出输入示例及其所需输出,目标是学习将输入映射到输出的一般规则。训练过程将继续,直到模型在训练数据上达到所需的精度水平。现实生活中的一些例子如下:
- 图像分类: 你用图像/标签训练。然后在未来,你会给出一个新的图像,期望计算机能识别出新的物体。
- 市场预测/回归: 你用历史市场数据训练计算机,让计算机预测未来的新价格。
- 无监督学习 :没有给学习算法贴标签,让它自己在输入中找到结构。它用于对不同群体中的群体进行聚类。无监督学习本身就是一个目标(发现数据中隐藏的模式)。
- 聚类: 你要求计算机将相似的数据分为若干类,这在研究和科学中是必不可少的。
- 高维可视化: 使用计算机帮助我们可视化高维数据。
- 生成模型: 模型捕捉到输入数据的概率分布后,将能够生成更多数据。这对于提高分类器的健壮性非常有用。
下面是一个简单的图表,明确了有监督和无监督学习的概念:
正如您可以清楚地看到的那样,有监督学习中的数据是有标签的,而无监督学习中的As数据是无标签的。
- 半监督学习 :如果你有大量的输入数据,并且只有部分数据被标记,那么这些问题被称为半监督学习问题。这些问题介于有监督和无监督学习之间。例如,一个照片存档,其中只有一些图像被标记(例如狗、猫、人),而大多数图像没有标记。
- 强化学习 :计算机程序与动态环境交互,在动态环境中,它必须执行特定的目标(例如驾驶车辆或与对手玩游戏)。该项目在探索其问题空间时,会获得奖励和惩罚方面的反馈。
2.基于机器学习系统所需的“输出”
- 分类 将一个或多个类别的输入划分为一个或多个类别,并将这些类别划分为一个或多个类别。这通常是在监督下解决的。垃圾邮件过滤是分类的一个例子,输入是电子邮件(或其他)消息,类别是“垃圾邮件”和“非垃圾邮件”。
- 回归 :这也是一个有监督的学习问题,但输出是连续的,而不是离散的。例如,使用历史数据预测股票价格。
两个不同数据集的分类和回归示例如下所示:
- 群集 :在这里,一组输入将被分成若干组。与分类不同的是,这些群体事先并不知道,因此这通常是一项无监督的任务。 正如您在下面的示例中所看到的,给定的数据集点已被划分为红色、绿色和蓝色可识别的组。
- 密度估计 :任务是找到输入在某个空间中的分布。
- 降维 :它通过将输入映射到低维空间来简化输入。主题建模是一个相关的问题,在这个问题中,一个程序被赋予一个人类语言文档的列表,并负责找出哪些文档包含类似的主题。
在这些机器学习任务/问题的基础上,我们有许多用于完成这些任务的算法。一些常用的机器学习算法有线性回归、逻辑回归、决策树、支持向量机、朴素贝叶斯、KNN(K近邻)、K均值、随机森林等。
注: 所有这些算法都将在接下来的文章中介绍。
机器学习术语
- 模型 一个模型就是一个模型 具体表现 通过应用一些机器学习算法从数据中学习。模型也称为 假设 .
- 特色 特征是我们数据的一个可测量的特性。一组数字特征可以方便地用 特征向量 .特征向量作为模型的输入。例如,为了预测水果,可能会有颜色、气味、味道、, 等 注: 选择信息丰富、有鉴别力和独立的特征是有效算法的关键步骤。我们通常雇佣 特征提取器 从原始数据中提取相关特征。
- 目标(标签) 目标变量或标签是我们的模型要预测的值。对于功能部分讨论的水果示例,每组输入的标签将是苹果、橙子、香蕉等水果的名称。
- 训练 其想法是给出一组输入(特征)和预期输出(标签),因此在训练后,我们将有一个模型(假设),然后将新数据映射到训练的类别之一。
- 预言 一旦我们的模型准备好了,就可以向它提供一组输入,它将提供一个预测输出(标签)。
下图明确了上述概念:
相关文章:
参考资料:
- https://en.wikipedia.org/wiki/Machine_learning
- https://leonardoaraujosantos.gitbooks.io/artificial-intelligence/
- http://machinelearningmastery.com/data-terminology-in-machine-learning/
本博客由 尼希尔·库马尔 .如果你喜欢GeekSforgeks并想贡献自己的力量,你也可以用write写一篇文章。极客。组织或邮寄你的文章进行评论-team@geeksforgeeks.org.看到你的文章出现在Geeksforgeks主页上,并帮助其他极客。
如果您发现任何不正确的地方,或者您想分享有关上述主题的更多信息,请写下评论。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END