机器学习的Softmax定义和优点-电子发烧友网

Softmax在机器学习中有非常广泛的应用，但是刚刚接触机器学习的人可能对Softmax的特点以及好处并不理解，其实你了解了以后就会发现，Softmax计算简单，效果显著，非常好用。

我们先来直观看一下，Softmax究竟是什么意思

我们知道max，假如说我有两个数，a和b，并且a>b，如果取max，那么就直接取a，没有第二种可能

但有的时候我不想这样，因为这样会造成分值小的那个饥饿。所以我希望分值大的那一项经常取到，分值小的那一项也偶尔可以取到，那么我用softmax就可以了

现在还是a和b，a>b，如果我们取按照softmax来计算取a和b的概率，那a的softmax值大于b的，所以a会经常取到，而b也会偶尔取到，概率跟它们本来的大小有关。所以说不是max，而是 Soft max

那各自的概率究竟是多少呢，我们下面就来具体看一下

定义

假设我们有一个数组V，Vi表示V中的第i个元素，那么Vi元素的Softmax值就是

机器学习的Softmax定义和优点

Vi元素的Softmax值

也就是说，是该元素的指数值，与所有元素指数值和的比值

这个定义可以说非常的直观，当然除了直观朴素好理解以外，它还有更多的优点

1.计算与标注样本的差距

在神经网络的计算当中，我们经常需要计算按照神经网络的正向传播计算的分数S1，按照正确标注计算的分数S2，之间的差距，计算Loss，才能应用反向传播。Loss定义为交叉熵

机器学习的Softmax定义和优点

交叉熵

取log里面的值就是这组数据正确分类的Softmax值，它占的比重越大，这个样本的Loss也就越小，这种定义符合我们的要求

2.计算上非常非常的方便

当我们对分类的Loss进行改进的时候，我们要通过梯度下降，每次优化一个step大小的梯度

我们定义选到yi的概率是

机器学习的Softmax定义和优点

yi的概率

然后我们求Loss对每个权重矩阵的偏导，应用到了链式法则

机器学习的Softmax定义和优点

求导结果

详细过程

机器学习的Softmax定义和优点

求导过程

最后结果的形式非常的简单，只要将算出来的概率的向量对应的真正结果的那一维减1，就可以了

举个例子，通过若干层的计算，最后得到的某个训练样本的向量的分数是[ 1, 5, 3 ],

那么概率分别就是

机器学习的Softmax定义和优点

训练样本的概率

如果这个样本正确的分类是第二个的话，那么计算出来的偏导就是

[0.015,0.866−1,0.117]=[0.015,−0.134,0.117]

是不是很简单！！然后再根据这个进行back propagation就可以了

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4789

浏览量
101528
机器学习

机器学习

+关注

关注
66

文章
8459

浏览量
133371

传统机器学习方法和应用指导

在上一篇文章中，我们介绍了机器学习的关键概念术语。在本文中，我们会介绍传统机器学习的基础知识和多种算法特征，供各位老师选择。 01 传统机器

发表于 12-30 09:16 •519次阅读

传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

如何选择云原生机器学习平台

当今，云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势，逐渐成为企业构建和部署机器学习应用的首选。然而，市场上的云原生机器

发表于 12-25 11:54 •210次阅读

什么是机器学习？通过机器学习方法能解决哪些问题？

来源：Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的

发表于 11-16 01:07 •602次阅读

什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>？通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题？

NPU与机器学习算法的关系

在人工智能领域，机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升，对计算资源的需求也在不断增长。NPU作为一种专门为深度学习等机器

发表于 11-15 09:19 •738次阅读

鲁棒性在机器学习中的重要性

金融风险评估。这些应用场景对模型的鲁棒性提出了极高的要求。鲁棒性的定义鲁棒性通常被定义为系统在面对不确定性和变化时仍能保持其功能的能力。在机器学习中，这意味着即使输入数据包含错误、

发表于 11-11 10:19 •695次阅读

MLOps平台优点

MLOps平台在提升机器学习模型的开发与部署效率、可扩展性与灵活性、透明度与可重复性以及降低风险和持续改进方面具有显著优点。

发表于 11-06 10:10 •240次阅读

具身智能与机器学习的关系

具身智能（Embodied Intelligence）和机器学习（Machine Learning）是人工智能领域的两个重要概念，它们之间存在着密切的关系。 1. 具身智能的定义具身智能是指智能体

发表于 10-27 10:33 •607次阅读

【《时间序列与机器学习》阅读体验】+ 时间序列的信息提取

之前对《时间序列与机器学习》一书进行了整体浏览，并且非常轻松愉快的完成了第一章的学习，今天开始学习第二章“时间序列的信息提取”。先粗略的翻阅第二章，内容复杂，充斥了大量的

发表于 08-14 18:00

机器视觉中常用的光源类型及优点?

机器视觉是一种利用计算机视觉技术来实现对图像的获取、处理和分析的技术。在机器视觉系统中，光源是至关重要的组成部分，它直接影响到图像的质量，进而影响到整个系统的准确性和可靠性。本文将详细介绍机器视觉

发表于 07-04 10:28 •852次阅读

人工智能、机器学习和深度学习是什么

在科技日新月异的今天，人工智能（Artificial Intelligence, AI）、机器学习（Machine Learning, ML）和深度学习（Deep Learning, DL）已成为

发表于 07-03 18:22 •1629次阅读

机器学习算法原理详解

机器学习作为人工智能的一个重要分支，其目标是通过让计算机自动从数据中学习并改进其性能，而无需进行明确的编程。本文将深入解读几种常见的机器学习

发表于 07-02 11:25 •1559次阅读

深度学习与传统机器学习的对比

在人工智能的浪潮中，机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步，为众多领域带来了革命性的变化。然而，尽管它们都属于机器

发表于 07-01 11:40 •1721次阅读

深度学习与度量学习融合的综述

如今，机器学习的应用广泛，包括人脸识别、医疗诊断等，为复杂问题和大量数据提供解决方案。机器学习算法能基于数据产生成功的分类模型，但每个数据都有其问题，需

发表于 04-24 09:49 •526次阅读

深度<b class='flag-5'>学习</b>与度量<b class='flag-5'>学习</b>融合的综述

机器学习如何助力芯片设计

1959年，计算机游戏和人工智能的先驱亚瑟·塞缪尔（Arthur Samuel）将ML定义为“使计算机能够在没有明确编程的情况下学习的研究领域”。

发表于 03-29 10:03 •596次阅读

机器学习8大调参技巧

今天给大家一篇关于机器学习调参技巧的文章。超参数调优是机器学习例程中的基本步骤之一。该方法也称为超参数优化，需要搜索超参数的最佳配置以实现最佳性能。

发表于 03-23 08:26 •787次阅读

搜索历史

机器学习的Softmax定义和优点

评论

传统机器学习方法和应用指导

如何选择云原生机器学习平台

什么是机器学习？通过机器学习方法能解决哪些问题？

NPU与机器学习算法的关系

鲁棒性在机器学习中的重要性

MLOps平台优点

具身智能与机器学习的关系

【《时间序列与机器学习》阅读体验】+ 时间序列的信息提取

机器视觉中常用的光源类型及优点?

人工智能、机器学习和深度学习是什么

机器学习算法原理详解

深度学习与传统机器学习的对比

深度学习与度量学习融合的综述

机器学习如何助力芯片设计

机器学习8大调参技巧