搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

算法工程师炼丹Trick手册

Focal Loss

针对类别不平衡问题，用预测概率对不同类别的loss进行加权。Focal loss对CE loss增加了一个调制系数来降低容易样本的权重值，使得训练过程更加关注困难样本。

loss = -np.log(p) loss = (1-p)^G * loss

Dropout

随机丢弃，抑制过拟合，提高模型鲁棒性。

Normalization

Batch Normalization 于2015年由 Google 提出，开 Normalization 之先河。其规范化针对单个神经元进行，利用网络训练时一个 mini-batch 的数据来计算该神经元的均值和方差,因而称为 Batch Normalization。

x = (x - x.mean()) / x.std()

relu

用极简的方式实现非线性激活，缓解梯度消失。

x=max(x,0)

Cyclic LR

每隔一段时间重启学习率，这样在单位时间内能收敛到多个局部最小值，可以得到很多个模型做集成。

scheduler=lambdax:((LR_INIT-LR_MIN)/2)*(np.cos(PI*(np.mod(x-1,CYCLE)/(CYCLE)))+1)+LR_MIN

With Flooding

当training loss大于一个阈值时，进行正常的梯度下降；当training loss低于阈值时，会反过来进行梯度上升，让training loss保持在一个阈值附近，让模型持续进行“random walk”，并期望模型能被优化到一个平坦的损失区域，这样发现test loss进行了double decent。

flood=(loss-b).abs()+b

Group Normalization

Face book AI research（FAIR）吴育昕-恺明联合推出重磅新作Group Normalization（GN），提出使用Group Normalization 替代深度学习里程碑式的工作Batch normalization。一句话概括，Group Normbalization（GN）是一种新的深度学习归一化方式，可以替代BN。

def GroupNorm(x, gamma, beta, G, eps=1e-5): # x: input features with shape [N,C,H,W] # gamma, beta: scale and offset, with shape [1,C,1,1] # G: number of groups for GN N, C, H, W = x.shape x = tf.reshape(x, [N, G, C // G, H, W]) mean, var = tf.nn.moments(x, [2, 3, 4], keep dims=True) x = (x - mean) / tf.sqrt(var + eps) x = tf.reshape(x, [N, C, H, W])returnx*gamma+beta

Label Smoothing

abel smoothing将hard label转变成soft label，使网络优化更加平滑。标签平滑是用于深度神经网络（DNN）的有效正则化工具，该工具通过在均匀分布和hard标签之间应用加权平均值来生成soft标签。它通常用于减少训练DNN的过拟合问题并进一步提高分类性能。

targets = (1 - label_smooth) * targets + label_smooth / num_classes

Wasserstein GAN

彻底解决GAN训练不稳定的问题，不再需要小心平衡生成器和判别器的训练程度

基本解决了Collapse mode的问题，确保了生成样本的多样性

训练过程中终于有一个像交叉熵、准确率这样的数值来指示训练的进程，数值越小代表GAN训练得越好，代表生成器产生的图像质量越高

不需要精心设计的网络架构，最简单的多层全连接网络就可以做到以上3点。

Skip Connection

一种网络结构，提供恒等映射的能力，保证模型不会因网络变深而退化。

F(x)=F(x)+x

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

模型

模型

+关注

关注
1

文章
3255

浏览量
48905
神经元

神经元

+关注

关注
1

文章
363

浏览量
18468
深度学习

深度学习

+关注

关注
73

文章
5506

浏览量
121260

原文标题：大道至简：算法工程师炼丹Trick手册

文章出处：【微信号：zenRRan，微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

评论

相关推荐

图像算法工程师的利器——SpeedDP深度学习算法开发平台

随着人工智能的兴起，AI工程师特别是基于图像的算法工程师日益成为炙手可热的香饽饽。特别是在一些行业市场例如工业领域等行业领域，需要根据具体场景对检测识别算法进行不断地优化完善，以达到更

的头像

发表于 11-08 01:06 •329次阅读

图像<b class='flag-5'>算法</b><b class='flag-5'>工程师</b>的利器——SpeedDP深度学习<b class='flag-5'>算法</b>开发平台

当你的工程师朋友失联时，别气，ta真的是在忙工作 #搞笑 #电子爱好者 #硬件工程师 #晶振 #扬兴科技

硬件工程师

扬兴科技

发布于 :2024年10月30日 18:39:16

硬件工程师VS软件工程师|硬件工程师看到这都泪目了！#硬件设计 #硬件工程师 #电子工程师 #软件工程师

硬件工程师

安泰小课堂

发布于 :2024年09月25日 18:47:52

FPGA算法工程师、逻辑工程师、原型验证工程师有什么区别？

，共同进步。欢迎加入FPGA技术微信交流群14群! 交流问题（一） Q：FPGA中的FPGA算法工程师、FPGA逻辑工程师、FPGA原型验证工程师三者有什么区别？ A：FPGA

发表于 09-23 18:26

正是拼的年纪|65岁电子工程师上班VLOG #65岁退休 #电子工程师 #搞笑 #上班vlog

电子工程师

安泰小课堂

发布于 :2024年07月25日 11:31:02

用二创，1:1复刻工程师的职场现状

工程师

扬兴科技

发布于 :2024年07月19日 18:30:07

干硬件这一行，各种辛酸只有同行才懂吧 ? #电路设计 #电子爱好者 #硬件工程师 #电子工程师

硬件工程师

扬兴科技

发布于 :2024年05月29日 18:23:29

嵌入式软件工程师和硬件工程师的区别?

、调试和测试嵌入式软件，以确保其功能正常，性能优良。 * 文档编写：包括编写用户手册、维护文档等。 * 维护和更新：对现有的嵌入式软件进行维护和更新，以解决出现的问题和满足新的需求。嵌入式软件工程师

发表于 05-16 11:00

电子工程师常见面试题(二)看看你能答对几道吧#电子工程师 #电子工程师面试 #电子信息 #电工

电子工程师

安泰小课堂

发布于 :2024年05月13日 17:29:54

“班长！说好毕业后当硬件工程师，你怎么..." #搞笑 #电子行业 #电子工程师 #晶振 #扬兴科技

电子工程师

扬兴科技

发布于 :2024年05月04日 01:33:18

大厂电子工程师常见面试题#电子工程师 #硬件工程师 #电路知识 #面试题

电子工程师电路

安泰小课堂

发布于 :2024年04月30日 17:33:15

一位硬件工程师的历练之路：从入门学习理论到... #搞笑 #硬件工程师 #电子工程师 #扬兴科技

硬件工程师扬兴科技

扬兴科技

发布于 :2024年03月13日 17:50:21

企业老工程师和高校老师有啥区别

电子工程师硬件

电子发烧友网官方

发布于 :2024年02月28日 17:50:00

RX722T工程师手册

电子发烧友网站提供《RX722T工程师手册.pdf》资料免费下载

发表于 02-22 14:54 •0次下载

RX722T<b class='flag-5'>工程师</b><b class='flag-5'>手册</b>

如何搞崩一个硬件工程师心态？试试对ta说这几句

硬件工程师

扬兴科技

发布于 :2024年02月20日 18:05:49