分享好友 最新动态首页 最新动态分类 切换频道
百度飞桨VisualDL全新升级!5大可视化功能助力模型高效调优
2024-11-07 22:56

深度学习模型训练过程盯log头晕眼花?复杂模型结构全靠脑补?网络各层效果无法评估?模型评估指标难以综合权衡?近日,VisualDL 2.0 ——飞桨可视化分析工具全面改版升级,帮众位开发者们从"炼丹萌新"变身"太上老君"。

百度飞桨VisualDL全新升级!5大可视化功能助力模型高效调优

VisualDL是百度飞桨为广大深度学习开发者订制的功能完备的可视化分析工具。它可以帮助深度学习开发者了解训练过程中模型参数的变化趋势、 网络层对数据特征的提取情况、网络结构应该如何调整、精度与召回是否达到了理想的平衡等,从而实现有方向性的错误排查,实现高效的模型调优。

早在2017年VisualDL 1.0就已推出,随着飞桨开源深度学习平台3年深入产业实践的不断打磨,VisualDL本次也完成了2.0版本的全新蜕变!相较VisualDL 1.0,新版本的API设计更加简洁易用、与框架衔接更为顺畅、功能更丰富,界面设计也全面进行了升级,致力为老用户带来全新体验,为新用户带来使用上的惊喜。

VisualDL 2.0能做什么?

当前,VisualDL 2.0共有五大可视化功能。

1、标量(Scalar)

标量可以通过图表的形式展示Loss、Accuracy、Learning Rate等参数指标在训练过程中的变化趋势,帮助开发者了解其是否朝着理想的方向优化,便于发现异常情况,及时排查并修复问题;另外,通过对比多组实验的训练参数,开发者们能深入探究参数对模型效果的影响,加速模型的调优。

实现代码:

2、数据样本分析(Sample)

数据样本分析可以在多种深度学习任务中发挥重要作用。例如在计算机视觉任务中,该功能不仅可以查看每个训练批次中的指定的样本图片,也可以展示图像数据的在训练过程中间阶段的提取特征情况,便于开发者们观察图片数据在训练过程中的状态,进而深入了解训练过程及效果。

实现代码:

在语音识别或合成任务中,数据样本分析功能可以帮助开发者实时获取训练过程中的音频数据,评估语音识别或合成的效果,挑选最优的训练模型。

实现代码:

3、模型结构(Graph)

模型结构功能支持一键可视化模型网络结构。开发者们可查看模型属性、节点信息、节点输入输出等,并支持节点搜索功能,协助开发者们快速分析模型结构并了解数据流向。

当前支持如下两种操作方式:

模型文件拖拽上传

在命令行加入参数--model并指定模型文件路径(非文件夹路径),运行命令后即可启动:

4、直方图(Histogram)

直方图可以展示Tensor(weight、bias、gradient等)数据在训练过程中的变化趋势,深入了解模型各层效果,帮助开发者精准调整模型结构。

实现代码:

5、PR 曲线(PR Curve)

PR曲线可以展示每一分类在不同阈值下的精度(Precision)-召回率(Recall)曲线,帮助开发者权衡模型精度和召回率之间的平衡,设定最佳阈值。精度是指正样本的数量除以所有被选中样本的数量,而召回率是指所有正样本中被推理正确的比例,由此可见精度越高,召回率越高,我们的模型就越好。但是很多情况下,鱼和熊掌不可兼得,无法同时保证精度和召回率都是最高,此时需要通过PR曲线,权衡精度与召回率,确定最佳阈值。

实现代码:

为了便于大家更好的了解VisualDL,我们结合一个简单的实际模型例子来更直观的看下这几个功能,那就是深度学习中的"Hello World",手写数字识别。

VisualDL 2.0怎么用?

假设在一个风和日丽的早晨,作为深度学习爱好者的你,想要建立一个简单的LeNet模型进行手写数字识别,在辛苦完成模型搭建后,进入模型训练时,却看到了如下一幕:

你心里一沉,这精度怎么抖得那么厉害啊。训练中哪里出现问题了呢?到底谁是"凶手"?可是连问题出在哪都不知道,模型优化和修复更是无从下手。这时你想起几日前偶然发现的深度学习可视化分析工具——VisualDL,心中顿时升起希望,因为在训练之前,已经把下面的代码添加到训练脚本中了。

接下来就执行下面的命令来开始奇幻的破案(调优)之旅吧!

执行命令后,即可得到这样一个网址http://localhost:8080/,打开浏览器输入这个网址即可查看究竟发生了什么。首先来看看案发现场。。

点击"标量数据"页签查看模型的Loss和Accuracy整体变化趋势,也就是把刚才的日志信息通过图形直观的展示出来。这部分对应的代码如下所示:

一眼望去,这哪是Loss和Accuracy的变化曲线啊,这明显是心率不齐啊,让人有打120叫救护车的冲动了!

显而易见,Accuracy一直在10%左右徘徊,Loss一直无法下降,由此我们开始逐个查看问题出在哪个环节。首先看看模型结构的实际样子,是否是结构设计出了问题。

点击"网络结构"页签,将保存在"./model"目录下的模型文件拖进页面即可看到模型的结构。

通过观察模型结构、节点属性、模型属性、数据流向,咱们可以直观的发现整体结构是符合预期的,也就是说模型网络本身是清白的,那么是否是模型"吃进"的数据有问题呢?

点击"样本数据"查看训练中的样本数据。这部分对应的代码如下所示:

通过查看每批次数据的第一张图片,发现输入数据也是没有问题的。那么咱们再来"回放录像",看看每一时间步的参数变化情况吧。

点击"直方图"页签,查看训练过程中每一时间步权重和偏差的变化情况,就如同回放整个训练过程的监控录像一样,让训练过程中参数变化不正常的问题无所遁形!这部分对应的代码如下所示:

通过查看后发现,每一层的权重和偏差的变化正常。由此证明不是特定层的初始参数配置出现问题,排除了模型结构、数据样本、每层网络参数配置后,还剩下超参数的配置,因此决定尝试不同的学习率(0.001,0.03,0.05,0.08,0.1),并通过VisualDL的多实验对比功能,来观察学习率对模型训练效果的影响情况。

启动多实验对比功能非常的简单,只需要在训练脚本中参考如下代码实现同一个目录下记录多份不同学习率的训练日志文件,并启动相应训练即可。接着启动VisualDL,就会得到多组实验记录对比图了。

你终于发现了问题所在了,原来是学习率设置的过大了,导致Loss无法下降收敛,根据"标量数据"展示的效果,当学习率为0.001时(深蓝色线条),Loss呈现优美的下降趋势且后续渐渐收敛,Accuracy呈现逐渐上升并趋于平稳,因此你将学习率设置为0.001,使得模型呈现最佳效果。

但是你还不满足于现状,想要选择一个最佳阈值,使得模型的精准度和召回率都达到最优,于是又开始使用"PR曲线"功能。

点击"PR曲线"页签,权衡精确度与召回间的关系,确定最佳阈值。这部分对应的代码如下所示:

以上图为例,该图是手写数字识别任务中类别7对应的PR曲线,从图中可以看出,当阈值为0.10、0.15或0.20时,准确率和召回率同时达到最高值,因此选择上述中的任意阈值,模型都可达到最佳效果。

最终,在VisualDL的帮助下,你确定了模型阈值为0.15,学习率为0.001,至此,一个效果理想的手写数字识别模型搭建完成。

写在最后

看到这里,相信大家已经对VisualDL 2.0有了一个比较全面的了解,也发现它是真的又有用,又好用吧?然而这还不够,飞桨团队还为它增加了诸多软实力:

1、高兼容性:全面支持飞桨、ONNX、Caffe等市面主流模型结构可视化,广泛支持各类用户实现可视化分析。

2、生态支持全面:与飞桨的多个套件、工具组件以及AI学习和实训社区AI Studio全面打通,为开发者们在飞桨生态系统中提供最佳使用体验。

最新文章
2023-2029年中国脂肪醇行业市场竞争态势及发展趋向分析报告
脂肪醇是合成醇系表面活性剂的主要原料,按原料来源不同又分为合成醇和天然醇。由石油为原料制备合成醇的路线很多,但目前已在工业上形成大吨位生产的路线主要有三条:1.几基合成醇,该法在羰基化催化剂接触下,将烯烃和一氧化碳、氢气反应,
seo综合查询是啥意思(seo综合查询工具可以查看哪些数据)
SEO中有一个很重要的知识点就是要在页面中布局关键词,那么在布局关键词时,往往给出的要求是“查找用户爱搜索的词”,并进行布局。那么如何查找用户爱搜索的关键词呢?1.搜索引擎下拉框我们在搜索框中输入相应关键词时,系统往往会在下拉
AI智能脱口秀文案生成工具:一键打造爆笑子与幽默桥,全面满足创作需求
AI智能脱口秀文案生成工具:一键打造爆笑子与幽默桥,全面满足创作需求在信息时代飞速发展的今天人工智能已经渗透到咱们生活的方方面面甚至连幽默与创意也不例外。你是不是曾经为创作脱口秀子而头痛不已绞尽脑汁却依然无法捕捉到那些让人捧
1000个箭头(ai源文件,可编辑)在此,绘图必备!
免费资源:一、国自然类:1 2023历年国自然标书全文3国自然项目答辩PPT5标书写作模板7 国自然项目造假清单22018-24年国自然清单4 基金插图素材(可编辑)6 ‍近10年国自然标书全文‍二、SCI生信+实验类:1 160套SCI实验操作视频3Meta分析范
交通银行:启动新一代集团信息系统智慧化转型工程
  中国网财经8月16日讯 交通银行16日在银行业例行新闻发布会上介绍了该行加速推进信息技术智慧化转型的相关情况。交通银行副行长沈如军表示,日前,交通银行正式启动新一代集团信息系统智慧化转型工程(“新531”工程),目的是以打造数字
抖音短视频什么时间段发布最多人看?抖音流量时间段分析
三、注意事项其实,选择视频发布的时间对流量的影响虽然很重要,但是我们也不可忽视视频的内容质量,一个优质的视频可以轻松帮助我们登上热门。那如何产生优质的内容呢,我们可以从以下两点出发:1)素材来源 内容是重中之重。但是创造优质
11个帮助站长提升网站搜索引擎自然流量的SEO技巧
怎样提高你的百度搜索引擎提升专业技能?能够小范畴的试着一下这一明细里边的SEO专业技能,她们全是行得通并便于了解的百度搜索引擎提升专业技能。绝大多数的SEO专业技能明细都很模糊不清:对的…点“回到”按键。在本文中,大家将清除模棱
9月20日,百万美国人打算解救51区的外星Homie
美国最热话题是,一群哥们儿要抱团冲进美国神秘的军事基地51区,活捉外星人。什么叫51区,杰个话题都快被他吗说烂了,简单带你复习一下:美国政府储藏1947年罗斯威尔不明飞行物坠毁残骸和地外生物尸体的仓库,以及和外星人签订研究外星科技
2024流行的1一4多人游戏有哪些 好玩的多人游戏排行榜
多人游戏随着发展目前已经成为了众多游戏玩家们的圣地,这种游戏类型不仅仅只是注重玩家的个人技术,更是对玩家们的心理素质以及团队协作的终极挑战,2024流行的1一4多人游戏有哪些,介绍的游戏将会给玩家带来阵阵令人心跳加速的快感,同时
2005年以来国内成品油历次调价一览表
三次成品油定价机制改革自1998年迄今,中国已经历了三次成品油定价机制改革。1998年6月3日,原国家计委出台《原油成品油价格改革方案》,规定中石油和中石化两个集团公司之间原油交易结算价格由双方协商确定,价格由原油基准价和贴水两部分
相关文章
推荐文章
发表评论
0评