【大厂AI课学习笔记NO.50】2.3深度学习开发任务实例(3)任务背景与目标

我们经常在做项目的时候,觉得分析背景和目标是浪费时间,觉得不过如此。

其实目标梳理特别重要,直接决定你数据的需求分析,模型的选择,决定你交付的质量。

人工智能项目也和其他项目一样,不要想当然,不要自己闷头去干。

当前的课程,给了一个玩具小车,在赛道上识别交通标志的深度学习案例,图像识别的图像分类。

背景:玩具车增加识别交通指示牌的能力。

目标:利用玩具车的前置摄像头,检测交通标志的位置。

任务过程包括:

  • 明确数据采集需求
  • 制作数据集
  • 模型训练
  • 模型评测

 

效果就是这样的。

我们可以看到,赛道是类似纸张铺设的,所以不平整。玩具交通标志,被用检测框标记出来。是很小的立起来的小牌子,塑料的,所以很容易有俯仰角、翻滚角等问题。

 计算机视觉(CV)实际应用中。

我们要注意,除了关注的主体,还有很多其他要关注的信息,比如背景、光照;

我们在做图像识别,那么光就是最重要的因素。是不是有逆光、背光、面向光?如果样本图片,不包含这些情况,那么训练出来的模型,就将出现准确率和召回率都很低的情况。

还有客户给我们讲需求时,由于客户不理解这些,可能认为一切很简单,给的项目预算,就有问题,而实际,在这个项目中,我们要采集甚至超过1万个样本,都要进行特征标注,这是非常大的工作量,都要项目经费去支撑。

作为项目负责人,如果忽略了这一点,也将导致项目无法继续交付和落地。

延伸学习:


在深度学习中,图像分类是一个复杂且具有挑战性的任务。以下是一些难点和注意事项:

难点:

  1. 数据集的质量和多样性:图像分类的性能在很大程度上取决于训练数据的质量和多样性。如果数据集不够大、标注不准确或者缺乏多样性,那么模型的泛化能力可能会受到限制。
  2. 模型的复杂性:图像分类需要处理大量的输入数据,并学习从这些数据中提取有用的特征。因此,模型需要具有足够的复杂性来捕捉这些特征,但同时也要避免过拟合。
  3. 光照和视角变化:图像中的光照和视角变化可能会对模型的性能产生负面影响。模型需要能够处理这些变化,并正确地分类图像。
  4. 类别不平衡:在某些数据集中,某些类别的样本数量可能远多于其他类别,这可能导致模型在训练过程中偏向这些样本数量较多的类别。

注意事项:

  1. 数据预处理:在进行图像分类之前,需要对图像进行适当的预处理,如缩放、裁剪、归一化等,以确保输入数据的一致性和模型的稳定性。
  2. 模型选择:根据具体任务和数据集的特点选择合适的模型。目前有许多先进的深度学习模型可用于图像分类,如卷积神经网络(CNN)、残差网络(ResNet)等。
  3. 调参技巧:在训练过程中,需要合理地设置学习率、批大小等超参数,并使用优化算法来加速训练过程。同时,还需要关注模型的过拟合问题,并采取相应的措施来避免过拟合。

目前最先进的模型和算法:

在图像分类领域,目前最先进的模型之一是EfficientNet系列模型。EfficientNet通过一种称为复合缩放的方法,在保持计算效率和精度的同时,实现了更高的性能。此外,还有许多其他优秀的模型,如ViT(Vision Transformer)等。

在算法方面,除了传统的梯度下降算法外,还有许多优化算法可用于加速训练过程和提高模型性能,如Adam、RMSProp等。这些算法可以根据具体任务和数据集的特点进行选择。

工具:

目前有许多深度学习框架和工具可用于图像分类任务,如TensorFlow、PyTorch、Keras等。这些工具提供了丰富的API和预训练模型,可以方便地构建和训练深度学习模型。此外,还有一些可视化工具可以帮助我们更好地理解模型的训练过程和性能,如TensorBoard等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/487442.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VUE2.0 tips整理

VUE2.0 tips整理 /* 相关技术 1.框架:element 2.echarts:可视化图表,[官网](https://echarts.apache.org/zh/index.html)*/引入静态图片资源到表格中 //(1)页面中引入图片 import ims from "/assets/images/lay…

React18源码: React调度中的3种优先级类型和Lane的位运算

优先级类型 React内部对于优先级的管理,贯穿运作流程的4个阶段(从输入到输出),根据其功能的不同,可以分为3种类型: 1 )fiber优先级(LanePriority) 位于 react-reconciler包,也就是L…

【人脸朝向识别与分类预测】基于LVQ神经网络

课题名称:基于LVQ神经网络的人脸朝向识别分类 版本日期:2024-02-20 运行方式:直接运行GRNN0503.m文件 代码获取方式:私信博主或 企鹅号:491052175 模型描述: 采集到一组人脸朝向不同角度时的图像,图像…

持续集成,持续交付和持续部署的概念,以及GitLab CI / CD的介绍

引言:上一期我们部署好了gitlab极狐网页版,今天我们介绍一下GitLabCI / CD 目录 一、为什么要 CI / CD 方法 1、持续集成 2、持续交付 3、持续部署 二、GitLab CI / CD简介 三、GitLab CI / CD 的工作原理 4、基本CI / CD工作流程 5、首次设置 …

华清远见嵌入式学习——驱动开发——day9

目录 作业要求: 作业答案: 代码效果: ​编辑 Platform总线驱动代码: 应用程序代码: 设备树配置: 作业要求: 通过platform总线驱动框架编写LED灯的驱动,编写应用程序测试&…

Rust通用代码生成器莲花发布红莲尝鲜版二十一发布介绍视频,前端代码生成物大翻新

Rust通用代码生成器莲花发布红莲尝鲜版二十一发布介绍视频,前端代码生成物大翻新 Rust通用代码生成器发布了红莲尝鲜版二十一的最新介绍视频,前端代码生成物大翻新。视频请见: Rust通用代码生成器:莲花,红莲尝鲜版二…

vue手写卡片切换,并且点击获取到卡片信息

需求:做一个卡片样式的列表,之后有一些基本信息,之后卡片选中后样式不一样,默认选中第一个卡片,点击卡片后可以获取到卡片的信息 一、效果 二、关键代码 index默认重0开始,activeTable默认为0,0-0等于0,但…

MT8791迅鲲900T联发科5G安卓核心板规格参数_MTK平台方案定制

MT8791安卓核心板是一款搭载了旗舰级配置的中端手机芯片。该核心板采用了八核CPU架构设计,但是升级了旗舰级的Arm Cortex-A78核心,两个大核主频最高可达2.4GHz。配备了Arm Mali-G68 GPU,通过Mali-G88的先进技术,图形处理性能大幅提…

unity屏幕受伤特效

//使用用途:同于屏幕掉血的后处理特效 //请结合和脚本:BloodScreen 挂载至摄像机使用本特效 //本特效设计之初未考虑兼容移动设备,请注意//使用说明: //掉血获取此脚本,将showBlood设置为true,如果您需要更…

easyui 手风琴Accordion 面板的高度设置

今天接到一个新的小需求,如下图,当预算表单只有一个时,要求不显示预算表单这块的内容。 考虑到页面创建时用到了表单的回调和点击方法,所以不能单纯的移除,移除右侧表格的创建会报错,所以只能隐藏。 隐藏…

Runaway Queries 管理:提升 TiDB 稳定性的智能引擎

在数字化系统扮演重要角色的今天,数据库稳定性成为企业关注的核心问题。对于重要计算机系统而言,突发的性能下降可能对业务造成不可估量的损失。为了稳定数据库性能,用户可以从管理流程入手规范变更的测试,或者利用产品手段减少预…

【VRTK】【Unity】【VR开发】使用注意事项-Simulator没反应

【背景】 建立一个基本的VRTK项目后,用Simulator Rig模拟运行,移动鼠标后发现Simulator Rig没有任何反应。 【分析】 Console中的报错信息类似于没有启用Legacy unity input package,Legacy的意思是经典的,所以应该是指没有在p…