Halcon参考手册异常检测知识总结

1.1异常检测介绍

本章将介绍如何使用基于深度学习的异常检测和全局上下文异常检测。通过这两种方法,我们想要检测图像是否包含异常(异常是指偏离正常的事物,未知的事物)。

异常检测或全局上下文异常检测模型学习无异常图像的共同特征。经过训练的模型将推断,输入图像只包含学习特征的可能性有多大,或者图像是否包含其他内容(这被解释为异常现象)。这个推理结果作为一个灰度值图像返回。其中的像素值指示输入图像中相应像素显示异常的可能性有多大。

我们区分了两种可以使用的模型类型:异常检测和全局上下文异常检测。

异常检测(模型类型为'anomaly_detection')的目标是结构异常,因此在训练过程中没有学习到的任何特征(这些可能包括划痕、裂缝或污染)。

图(1)一个可能的异常检测示例

在图(1)中,输入图像的每个像素都被赋予一个值,该值表明该像素是异常的可能性有多大。虫子不是模型在训练中看到的无虫苹果的一部分,因此它的像素得到了更高的分数。

全局上下文异常检测(模型类型'gc_anomaly_detection')包括两个任务:结构异常检测和逻辑异常检测。结构异常主要包括未知特征,如划痕、裂缝或污染。逻辑异常包括图像中对象的数量错误或位置错误。

图(2) 一个可能的全局上下文异常检测示例

在图(2)中,输入图像的每个像素被分配一个值,该值表明该像素是异常的可能性有多大。因此,可以检测到两种不同类型的异常,结构异常和逻辑异常。结构异常:一个苹果中有一条虫子,这与模型在训练中看到的苹果不同。逻辑异常:一个苹果被放在柠檬中。虽然苹果本身是完整的,但违反了逻辑约束,因为模型在训练过程中只看到了正确分类的水果的图像。

全局上下文异常检测模型由局部子网和全局子网组成。该模型可以简化为一个子网,以提高运行时和内存消耗。如果单个子网性能足够好,建议这样做。详细信息请参见get_dl_model_param中的参数'gc_anomaly_networks'。设置'gc_anomaly_networks'后,需要再次评估模型,因为该参数会显著改变全局上下文异常检测的性能。

局部子网(Local subnetwork):该子网用于在较小的局部范围内对图像进行异常检测。它的设计目的是检测结构异常,但也可以发现逻辑异常。因此,如果可以通过分析图像的单个patches来识别异常,则由模型的局部子网来检测异常。有关如何定义局部子网的相关信息,请参阅get_dl_model_param中参数'patch_size'的描述。

全局子网(Global subnetwork):该子网用于在大范围或全局范围内对图像进行异常检测。它的设计目的是检测逻辑异常,但也可以发现结构异常。因此,如果需要查看大部分或全部图像来识别异常,则由模型的全局组件检测异常。

图(3)图像训练的一个典型任务

在图(3) 中,苹果和柠檬完好无损,分类正确,贴上了正确的标签。

图(4)一些可以通过全局上下文异常检测的示例

在图(4-1)中,逻辑异常,最有可能被局部子网检测到(标签异常);图(4-2)结构异常,极有可能被局部子网检测到(苹果上有虫子);图(4-3)逻辑异常,极有可能被全局子网检测到(排序错误);图(4-4)逻辑异常,很可能被全局子网检测到(苹果有缺失)。

1.2 异常检测通用工作流程

(1) 数据预处理

①通过函数read_dl_dataset_anomaly()函数来转换数据集的信息内容。它创建一个字典DLDataset作为数据库,并存储有关数据的所有必要信息。

②使用split_dl_dataset()函数进行数据集的拆分。

③网络对图像提出了相应的要求,例如图像大小和灰度值范围可以使用get_dl_model_param()算子获取。

④使用preprocess_dl_dataset()函数对数据进行预处理。使用create_dl_preprocess_param()函数,来设置指定预处理参数,例如图像大小,并将所有参数及其值存储在字典DLPreprocessParam中。

(2) 模型训练

①采用create_dl_train_param()函数,设置训练参数并将其存储在字典TrainParam中。

②采用train_dl_model()函数训练模型。此函数调用normalize_dl_gc_anomaly_features()函数,将类型为'gc_anomaly_detection'的模型适应于数据集的图像统计。

然后分别调用相应的训练算子 train_dl_model_anomaly_dataset ('anomaly_detection') 或'train_dl_model_batch' ('gc_anomaly_detection')。此算子期望的参数是模型句柄DLModelHandle、包含数据信息的字典DLDataset和包含训练参数的字典TrainParam。

③归一化网络。此步骤仅在使用全局上下文异常检测模型时才需要。异常分数需要通过normalize_dl_gc_anomaly_scores()函数进行归一化。这样做目的是在稍后对异常分数应用阈值时获得合理的结果(请参阅下面的“特定参数”一节)。

(3) 模型评估

①设置可能影响评估的模型参数。

②使用evaluate_dl_model()进行模型的评估。此函数需要一个带有评估参数的字典GenParam。

③字典EvaluationResult保存所需的评估度量。

(4) 模型推理

①使用get_dl_model_param()算子或者create_dl_preprocess_param_from_model()函数获取模型对图像的要求。

②使用set_dl_model_param()算子设置下面“模型参数”一节中描述的模型参数。

③使用gen_dl_samples_from_images()函数为每张图像生成数据字典DLSample。

④使用preprocess_dl_samples()函数对每张图像(都要像训练图像一样)进行预处理。在预处理步骤中保存字典DLPreprocessParam时,可以直接使用它作为输入来指定所有参数值。

⑤使用apply_dl_model()算子进行模型推理,并从字典DLResult中获取推理结果。

1.3 异常检测补充说明

(1) 数据(Data)

我们区分用于训练、评估和新图像推理的数据。作为一个基本概念,该模型通过字典处理数据,这意味着它从字典DLSample接收输入数据,并分别返回字典DLResult和DLTrainResult。

(2) 类(Classes)

在异常检测和全局上下文异常检测中,有两类:'ok',意思是没有异常,类ID为0。'nok',表示异常,类别ID为1(对于ID >0的像素值,请参见下面的“评估数据”小节)。这些类既适用于单个像素,也适用于整个图像。

(3) 训练数据(Data for training)

该数据集仅包含无异常的图像和相应的信息。它们必须以模型可以处理它们的方式提供。关于图像要求,请在下面的“图像”一节中找到更多信息。训练数据用于为您的特定任务训练模型。借助这些数据,模型可以学习无异常图像的共同特征。

(4) 评估数据(Data for evaluation)

该数据集包括没有异常的图像,但也可以包含有异常的图像。这个集合中的每个图像都需要一个指定图像类别的真值标签(参见上面的部分)。这表示图像是否显示异常('nok')或没有('ok')。如果图像包含在DLSample字典中,则可以在像素级别上直观地评估模型在查找异常方面的性能。在该图像中,每个像素表示类ID,因此输入图像中对应的像素是否显示异常(像素值> 0)或不显示异常(像素值等于0)。

图(5) anomaly_file_name示例

在图(5)中,为了提高可见度,灰度值被用来表示数字。图(5-1)为输入图像,图(5-2)对对应的normaly_file_name提供类注释,0:'ok'(白色和浅灰色),2:'nok'(深灰色)。

(5) 图像(Images)

该模型对图像的尺寸、灰度值范围、类型等提出了要求。具体的值取决于模型本身。有关不同模型的具体值,请参阅read_dl_model的文档。对于读模型,可以使用get_dl_model_param查询它们。采用preprocess_dl_samples()函数对图像进行预处理。

(5) 模型输出(Model output)

训练输出根据使用的模型类型不同而不同:

异常检测:作为训练输出,train_dl_model_anomaly_dataset()算子将返回一个字典DLTrainResult,其中包含训练期间收到的最佳获得错误和实现该错误的时间点。

全局上下文异常检测:作为训练输出,train_dl_model_batch()算子将返回一个字典DLTrainResult,其中包含总损失的当前值以及模型中包含的所有其他损失的值。

作为推理和评估输出,模型将为每个样本返回一个字典DLResult。

对于异常检测和全局上下文异常检测,该字典包括以下额外项:

normaly_score:表示整个图像包含异常的可能性的分数。这个分数是基于normaly_image中给出的像素分数。

对于全局上下文异常检测,根据所使用的子网,也可以只计算局部(anomaly_score_local)和全局(anomaly_score_global)子网的异常分数。

anomaly_image:一个图像,其中每个像素的值表示其对应的像素在输入图像中显示异常的可能性(参见下图)。对于异常检测,这些值对于全局上下文异常检测没有约束。根据所使用的子网,在使用全局上下文异常检测时,也可以仅通过局部(anomaly_image_local)或全局(anomaly_image_global)子网计算异常图像。

图(6) normaly_image示例

在图(6)中,为了可视化,灰度值被用来表示数字。图(6-1)提供类注释的anomaly_file_name, 0: 'ok'(白色和浅灰色),2:'nok'(深灰色)图(6-2)为对应的anomaly_image。

(7) 特定参数(Specific Parameters)

对于异常检测或全局上下文异常检测模型,使用set_dl_model_param设置模型参数和超参数。在get_dl_model_param中更详细地解释了模型参数。由于异常检测模型的训练是一次利用完整数据集完成的,而不是批处理,因此某些参数(例如“batch_size_multiplier”)没有影响。

该模型返回分数,但不将像素和图像分类为是否显示异常。对于这种分类,需要给出阈值,为视为异常的像素或图像设置最小分数。可以使用compute_dl_normaly_thresholds()函数来估计可能的阈值。可以通过threshold_dl_normaly_results()函数来应用这些阈值。

作为结果,该过程将以下项(取决于阈值)添加到样本的字典DLResult中:

①anomaly_class

整个图像的预测类别(对于给定阈值)。对于全局上下文异常检测,根据所使用的子网,也可以仅通过局部(anomaly_class_local)和全局(anomaly_class_global)子网计算异常类。

②anomaly_class_id

整个图像的预测类的ID(对于给定的阈值)。对于全局上下文异常检测,根据所使用的子网,也可以仅通过局部(anomaly_class_id_local)和全局(anomaly_class_id_global)子网计算异常类ID。

③anomaly_region

由所有被认为显示异常的像素组成的区域(对于给定的阈值,请参见下图)。对于全局上下文异常检测,根据使用的子网,也可以只计算局部(anomaly_region_local)和全局(anomaly_region_global)子网的异常区域。

图(7) anomaly_region 示例

在图(7)中,为了可视化,灰度值被用来表示数字;图(7-1)为得到的像素分数的异常图像;图(7-2)为对应的异常区域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/277236.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

map 和 multimap 存储区别 、取消自动排序 unordered_map

测试代码 std::map<int, CString > Map1;Map1.insert({ 6, L"HN400*200*11*8" });Map1.insert({ 5, L"HN200*200*11*8" });Map1.insert({ 7, L"HN100*200*11*8" });Map1.insert({ 4, L"HN200*200*11*8" });Map1.insert({ 4, L…

Spring对JUnit4和junit5的支持

Junit4支持 第一步&#xff1a;准备工作&#xff1a; 引入JUnit4的依赖&#xff0c;Spring对JUnit支持的依赖还是&#xff1a;spring-test&#xff0c;如下&#xff1a; <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://ma…

致命解药,冒险游戏剧情!

致命解药&#xff1a;僵尸末日的生存探索 《致命解药》是一款由两人团队精心制作的单机冒险游戏。这款游戏的故事发生在僵尸横行的末日世界&#xff0c;人类在绝望中寻找希望&#xff0c;在黑暗中寻找光明。而玩家的使命&#xff0c;就是在这个残酷的世界中&#xff0c;寻找能…

【数据结构c实现】顺序表实现

文章目录 线性表线性表的顺序实现顺序表结构顺序表初始化增配空间Inc打印顺序表show_list线性表长度length尾部插入push_back头部插入push_front尾部删除pop_back头部删除pop_front按位置插入insert_pos按值查找find按位置删除delete_pos按值删除delete_val排序sort(冒泡&#…

VSCode解决本地浏览器需要跨域问题

这里写目录标题 测试用代码执行代码后控制台报错现象解决方案 测试用代码 先把测试用的代码贴出来 测试代码结构 index.html <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Com…

ShellCode注入程序

程序功能是利用NtQueueApcThreadEx注入ShellCode到一个进程中&#xff0c;程序运行后会让你选择模式&#xff0c;按1为普通模式&#xff0c;所需的常规API接口都是使用Windows原本正常的API&#xff1b;在有游戏保护的进程中Windows原本正常的API无法使用&#xff0c;这时候需要…

Android自定义图片涂鸦View实现绘制和橡皮擦功能

在Android应用开发中,涂鸦功能是一个常见的需求,用户可以在画布上进行自由绘制和擦除操作。本文将介绍如何使用自定义View来实现一个具备绘制和橡皮擦功能的涂鸦View,并提供了相关示例代码。 1. 引言 在移动应用开发中,涂鸦功能为用户提供了一种直观的绘图体验,并广泛应用…

怎么制作GIF动图?教你这几个简单方法

怎么制作gif动图&#xff1f;GIF动图是一种非常有趣且实用的图片格式&#xff0c;它能够以短小精悍的方式展示动画效果&#xff0c;因此在社交媒体和聊天应用中备受追捧。本文将向您介绍几种制作GIF动图的方法&#xff0c;让您轻松制作出自己的动图。 GIF动图制作方法一&#x…

音视频技术开发周刊 | 323

每周一期&#xff0c;纵览音视频技术领域的干货。 新闻投稿&#xff1a;contributelivevideostack.com。 Meta牵头组建开源「AI复仇者联盟」&#xff0c;AMD等盟友800亿美元力战OpenAI英伟达 超过50家科技大厂名校和机构&#xff0c;共同成立了全新的人工智能联盟。以开源为旗号…

建立海外SD-WAN专线网络的成本分析

高速、稳定的网络连接是企业成功拓宽海外市场和开展海外业务的关键因素之一。作为一种提供更高质量和性能的连接的网络解决方案&#xff0c;海外SD-WAN专线被越来越多的企业选择。以下将详细介绍建立海外SD-WAN专线网络的成本组成&#xff0c;以协助企业更全面地了解和规划对网…

C#基础——类、对象和属性

C# 属于 面向对象 的编程&#xff0c;“万物皆对象” 面向对象编程的三大特性&#xff1a;封装、继承、多态。 通过类能过较好的体现该语言的特点 类&#xff1a;是具有相同属性和行为特征的集合 类的语法格式&#xff1a; 访问修饰符 class关键字 类名 两种创建类的方式 第…

单片机Freertos入门(二)任务的创建、删除

1、串口配置 首先将串口进行配置&#xff0c;后续经常会应用&#xff0c;具体步骤点击&#xff1a;串口配置。 2、任务 创建一个任务&#xff0c;就是开辟一个空间、每个任务中都会有while&#xff08;1&#xff09;死循环。 2.1相关函数 动态创建&#xff1a;xTaskCreate…