Auto-Encoder
输入图片经过两个网络后,计算他们两个越接近越好。
类似于Cycle GAN。
encoder将高纬度数据降维,作为低纬度向量
假如噪声进行训练,encoder将图片中的噪声去除。
其实BERT而言,就是以后个auto-encoder。
Feature disentangle
黄色部分就是提取出来的语者的特征向量。
提取语者特征,进行辅助训练,相当于特征提取后,附加演化,进行最终输出。
discrete representation 离散分布
将encoder输出的向量进行二进制转换或者是one-hot变化。
encoder输出一系列的向量集,选取最优可能的向量进行decoder。
假如对应的中间输出不是向量的话,是文字的话,可能中间输出的就是文章的总结。将文字作为representation。
其中,中间的输出representation经过discriminator作为一种监督,将中间输入符合人为的可读性总结,如果没有的话,由于机器的学习可能导致人为看不懂。
Generator
将其中的decoder拿出来使用,作为一种generator,输入一个向量,输出一个图片。
Anomaly detection 异常检测
Anomaly detection 其它方式
不能使用简单地使用二类分类的问题,因为异常资料是不固定的。
具有label的分类器
加多一个信心分数,进行两次判断,除了分类还可以输出一个信心分数,进行作为一种阈值的判断。
对于系统判断来说,不一定正确率就是正确的,因为存在了数据集分布的不确定,应该使用的真值表进行判断异常率和正确率。将不同的正确数量和异常数量进行一种权重算法。
假如是没有label的资料的时候,只是存在x但是没有y,利用概率进行计算
使用概率的过程,使用的likelihood的方式
使用多种特征,构建多维度的分析图像,多维度的概率分布。
上面讲述的是一般模型进行设计,使用的是概率计算公式,我们也可以使用的深度学习的auto-encoder,上面讲述过了。
将图片还原和原始图像进行相似度比较,查看是不是异常类。