离散特征处理 离散特征是什么 怎么处理离散特征 One-hot编码 Embedding嵌入 从one-hot到Embedding,已经节省了很多的存储空间,但当数据量大的时候,还是占空间,所以工业界仍会对Embedding进行优化 而一个物品所对应的Embedding参数是通过训练来得到的。 参数是值得训练的,因为参数实际上代表着向量的位置信息。 这种位置信息会使得性质类似的物品更加聚合到一块去,而性质差异较大的物品在空间上更加分散。 而Embedding并不是完全和One-Hot向量脱离关系,可以通过One-Hot向量进行存取对应的向量。