机器不学习 www.jqbxx.com : 深度聚合机器学习、深度学习算法及技术实战

机器不学习：深度学习如何在多标签分类中考虑标签间的相关性？

1 多标签问题的简单解决思路

利用神经网络，我们可以很轻松处理一个多标签问题。如标题图所示，为前馈神经网络添加适当数量的隐含层，同时在输出层使用某个阈值判断标签分类结果即为一种基础的解决思路。

上述是一种简单的从多分类问题拓展到多标签问题的解决思路，这样的思路中，我们可以用输出结果[0.1, 0.9, 0.8, 0.2, 0.85]表示该输入属于标签2、3和5（假设阈值为0.5，标签从1开始计数）。

2 存在的问题

上述思路存在的问题之一是没有考虑标签间的相关性，而这种相关性可能能够提高特定问题上模型的效果。例如，在对文章进行分类的时候，我们经常能够看到标签神经网络和深度学习一起出现，而神经网络和区块链一起出现的几率就会降低一些，我们基本可以从中得知，标签为神经网络的文章具有较大的可能也可以具有标签深度学习，这便是标签间相关性对多标签问题模型的促进效果。

3 解决思路

如今我们希望在多标签分类问题中考虑标签间的相关性，因此我阅读了较新的相关文献，对这些文献进行了总结。

3.1 COLING2018《SGM: Sequence Generation Model for Multi-label Classification》

来源链接：https://arxiv.org/abs/1806.04822

这篇论文是COLING2018 Best papers（Best error analysis & Best evaluation），其误差分析和评估方面做的比较好，论文主要的贡献是：

1. 把多标签分类问题当做序列生成问题，进而考虑标签间相关性

2. 在序列生成模型的decode部分进行了改造，不但考虑了标签间相关性，还自动获取了输入文本的关键信息（Attention机制）

3. 本论文提出的方法效果极好，指标比baseline提升很多。在关系表示上也具有非常好的效果。

模型如下图所示：

机器不学习：深度学习如何在多标签分类中考虑标签间的相关性？