告别2019：属于深度学习的十年，我们必须知道的经典

发布时间：2020-01-02 10:09:08 所属栏目：数据来源：网络整理

导读：告别2019：属于深度学习的十年，我们必须知道的经典

（原标题：告别2019：属于深度学习的十年，那些我们必须知道的经典）

我们正式告别了上一个十年。

在这十年中，伴随着计算能力和大数据方面的发展，深度学习已经攻克了许多曾经让我们感到棘手的问题，尤其是计算机视觉和自然语言处理方面。此外，深度学习技术也越来越多地走进我们的生活，变得无处不在。

这篇文章总结了过去十年中在深度学习领域具有影响力的论文，从 ReLU、AlexNet、GAN 到 Transformer、BERT 等。每一年还有很多荣誉提名，包括了众多名声在外的研究成果。

2011年：激活函数 ReLU

《Deep Sparse Rectifier Neural Networks（ReLU）》

论文链接：（被引用量4071）

告别2019：属于深度学习的十年，我们必须知道的经典

早期的神经网络大多使用 sigmoid 激活函数。虽然它具有很好的效果，但是，随着层数的增加，这种激活函数使得梯度很容易出现衰减。在 2011 年的这篇论文中，ReLU 被正式提出。它能够帮助解决梯度消失的问题，为神经网络增加深度铺路。

告别2019：属于深度学习的十年，我们必须知道的经典

Sigmoid 及其导数。

当然，ReLU 也有一些缺点。在函数为 0 的时候不可微，而神经元可能会「死亡」。在 2011 年之后，很多针对 ReLU 的改进也被提了出来。

年度荣誉提名：（这一年的大部分研究集中于对激活函数的改进）

1、《Rectifier Nonlinearities Improve Neural Network Acoustic Models（Leaky ReLU）》

基于对 ReLU 进行了改进的激活函数，在 x 为负时不取 0。

论文链接：https://ai.stanford.edu/~amaas/papers/relu_hybrid_icml2013_final.pdf

2、《Fast and Accurate Deep Network Learning by Exponential Linear Units (ELUs)》

论文链接：https://arxiv.org/abs/1511.07289

3、《Self-Normalizing Neural Networks（SELUs）》

论文链接：https://arxiv.org/abs/1706.02515

4、《Gaussian Error Linear Units (GELUs)》

这一激活函数已证明比 ReLU 效果更好，BERT 等模型已使用。

论文链接：https://arxiv.org/abs/1606.08415

2012 年：掀起深度学习浪潮的 AlexNet

《ImageNet Classification with Deep Convolutional Neural Networks（AlexNet）》

论文链接：https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks（被引用量 52025）

告别2019：属于深度学习的十年，我们必须知道的经典

AlexNet 架构。

AlexNet 经常被认为是这一波人工智能浪潮的起点，该网络在 ImageNet 挑战赛中的错误率与前一届冠军相比减小了 10% 以上，比亚军高出 10.8 个百分点。AlexNet 是由多伦多大学 SuperVision 组设计的，由 Alex Krizhevsky, Geoffrey Hinton 和 Ilya Sutskever 组成。

AlexNet 是一个 8 层的卷积神经网络，使用 ReLU 激活函数，总共有 6 千万参数量。AlexNet 的最大贡献在于证明了深度学习的能力。它也是第一个使用并行计算和 GPU 进行加速的网络。

在 ImageNet 上，AlexNet 取得了很好的表现。它将识别错误率从 26.2% 降到了 15.3%。显著的性能提升吸引了业界关注深度学习，使得 AlexNet 成为了现在这一领域引用最多的论文。

年度荣誉提名：

1、《ImageNet: A Large-Scale Hierarchical Image Database（ImageNet）》

ImageNet 是斯坦福大学李飞飞等人完成的一个用于图像识别的数据集，是计算机视觉领域检验模型性能的基准数据集。

论文链接：

告别2019：属于深度学习的十年，我们必须知道的经典

ImageNet

2、《Flexible, High Performance Convolutional Neural Networks for Image Classification（Jurgen Schmidhuber 为通讯作者）》

论文链接：~juergen/ijcai2011.pdf

3、《Gradient-Based Learning Applied to Document Recognition》

论文链接：

2013 年：NLP 的经典 word2vec，开启深度强化学习时代

《Distributed Representations of Words and Phrases and their Compositionality（word2vec）》

论文链接：https://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf（被引用量 16923）

Word2vec 是由谷歌研究团队里 Thomas Mikolov 等人提出的模型，该模型能从非常大的数据集中计算出用以表示词的连续型向量。word2vec 成为了 NLP 领域的深度学习主要的文本编码方式。它基于在相同语境中同时出现词具有相似含义的思路，使文本可以被嵌入为向量，并用于其他下游任务。

年度荣誉提名：

1、《GloVe: Global Vectors for Word Representation》

论文链接：https://nlp.stanford.edu/pubs/glove.pdf

2、《Playing Atari with Deep Reinforcement Learning》

论文链接：https://www.cs.toronto.edu/~vmnih/docs/dqn.pdf（被引用量 3251）

告别2019：属于深度学习的十年，我们必须知道的经典

DeepMind 的 DQN 模型玩雅达利游戏

DeepMind 在这一年提出的用 DQN 玩雅达利游戏开启了深度强化学习研究的大门。强化学习过去大多数情况下用在低维环境中，很难在更复杂的环境中使用。雅达利游戏是第一个强化学习在高维环境中的应用。这一研究提出了 Deep Q-learning 算法，使用了一个基于价值的奖励函数。

年度荣誉提名：

1、《Learning from Delayed Rewards（Q-Learning）》

论文链接：~chrisw/new_thesis.pdf

2014 年：GAN；Adam；Attention 机制

《Generative Adversarial Networks》

论文链接：https://papers.nips.cc/paper/5423-generative-adversarial-nets（被引用量 13917）

（编辑：52刷机网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

1/4

尾页