深度学习光环背后,哪些机器学习的新进展被忽视?
|
反向强化学习采用了和传统强化学习相同的基础设定,然后做相反的事。在强化学习里,给定一个回报函数,让模型找到会得到最大回报的策略;在反向强化学习里,给定一个策略,然后模型找到可以被这个策略最大化的回报函数。 它的关键在于从对行为的观察中学习,即便你可能无法访问回报函数,或者无法模仿特定的执行器的行为。反向强化学习已经成功训练出了和人的行为很类似的玩第一人称射击游戏的 AI。 反向强化学习中有一个重大的开放问题是如何从并非最优的演示中学习。目前的系统能很好地模仿人类,以至于它们体现出的失效模式也和人类相似。想要从人类身上学习,但是得到比人类更高的表现,理论上看起来是可行的,但做起来非常困难。近期的文献综述可以参考 https://arxiv.org/abs/1806.06877。 自动机器学习 AutoML 这个自领域很重要,也很酷。可以把它看做一个决策树,在给定数据集以后帮你决定什么样的数据处理流水线是最好的。它很有用,也会在整个机器学习领域中占据更多位置。谷歌目前就已经面向商业用户提供 AutoML 服务,不过显然这是面向自己没有编程能力的客户的。 目前最热门的自动机器学习算法是 Auto-sklearn(https://automl.github.io/auto-sklearn/master/ ),还有基于它进一步改进的 Mosaic。AutoML 也有一些比赛,排名前几的算法都有很高的参考价值。 (编辑:52刷机网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
