加入收藏 | 设为首页 | 会员中心 | 我要投稿 52刷机网 (https://www.52shuaji.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 4G频道 > 通讯 > 正文

八年了!除了NLP和CV,人工智能就不能干点别的?

发布时间:2020-01-01 09:40:07 所属栏目:通讯 来源:网络整理
导读:八年了!除了NLP和CV,人工智能就不能干点别的?

中间存在一个技术层面的问题。这就是我前面提到的十几个技术子问题。对于计算机视觉而言,它们是用于NLP的图像识别,图像分割和图像生成,包括解析,文本分类,机器翻译和问题解答等方面,其中通用语言理解评估(GLUE, General Language Understanding Evaluation)基准很好地代表了后者。

大多数研究人员和行业专家都处于这一级别。当然不是所有的人都专注于涉及GLUE或视觉任务的研究,你可能就是一个例外而不同意我的说法。但是,作为局内人,你可以清楚地明白我们中有多少人处于这个级别之中,又有多少人从事与这份任务清单本身、变形或组合之外的工作。

中间层的界限取决于理论科学底层的发展状况。在底层出现的任何新想法,例如梯度下降,存储单元或卷积滤波器,都可以在技术问题级别实现一系列新动作。

正如理论科学的进步可以实现整个技术领域的扩展一样,解决单个技术问题也可以实现金字塔顶端的一系列工业应用成为可能。

该模型说明了行业的一个基本限制:虽然将产品从技术问题的层次转换到工业应用相对简单,但是反过来则难以实现。将应用程序流程视作一系列单向箭头,如果我们在技术水平上只有一群特定的计算机视觉和自然语言处理工具,那么许多工业应用将无法实现。如果事实是这样,绝大多数人都会这样做。一位需要设计工业应用程序的AI专家最初希望在技术层的某个地方找到答案,但实际上可能会走向更广泛且令人兴奋的技术问题。

走进AI

技术问题和工业化实践的当前状态使得从应用程序到现有技术工具的反向路径几乎难以实现。现有的AI工具箱是为计算机视觉和自然语言处理(NLP)中特定的应用量身定制的,而这些工具越先进,其关注范围就越窄。

以数据的大小为例,在植物基因组学中,我们从拟南芥的1.35亿个字母基因组开始。如果将其按比例成卷打印,一个拟南芥基因组的每个数据点将占用150卷,这还仅仅只是开始。番茄基因组将生成9.5亿个字母文本或1,055卷印刷量,大麦将生成53亿个字母或5,888卷,小麦将生成170亿个字母或18,888卷。当前的NLP无法处理这么大数据量的任何东西,我们目前所有的用于NLP的现代深度学习工具,例如类似变压器的网络,只能处理长达数千个元素的序列。

另一个例子是数据的性质。基因组由四个离散的核苷酸组成,这些核苷酸由四个字母分别表示:A,C,T和G。一个核苷酸的T字母数量不容许出现多一个或者少一个的任何偏差,此外,将单个T更改为其他字母,则可能导致完全不同的表型,致命疾病或致死性疾病。

上述潜在问题都限制了为连续数据开发的计算机视觉技术的使用。将这些数据规模加总,以方形四通道图像表示的人类基因组将具有54,772 x 54,772像素的分辨率,这远远超过了现代计算机视觉神经网络可以处理的分辨率水平。

基因组数据的性质和大小对我们目前所有最先进的深度学习技术提出了挑战,在计算机视觉或NLP领域中迄今还没有可借鉴的神经网络体系或训练实践能够解决上述问题。

天文学,化学,材料科学等数据丰富的学科,都存在着类似的问题:它们无法使用局限于狭窄的计算机视觉和NLP解决方案的现有AI工具集。目前有几种流行的解决方法,例如将十六进制数据转换为图像,调整其大小之后再使用计算机视觉工具等,但它们并没有太大帮助。

在这一点上,那些坚持不懈地寻求解决方案的人别无选择,只能进入人工智能的最深层次,即理论层次。 AI生态系统的这一根源促使了很多发现,包括关于深度神经网络如何工作,不同体系结构如何影响其行为,不同激活功能如何与特定数据分布相互关联等。换句话说,你可以使用这些工具创建自己的工具箱,并应用于你关心的工业程序。

这是一场艰难的旅程,它需要时间,深厚的专业知识,奉献精神和些许运气,但最终,你将在AI生态系统中开发出全新的技术问题层。尽管是为特定的工业应用而构建的,但该新工具集可以很多解决其他问题,例如解决图像识别的技术可以为各种产品和产品原型提供新的思路,从放射学分析到自动驾驶系统例如Tesla Autopilot等都将受益于此。

image

解决计算机视觉和NLP的技术问题是一条非常可靠,可预测和安全的途径。在这些领域有很多研究小组,初创公司和知名公司。专门研究计算机视觉或NLP还可以确保你接触到前沿的工具,包括数据集,GPU技术,框架,以及大量的开源存储库等,这些储存库囊括了示例,库,基准测试和其他有用的资源。好的工具可以减轻我们的工作负担并提高生产力,这也许可以解释为什么AI人才在这两个特定领域中聚集。

另一方面,创造自己的用于天文学,遗传学,化学,材料科学,地球科学或经济学的AI工具箱是一项充满挑战,甚至偶尔令人沮丧的孤独旅程,你只能依靠自己和你的团队。但是,它可以使整个领域收益,足以建立另一个十亿美元级别的公司或一个研究机构。

(编辑:52刷机网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读