加入收藏 | 设为首页 | 会员中心 | 我要投稿 52刷机网 (https://www.52shuaji.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 智能家居 > 正文

日播放量200亿,快手背后的AI异构计算技术解密

发布时间:2019-12-23 00:16:37 所属栏目:智能家居 来源:网络整理
导读:从Gif工具一跃成为日活最高、最赚钱的短视频内容社区之一,快手背后有什么硬核技术?
日播放量200亿,快手背后的AI异构计算技术解密

智东西(公众号:zhidxcom)
文| 李水青

近年来,短视频成为移动互联网全速发展的地方,而快手也成为最大的流量收割者之一。

据统计,2018年,快手短视频App日活达到2亿人次,日播放量达200亿;大约每7个中国人中就有一个快手的内容生产者,日均新增作品超过1500万个;同时,有1600多万人通过快手App获得收益,总体收超过200亿。

自2011年成立以来,快手从一个Gif生成工具一跃成为日活最高、最赚钱的短视频内容社区之一,并且相继得到百度、腾讯等互联网巨头、头部内容平台的投资,其发展速度令人咋舌。

而作为新一代视频平台,快手的AI“黑科技”也贯穿于其内容、分发、互动的各个环节,令人想要一探究竟。

近日,智东西来到快手总部,有幸探访到了快手异构计算架构师钟辉,并向他了解到了这家“国民级视频社区”背后的AI技术应用及英特尔为其提供的硬核“装备”。钟辉的电脑屏幕上显示着“距离春节2020年春节38天”的倒计时,这对他来说就像“高考倒计时”。据了解,快手上个月刚刚中标了2020年央视春晚独家互动合作伙伴。

日播放量200亿,快手背后的AI异构计算技术解密

一、快手,越来越像家AI公司

很多“快手”用户都能体验到,快手APP中有许多酷炫的视频特效和包装功能,这也是快手AI“炫技”的一大窗口。

在记录和生产体验方面,“梵高”特效中的场景语义分割、“雷神”中的手势识别、国内首创的“智能剪影”、不挑手机配置的“变童颜”特效中的移动终端实时GAN等都是自主研发。

日播放量200亿,快手背后的AI异构计算技术解密

在消费互动体验方面,其视频的增强、转码、播放、渲染以及直播和游戏服务都涉及多个环节不同的智能技术,比如将720P视频提升到1080P的超分算法等。

从内容方面来说,快手在内容安全、原创保护和视频配音等侧重方面有一套自己的“多模态内容理解”逻辑。

具体来说,快手使机器提取用户上传的文本、图像、音频中的特征,通过知识图谱、语义理解、分类检索的技术来为视频配上跌宕起伏的音乐、审核内容是否涉及黄赌毒、判别内容是否山寨其它的网红视频等。

日播放量200亿,快手背后的AI异构计算技术解密

快手相关负责人告诉智东西,快手更加致力于通过机器学习、强化学习、图表达学习等技术手段践行“普惠”价值观。

具体来说,通过全新一代推荐系统,快手一方面采用“基础曝光+爬坡”的机制,使得所有用户的内容既能得到关注,又能沉淀出精品;另一方面,利用“基尼系数”来平衡流量分配,适当将大主播的流量分配给长尾用户,从而减弱流量维度的“贫富差距”。

日播放量200亿,快手背后的AI异构计算技术解密

二、面临存储、网络和计算挑战,搭建异构计算平台

AI和大数据驱动,体现在快手从“内容生产”到理解、分发、消费、互动的各个环节。作为一家主打短视频/直播的全民性社区,快手的AI应用的数据中心在存储、网络、计算三个方面面临巨大挑战。

快手异构计算架构师钟辉说:“一方面,日均新增超1500万作品,内容数据、行为数据、以及由数据特征提取带来巨大存储挑战;另一方面,在训练和推理当中因为特征参数越来越多,导致模型变得越来越大,由此带来这些数据在网络当中传输的挑战。再加上每天千亿级的展示,这当中也带来了计算和内存挑战。”

日播放量200亿,快手背后的AI异构计算技术解密

快手的一大关键解法是构建“异构计算平台”。

简单地说,“异构计算”就是在CPU加上各种加速器,如FPGA(Field Programmable Gate Array,现场可编程门阵列)、ASIC(Application Specific Integrated Circuit,专用集成电路)、GPU等等。

近年来,CPU性能提升已经遇到了明显瓶颈,每年仅提升约3%,但是数据的增长率却达到30%,所以供需之间有一个巨大的缺口,异构计算应运而生。

在加速器上,快手选择英特尔的FPGA产品加持其数据中心。FPGA是可编程的器件,具有灵活、低延迟的特点,正好契合快手快速发展的AI模型、算子。

钟辉说:“相比于GPU,FPGA更适用于线上强调实时推理的应用场景,并且在数据中心,FPGA是有网口的,而GPU是没有的,所以有一些任务GPU是不擅长做的。”

日播放量200亿,快手背后的AI异构计算技术解密

三、三大类异构平台,基于英特尔FPGA

钟辉介绍,快手异构平台分为三大类,分别是基于英特尔A10、E3S10和PAC S10的器件。

以A10为例,它的峰值算力可以达到1.366TFLOPS,它也有一列列的片上的SRAM,这就构成了片上的分布式存储,可以提供6MB的SRAM;区别于CPU和GPU,它的片上的SRAM是分布式的,所以它可以提供高达8TB/s的并行带宽,非常满足深度学习模型的需求。

日播放量200亿,快手背后的AI异构计算技术解密

另外,A10也有片外的DDR,从接口来说,它提供了PCIe的接口,可以以加速卡的形式插在服务器上,构成一个异构计算系统。

(编辑:52刷机网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读