今日头条运营方法论,芯片上视觉任务的神经网

时间:2019-09-16 02:59来源:www.68455.com
原标题:B站“招安”史 原标题:今日头条运营方法论:如何短时间内打造千万级影响力? 原标题:干货 | 地平线:面向低功耗 AI 芯片上视觉任务的神经网络设计 |职播间第 2 期 作者:

原标题:B站“招安”史

原标题:今日头条运营方法论:如何短时间内打造千万级影响力?

原标题:干货 | 地平线:面向低功耗 AI 芯片上视觉任务的神经网络设计 | 职播间第 2 期

作者:庞李洁

打造千万级影响力不难,写出10w 也不难,难的是你能否做到这三点,即注重内容、研究平台、制造矩阵。

AI 科技评论按:随着这几年神经网络和硬件(GPU)的迅猛发展,深度学习在包括互联网,金融,驾驶,安防等很多行业都得到了广泛的应用。然而在实际部署的时候,许多场景例如无人驾驶,安防等对设备在功耗,成本,散热性等方面都有额外的限制,导致了无法大规模应用深度学习解决方案。

B站“红”了。

图片 1

近日,在雷锋网 AI 研习社第 2 期职播间上,地平线初创人员黄李超就介绍了 AI 芯片的背景以及怎么从算法角度去设计适合嵌入式平台高效的神经网络模型,并应用于视觉任务中。之后地平线的 HR 也进行了招聘宣讲,并为大家进行了招聘解读。公开课回放视频网址:

9月10日,哔哩哔哩与人民日报全国党媒信息公共平台正式签署战略合作框架协议,双方将联合发起媒体融合公益基金。

相信很多做自媒体的人都有这样的一个执念,就是写出刷爆朋友圈的文章,如果用一个数字来表示,那就是10w 。

黄李超:本科毕业于中山大学,在帝国理工硕士毕业之后于 2014 年加入了百度深度学习研究院,期间研发了最早的基于全卷积网络的目标检测算法——DenseBox,并在 KITTI、FDDB 等特定物体检测数据集上长期保持第一名。 2015 年,他作为初创人员加入地平线,现研究方向包括深度学习系统研发,以及计算机视觉中物体检测,语义分割等方向。

图片 2

可以说,写出10w 已经成了做自媒体、写公众号等的人的主要甚至唯一的目标,因为这个目标,众多小编努力着让自己可以凭借达成这个目标而实现逆袭。

分享主题:面向低功耗 AI 芯片上视觉任务的神经网络设计

双方合作之后,将在正能量视频产业发展、正能量内容创作激励、党媒优质内容创作人才培养等多方面开展实质性合作。该基金也将致力于解决媒体融合过程中存在的人才培养、内容激励等方面的短板,助力正能量内容供给侧改革。

但是,很多人其实陷入了这样的误区,“自媒体=公众号”,而因为这个误区,很多人陷入了无效努力的职业陷阱里,无法自拔。

分享提纲

B站与人民日报牵手弘扬正能量,一时引发舆论广泛关注。有网友对此评论道:“以前的B站已经死了,现在我叫钮祜禄·B站。”

实际上,自媒体不仅仅是公众号,也包括其他平台,比如今日头条,一点资讯,企鹅号等其他内容平台。

  1. 介绍当前 AI 芯片概况,包括现有的深度学习硬件发展情况,以及为何要为神经网络去设计专用芯片。
  2. 从算法角度,讲解如何设计高性能的神经网络结构,使其既满足嵌入式设备的低功耗要求,又满足应用场景下的性能要求。
  3. 分享高性价比的神经网络,在计算机视觉领域的应用,包括实时的物体检测,语义分割等。
  4. 地平线 2019 年最全的校招政策解读。

图片 3

在过去,写公众号就可以勉强算做自媒体人,但是现在,可以说一个自媒体人不再是单纯的公众号运营者,而是能够驾驭多个内容平台的综合人才。

雷锋网 AI 研习社将其分享内容整理如下:

B站与官方媒体渊源颇深,可以追溯到《我在故宫修文物》席卷互联网之时。然而,在近一年多的时间里,B站曾遭遇大量影视内容被下架、并多次遭央视点名,每次与官方媒体并列几乎都是负面信息。以致于此次#B站 人民日报#上了热搜,还有不少网友以为B站再遭“封杀”,点开之后才发现是场虚惊。

换句话讲,能打造自媒体矩阵,才是一个自媒体人需要拥有的核心竞争力。

今天,我将从以下三个方面来进行分享:

图片 4

一、自媒体矩阵的打造

第一,当前 AI 芯片发展的现状。这里的 AI 芯片并不是单指狭义的 AI 专用芯片,而是指广义上包括 GPU 在内所有可以承载 AI 运算的硬件平台。

对于这样的“担惊受怕”,B站自身同样深有体会。此前,《镇魂》《白蛇》被下架;范冰冰、赵薇、黄晓明深陷监管漩涡;印纪传媒、文投控股等影视公司频繁“出事”;税改席卷整个影视行业,官方整治天价片酬;爱奇艺主动放弃显示前台播放量,宣布告别“唯流量论”;古装剧遇冷,各大影视公司纷纷拥抱现实题材,也是为了政治正确……整个行业地震不断,各个公司、平台如履薄冰。

一般来说,自媒体矩阵是需要一个团队来进行打造的,一个人很难打造,这是因为,每个自媒体平台的特点不一样,内容要求不一样,流量质量不一样,最好的方式就是一个人负责一个自媒体平台的运营。

第二,在嵌入式设备的环境下如何设计高效的神经网络。这里我使用的案例都选自业界中比较重要的一些工作——也有一部分来自我们的地平线。同时这一节大部分的工作都已经落地到实际应用场景。

面对如此的监管重压,B站迅速转变策略,积极应对,不仅在APP首页开辟了“共筑中国梦”板块,还在总部大厅摆放党建学习内容,现在又与人民日报合作……B站已被彻底“招安”。或许,只有让二次元穿上“黄马褂”,B站才能在二次元视频网站的“头把交椅”上坐得更稳。

可惜,这样的团队很少,就我的观察,大多数自媒体团队精力都在公众号上(包括小程序),少数会在今日头条上进行运营。

第三,算法 硬件在计算机应用上的一些成果。

甩开A站,月活近亿,亏损缩窄

而对一个人来说,想打造自媒体矩阵,最快也是最有效的方式,就是内容分发,而这么做的目的最好只有一个,那就是追求总的阅读量,因为只有这个目标才能让你更加专注,不致分心。

介绍 AI 芯片之前,先介绍 AI 的大环境。大家都知道现在是机器学习时代,其中最具代表性的是深度学习,它大大促进图像、语音、自然语言处理方面的发展,同时也给很多行业带来了社会级的影响。例如在社交网络的推荐系统、自动驾驶、医疗图像等领域,都用到了神经图像技术,其中,在图像医疗,机器的准确率甚至大大超过了人类。

但在监管面前,一切都显得无力

总的来说,想要打造自媒体矩阵,必须具备两个能力,一个是内容的持续输出能力,一个是运营的能力,而如果在这两者间选择一个作为重心的话,内容输出肯定是首选,但也是最难的,因为它是你区别于其他自媒体最重要的标准。

图片 5

B站被“招安”,有一个循序渐进、互相博弈的过程。其间,包括B站甩开A站、遭遇海外影视剧版权重创、赴美上市、被央视点名等几个重要节点。

不过,单凭内容肯定是不行的,运营也要跟上,但这就要思考一个问题:自媒体矩阵运营的目的是什么?我的答案是获取用户或导流。

从整个互联网发展的情况来看,我们先后经历了 PC 互联网、移动互联网时代,而接下来我们最有可能进入一个智能万物互联的时代。PC 时代主要解决信息的联通问题,移动互联网时代则让通讯设备小型化,让信息联通变得触手可及。我相信在未来,所有的设备除了能够互联之外,还能拥有智能:即设备能够自主感知环节,并且能根据环境做出判断和控制。现在我们其实看到了很多未来的雏形,比如无人车、无人机、人脸开卡支付等等。不过,要让所有设备都拥有智能,自然会对人工智能这一方向提出更多要求,迎接更多的挑战,包括算法、硬件等方面。

甩开A站

那么,在自媒体平台间进行导流,是否合适,也是否值得呢?答案是肯定的,因为这是一个团队去做自媒体矩阵的原因之一,也是目的之一。那要怎么做呢?

大规模运用深度学习需要去应对很多挑战。首先从算法和软件上看,如果把 AI 和深度学习用在某个行业中,需要对这个行业的场景有深入的理解。场景中也有很多痛点需要去解决,但是是否一定要用深度学习去解决呢?在特定场景下,往往需要具备能耗比、性价比的解决方案,而不是一个仅仅能够刷数据集的算法。随着这几年算法的快速发展,人们对 AI 的期望也在不断提高,算法的发展是否能跟上大家的期望,这也是一个问题。

众所周知,B站并不是最早的二次元视频弹幕网站,在它之前,A站已经先发制人。然而,抢得先机的A站却一步步落得下风。

为了弄清楚这个问题,我们拿除微信外另一个有名的内容创作平台–今日头条来举例说明如何进行跨平台的流量获取。

从硬件上看,当前硬件的发展已经难以匹配当前深度学习对于计算资源的需求,特别是在一些应用场景中,成本和功耗都是受限的,缺少低成本、低功耗、高性能的硬件平台直接制约了 AI 技术和深度学习方案的大规模应用,这也是我们地平线致力于解决的行业难题。

图片 6

二、今日头条的运营方式

当前 AI 芯片发展的现状

在A站成长的10年里,高管动荡不断导致核心团队流失,版权纠纷、无证上岗等问题一一暴露,UP主纷纷转投B站怀抱。而另一边的B站,则不断优化用户体验,大力布局版权内容,基于二次元上下游开发全产业链生态。在清晰的发展规划下,B站将A站远远甩开,迅速占领二次元高地。

今日头条是一个以算法推荐为主的内容平台,是流量巨头,其公司旗下有很多app,比如著名的抖音、今日头条、悟空问答、西瓜视频、火山小视频等。

接下来我们介绍一下 AI 硬件的一些情况。大家都知道,最早神经网络是运行在 CPU 上的。但是 CPU 并不能非常高效地去运行神经网络,因为 CPU 是为通用计算而设计的,而且其计算方式以串行为主——虽然一些运行指令可以同时处理较多数据。除此之外,CPU 在设计上也花了很多精力去优化多级缓存,使得程序能够相对高效地读写数据,但是这种缓存设计对神经网络来讲并没有太大的必要。另外,CPU 上也做了很多其他优化,如分支预测等,这些都是让通用的运算更加高效,但是对神经网络来说都是额外的开销。所以神经网络适合用什么样的硬件结构呢?

版权重创

图片 7

图片 8

然而好景不长,正值B站顺风顺水之时,监管重压一夜袭来。

今日头条产品矩阵

在讲这个问题之前,我们先从神经网络的特性说起:

去年7月,B站的海外影视剧板块遭遇重创。由于B站版权缺失,平台境外影视剧几乎全部遭遇下架处理,包括日剧,泰剧,俄剧,英剧,挪威剧等多个剧种,无论热门还是冷门内容,都未能幸免。

对于以文字为主体的自媒体来说,抖音、西瓜视频等不会是优先选择(除非你的战略有变),只能选择在今日头条上进行内容输出和运营。

第一,神经网络的运算具有大规模的并行性,要求每个神经元都可以独立并行计算;

图片 9

对于今日头条上文字方面的内容运营,其实有三个平台要重点把握,分别是:头条号、微头条和悟空问答。

第二,神经网络运算的基本单元主要还是相乘累加,这就要求硬件必须有足够多的运算单元;

之后不久,有网友曝出B站的部分版权内容也被下架进入审核阶段,通过审核则可重新恢复上线。可见,这一次审查并非单一针对版权,而是面向B站的全部影视内容。

  1. 头条号

第三,神经元每一次运算都会产生很多中间结果,这些中间结果最后并不会复用,这就要求设备有足够的带宽。一个理想的设备,它应该有就比较大的片上存储,并且带宽也要足够,这样才能放下网络的权重和网络的输入;

尽管B站通过购买大量版权解决了此次危机,但同时,B站也切实感受到政策的不可违抗性。在监管面前,一切都显得无力。

这是今日头条上最主要的内容输出方式,其运营方式非常简单,就是写文章,尽量写原创文章,或者适当选择一些热文进行转载,我个人建议尽量原创,因为原创会倒逼自己的能力,受益无穷。

第四,由于神经网络对计算的精度并没有那么敏感,所以在硬件设计的时候可以使用更简单的数据类型,比如整型或者 16bit 的浮点数。因此,这几年大家使用的神经网络解决方案,都是 CPU 比较适合于神经网络运算的硬件(可以是 GPU、DSP、FPGA、TPU、ASIC 等)组成异构的计算平台。

赴美上市

关于文章的写作,无外乎两个关键部分,一是如何起好标题,而是如何写好文章的内容。

最常用的方案是 CPU GPU,这个是深度学习训练的一个标配,好处是算力和吞吐量大,而且编程比较容易,但是它存在的问题是,GPU 的功耗比较高,延迟比较大,特别是在应用部署领域的场景下,几乎没有人会用服务器级别的 GPU。

度过危机之后,B站的发展势头依然强劲。

先说标题,我个人很推崇关于标题的这两点起法:要么颠覆认知,要么关联权威。

应用场景下用的更多的方案是 FPGA 或者 DSP,它们功耗比 GPU 低很多,但是相对的开发成本较大。DSP 依赖专用的指令集,它也会随着 DSP 的型号变化有所差异。FPGA 则是用硬件语言去开发,开发难度会更大。其实也有一起企业会用 CPU FPGA 去搭建训练平台,来缓解 GPU 训练部署的功耗问题。

今年3月,B站在纳斯达克证券交易所正式挂牌,估值高达32亿美元,合约220亿人民币,风光一时无两。

颠覆认知,简单说就是你的标题表达的是反常理、反直觉的观点,而人一旦被颠覆认知,就会产生好奇,进而点击浏览你的文章。

虽然刚刚提了很多神经网络加速的解决方案,但是最合适的还是 CPU 专用芯片。我们需要专用 AI 芯片的主要原因是: 虽然现在的硬件工艺不断在发展,但是发展的速度很难满足深度学习对计算力的需求。其中,最重要有两点:

Q2财报数据显示,本季度内,B站营收10.27亿元,同比增长76%,净亏损7031万元,净亏损率为7%,相比于去年同期的9%有所下降。B站营收持续稳步增长,亏损进一步收窄,业绩提振下,公司股价上涨近20%。

图片 10

第一,过去人们认为晶体管的尺寸变小,功耗也会变小,所以在相同面积下,它的功耗能保持基本不变,但其实这条定律在 2006 年的时候就已经终结了

图片 11

颠覆认知型标题

第二点,我们熟悉的摩尔定律其实在这几年也已经终结了。

同时,财报也显示,B站7月的月活用户高达9800万,即将破亿。值得注意的是,在7月下旬,B站APP还曾下架整改5天。这也从侧面反映出B站用户粘性之高,短暂下架并没有产生太大影响。

关联权威,也就是和有名的人物、事件、甚至是企业产生关系,这种标题起法其实一般用于追热点,或者和颠覆认知一起使用。

我们可以看到芯片在这几年工艺的发展变得越来越慢,因此我们需要依靠专门的芯片架构去提升神经网络对计算平台的需求。

央视点名

图片 12

图片 13

然而,几乎与B站上市同时,平台被曝出一位名为“科里斯”的UP主引导10岁女孩与其“文爱”,招致监管部门关注。最终,B站和该UP主均出面道歉,后者账号被永久封禁,同时B站方面表示将在团中央权益部指导下,设立青少年维权站。

关联权威型标题

最著名的的一个例子就是 Google 的 TPU,第一版在 2013 年开始开发,历时大约 15 个月。TPU 里面使用了大量乘法单元,有 256*256 个 8 位的乘法器;片上有 28MB 的缓存,能够存储网络的参数和输入。同时,TPU 上的数据和指令经过 PCN 总线一起发过来,然后经过片上内存重新排布,最后计算完放回缓冲区,最后直接输出。第一版 TPU 有 92TOPS 的运算能力,但是只针对于神经网络的前向预测,支持的网络类型也很有限,主要以多层感知器为主。

今年6月,B站由于部分“ASMR”视频存在传播低俗甚至淫秽色情内容,打“色情擦边球”,被全国“扫黄打非”办公室约谈。B站迅速回应,并下架了相关视频内容。

对于文章来说,起标题花费的时间几乎占了一半,剩下的一半就是打磨文章内容了,而在内容上,很多人容易忽略这一点,即文章框架。

而在第二版的 TPU 里面,已经能够支持训练、预测,也能够使用浮点数进行训练,单个 TPU 就有 45TFLOPS 的算力,比 GPU 要大得多。

7月,央视报道称,B站上的动漫作品中,存在令人担忧的低俗内容,甚至有些视频涉及兄妹乱伦等,部分作品播放量上千万。对此,B站回应将加强内容审核,完善“风纪委员会”机制,发动用户对内容和社区进行自查自清。但最终,B站APP仍被下架5日,股价也受此影响,当日下降4%。

文章其实有多种框架,比较有名的是SCQR,即场景-冲突-疑问-答案,这是一种已经公式化的写法,可以直接套用。

图片 14

图片 15

而我个人最喜欢,其实是这两种写作套路:

其实我们地平线也研发了专用的 AI 芯片,叫做 BPU,第一代从 2015 年开始设计,到 2017 年最终流片回来,有两个系列——旭日和征程系列,都针对图像和视频任务的计算,包括图像分类、物体检测、在线跟踪等,作为一个神经网络协处理器,侧重于嵌入式的高性能、低功耗、低成本的方案。

从道歉封号到APP被下架,B站面临的监管压力越来越重。而且,在这几次事件中,均出现了低俗、色情等关键词,B站频频“暴雷”游走于红线边缘,若不及时对平台内容加以引导和审核,很可能招致“灭顶之灾”。毕竟,在同期,内涵段子因涉嫌传播低俗内容被永久关停,后来“二更食堂”、“暴走漫画”也迫于监管压力主动下线、关停相关产品“断臂求生”。整个行业风声鹤唳、草木皆兵,即便B站受市场欢迎、被资本青睐,也必然要向监管“臣服”。

  • 一是WWH(是什么-为什么-怎么办);
  • 二是故事 鸡汤。

图片 16

90后用户占比近93%

在微信生态里,故事是非常容易被传播的,因为在《疯传》里,故事就是传播六要素之一,在今日头条上也是如此。

比较值得一提的是,我们在我们的 BPU 架构上设计了弹性的 Tensor Core,它能够把图像计算所需要的基本单元,常用操作例如卷积、Pooling 等硬件化,非常高效地去执行这些操作。中间通过数据路由桥(Data Routing Bridge)从片上读取数据,并负责数据的传输和调度,同时,整个数据存储资源和计算资源都可以通过编辑器输出的指令来执行调度,从而实现更灵活地算法,包括各种类型的模型结构以及不同的任务。

怎么能不身负影响“未来一代”的责任

故事鸡汤文的创作非常容易,首先要收集大量故事素材,写的时候进行改编,其次是明确主题,将能与主题契合的故事进行串联。

总的来说,CPU 专用硬件是当前神经网络加速的一个较好的解决方案。针对专用硬件,我们可以根据功耗、开发容易度和灵活性进行排序,其能耗跟其他两者(开发容易度和灵活性)是相互矛盾的——芯片的能效比非常高,但是它的开发难度和灵活度最低。

昨日(9月10日),在教师节当天,人民日报宣布与B站合作,致力于解决媒体融合过程中存在的人才培养、内容激励等方面的短板,助力正能量内容供给侧改革。至此,B站不仅被彻底“招安”,还被委以重任。

明白了这点就可以知道咪蒙为什么能成功,除了她的写作经历和团队协作,就是把“故事 鸡汤”的套路流水线化,怪不得大多数自媒体人竞争不过她。

如何设计高效的神经网络

B站向党媒靠拢可以理解,那么,人民日报为什么要选择B站呢?

至于WWH的写法,是需要长时间磨练的,因为这需要对一个问题进行仔细剖析和论证,需要强大的逻辑推理能力,而如果能长时间坚持这种写法,对于逻辑思维的锻炼也是大有裨益的。

说了这么多硬件知识,接下来我们讨论怎么样从算法角度,也就是从神经网络设计的角度去谈怎么加速神经网络。相信这个也是大家比较关心的问题。

编辑:www.68455.com 本文来源:今日头条运营方法论,芯片上视觉任务的神经网

关键词: 公司 开发 视频 媒体 今日