富媒体时代,视频与AI的“生态发酵”
【摘要】透过画质问题和内容筛选的发展过程,我们发现AI技术真的已经不再虚无缥缈,目前AI赋能下的视频行业新业态已经得以凸显,未来它将带给我们什么样的惊喜呢,相信在不久的将来我们会找到答案。
金评媒(http://www.jpm.cn)编者按:透过画质问题和内容筛选的发展过程,我们发现AI技术真的已经不再虚无缥缈,目前AI赋能下的视频行业新业态已经得以凸显,未来它将带给我们什么样的惊喜呢,相信在不久的将来我们会找到答案。
伴随着移动互联网的高速发展以及泛娱乐化的井喷,视频制作的门槛也大大降低,UGC视频创作逐渐崛起,视频时代已经到来,而围绕视频时代所带来的表现形式也是多种多样,视频生产社会化进程加快,视频产业也迎来了大爆发。
然而野蛮生长往往也会带来许多弊端,对于视频企业来说,富媒体时代同样有着诸多痛点亟待解决。
富媒体时代的双刃剑:视频产业井喷发展,内容质量良莠不齐
富媒体时代的视频行业,已然是一片花团锦簇,然而与“多”如影随形的往往是“质”,视频产业的质包含两个层面,一是视频内容本身的质量,二是视频画质方面的问题。
先说画质问题,这是影响用户体验的最直接因素。目前视频输出渠道中,画质的痛点也各有不同。可能是由于拍摄时间久远,所需设备昂贵等;也有可能存在视频平台出于节省带宽的考虑,将码率设置较低。还有一种就是视频录制本身设备简陋,例如直播和小视频,可能存在主播硬件配置低,难以保证传输画质的高分辨率或者护腕直播场景网络差。
以直播为例,直播整个链路是比较长的,包含有接流、转码、切片、分发、下载等众多环节,链路上任何一个节点有问题,都可能导致视频不能播放或者画质质量差。对于直播平台来说,为了保障各种网络环境下能够流畅的观看视频,需要对输入流进行编码及封装格式的转换。而且还需要减少到用户的传输链路。
因此,对于很多视频企业来说,现有的解决方案不仅流程多效率低,而且这也导致了成本偏高,而实际效果却并不完全尽如人意。
除此之外,内容筛选问题是视频企业的又一大难题。
随着互联网业务的大力发展,互联网给人们带来了更便利、更快速、更多元化的信息交互形式的同时,也带来信息交互过程中的安全隐患问题,如何设计更高效的富媒体信息管控方案成为了信息化过程中最为重要的一环。
国家层面上,也越来越重视互联网信息的安全,其中很重要的一点是保障网络内容的和谐干净,防止人民受到涉政、涉黄、诈骗等违规违法信息的侵害,降低社会和经济损失。现在的视频输出渠道多,UGC数量庞大,但内容筛选又必须严格。而常规的人工筛选,成本高,效率低,合格率全行业也只有80%。如何进行视频内容的管控和筛选无疑成了一大难题。
基于AI发展下的诗和远方
当下人工智能热度可谓是空前高涨,而伴随着相关技术的飞速发展,曾经AI这一虚无缥缈的概念如今也融入了越来越多的行业。通过技术方面的赋能,对这个行业进行改造和赋能,从而创造更大的财富。
那么人工智能能不能和视频领域相结合,从而解决前面我们提到的现在视频公司所面对的问题呢?从目前的情况来看,这样想法并不是不可能。
先说视频画质,与之有些类似,容易让人联想到的是图片画质问题,近年来随着技术的进步,国外有人探索使用深度学习和神经网络等人工智能的手段来将传统摄像头拍摄出的“渣画质”照片“还原”成更逼真的照片。这也让人们相信视频画质也可以通过AI技术进行改善充满期待。
而在视频内容筛选方面,AI同样让人期待不已。在当下很多信息流的资讯类平台中,基于人工智能深度学习的算法识别与筛选功能已经表现出色,在对内容的推送可以实现精准化。
虽说图文和视频是两种不同的内容形态,但终归是有相似的需求原理。近年来,人脸识别以及利用机器学习来解读视频的声音和图像信息等技术也得到了突飞猛进的发展,很多科技公司已经掌握了相关技术,能够屏蔽直播或者录制视频中的情色信息。
可以说伴随着AI技术的不断发展,通过AI解决当前视频公司所面对的画质差、筛选难等问题已经成为必然。
从虚无到落地:AI赋能下的新视频生态凸显
从目前来看,随着神经网络技术以及基于深度学习的超分辨率技术以及深度学习的画质修复技术的快速发展,一些具备技术基因的科技公司已经具备了解决视频公司痛点的能力。
先说画质方面,近年来出现的超分辨率技术,可为视频提供商和用户大幅节省存贮成本与传输带宽,大大缓解了上述问题带来的成本压力,这种技术能够将高清视频缩放成低分辨率视频进行传输。
而在视频内容筛选方面,算法对于敏感图像的识别准确率已经很高基本达到可以在生产环境应用的程度。人工智能的使用原理类似于早期的黑白名单、过滤器以及内容特征识别、贝叶斯过滤、 相似度匹配规则等,通过机器学习、大数据分析、人机识别等技术来实现。
在今年年中谷歌宣布了下一代图像识别技术Google Lens,能够允许人工智能识别图片中的对象和定位等,以及利用AI做到一些非常酷的事情。通过其知识图谱,帮助AI识别图片或视频中的对象。
在今年的5月22日和6月13日,阿里云机器学习在斗鱼直播上也分享了如何使用TensorFlow技术实现图像识别的技术直播。对画面、敏感词汇等进行准确洞察。
除此之外,金山云也推出的AI画质+产品以及AI图像安全监控平台。在画质方面,可以有效压缩图像视频大小,减少带宽和存储空间,移动端的实时处理,还可针对不同类型视频采用相应模型处理。在内容筛选方面,可以结合文字、声纹识别、图片等综合信息进行判断,同时支持颜值识别、性别识别、人脸识别、通用场景识别、通用物体识别等多种方式。
由此可见,通过AI赋能可以有效解决富媒体时代视频公司所面对的问题。不过人工智能的大幕才刚刚拉开,今天我们谈到的画质和内容筛选,包括一些视频公司通过人工智能进行内容创作,这其实更多的只是涉及到人工智能对视频领域产业链上层的改造。而如今的视频领域已经延伸出了更长的产业链,这也势必将是人工智能大显身手的地方。
就比如我们今天所讲的画质问题,图像处理能力赋予了机器看世界的能力,在未来,图像处理技术势必会帮助视频公司更好的变现,尤其是在在消费级视频场景中的应用可谓是更为广泛,包括智能追踪、直播互动、广告精准推荐等,实现视频场景匹配和广告自动投放。
透过画质问题和内容筛选的发展过程,我们发现AI技术真的已经不再虚无缥缈,目前AI赋能下的视频行业新业态已经得以凸显,未来它将带给我们什么样的惊喜呢,相信在不久的将来我们会找到答案。
(编辑:杨少康)