马栏山上绽放智能之花
长沙晚报掌上长沙9月9日讯(全媒体记者 尹玮 实习生 黄楠)8日下午,首届“马栏山杯”国际音视频算法优化大赛颁奖盛典暨高峰论坛在马栏山举行。该活动是2020互联网岳麓峰会的重要组成部分。
前沿课题源自业界需求
马栏山视频文创产业园聚集了大量音视频相关企业。在一般人印象中,音视频行业属于文化创意范畴,但实际上它的发展也离不开科技支撑。今年5月,园区和芒果TV联合举办了首届“马栏山杯”国际音视频算法优化大赛,向音视频领域的3个前沿课题发起了挑战,包括视频特定点跟踪、视频推荐、视频画质损伤修复。
这3个课题都是基于业界发展的需要而提出来的。以视频特定点跟踪为例,它要解决的是广告植入的问题。这是困扰视频网站、广告主和观众已久的难题。
传统上,视频网站会在正片开始之前,插入一段贴片广告。观众在选择花钱成为会员之后,就可以跳过这段广告直接观看正片。但这一商业模式有一个缺陷,它将广告主与观众放在了对立面上,观众成为会员的比例越高,广告的效果越差。结果就是广告收入和会员收入会呈现此消彼长的结构性矛盾。
为解决这一矛盾,视频网站选择以植入广告代替贴片广告,植入广告本身就是正片的有机组成部分,诸如综艺节目中嘉宾喝的饮料,电视剧中角色使用的手机等,都可以吸引相关广告主。但这一商业模式有赖于项目前期的招商,对广告主而言存在一定风险性,就像押宝一样。可能出现广告主钟意的电视剧,观众却不买账,或广告主不看好的综艺,观众却十分追捧。这对特别讲究创新的新节目而言,体现得更为明显,有时一个好点子,就是因为没有“金主爸爸”买单而只能封存于脑海深处。
有没有什么办法既可以让观众免受贴片广告之苦,又让广告主减少决策风险?去年2月,一段杨幂换脸朱茵的视频走红网络,提供了一个解决思路——既然视频中的动态人脸都可以替换,那饮料能不能换?手机能不能换?就算前期招商没有广告,播出后反响好,广告主找上门来再替换成相应品牌就是了。而要做到这一点,靠一帧一帧去抠图是不行的,那工作量太大了,只能依靠科技的力量,让计算机去自动替换。这就是视频特定点跟踪要满足的业界需求。
研究成果应用前景广阔
“马栏山杯”的消息公布后,立即吸引了一大批来自高校、科研院所、互联网企业才子才女们的关注。共有1294支队伍报名参赛,其中北京大学34支,清华大学25支,麻省理工学院等国外顶级名校37支。
来自香港理工大学的曾辉博士和小伙伴们一同组成了ManGoGo战队,共同挑战视频画质损伤修复课题。曾辉的导师在画质领域已经开展十余年的研究,论文发了不少。而在曾辉看来,科研的目的不仅仅是发表论文,他也希望研究的东西能对解决实际问题有所帮助。“马栏山杯”最吸引他的地方正是这一点,他可以走出实验室,了解到业界的真实需求,这是他报名参赛的重要原因。“这次比赛题目中的画质压缩、噪声等都是业界频繁出现的情况,为我们今后的研究提供了很多真实场景的经验和数据支持。”
在曾辉看来,视频画质损伤修复的应用前景非常广阔,“国家非常重视4K超高清电视的发展,总局6月才印发了《4K超高清电视节目制作技术实施指南(2020版)》。在政策优势和技术普及的背景下,相关的应用场景和需求会大大增加。”
除了向前看,视频画质损伤修复还能往后瞧,用于还原旧有影像资料。曾辉举例说:“像一些经典老剧,用4K超高清电视播出会有问题,因此需要重新修复。”诸如《还珠格格》《士兵突击》等经典,都经历了这样的修复才重新与观众见面。此外,修复老影像对于保存历史记忆、继承传统文化也有着重要意义。像上世纪80年代,湖南对湘剧、花鼓戏等地方剧种进行了演出录像,但受限于当时的技术条件,这批视频像素偏低,噪音较大,看不清演员的面部表情,听不清演员的唱念细节,只能模模糊糊瞧个大概,是很多戏迷心中的遗憾。进行修复后,这些戏曲资料的清晰程度会上一个台阶,对传承戏曲有着重要意义。
正因如此,曾辉十分肯定地表示:“可以说,视频画质损伤修复无论对于未来,还是对于过去,都有着丰富的实践场景。”
吸引算法人才加盟长沙
举办“马栏山杯”,除了要解决业界实际需求,还有一个重要目的——吸引一批优秀算法人才来到长沙,投身互联网产业大潮。在论坛上,王心莹、罗江伟、王炜签约芒果TV,在兴趣相投的大旗下,他们正式成为“新长沙人”。
记者见到王心莹时,脑海中立刻浮现了湘妹子姚婷的身影,后者于8月入选华为“天才少年”项目,在网上吸引了大量点赞。王心莹也是这样一位高学历的美女,伦敦大学学院毕业后,她来到福州一家企业担任算法工程师,与马栏山结缘实属意外。
王心莹在伦敦期间学习过医疗图像配准课程。现在医院里有很多检测设备,比如X光、B超、CT、核磁等,每个设备可以出一张图,有没有办法把这些不同设备做出来的图合成一张总图,以此更好地判断病情呢?医疗图像配准就是要解决这个问题。
当看到“马栏山杯”的题目后,王心莹敏锐地注意到视频特定点跟踪的问题可以用医疗图像配准来解决,本质是利用了数学中的空间几何变换原理,将视频第一帧的目标映射到后续每一帧。于是她独自组成了炸米饼啊战队参加了大赛,并以MSE0.588的绝对优势夺冠,这意味着用她的算法,可以将平均坐标点像素误差控制在1个像素以内。
将不同领域的专业知识进行迁移,王心莹的办法让大赛主办方眼前一亮。她告诉记者:“我并不一定比其他选手优秀,能够突破的关键可能是勇于打破固有的思维模式,灵活思考与运用,并尝试跨领域结合。”
王心莹就是这样一位勇于尝试新鲜事物的妹子。长沙对她来说,是一座完全陌生的城市,视频行业对她来说,是一个接触不多的领域。而在主办方的诚挚邀请下,她最终决定离开福州,投身长沙互联网产业大潮的怀抱。谈及为何来到长沙,她说:“兴趣就是最好的动机,我参赛是因为对这个项目感兴趣而研究技术。人工智能与音视频的结合是无尽的星辰大海,长沙给了我这样的机会,让我能在感兴趣的算法海洋中乘风破浪。”
因为兴趣而来到长沙的,还有罗江伟。不是科班出身的他,通过这次大赛证明了自己的实力,拿到了梦寐以求的算法岗位。他鼓励更多的年轻人:“不要轻言放弃,坚持心中所爱,总有一天我们可以相聚马栏山。”
>>我要举报