专业行业新闻和深入的报告,不容错过
━━━━━━━
杜兰特在决赛中赢得了MVP。几乎同时,在腾讯视频上启动了一个名为“杜兰特11年的精彩评论”的视频。与过去的媒体仔细编辑并提前准备了手稿不同,该视频是当场实时完成的,整个过程中几乎没有手动参与。
如果您仔细观看此视频,它不仅非常完整,而且具有自然而平稳的过渡。中间也有许多文本评论和图片过渡。编辑效果不少于普通视频编辑器的编辑效果。您可能很难相信这样的视频是“由AI制作的”。
但事实是,“ IBM AI视觉视觉大脑”确实将其变成了现实。人工智能每分钟将在Tencent NBA视频中启动,这将成为新的常态。
“杜兰特(Durant)在中午发起的11年的精彩评论”只是“ Ibmai Vision Vision Brain”和Tencent Sports之间合作的一小部分。
这次,IBM和Tencent Sports与跨境合作合作,最直接的产品是“篮球游戏AI编辑”。该产品可以帮助腾讯运动在游戏现场直播期间实时完成视频识别和切割工作,并可以根据人类的灵感和要求在游戏的20秒内将其结合成电影。实际上,这也是中国第一次将人工智能技术应用于体育视频内容编辑。
实际上,“杜兰特(Durant)的11年精彩评论”并不是“篮球锦标赛的AI编辑”第一次采取行动。在NBA 2018赛季决赛之前,Tencent Sports向社区中的粉丝们发起了互动式投票,“如果您有AI大声疾呼,请为您最欣赏的超级巨星特征投票。” IBM AI Visual Brain根据投票结果的关键字特征编辑了七个超级巨星游戏的视频。自从最后一天的第一场比赛以来,它就已经进行了,并向数亿观众展示了相关内容。
杜兰特(Durant)11年的精彩评论
Tencent Sports于2015年成为NBA China Digital Media的独家官方合作伙伴。除了提供现场活动广播服务外,它还一直在探索内容和技术升级,为1.43亿篮球迷提供了新的在线观看体验,最适合他们的期望。
对于粉丝来说,除了观看当前的实时游戏外,讨论历史也是粉丝的乐趣之一。与人类相比,在这种历史上,机器肯定是“认可”的。数据表明,全球数据量将在2025年达到163ZB,为机器提供无数材料。近年来,随着NLP技术的成熟,基于文本的学习已经变得相对成熟,并已逐渐被一些体育大数据公司使用。
在过去的几年中,世界各地的在线内容迅速发展。视频网站和在线电视平台不仅积累了大量的历史视频数据,而且数据量在几秒钟内仍在继续增加。一般而言,用户以高频检索的数据仅占总数的20%。通过管理和采矿视频数据,可能会产生更大的商业价值。据说,包括腾讯运动在内的许多视频平台都在寻求解决方案。
这次,IBM AI视觉大脑为腾讯NBA编辑团队定制了AI视频编辑解决方案,在一定程度上使大规模的历史事件视频材料可按需搜索和伪装,从视频。
许多公司已经考虑过使用机器自动生成视频。此前,包括Google,Microsoft,Alibaba和MIT在内的公司也推出了类似的演示或研究结果。这次,IBM的“杜兰特11年的精彩评论”更像是可以实际实施的产品,并且在计算机视觉引用最难引用的篮球场中使用。
为了完成从演示到产品的转型,技术的可靠性更高。产品“篮球人工智能编辑器”主要基于IBM中国研究所创新的视频深度学习平台 - “ IBM AI视觉视觉大脑”。目前,该平台已经具有智能的视觉识别,理解和编辑技术。
尽管有些公司还使用计算机愿景来编辑和制作视频,但IBM的AI Visual Brain也在2017年在Hunan TV的“ I Am the Future”上首次亮相,并完成了北美市场中“ Morgan”电影预告片的编辑,但在计算机视觉方面,篮球分析是所有体育赛事中最困难和最复杂的。篮球是一项高速运动,有许多人,互相阻挡,多个相机和频繁的镜头运动,这对于机器学习非常困难。
在此阶段,IBM AI视觉视觉大脑可以理解篮球,了解规则,识别行动并通过机器学习得分错误。在2018年的NBA决赛中,它根据腾讯七位最受欢迎的明星(全面,精确,霸气,杀人,艰难,坚韧,坚固,坚定和稳定)从腾讯编辑那里学习了篮球比赛的场景和视频镜头语言。 。
IBM AI can identify these 7 stars (Curry, James, Durant, Harden, Paul, Love, Thompson) in real time based on the Tencent NBA database of 69 years, accurately Mark and cut out their special movements (retreatment shots, slam dunks,三分球等)和表达式(咆哮,兴奋,幸福等),最后为每个星星编辑一个45秒的视频亮点。从决赛的第一场比赛的直播开始,它为数亿观众展示了许多令人兴奋的时刻。
之所以能够实现这一目标的原因是,“ IBM AI Vision Brain”从三个链接中解决了项目问题:建模,切割和编辑(作曲),并进行了许多技术优化,并进行了很多技术优化机器学习。
1。建模
在一个月内,建模通过少量视频数据完成,从而使机器学习能够理解篮球。通过“多模式的视觉理解技术”,视频屏幕是“像素级跟踪和识别”,包括玩家的面部识别和人类动作识别(SLAM DUNK,射击,射击,空中继电器,上篮,上升,拯救球,庆祝,庆祝),人类表达认可(咆哮/咆哮,悲伤,幸福,有趣),物体识别(法庭,篮球,篮子,泽西岛号码);并分析和判断其背后的相关性,人类运动与对象之间运动之间关系的逻辑,例如,判断谁是阻止行动中的主要攻击者,以及他的射击行动是否成功。通过第一步,我们等同于培训“ AI编辑器”的篮球视频。
2。切割
第二步是让这位“ AI编辑器”工作,并将在过去69年中为20年的20个玩家(包括角色和运动轨迹)进行数百万分钟的篮球游戏中的每个视频数据框架。 ,声音等。将非结构化视频数据提取到结构化数据中,并使用数据库实时管理它,从而使每个帧可检索。同时,将根据动作的令人兴奋和不同主题的匹配程度(“体育”,“统治”,“综合”,“企业”,“坚硬”,“ Precision”,“ Precision”,“ Precision”, ETC。)。
3。编辑成电影
第三步是与机器合作完成筛选,剪接和切片。体育编辑设定了所需的应用程序方案要求,例如主题和播放器。 “ AI编辑器”根据综合分数选择了主题最合适的视频片段,几乎可以实时生成一分钟的编辑视频,并添加了特殊效果处理。 2-3个小时的实时竞争,在IBM的AI视觉大脑进行了仅20秒的处理后,它可以将1分钟输出到一块中。
重复此过程后,该机器将根据受众的需求总结视频需求,不断优化和更新建模,并且输出完成的视频将更符合用户的需求。
Tencent Sports采用了“ IBM AI Vision Brain”,为粉丝提供了获得更多高质量内容的可能性。对于腾讯运动,这可能是降低成本并改善用户体验的好方法;换句话说,对于该行业,它很可能为人类计算机协作工作模型提供有效的参考。将来,由IBM AI视觉大脑代表的与计算机视觉相关的技术可能会发挥更大的作用。
IBM AI视觉视觉脑技术的分析
对于观众来说,过去,传统的体育媒体输出内容通过社论角度向观众输出,用户通常在内容生产中没有发言权。即使当前的媒体环境会通过点击影响内容生产,也经常具有滞后。这次,Tencent Sports和IBM的合作实际上是基于观众的想法。通过观众选择的自定义角度,它致电数十亿个视频库资源来生成观众喜欢的内容。
假设将来,Tencent Sports将向观众开放相关的视频资源库。观众将根据其创造力称为“篮球人工智能编辑器”的技术服务,自动生成各种视频并发布它们,这可能会带来新的UGC创意内容的新繁荣。 。以前,诸如A,B,Douyin和Kuaishou之类的平台证明了用户创意视频内容带来的价值。
对于腾讯,当前受众对内容质量的要求正在不断提高。借助技术的帮助,提供更多高质量的内容不仅有助于减少时间和人工成本,而且是改善用户体验并提高用户粘性的一种有利手段。
市场数据预测,视频内容将占2017年全球网络流量的74%,全球在线视频广告市场规模将达到190亿美元。对于Tencent来说,这也是一个必须重视的大市场。视频内容的生产成本相对较高,即使对于腾讯,在视频内容时代也不容易获得股息。尽管腾讯可能不会在内容生成中承受巨大的经济压力,但时间是视频领域的金钱。更快地生成高质量内容并通过腾讯的渠道传播高质量的内容可能是一个更好的选择。
此外,对于腾讯运动,与IBM的合作不仅最大化了数十亿个视频材料库中视频数据的价值,而且还可能使Tencent Sports Live广播更加有趣。首先,AI重新提取,识别和利用大量的历史视频(或音频,图像)数据,以便可以根据需要搜索和提取视频材料,以便最大化每一分钟和每一秒的价值腾讯运动的数量无疑对数据具有重要意义。
其次,这种合作实际上探讨了人类计算机协作的新工作流程。使用机器以快速的速度处理大量数据,实时确定和编辑可以大大降低人工成本并缩短工作时间;同时,由于机器比人类更准确,更合理,因此可以避免内容产生的主观趋势,这更有可能产生传播价值。 ;在学习过程中,机器也可能希望人类学习新的灵感,从而在内容中产生新的创造力。
结合AI技术,实际上有更多有趣的尝试。今年,IBM还将AI技术应用于高尔夫场。在今年的大师赛中,大师与IBM Watson进行了合作,利用企业级的人工智能技术来捕捉激动人心的比赛场面。在比赛中,他自动捕获了面部特写镜头和秋千,以向观众展示,并取得了良好的成绩。影响。
实际上,IBM AI视觉大脑的技术领导力和可靠性也使得有能力完成更具想象力的任务。
根据IBM提供的信息,IBM AI Visual Brain已经是一个相对完整的人工智能视频深度学习平台,它可以帮助企业自动完成个性化的机器学习,将其从开箱即用,并授权企业独立执行深入执行图像。要学习,IBM不需要做很多后续服务。
与行业中其他视觉识别技术相比,IBM的多模式图像分析相对复杂,具有更全面的分析维度,更高级的自动优化程度,并且可以自动获得的机器理解中更准确。此外,凭借其强大的适应性,该技术可以选择地放在云或自己的服务器上,并保证其安全性,因此公司不必担心数据泄漏的风险。
人们获得的信息中有80%来自视觉,大脑的分析能力可以实现对世界的理解和感知。在五年内,全球摄像机的数量将超过44万亿,如果IBM AI视觉大脑使这些设备具有思考的能力,则可能会产生不可预测的影响。
对于可以在短期内实现的特定情况,IBM AI视觉大脑仍然有很多想象的空间。例如,在媒体和娱乐行业中,IBM AI视觉技术可以帮助视频识别和编辑工作,例如体育赛事,电子竞技比赛,新闻和电影预告片,并具有大量视频;通过相机,产品质量检查和生产线安全检查,避免了员工的恶意工作行为,超市中的付款等等。在医疗行业中,残疾人或独自生活的老年人受到监督,并在出现问题时立即警告。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系本站,一经查实,本站将立刻删除。如若转载,请注明出处:https://www.yonghebaozhuang.com/html/tiyuwenda/6179.html