目前,广播电视行业拥有海量的媒体内容数据、用户服务数据,如何充分挖掘这些数据的价值,为内容生产、业务创新、用户服务、运营推广、领导决策等提供支持,是一个全新的课题。
为了加强大数据技术在广播电视行业应用的引导与规范,2018年,国家广播电视总局科技司组织广播电视有关节目制播/传输机构、科研单位和相关企业开展广播电视行业大数据技术研究与应用工作。在深入分析广电大数据技术应用现状和发展趋势,研究广播电视节目制播生产、有线网络传播、网络视听业务服务等领域的应用场景、总体框架、关键技术的基础上,组织起草了《广播电视行业应用大数据技术白皮书(2018)》,并于2019年5月16日正式发布。
作为主要起草单位之一的江苏省广播电视总台,很早就开始了广电大数据的应用探索,依托“荔枝云”平台强大的汇聚和支撑能力,实现了海量新闻线索的动态汇聚以及全台资源的收集、整理、归纳、聚类、关联等自动化处理分析,并为使用者提供背景、脉络、时间相关性等有深度的数据分析,为节目生产提供数据支撑。本刊记者有幸在IMIC2019会议现场采访到了江苏省广播电视总台技术研发部副主任吴昊,深入了解了《广播电视行业应用大数据技术白皮书(2018)》(以下简称白皮书)的指导意义和江苏省广播电视总台在大数据应用方面进行的探索。
江苏省广播电视总台技术研发部副主任
吴昊
大数据智能化是必然趋势
随着媒体融合向纵深发展,广电涉及的业务越来越多,业务覆盖越来越广。吴昊指出,如果仅仅依靠传统的技术来进行数据管理,没有一个智能系统来分析节目生产过程中的数据,维护会很困难。随着篮子越做越大,仅靠传统的手段是不行的,广电的智能化大数据应用是一个迫在眉睫要做的事情。
吴昊表示,对传统广播电视台来说,《广播电视行业应用大数据技术白皮书(2018)》非常有指导意义。一直以来,广电行业缺失数据治理,白皮书研究分析了广电行业大数据的应用需求、关键技术、体系架构、应用场景等,为各级广电机构利用大数据技术、建设大数据平台提供了指导,推动了行业在大数据技术应用上开展创新实践,为未来广电行业大数据平台的建设奠定了基础。
推动广电大数据建设规范化发展
吴昊介绍道:“以前提到大数据的概念,更多的是指用户数据,但是这次白皮书提到了一个很好的概念,那就是大数据到底是指什么?视音频内容算不算大数据?针对这个问题一开始有很多分歧,白皮书对此给出了定义,广播电视台也有大数据,而且有很多应用场景,不仅仅是新媒体端,实际上在节目生产的过程中,以及媒资管理中,都可以应用到大数据技术来提高生产效率,当然发布端也是一个重点。广电大数据具备四个方面的特征,一是媒体内容数量多、体量大,二是来源和类型多样性,三是数据增长迅速并且对数据获取和处理速度有很高的要求,四是变化速度非常快。”
吴昊指出,白皮书还提出了非常重要的一点,就是要建立各种规范,提供一系列规范标准,各地在建设广电大数据平台时,技术架构和业务应用服务需要进行统筹规划设计,要以实现全国性广播电视行业大数据共享共用为目标,建立标准的数据接口规范,具备安全交互数据互联机制,推动形成全国性的大数据采集、汇集和应用机制,倡导未来要建立全行业性的统一的大数据平台,这样才能更多地发挥大数据的价值。
深耕用户服务用户
助力县级融媒体建设
在采访中我们了解到,以前的智能应用都是不成体系的单个场景应用,江苏台根据白皮书的指导,已经开始规划部署大数据的基础能力和应用能力,并进行试点应用,例如APP的智能推荐、IPTV用户数据分析、媒资智能化标引、语音识别等。具体思路就是依托“荔枝云”平台,建设大数据的PaaS层,即在PaaS层上建设大数据的能力,然后再基于这些能力做一些典型的应用。
按照不同的维度,广电大数据可分类为:媒体内容大数据和用户服务大数据,实时数据和非实时数据,结构化数据、非结构化数据和半结构化数据。针对媒体内容大数据和用户服务大数据,吴昊进行了系统的介绍。他指出,内容生产大数据,就是在生产过程中,会用到很多大数据,比如智能化媒资。用户服务类大数据,就是用户产生的行为这一类数据,但是这部分数据不一定是个人数据,还有可能是家庭数据。以前广播电视没有直接面对用户,但是现在无论是电视台还是网络公司,都有自己的用户,都要去面对,用户的行为习惯是什么,是个人用户还是家庭用户,如何进行用户画像,这就需要用大数据的技术手段,才能比较好地解决这些问题。
吴昊坦言:“未来江苏台会搭建一个平台,一方面是为台内的团队服务,另一方面就是服务于县级融媒体建设。江苏台有一个自主研发的 APP 平台,可以为各个县开发自己的 APP。接下来江苏台可能会和第三方合作,借助大数据平台,帮助各个县做用户数据分析,深耕用户、服务用户。”
运用互联网思维
积极部署大数据智能应用
充分挖掘媒体内容数据、分析用户数据,可广泛应用在广播电视内容的采集与生产、节目的推荐与经营、用户的跟踪与服务、舆情的监控与管理、节目的传输与分发以及节目监控监管等领域。
谈及下一步的规划时,吴昊表示,针对台内的业务系统,同样也要部署大数据智能应用。目前正在进行规划将大数据应用集成到“荔枝云”平台,初步想法是实现两个方面的应用:一个是建立自主开发的用户数据库,之所以选择自主开发是因为用户信息比较敏感,还要考虑安全性,不适合给其他公司做;第二个是要在融合生产的业务流程中引入大数据智能应用,以便更好地进行智能判断。
“此外,智能化媒资也是我们正在考虑的部分。” 吴昊继续介绍道:“虽然叫智能化媒资,但实际上是通过引入一些智能标引的手段,形成了大量的数据。对于这些智能数据的处理,传统的手段肯定是不行的,必须要引入人工智能去做智能内容生产。”
吴昊指出:“广电行业应该多跟互联网去学习,将非结构化数据结构化,然后去做检索。这部分数据体量会非常大,传统数据库的处理效率是很低的,必须运用大数据智能化技术去做这些工作。具体做法是在底层搭建一个大数据框架的基础处理系统,在上层加载各种应用,比如智能标引,完全可以把它做成一种工具能力服务,可以支持上层各种不同的应用,这样做很有必要,避免了重复搭建。这个思路和原来建设云技术平台的理念是一脉相承的,即上层应用主要提需求,不要管下层的资源配置是怎样的,也不要管应用了哪些工具和能力。”
吴昊表示,未来大数据会有两个典型的应用场景,第一个它可以帮助我们的生产过程更加智能化;第二个就是把我们原来广播式的受众转变成用户,为其提供用户服务。
目前,大数据在广电行业的运用还处于探索和逐步成熟阶段,广电各个领域应该高度关注和积极布局,在白皮书的指导下,打造新型大数据平台,以满足广电领域未来发展中海量、多元数据的快速处理和分析。
本文刊登于《有线电视技术》2019年第8期
原标题:
扎实推进大数据应用 助力县级融媒体发展
——访江苏省广播电视总台技术研发部副主任吴昊
作者:
本刊记者
李玉薇
领取专属 10元无门槛券
私享最新 技术干货