摘要 语音智能控制的源头可追溯到2014年苹果推出的智能语音系统Siri,不过其当时仅是内置到手机里使用。随着亚马逊智能音箱Echo出现,谷歌、百度、阿里巴巴、腾讯等国内外各大巨头企业
语音智能控制的源头可追溯到2014年苹果推出的智能语音系统Siri,不过其当时仅是内置到手机里使用。随着亚马逊智能音箱Echo出现,谷歌、百度、阿里巴巴、腾讯等国内外各大巨头企业开始竞相进入该领域,陆续推出多种内置语音助手的智能产品。近几年,随着物联网等科学技术的迅速发展,智能语音相关技术在现实生活中的使用率越来越高,特别是语音识别、语音合成、语音理解、语音控制等技术。其中,语音控制作为人类最自然、最便捷的交互控制方式,规模化应用之后,有利于解放人们的双手,能进一步增加系统操作的简便性、易性性、互动性和娱乐性,必然率先在各行各业应用中爆发。语音智能控制技术由输入、识别、理解和控制等多领域学科知识共同组成,随着科学技术的发展和进步,涉及到的各个技术,尤其是语音识别技术可以在特定条件下取得非常高的识别准确率,从而保证了语音智能控制技术的执行效果[1]。为了更好地开发应用此项技术,本文结合广播电视监测实际使用需求,从智能控制广播电视监测系统的应用层面,对其实际使用条件展开研究、分析,论证此项技术在广播电视监测中的实用性和可行性。
1语音智能控制技术在广电监测中的适用性
在广播电视监测领域,软件上涉及到监测数据采集、安全播出、广播电视广告节目、新媒体内容、大数据展现等多个监测系统,如此多的系统,通常部署在信号接入、信号汇聚、信杨文婷(国家广播电视总局282台,湖南410146)号应用的三个差异化的层级结构中。语音智能控制技术的应用,适用性很广,可通过对上述三个层级中承载不同监测功能的广播电视监测系统进行控制,如图1所示。第一,在信号接入层中,通过对每个监测节点的控制,将其对应的音频与视频数据接入到系统程序中。而在广播电视实际工作中,SDI、RF、ASI等都是常见的信号播出形式。在监测工作中,岗位工作人员需要对其中的一种或多种格式数据进行转化,以此才能满足广播电视工作的具体需要。完成信号接收转化之后,可将转化板卡调整为应用性较强的IP信号,并按组播形式输出到交换机设备中,完成层级结构的功能作用。第二,信号汇聚层中,主要完成交换机接入信号的整合,并将整合后的信号数据转移到相应的应用层中。在具体工作中,汇聚层应至少保证两台交换机设备执行工作指令,并使用不同网段对这两个交换机设备进行区分。在这一技术条件下,可以保证交换机设备的管理效果,在实现冗余信息备份管理的同时,避免两个接入层的交换机设备可能同时发生故障的问题[2]。而执行这一技术方案,需要对网络作出规划性调整,尤其在分段结构上,要保证故障节点的快速定位,高效率处理可能发生的网络异常问题。针对广播电视监测系统的工作需要,应在汇聚层中引入存储设备分析与警报系统的应用功能,在对节目历史数据进行查询的同时,通过警报系统第一时间定位播出异常问题,提高监测执行力。第三,在信号应用层中引入语音智能控制技术,需要设置语音信号接收服务器以及相应的终端显示设备。在进行技术管理的同时,通过语音识别服务器,对声音发出者身份进行识别,确认并核实其身份信息之后,将语音信息内容转化为数字化的操作指令,并将这一指令信号传递给服务器程序。在核心服务器中,通过监测板卡的输入信息号,对信息名称、格式、参数、IP、路由、位置等信息进行汇总,以便形成完整的数据资料。在信号服务器设备接收到具体指令信息后,就可以对其中的信号内容作出判断,并将其投放到终端的显示设备中。终端显示设备在接收具体指令后,凭借自身的解码模块,可以完成对应播出信号格式的转化,并保证人工条件下对广播电视播出异常的判断,完善监测系统管理形态。综合以上三个技术层级,就形成了广播电视监测系统汇总的完整技术框架,在执行各层级工作内容的同时,保证技术系统整体的工作状态,实现广播电视监测系统与语音智能控制技术的对接。
2语音智能控制系统对广电监测系统的应用
2.1系统框架
一个完整的语音智能控制系统框架包括以下四部分,如图2所示。1.智能终端:用于接收用户的语音信号,多是手机、麦克风、智能音箱等带语音输入和输出的设备,市场上质量好一点的智能终端设备通常都自带降噪或环境自适应功能。2.语音识别系统:用于将语音信号转换识别成文字。目前,国内不仅有很多大学研究机构,也有很多互联网公司,都可以提供成熟的语音识别系统调用使用,而且可以提供私有云或公有云进行部署,另外,随着科技的发展,语音识别的准确率在特定条件下甚至达到98%以上。3.语义理解系统:用于将识别后的文本转成换控制指令。该系统相对比较简单,不需要很复杂的语义理解技术,通常包含一个命令集,能从识别后的文本中抽取主要特征,与命令集关联,从而形成并输出相对准确的控制指令。4.被控系统或设备:能够接收控制指令,基于指令自动完成操作,甚至完成操作后,能够在终端解码器设备的支撑下,完成语音信息的播放,实现信息的有效反馈。
2.2控制流程
语音智能控制技术在广播电视监测系统中的应用,表现出一定的流程化特征,可以分为语音输入、指令转换、指令执行这三个步骤。具体的语音控制流程如图3所示。以身份认证为基础,在用户说出特定的指令语音信息后,判断其声纹特征。通过这种双重保险控制,保证身份管理状态的安全性。如果身份认证没有识别成功,则重新回到初始状态,直到身份认证成功为止。在完成身份指令认证之后,需要根据用户的个性化身份配置,将接收的语音内容转化为系统可以理解的执行指令或指令集合[3]。在系统程序中,还带有一种特殊的告警指令信息,这一信息内容,是保证广播电视监测系统功能状态的重要条件。完成信号定位处理之后,需要在信号服务器系统中,定位并播放相应的信息内容。此时,需要调用终端服务器中的解码程序,对MPEG-2、MP3、AC3等模式进行解码播放,以保证终端信号程序的完整执行。另外,在执行广播电视监测系统的过程中,需在完成独立语音交互指令之后,等待信息的回馈,从而保证语音输入的连续性与完整性工作状态。实际应用中,需要引入指令关键词,对执行、任务等工作内容中的重点信息,进行针对性识别。例如,当程序接收到语音信号“检查××卫视光缆源”指令后,需要凭借其中的“检查”指令,定位并转换显示界面的指令状态,然后根据技术人员的管理,对“××卫视光缆源”的播出内容与效果进行检查。然后,可以在智能化系统支撑下,对历史记录数据作出分析,确定“××卫视”在10分钟之前的播出效果,并在调用录像数据的同时,实现对于广播电视播出界面的全方位检查。2.3应用效果在广播电视监测领域,按总局安全播出保障的规定,要求实时性、零故障报警完成广播电视监测。语音智能控制技术的应用,可以发挥以下作用:1.可以充分解放人力,尤其是在一些重保期场合,值班员面对多个监测系统,因为要操作多个系统,难免出现手忙脚乱的情况,通过语音智能控制,可以快速切换调用不同的监测系统,快速把监测结果上报给有关部门,从而保证监测工作的及时性和有效性。2.可以有效地提升日常工作中的节目调度,并在“零秒停播”和安全播出方面实现节目控制水平的系统化升级。通过及时、高效的语音信息传输,最大程度上降低广播电视播出过程中隐患问题的发生概率。3.从安全角度出发,可以通过语音智能控制技术,录入具备操作权限工作人员的声音特征,并在接收语音资料的过程中,由程序系统完成说话者的声音确认,有效隔绝无权限指令,并借此提升整体系统的语音操控安全性,保障监测系统工作状态准确无误。
3结语
综上所述,在现有广播电视监测系统中加入语音智能控制技术,可以在保证基础监测框架不发生改变的基本前提下,实现应用技术类型的升级改造。这不仅是广播电视监测技术升级的重要手段,也是拓展语音智能控制技术应用空间的有效途径,需得到相关技术人员的高度重视。
参考文献:
[1]李厦.一种基于视频特征的智能电视广告监播系统设计方案[J].广播与电视技术,2019,46(06):137-141.
[2]尹小曼,马俊,陈博行,等.基于zigbee技术的智能家居环境监测系统设计与实现[J].自动化与仪器仪表,2019(03):96-99.
[3]王君,杨婧茹.卫星地球站广播电视智能监测告警管理平台的设计与应用[J].数字传媒研究,2018,35(07):59-63.
《语音智能控制在广播电视监测的应用》来源:《广播与电视技术》,作者:杨文婷
转载请注明来自:http://www.lunwenhr.com/hrlwfw/hrsklw/15010.html