百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

基于Duffing共振的语音真伪检测技术研究

cac55 2025-02-21 12:23 27 浏览 0 评论

刘凯

(长江大学 工程技术学院, 湖北 荆州 434023)

摘要:在数字语音真伪技术中,基于电网频率的检测方法是当前研究的热点。由于数字录音设备在录音过程中不仅记录语音内容本身,还携带微弱的电网电压或电流信号,利用Duffing共振理论来提取数字录音信号中的微弱电网信号,根据其输出特征参数的幅频特性和相频特性来判断录音文件的真伪性。通过实验分析论证了该方法的可行性和实用性,为数字录音真伪鉴别技术提供了一条新的研究方向。

0引言

近年来,数字多媒体技术飞速发展,数字信息已经渗透到人们生活的方方面面。在语音处理技术领域,人们已经可以很方便地获取语音信号,并利用音频编辑软件对其进行有意或无意的编辑和修改,这种篡改行为对语音数据的安全性构成了强大的威胁。随着数字信息已逐步应用于司法取证,语音真伪检测技术也逐渐成为国内外学术界研究的热点。

电力系统是促进国家发展的基本因素之一,公用的电网信号可以看成是一个正弦波,它有一个固定的频率,该频率称为电网频率(Eleetrie Network Frequency,ENF)[1]。电网提供的大部分电力都是来自于能产生交流电的涡轮,这些涡轮的转速便决定了电网频率,正常运行的电网频率值是50 Hz或60 Hz,中国的电网频率值是50 Hz。电网频率变化具有均一性和唯一性,其波动不仅表征系统的动态行为,而且承载丰富的时间信息。由于数字录音的原理与模拟磁带录音不同,无法在磁踪迹和抹音磁头上找到录音开始、停顿和终止等物理特征,因而迫切需要寻找其他的鉴别方法。GRIGORAS C将电网频率变化与数字录音真伪鉴别联系起来,提出电网频率准则[25]。该方法认为数字录音设备在录音过程中不仅记录语音内容本身,而且还因该设备由电网直接供电的缘故而捕获到微弱的电网电压或电流信号;若录音设备采用电池供电,周围其他的用电设备产生的电磁场也有可能感应出电信号,在录音记录中留下感应信号的踪迹[67]。近年来,随机共振在信息技术领域的应用已经有了相当大的发展,例如基于随机共振的信号检测方法为强噪声背景下弱信号的提取提供了新的途径[8]。因此可以考虑利用Duffing共振理论来提取录音信号中的微弱电网或电压信号,从而判断录音文件的真伪性。

1Duffing共振理论基础

Duffing方程的一般形式为[9]:

其中,γ是阻尼系数;κ、ζ为常数;FcosΩt是系统的外力项;Ω是外力项频率。式中正、负号分别表示硬弹簧和软弹簧两种情况。理论情况下,在线性系统中当强迫力的频率与系统本身的频率相同时,系统会出现共振现象,在非线性系统中也会出现类似的情况。

无阻尼情况下Duffing方程为:

令κ=ω20 ,ζ=εβ20,其中ε>0,引进多重时间尺度变量,如多重时间尺度[10],有:

认为函数x不仅依赖于ε和t,还依赖于T0,T1,T2,…,Tn,有:

x=x0(T0,T1,…,Tn)+εx1(T0,T1,…,Tn)+…(4)

得到式(2)的一阶近似解:

考虑有阻尼的Duffing方程:

令α=α(T2,T3,…,Tn),ω=ω0+3β20α28ω0ε ,θ0=θ(T2,T3,…,Tn)

仅考虑无阻尼Duffing方程的通解,式(7)的通解为:

x(t)=αexp(-γt)cos(ωt+θ0)(8)

其中,α为振幅,ω为角频率,θ0为初始相位。

考虑有外力驱动的情况(式(1)),即当式(8)中ω=Ω时系统发生共振。

当在t(0+)时刻输入一个脉冲响应δ(t),系统的时域函数为h(t),由δ(t)*h(t)=x(t),可以得出H(s)=X(s),即h(t)=x(t)。

2基于Duffing共振的语音真伪检测技术

该检测技术具有如图1所示的步骤。

(1)首先对待检测录音信号进行预处理。预处理包括抗混叠滤波,预加重和分帧加窗。

(2)对预处理的录音信号进行快速傅里叶变换(FFT变换)得到其频谱特性。

(3)将频域信号通过一个Duffing共振带通滤波器,带通滤波器的中心频率为50 Hz,该滤波信号即为提取到的电网信号。通过第1章Duffing共振理论的介绍已经得出了模拟滤波器的单位冲击响应h(t),对其进行拉普拉斯变换就可以得到模拟带通滤波器的系统函数H(s),然后通过双线性变换就可以得到数字带通滤波器的系统函数H(z),该滤波器的幅频特性如图2所示。

(4)画出该滤波信号的幅频图和相位图。

(5)根据幅频图和相位图上有无突然的跳变来判断音频是否发生过篡改操作。图2Duffing共振带通滤波器的幅频特性

3实验和分析

有4段待检测录音音频,都是由计算机的麦克风录音,录音和篡改软件为Cool Edit Pro V21简体中文版,分别对应音频1、音频2、音频3和音频4。其中音频1为女生未经过篡改的原始录音,录音内容为“零”, 音频2为男生未经过篡改的原始录音,录音内容为“零”,将音频1复制粘贴到音频2为音频3,内容变为“零零”,将音频1由软件加入频率为50 Hz的合音得到音频4。分别对音频1、音频2、音频3和音频4用基于Duffing共振的篡改检测方法进行真伪检测,检测流程如图1所示。

图3~图6分别为音频1、音频2、音频3和音频4的时域波形图,图7~图10分别为音频1、音频2、音频3和音频4经系统后的频谱图。

从图7、图8可以看出,没有经过篡改的音频信号经过系统后的频谱图具有比较好的双峰性,而且第一个峰的频率在50 Hz。图9是经过篡改后的音频信号经系统后的频谱图,从图中可看出只有一个峰值,而且峰值处的频率为100 Hz。

由此可以得出结论,经过篡改后的音频信号经过系统后的频谱会发生较大的突变,频谱的中心发生搬移。

图9与图7的幅频图完全一致,人为添加计算机合成的同频率音频对音频信号通过系统后的幅频特性没有影响。图11和图12分别为音频1和音频4通过系统后的相频图,从图中可以看出,音频4的相频特性较音频1相位发生了很大的变化。

4结论

本文研究了一种基于Duffing共振的语音数字语音真伪鉴别技术,通过实验,对比实验结果,经复制粘贴篡改操作的音频信号经过Duffing共振系统,其幅频特性会发生较大的变化;而经计算机软件添加合成音频的音频信号经过Duffing系统后,其幅频特性基本不变,变化的是相频特性。由实验可以得出:基于Duffing共振的数字语音真伪鉴别具有一定的可行性和实用性,在以后的研究过程中,还会进一步探讨该系统在其他数字语音篡改技术中的应用。

参考文献

[1] GUPTA S, CHO S, JAYKUO C C. Current developments and future trends in audio authentication [J]. IEEE Multimedia, 2012,19(1): 5059.

[2] GRIGORAS C. Digital audio recording analysis: The electric network frequency criterion[C]. Diamond Cut Productions, Inc., Applications Notes AN4, 2003.

[3] GRIGORAS C. Digital audio recording analysis: the electric network frequency (ENF) criterion [J]. The International Journal of Speech Language and the Law, 2005, 12(1):6376.

[4] GRIGORAS C. Applications of ENF criterion in forensic audio, video, computer and telecommunication analysis [J]. Forensic Science International, 2007(167):136143.

[5] GRIGORAS C. Applications of ENF analysis in forensic authentication of digital audio and video recordings [J]. The Journal of Audio Engineering Society, 2009, 57(9):643661.

[6] 杨林国.词类扩充方法在语音识别中的应用[J].电子技术应用,2014,40(6):123125,129.

[7] 赵媛媛,王力.基于流形学习ISOP算法的语音特征提取及应用研究[J].微型机与应用,2014,33(1):4345,49.

[8] 赖志慧,冷永刚,孙建桥,等.基于Duffing振子的变尺度微弱特征信号检测方法研究[J].物理学报,2012,62(5):05050310505039.

[9] 王海波.Duffing方程非线性振动特性的计算和分析[D].西安:西安建筑科技大学,2009.

[10] 徐博侯,曲绍兴.非线性力学导论[M].杭州:浙江大学出版社,2012.

相关推荐

QQ表情大图(QQ表情大图怎么发)

爷青回 | QQ经典老头像(爷青回这个梗出自哪里)

点个关注不迷路记得点击上方关注我呦点击表情包长按可保存至手机表情包素材来源于网络,仅供分享哦拿完图记得吱一声点击下方分享、在看让更多人看到...

史上最全QQ官方经典头像全面翻新,不光高清还会动

每当看到上面这些头像,总能想起那些年的"轻舞飞扬","缘分天空","追风少年",这些已经模糊的头像给我们留下了太深的印象。这次为了纪念QQ20周年,腾讯官方整合了早期的105个经典头像,进行了全面翻...

QQ最全表情含义图解意思(qq表情含义图解最新 新版 文字)

QQ都不陌生吧!对QQ的表情符号含义你了解多少呢?在本文中最全图解233个表情所表达的含义,供有需人享用。用过QQ的人都晓得它的创始人是马化腾。QQ于1999年2月10日正式推出。QQ是腾讯公司开发的...

海联真人版QQ经典表情(海联真人版qq经典表情在哪)

海联版傲娇的说声“耶”狂拽炫酷就是我淑女应该轻言细语萌萌哒的娇羞哎哟喂小丫头片子机智如我吓死宝宝了欧巴卡几嘛~今天天气好晴朗怎么样?是不是很有趣呢拿起手机给自己拍几张萌萌哒的美照吧...

QQ音乐·音乐灵感独家对话金曲奖「最佳单曲制作人奖」得主JADE

JADE-AllRightJADE-差-点JADE-Goodbye,GoodbyeJADE-IAmLovefeat.乔瑟夫Chillseph下面请听本期灵感电台节目:本期博客...

亿万富豪爱泼斯坦狱中“自杀”,他背后的神秘女人出现在洛杉矶快餐店

爱泼斯坦在狱中离奇“自杀”,但他身负同谋指控的前女友、英国社交名媛希莱恩·麦克斯维尔(GhislaineMaxwell),却意外地出现在了洛杉矶街头平民快餐店,边啃着汉堡,咽着薯条,嘬着奶昔,边埋头...

扛起星战大旗的你们 觉得星战女需要换一身衣裳吗?

马上进入2016年,除了各种总结盘点以外,2016年的新看点也是需要科普一下了。目前最令人期待的应该就是《星球大战》回归了!《StarWars:原力觉醒》1月10日上映,博主不是电影评论员,所以不会...

和人对话的时候,我,最怕的就是,看到了自己内心的惶恐和脆弱

IWannaBeYourSlave(LiveFromGlobalCitizenLive2021),Maneskin很多时候,哪怕最甘于寂寞的人,也需要和人发生关联,需要和这个世界沟...

2024年度串烧完整版(搞笑失败尴尬丢人版)来了

一首APT的时间带你回顾你的2024年年度歌单。·1.《免我蹉跎苦》黄龄。·2.《红昭愿》音阙诗听。·3.《苹果香》狼戈。·4.《免我蹉跎苦》黄龄。·5.《红昭愿》音阙诗听。·6.《苹果香》狼戈。·7...

一课译词:打工人(打工人的翻译)

下午好,各位打工人!近日,“打工人”爆红网络,受到各行各业年轻人的追捧,但这词到底说的是个啥?“打工人”是那些依靠体力或技术的劳动者的统称。除了赚钱这个最大的目标,别的啥也不想;他们意志坚定,也不会迟...

初级词汇题(一)柏拉图指出不是每个孩子都适合上学,你赞成吗?

初级词汇题(一)柏拉图在《理想国》中指出不是每个孩子都适合上学,你赞成吗?今天分享的题目是我基于英文原著改编的初级词汇题A开头的第81道题。背景知识拓展:什么是nativist(先天论者)?什么是哲学...

治愈系英文:每个说不想恋爱的人,心里都装着一个无法拥有的人

Therearesomanypeopleouttherewhowilltellyouthatyoucan't.Whatyou'vegottodoisturna...

首首经典!意大利流行乐队Maneskin作品I WANNA BE YOUR SLAVE

手机点击试听(上边)Maneskin是一支来自罗马的意大利流行摇滚乐队,由主唱DamianoDavid、贝斯手VictoriaDeAngelis、吉他手ThomasRaggi和鼓手...

国家电网新一代电子商务平台投标文件双层PDF制作最全教程

投标知识在招投标过程中,我们经常碰见有些文件要求制成双层PDF格式,那么双层PDF是什么呢?怎么制作呢?今天就给大家普及下。定义双层PDF双层PDF格式文件是一种具有多层结构的PDF格式文件,是PD...

取消回复欢迎 发表评论: