哪些场景需要真人接听检测?
-
呼叫有分机号的虚拟号(隐私号)
-
使用没开通反极信号的模拟线路进行外呼
-
呼叫企业总机转分机
虚拟号(隐私号)之分机号
在外卖、网购、物流等行业为了保护用户隐私,平台会把联系电话替换成一个零时的中间号码,拨打中间号码会呼叫转移到实际的手机上。这个中间号码称之为隐私号或者虚拟号。
为了解决隐私号不够用的问题,平台给一个虚拟号分配了4位的分机号,1个虚拟号就可以对应9999个真实的手机号了。
反极信号
模拟电话通过检测反极信号来获取是否应答,随着电话网络升级换代,现在大部分运营商都不给模拟电话开通反极信号。
呼叫带分机的虚拟号(隐私号)流程
拨打11位手机号码 -> 听到输入分机号提示音
-> 输入分机号 -> 等待用户接听
大部分手机也支持直接拨号 “虚拟号,分机号”,免去了手动输入分机号的麻烦,android的实现原理也是接通后延时1秒发送按键(DTMF)实现的。
FreeSWITCH呼叫带分机的虚拟号的命令
originate {ignore_early_media=true}sofia/gateway/default/虚拟号 send_dtmf:W1234,park inline
小写 w 延迟半秒发送
大写 W 延迟1秒发送
存在的问题
1 发送的DTMF(分机号),虚拟号平台可能收不到
2 无法获取真实的被叫是否接通
发送分机号原理
- 通过发送DTMF来实现输入分机号,DTMF的传输方式主要有rfc2833和inband(带内)
- 比较常见的问题为明明发送了正确的分机号,却听到了的类似提示音“请确定分机号后再次拨打电话”,出现这个问题是DTMF传输过程丢失了。
- 主要是因为电话交换机兼容性的原因有可能出现DTMF丢失,比如有的平台的虚拟号可以拨通,有的平台的虚拟号却不可以。
虚拟号平台接收分机号的流程
解决DTMF丢失的思路
- 电话接通后,先检测提示音,检测到提示音停止后,用 rfc2833 方式发送一次。如果3秒内都是静音用inband(带内)方式再发送一次。
- 电话接通后等待1秒,用 rfc2833 方式发送一次。如果10秒内检测到提示音用inband(带内)方式再发送一次。
- FreeSWITCH rfc2833发送DTMF的函数是 senddtmf
带内发送DTMF的函数是gentones
呼叫虚拟号可能出现的呼叫结果
1、平台接收不到DTMF(分机号),提示“请确定分机号后再次拨打电话”后挂断
2、平台转接真实的被叫后,真实的被叫拒接、无法接通、关机等情况,比如提示音”你拨打的电话正忙请稍后再拨”
3、平台转接真实的被叫后,真实的被叫应答,转接成功了。
判断“平台接收不到DTMF”的思路
- 可以预先采集虚拟号平台的提示音。拨通虚拟号后提取声纹和预先采集的声纹进行匹配,如果检测到声音的声纹都是虚拟号平台的提示音,没其他声音(回铃音,彩铃音),也没有检测到未知声纹。就可以认为虚拟号平台没接收到有效的分机号,未执行转接。
- 不需要预先采集虚拟号平台的提示音。拨通小号平台后,等待小号平台播放“请输入分机号”的提示音,采集声纹,然后发送分机号(DTMF),如果后续声音的声纹,和第一个提示音的声纹匹配,没其他声音(回铃音,彩铃音),也没有检测到未知声纹。就可以认为虚拟号平台没接收到有效的分机号,未执行转接。(如果接收按键超时的提示音和请输入分机号的提示音不是一个人录音的这个方法就会出现检测错误了,所以建议使用预先采集提示音的方法)
判断“真实被叫无法接通”的思路
-
思路1:预先收集各种呼叫失败的提示音,进行声纹匹配。
-
思路2:使用ASR识别提示音内容,根据提示音内容判断。
判断“真人接听”思路
真人接通前可能出现的 声音是彩铃,回铃音, 呼叫失败的各种提示音,只要不符合以上特征就可以认为是真人接听了。
当然判断真人接听没一个简单的方法,需要多维度分析,根据我多年的研究总结出以下思路
- 检测噪音法
- 检测静默法
- 声纹检测法
预先收集所有呼叫失败的各种提示音(空号、关机、通话中、留言等),如果检测到声纹,不是呼叫失败的提示音,那么就可以认为是真人的声音了。
开源声纹提取工具
- kaldi
- WeSpeeker
- PaddleSpeech
开源语音识别工具
- FunASR (阿里达摩院开源大型端到端语音识别工具包) 开源了6万小时训练的工业级的语音识别模型。
强烈推荐,顶顶通实时质检系统就集成了FunASR。 - WeNet 出门问问语音团队联合西工大语音实验室开源的一款面向工业落地应用的语音识别工具包。
- Whisper OpenAI开源的通用语音识别模型。