3.1 背景
电信运营商在部署VoIP网络后,在不同程度上遇到了网络不稳定,用户语音质量不好,投诉大量上升等棘手问题。在传统的运行维护模式下,维护人员往往疲于奔命,到处扑火,但是收效甚微,投诉越来越多。因为传统的运维模式是被动的,运营商收到投诉报告,安排维护人员到现场通过被动监测的方法进行测试,找出问题,协调解决,时间和人员消耗很大,投诉较少的情况下还好,一旦投诉大量出现就只能望洋兴叹!运营商以前面对的是相对稳定的PSTN网络,投诉很少;VoIP具有服务多、成本低等优点,但是同时存在语音质量和网络问题,这是运营商不可避免的,那么怎样才能破解如此尴尬的局面呢?也许,我们需要更好的维护模式。
目前,存在两种电信网络维护模式。第一种,是采用网络监控的方法,主要在各个主要信令点对信令网络(如No.7网络)进行7×24h监控,发现信令异常及时上报,维护人员可以及时排查规避故障链路,保障通信畅通;第二种,是采用主动分布式测试的方法,在各个主要监测点,模拟用户进行真实呼叫,得到人体感知的语音质量等反映网络运行质量的参数,维护人员可以设定系统模拟用户呼叫的频率和时间,定时拿到测试报告,及时发现网络运行中的故障,尤其是人体感知的语音质量故障,在用户投诉之前就有可能解决问题,它也可以实现7×24h的网络故障报警。
那么,我们分析一下这两种维护模式的异同。
3.2 主动式维护和被动式维护
(1)主动式维护模式与被动式维护模式的相同点
●两种维护模式都采取集中控制或集中采集的方式,控制台都可以在第一时间掌握各个节点的故障信息,为故障排查争取时间;
●两种维护模式都是7×24h系统,适用于电信运营商的网络维护。
(2)主动式维护模式与被动式维护模式的不同点
●被动式维护模式主要采用监控手段,被动采集信息,可以针对信令网络(主要是No.7网络)进行维护,对排查信令故障比较有效;主动式维护模式主要采用测试手段,主动模仿用户发起呼叫,得到真实的人体感官体验信息(例如话音质量参数),对排查用户投诉比较有效。
●被动式维护模式是运营商在PSTN系统维护中应用比较成功的系统,PSTN系统采用64kbit/s固定话路,语音质量非常稳定,网络故障主要集中在信令网络,因此被动式维护模式在传统的PSTN网络比较适用;主动式维护模式,随VoIP网络的发展而逐步发展,并在VoIP系统维护中得到广泛应用,VoIP系统由于采用IP方式,话路带宽没有保证,语音质量不稳定,网络故障主要集中于语音质量问题,因此主动仿真用户发起呼叫测试的方法,既可以发现信令协议层面的问题,更主要的是它能够及时发现用户语音质量的问题,在用户投诉之前就可以发现问题。
●被动式维护模式是事后维护模式,它并不能在VoIP系统中及时发现网络故障,尤其是用户的语音质量故障,而是用户投诉后,在它保存的数据库中查找该用户的呼叫追踪信息,费时费力;主动式维护模式是事前或事中维护模式,它能够根据网络语音质量参数的变化,及时发现两个或多个测试点之间的故障,发出预警,并找到故障点,进行进一步排查,即使在用户投诉后,也可以及时还原用户故障并加以排除。
(3)假想的例子
●假设某个运营商在某个城市部署了A/B/C三个VoIP局点,或者制改造了核心网部分,并同时部署了主动和被动式维护系统。
●某天,A局到B局之间由于网络数据过载而造成通信故障,用户感觉语音质量下降严重;C局的某个用户由于自己的VoIP终端问题也感觉到语音质量不好;这样A/B/C三个局都有用户来投诉,我们来看看两种维护系统的表现。
●被动式维护系统监测到了A局到B局之间有大量丢包,网络延迟很大,给出网络告警,但并不知道用户那里的话音质量到底是什么样,只能等待用户投诉后的描述;A/B局用户投诉后,维护人员输入用户号码和故障时间到监测系统中进行过滤,找到呼叫追踪信息,并找到相应的承载话音的RTP流(数据量极大),通过事后分析,确认语音质量(MOS)不好,但究竟哪里出了问题还是一头雾水。这时C局的那个用户来了,说他的话音质量也不好,维护人员经过过滤排查,并没有发现他的呼叫质量有问题,只好再观察,C局用户很不满意地离开了,A/B局的用户也只是得到了网络问题的答复而已。
●主动式维护系统通过A/B/C三个测试点两两的测试(假设5min发起一次呼叫测试),知道A,B局间网络丢包严重,网络时延较大,用户通话出现断断续续,语音质量严重下降,肯定会有用户投诉,维护人员通过测试报告得到初步结论:网络故障。对于C局用户的投诉,由于主动维护系统并没有得到C局与A,B两点之间的故障报告,所以怀疑C用户的终端有问题。根据对C局用户终端的语音质量测试(系统具备此功能),发现C用户终端有编解码问题,换了终端,问题得到解决,C用户很满意。A/B局的用户并不满意,他们抱怨说,平时打电话质量很好,今天就不行了。于是,维护人员又采用主动式系统,在晚间闲时对A,B间进行了一次100路的性能测试,呼叫一段时间后,出现网络过载,用户的话音质量下降,问题再现了!维护人员对网络优化后,问题彻底解决了。
我们刚刚举了一个比较极端的例子,事实上,两种维护模式应该是相辅相成的,运用得体,会起到很好的效果。
(4)实例
●某个运营商在某个城市部署了几个VoIP局点,开始试运营,并在重点局点同时部署了主动和被动式维护系统。
●从一开始,就有用户投诉,他们打电话总有“单通”现象,即一方听得见对方,但另一方却什么也听不见,话音好像只能单向传输;由于开始用户投诉少,运营商并没有在意,但是随着放号量的扩大,用户投诉大量涌现,运营商开始紧张起来,并开启了主动和被动维护系统(以前并没有真正使用)。
●很快,主动式系统报出了某两个局点之间的用户通话存在“单通”现象,运营商半信半疑,找出了被动式系统存储的RTP话音数据,发现确是只有单向话音流,而并非双向。
●VoIP系统的提供商开始推卸责任,这肯定是网络有问题。于是,运营商找来网络测试仪表进行IP网络检测,发现网络很正常。一切的怀疑点都在VoIP系统设备提供商身上,他们只好低头查找自己的问题,终于在几天后,发现系统中存在一个BUG,很快“单通”问题得到了解决。从此,运营商觉得维护系统对它还是有价值的。
3.3 结论
(1)对于运营商的传统PSTN网络维护,被动式监测系统占优势。
(2)对于VoIP网络或PSTN+VoIP混合网络维护,我们要看具体情况。在网络部署初期,主动式测试系统占优势,它不但能够及时报告网络损伤和用户感知的语音质量,还能在用户投诉后及时再现问题,并可以对用户终端进行排查,找到问题所在;在网络逐步走向成熟后,话音质量问题逐步减少,被动式监测系统会发挥更大的作用,因为这时候网络协议交互方面的维护显得更加突出。
(3)运营商采用主动式系统和被动式系统维护NGN网络,如果运用合理,能够起到相辅相成的作用。
|
| |