VoLTE经验总结
1 广州VOLTE网络质量现状
经过近三个月的优化工作,广州ATU网格内,掉话率逐步改善,从11.5%(四月)下降至3.27%(七月);接通率从93.1%提升至6月份的96.6%,七月份下降至89.46%。
七月份测试期间核心网的IOT测试也在进行;较多invite 500、SIP unknown、MT CSFB等异常问题导致的连续多次未接通。广东公司计划在本周对广州IMS进行华为IMS替换爱立信IMS的操作,故七月份测试遇到的异常IMS相关问题分析进度暂缓。
2 广州VoLTE测试问题优化进展
2.1 异频重定向掉话问题验证(问题解决)
背景:中兴eNodeB在P01版本下,因邻区缺失导致异频重定向掉话,该问题需升级P02版本解决。
网格44、45测试过程中未发生异频重定向掉话,信令上分析测试过程中出现过多次连续上报异频A3的测报,未切换也未发生重定向,P02版本禁止QCI 1 业务异频重定向功能生效。
2.2 异系统重定向掉话问题验证(问题解决)
背景:中兴eNodeB在P01版本下,VoLTE发生重定向掉话,该问题需升级P02版本解决。
网格44、45基础覆盖较差,以往拉网测试均会发生多次系统重定向掉话,7月24日,网格44、45完成P02版本升级,升级后重定向掉话问题解决,拉网测试掉话率改善明显。
P02版本禁止QCI 1业务重定向功能打开,终端上报A2(盲重定向门限)或B2事件(2G邻区信息错误)等前期会导致重定向的情况下,网络均未下发重定向,VoLTE业务保持通话结束后自动挂机,未产生掉话事件
2.3 TM3/8转换掉话问题验证(问题解决)
背景:中兴eNodeB在P01版本下,VoLTE业务过程中发生TM3到TM8模式转换,因为基站提前转换导致终端掉话,该问题需升级P02版本解决。
8月3日,网格45所有升级站点打开TM3/8自适应,验证VoLTE业务在TM3与TM8进行转换时是否掉话,测试结果如下:
网格45遍历拉网测试中出现26次TM3向TM8的模式转换,转换正常未发生异常。
2.4 X2开启告警验证(问题解决)
背景:广州前期因中兴网管告警问题未打开X2接口,导致跨站重建立不可用,需升级P02版本对X2告警量进行抑制。
8月5日,网格44、45所有升级站点打开X2接口功能,指定开启X2自配置站点213个,8月6日统计站点X2偶联条数共计4604条。
告警问题:
网格44、45开启X2后,8月6日网管出现60多条X2断链告警,告警主要原因:
a、传输不通,部分微站无法与宏站正常建链;
b、个别小区被蔽塞不能正常建链;
升级后EMS网管上只出X2断链告警,并且所有基站仅出1条(多条X2断链),无SCTP断链告警,网管上可明确区分X2与S1告警,告警量大幅下降。
2.5 X2开启跨站重建立功能验证
P02版本支持无邻区的跨站重建立,在X2链路建立后,对于无邻区跨站重建立带来一定的增益,提高跨站重建立的效率;
X2开启,网格44统计VoLTE拉网发生重建立请求共14次,跨站重建成功6次;从性能指标统计来看,RRC重建成功率从50%左右提升至80%左右。
原理:目标小区通过终端上报的PCI查找该站点保存的有X2关系的邻站所有小区信息,向所有相同PCI小区索取上下文。
3 广州VOLTE优化经验
3.1 日常优化工作
日常优化工作主要从无线覆盖优化、参数优化、系统内外邻区优化,功能优化四个方面着手,与ATU路网、工程建设紧密配合,提升整体网络质量。
3.2 RLC优先级优化
现象:呼叫建立与切换过程冲突,专载被MME释放。呼叫建立过程中专载建立与切换几乎同时发生,MME未收到NAS专载完成消息导致释放专载,终端回复invite580(也有上发CANCLE的情况),专载丢失形成未接通事件。
原因分析:QCI5设置的RLC优先级为2,高于SRB=2(传送NAS层消息)配置为3. 导致NAS的层3消息已经比MR要早,但是因为优先级比MR和SIP低,未及时发送。
优化措施:降低QCI 5优先级,确保SIP消息及时上传,修改后此类问题改善明显。
3.3 QCI 5 PDCP DiscardTimer时长优化
现象:终端业务建立过程中,出现SIP信息传递丢失的问题,导致收到网络下发的INVITE500或者580等原因值释放。
原因分析:UE在无线信道较差的情况下,SIP信令发送或接收不完整或者无法及时传递,导致IMS相关定时器超时而发起会话cancel。经过分析,由于QCI5的pdcp 丢弃时长过小,在无线覆盖较差的地方,上行时延会变大,容易导致QCI5信令丢包。
优化措施:
QCI5 PDCP DiscardTimer由300ms修改为无穷大
优化效果:
VoLTE无线接通率提升明显
3.4 SBC传输协议TCP重传次数优化
背景:被叫从2G返回4G后,主叫起呼,被叫首先bye消息,紧接着接连收到多条上一次呼叫的invite,被叫回复bye481\\invite486\\invite580,呼叫失败。
优化措施:爱立信SBC对TCP配置进行了修改:最大重传次数从15次改为5次,最大重传隔间从十几分钟改为15s,此类问题已解决。
3.5 系统间邻区优化
广州LTE网络的GSM邻区关系根据工程参数、共站2G邻区同向小区继承进行规划,同时根据4G、2G道路测试数据匹配进行邻区补充:
4G弱信号路段与2G拉网服务小区匹配:利用第三方拉网测试数据,将4G和2G拉网信号强度、经纬度、服务小区等信息导出。通过经纬将4G弱信号(RSRP<-110dbm)与2G强信号(RXLOV>-95dbm)在50米范围内拟合,根据拟合度对2G邻区进行补漏工作
5月份第一轮拟合数据,剔除现网已配置的邻区关系,补漏483对;
6月份第二轮拟合数据,剔除现网已配置的邻区关系,补漏邻区关系487对。
eSRVCC切换提升明显,且由于2G邻区不准确导致的异系统重定向大大减少。
3.6 重定向掉话
中兴区域掉话最严重属于重定向掉话,在中兴基站算法中,以下三种可能发生重定向,重定向释放RRC后,专载同时被拆除,VoLTE业务产生掉话。
3.7 上行PUSCH功控参数优化
背景:4月集团在中兴区域拉网测试发现上行PUSCH发射功率偏高,对现网参数检查发现,中兴区域上行期望功率值设置过高。
优化措施: 进行功控相关参数优化,
现网配置: p0NominalPUSCH =-75 ;puschPCAdjType=0
优化值: p0NominalPUSCH =-87 ;puschPCAdjType=2
●同等路损情况下,参数修改后,ue发射功率大约下降2~3dB。
●目前终端平均上行发射功率仍高于10db,仍需中兴完善现有功控方式。
修改后,PUSCH TxPower(10dbm以上)占比由40%下降到30%左右。
3.8 RTP丢包率优化
背景:4月份测试中,中兴区域RTP丢包率偏高,个别网格甚至达到2%以上。
原因分析:在无线质量较好的情况下基本无丢包;无线质量较差的情况下上行丢包现象较为严重,PDCP重传时间超时,数据包将被丢弃;
外场测试表明QCI 1 PDCP Discardtimer 配置与RTP丢包率及Jitter有密切关系,QCI 1 PDCP Discardtimer 配置越大,RTP丢包率越低,但Jitter也随之变大。
●MOS值与RTP丢包及Jitter关系都较大,目前广州正在601P02版本下进行100ms / 300ms / 500ms / 750ms / 1500ms / infinity完整的对比验证。
●进一步联合中兴公司定位RTP丢包率偏高的问题,并推动产品功能算法改进。
3.9 MME专载保存功能(可选)
功能描述:在基站发起UE-lost原因值的上下文释放请求时,MME保持专载2s不释放,等待空口重建。
验证情况:已在GZMME1602下成功验证了该功能。当时无线环境较差,UE发起RRC重建失败,通过MME专载QCI1保持功能使得在新发起的业务过程中,RRC重配中建立包括专载QCI1的3条DRB,不会发生掉话。(本次测试中专载保持时长约1.358s)
功能总结:
1)当无线环境较差时,UE发生RRC重建,若RRC重建成功,手机将不会掉话。
2)MME侧也可以在RRC重建失败后,通过MME专载QCI1保持功能使得在新发起的业务过程中,专载QCI1继续保持,也可使得手机不掉话。
3)此功能为爱立信MME非必选功能,建议打开。但是该功能不在集采目录,暂时无法采购。
3.10 专载释放与切换冲突,通话结束未收到专载释放掉话
[问题描述]:在拉网测试过程中,通话挂机后,主叫上报BYE消息,IMS回BYE200消息前后,同时手机发生切换,未收到EPS专载释放请求,1s后软件统计掉话。
[问题分析]:经分析MME log,发现MME未收到PGW下发的delete bearer request消息。当X2切换触发SGW-initiated bearer modification procedure(完整信令是CCR-CCA),如果此时SIP挂机触发PCRF也发RAR给PGW,由于Gx链路时延等原因,使得RAR先于CCA到达PGW,根据协议规定,PGW会继续SGW-initiated bearer modification procedure而reject RAR (result code DIAMETER_OUT_OF_SPACE)。
[优化措施]:当前解决办法:
(1)缩短DRA时延配置。
(2)修改SAPC到DRA链路为主-备模式,保证CCA和RAR走同一路径和到达PGW的先后顺序。
[优化结果]:近期调整后的网格测试,暂时没有发现BYE200消息前后发生的切换没释放QCI 1专载的情况。
3.11 通话结束MME收到del bearer req,专载释放与切换冲突,基站未下发NAS
[问题描述]:通话挂机后,主叫上报BYE消息,IMS回BYE200消息前后,同时手机发生切换,EPS专载没有释放,1s后软件统计掉话。
[问题分析]:主叫挂机后,MME收到del bearer req,下发Deactivate EPS bearer context Request给源eNB携带NAS释放专载,但同时源eNB触发X2切换,向MME响应ERAB release response (X2-Handover-Triggered),NAS消息未下发到手机。根据协议36.413 中8.6.2.4有描述当eNB在触发X2切换时,eNB将不传递NAS消息。
[优化措施]:属测试软件统计问题,建议软件加以剔除该问题。
4 存在问题和建议
设备功能问题:
●切换冲突问题:基站无法解码SIP消息,UE专载建立完成的NAS消息上报时间无法确认,基站侧难以彻底解决,需要核心网做相应的功能优化,
●呼叫过程eSRVCC:IMS不支持呼叫过程中发生eSRVCC,在4g网络覆盖达到2g规模之前,该问题都不可避免存在。
终端eSRVCC测量性能提升
4G弱覆盖比例较高:广州网格范围内黑点路段603个,是VoLITE业务问题多发路段,大部分需要加站解决,专项整治计划进度和质量不在项目把控范围。而目前芯片在测量GSM邻区的时延较长,存在LTE弱信号拖死掉话的较大概率。
2 案例分析
2.1 典型案例
案例1:LTE弱覆盖,eSRVCC切换不及时掉话
10:57:29.710基站下发异频异系统测量报告,包含2G频点及B2门限(LTE:-110,GERAN:-95)
10:57:38.479,主叫达到B2门限
10:57:42.109,主叫RSRP已恶化至-117dBm,SINR至-3,但终端仍没有上报B2事件
10:58:05.587,RTP包不能正常收发,10s后RTP inactivity定时器触发,会话中断,出现掉话:
解决建议:
①规范LTE频点配置,清理多余异频频点,缩短终端测量周期;
②终端芯片提高测量能力,尽快实现CDRX休眠期测量功能。
案例2:VoLTE单通现象
VoLTE单通现象分为两类:一是VoLTE打VoLTE单通,二是VoLTE拨打GSM单通。经分析,第一类主要是终端问题,第二类主要是网络问题。
注:红圈为RTP包抓包位置
案例3:eNodeB参数配置不合理,导致eSRVCC失败
问题现象:
终端发生eSRVCC时,在LTE向GSM切换过程中产生掉话。
问题分析:
终端可以正常收到测控消息,并上报测量报告,且掉话发生在向GSM切换过程中,是GSM或者和基站侧参数设置问题。
问题解决:
基站BsCAccess-ID项中的管理状态为Locked,设置有误。将该状态修改为Unlock后,对该站点进行重启后发现eSRVCC功能正常。
2.2 空口信令判断案例
案例1:RRC重建失败,无线网问题
现象:切换失败导致RRC释放,重建RRC未成功,重新进行RRC申请,QCI=1的承载未建立成功,导致掉话
分析:呼叫重建失败后,新小区重新申请RRC,未能建立VOLTE专载,导致掉话。该流程均由ENODEB控制执行。而切换失败的原因往往是无线环境问题、参数配置不合理、邻区漏配、非竞争随机接入异常等,均为无线网问题。
结论:切换失败与RRC重申请流程均与EUTRAN相关,因此认定为无线网问题。
案例2:基站异常导致双端无下行信令及RTP包断传,无线网问题
现象:主被叫VOLTE接通后,在同一小区同时发生缺失下行信令20秒,此后数秒发生终端上发bye request挂断。
分析:丢信令之前,主被叫双端处于同一小区,且RTP包双向传输正常。丢信令期间,终端测量信息完整,但在2秒后发生RTP包只有终端向网络单向传输,未再有任何网络下发的RTP包,高度怀疑基站临时故障导致。
结论:软件显示丢信令,但通过进一步分析确认应为基站故障导致。无线网问题。
案例3: VOLTE接通下发生IMS注册掉话,IMS网络问题
现象: VOLTE接通后,被叫发生IMS注册且成功,此时主叫收到网络下发的bye request内含注册超时字样
分析:按照3GPP协议,终端应在3000秒上发注册,本次华为SBC于3600秒才收到注册请求,此时IMS认为注册超时,对主叫下发了sip bye消息释放了。
但通过进一步确认,终端实际于600秒前已上发了注册消息(UDP),但此时恰好在G网下,未收到回复:
注:同样类型的掉话也有600秒前处于LTE网(TCP),而未收到OK或未鉴权回复的情况
结论:前10分钟的注册失败,导致了后续的IMS通话中释放,虽然终端前一次的失败处理机制可能存在问题,但仍然体现出IMS对通话中发生注册时直接释放会话的措施欠妥。
2.3 网元流程判断案例
案例1:被叫收到寻呼但未收到INVITE请求,核心网问题
现象:主叫上发了invite,被叫收到了寻呼且建立RRC成功,此时应收到下行的invite,但始终未收到。
分析:被叫响应寻呼并进行了RRC申请,表明MME已收到由SGW触发的数据业务请求,即sip invite消息应由IMS网元的SBC下发给了PGW、SGW。
①Sip invite消息由IMS网元SBC下发到被叫核心网网元PGW
②PGW转发给SGW,SGW通过S11触发MME进行寻呼被叫
③被叫被寻呼到,并完成RRC连接与建立默认承载所需RAB,接收数据
结论:收到寻呼消息表示sip invite数据包已经到达了LTE核心网,未能继续下发当前怀疑是sip数据在S/PGW异常丢失。
案例2:重配置消息释放DRB承载,无线网与核心网配合问题
现象:被叫上发sip183后,在激活EPS承载之前,终端上报了1条A3测报,激活EPS后,发生切换重配置消息中释放了QCI=1的DRB。
分析:起呼时MME进行激活EPS承载流程过程中,恰好发生S1切换时,由于EPS承载建立未完成,MME在切换准备阶段,对下发到目标小区的切换准备的请求消息中不
携带QCI=1的VOLTE专载,导致VOLTE专载源小区完成的情况下,在目标小区被释放,切换完成后呼叫中断
①切换准备时,MME向目标小区发切换请求,RAB建立请求表只有2条,无QCI=1的专载
②目标小区收到MME的切换请求后,回复的切换确认消息里仅有2条RAB建立
③MME向源小区下发的切换命令消息中,只建立2条承载,导致ENODEB释放了QCI=1的VOLTE专载。
结论:切换与EPS激活流程碰撞,无线网与核心网配合问题。在进行激活EPS专载过程中,发生切换时,均会造成上述问题,目前还无较好的解决办法。
2.4 网络设备问题案例总结
案例1:中兴ENODEB异频重定向掉话,无线网问题
现象:主被叫VOLTE接通后,服务小区信号较差,但未配置异频邻区;通过重定向消
息RRC connection release携带频点,由D频段重定向到F频段,但VOLTE呼叫不支持重定向方式的RTP包接续,导致掉话。
设备:中兴ENODEB
分析:中兴设备为了防止邻区漏配情况下,影响用户在LTE数据业务下的感知质量,默认具备异频重定向功能,但未曾考虑对VOLTE呼叫的接续保持。
结论:完善邻区配置,在VOLTE呼叫区域考虑关闭中兴设备的异频重定向功能。
案例2:华为基站到卡特切换导致的RTP包传输中断问题,无线网问题
现象:主被叫接通状态下,在发生一次由华为设备到卡特设备的切换后,20秒后主被叫终端同时上发了bye request消息,网络侧回复bye(487 Request Terminated),后网络去激活了EPS承载,掉话。
设备:华为ENODEB与卡特ENODEB
分析:PDCP SN SIZE长度有12bit和7bit,目前华为基站配置为12bit,贝尔配置为7bit,两个厂家配置数据不统一。华为enodeb设备具有自适应功能。
①在华为小区起呼时,切换到卡特小区时,卡特无自适应功能,PDCP SN不一致导致组包混乱。
②当在贝尔小区起呼时,切换到华为小区时,华为PDCP SN自适应为7bit,通话正常。
结论:临时解决方案:华为PDCP SN Size修改为7bit,进行拉网测试主叫呼叫56次,未出现终端主动上发bye的掉话。异常掉话及切换后单通问题基本解决
案例3:爱立信IMS网元CS域呼叫处理能力不足问题,IMS网络问题
现象:在做互通测试过程中,主叫VOLTE起呼后,被叫始终在TD下未收到寻呼消息,主叫收到网络侧下发trying后,立即收到网络下发的invtie 604(Does Not Exist Anywhere),呼叫失败。
设备:爱立信IMS
分析:空口信令仅能确认,被叫端处于TD网,发INVITE到MGCF,MGCF回复604 Does Not Exist Anywhere。该问题为爱立信IMS网元MGCF默认配置仅能同时容纳32个CS域呼叫,导致互通测试过程中,由于容量不足,造成大量连续未接通。
结论:爱立信IMS网元MGCF默认配置容量偏小,发生以上问题后,经过扩容已达可处理2、3G呼叫320个。
案例4:华为EPC修改EPS与切换碰撞,拒绝承载修改。核心网问题
现象:主叫VOLTE起呼后,收到网络回复trying,激活了EPS承载后,又进行了1次EPS承载的修改,此时主叫侧在发生了1次LTE的切换后,收到IMS网络下发的sip503消息,服务不可得。
设备:华为EPC
分析:某地在激活EPS完成后,仍需要进行2次EPS承载的修改,本次呼叫时第2次EPS的修改(空口信令不可见)恰好与切换同时发生,当IMS要求核心网PCRF需要对EPS承载进行修改时,由于切换具有更高的优先级,华为EPC拒绝了承载更新,而只执行切换,导致IMS下发sip 503消息中断呼叫
该市合适的CQI=1的EPS承载建立需要3个步骤:
①CQI=1的初始EPS承载建立,GBR=40kbps但TFT无IPV6地址
②修改GBR49kbps支持高清语音并对TFT内的增加IPV6地址以及 UDP端口进行修改
③在现有TFT中再新建两个ptf。
结论:冗余的EPS承载修改TFT,一方面导致了呼叫建立时延长;同时增加了与切换发生冲突的几率;华为EPC在切换与修改EPS承载冲突时,不具备同时处理或排队处理的
能力,导致直接以“资源临时不可得”拒绝了承载更新。一方面建议降低EPS承载修改次数,减少切换碰撞几率与时延;另一方面建议华为EPC进行升级。
案例5:华为EPC、中兴IMS协议理解不一致。IMS网络问题(升级SBC解决故归此类)
现象:VOLTE起呼后,EPS承载激活完成,有一定几率1秒后直接收到网络直接下发sip 500消息(Server Internal Error),中断呼叫。
设备:华为EPC、中兴IMS
分析:EPC按照3GPP规范产生的计费标识中包含“0a”的内容,但在IMS网络中,按照SIP协议将“0a”解析成换行符,造成对计费标识的误读。导致中兴IMS网与华为EPC网元PCRF对RX接口中字符格式理解不一致;中兴不支持PCRF通过Rx接口返回的不可见字符,导致了IMS直接下发了内部服务器错误
经过IMS内部信令跟踪:
①中兴IMS网元SCSCF返回500错误,原因为收到SBC转发的invite request消息携带的PCV头部有问题,发现换行符(0A),导致S-CSCF网元上解码认为头部结束,从而认为不合语法规范,获取ecid失败
②华为EPC网元PCRF通过Rx接口返回接入网络计费标识
( Access-Network-Charging-Identifier-value),至中兴IMS SBC,而后中兴SBC通过ecid参数来HEXDIG编码上述计费标识信息
29.214协议:The Access-Network-Charging-Identifier-Value AVP (AVP code 503) is of type OctetString, and contains a charging identifier
结论:即3GPP该计费标识可以包含字符串形式,中兴按IMS SIP协议理解ecid只能是可见字符,对字符串形式不进行HEXDIG转换,导致了上述问题。临时解决方案,中兴SBC进行相应的版本或补丁解决,支持不可见字符。
因篇幅问题不能全部显示,请点此查看更多更全内容