为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

通信设备硬件可靠性预测的后处理

2017-11-29 8页 doc 58KB 16阅读

用户头像

is_083599

暂无简介

举报
通信设备硬件可靠性预测的后处理通信设备硬件可靠性预测的后处理 否满足用户对持续稳定可靠通信服务的需求。一旦发生典我们把故障率λ的倒数记为平均故障间隔时间MTBF。阿 型的硬件故障,所造成的现场硬件召回更换、返厂维修、现 朗Bell实验室基于美国国防部可靠性分析中心提出的MIL- 场业务丢失、服务品质下降等一系列影响,将对通信设备制 HDBK-217标准,推导生成适于商用电子产品的Telcordia 造商、及运营商带来巨大损失。 SR-332标准,制定黑盒稳态产品故障率λ及平均故障间隔 本文中硬件可靠性预测的后处理,是指通信产品在其 时间MTBF的计算方...
通信设备硬件可靠性预测的后处理
通信设备硬件可靠性预测的后处理 否满足用户对持续稳定可靠通信服务的需求。一旦发生典我们把故障率λ的倒数记为平均故障间隔时间MTBF。阿 型的硬件故障,所造成的现场硬件召回更换、返厂维修、现 朗Bell实验室基于美国国防部可靠性中心提出的MIL- 场业务丢失、服务品质下降等一系列影响,将对通信设备制 HDBK-217,推导生成适于商用电子产品的Telcordia 造商、及运营商带来巨大损失。 SR-332标准,制定黑盒稳态产品故障率λ及平均故障间隔 本文中硬件可靠性预测的后处理,是指通信产品在其 时间MTBF的计算方法,并逐步修订优化,成为通信行业 上游生命周期的设计阶段,推导出硬件可靠性预测论数据 公认的硬件可靠性预测标准。 (包括产品故障率λ及平均故障间隔时间MTBF),以及在下 事实上,在以集中规模效益为主的通信设备制造商 游生命周期中的制造、物流和现场维护环节的敏捷后处理 的内部,许多和硬件相关的工作都以并行处理方式运行, 方法。不同于常规的硬件可靠性反馈机制,该方法可以不依 如硬件设计部门不停地开发新产品、采购部门每个月都在 赖于产品返修环节对故障返修数据的统计分析,使硬件设 不断引入新的供应商部件、制造部门每周都根据订单将生 计部门的角色从被动接收到主动跟踪,能够有效发掘产品 产出的产品发往用户现场,这当中有相当多的不确定动态 硬件隐患、有利于即刻采取应对措施以限制故障的影响。对 因素。而在设计阶段得到的新产品的可靠性预测数据是一 于部门分工职责明确、部门间协作流程健全却复杂的大中型 个恒定的数据,难以和平日繁忙多变的公司运营环境有机 通信设备制造商、通信运营商都有着积极的借鉴意义。 结合起来。从流程的角度来说,保护产品的硬件可靠性在 理论上都有应对的法则,譬如严格的供应商审核制度:一 旦发现有部件失效,现有部件库存、制成产品库存及已发 往用户的产品都有一系列的应对措施,供应商管控评级分 2 可靠性现状中的问题 数也要下调;譬如采购部门每当新引入新的供应商部件充 随着现代通信产品生命周期流程的逐步成熟,在产实既有部件资源,多个产品线的各个硬件设计部门都要评 品设计阶段就要求对设计中的产品做量化的可靠性预测, 估是否需要重复一次在开发阶段执行的复杂应力产品可靠 收稿日期:2012-03-01 检验手段;再如新产品发布推向市场以后,返修部门经成,当全部部件工作正常、系统完整才算正常。对对新产品的故障返修数据分类统计分析,对疑似单一故 冗余设计的独立功能单元来说,串联的可靠性计算 类型畸高的新产品反馈给设计部门,要求做升级改进等 没有夸大可靠性故障,因为对硬件的角度而言,即 。但在实际操作中,以上这些流程在可执行效率上经常 链路冗余当中一路发生故障,从外部看功能单元在 出现争执,如针对后引入新部件的过度复杂的应力产品 工作”,但该单元依然要判决为已发生故障,因其 靠性检验的投入成本很高、甚至超过引入新供应商部件 分的功能已经受损。对于由多个硬件功能单元组成 来的收益,但是鲁莽的简化评估又为制造中的新产品可 硬件整机,串联的可靠性计算方法就不再适用,因 性带来风险;再如在新产品的入市初期,返修部门对于 系统已经考虑了硬件功能单元之间的冗余保护,系 产品的故障定位及返修的技能掌握有限,前期成功返修 的可用性指标比单一功能单元有所提升,而串联的 率不高,故障返修统计数据的精确度较差,而对于抓住 计算方法特点是组成部件越多、可靠性计算结果越 个真正需要改进的可靠性问题的反馈流程周期非常长, 此,可靠性预测的后处理都要指向独立可更替的硬 时硬件设计部门在一年半载之内都无法得到对新产品的 单元,而不适于由其组成的设备硬件整机和由其构 靠性问题的准确返修反馈。 杂网络系统。 大多数的硬件产品可靠性的问题都与设计有关,或 单个部件i的可靠性呈指数分布,即: 至少可以通过改进设计解决问题。可以说随着硬件设计 门能力的逐步成熟,新产品的大部分硬件可靠性问题已 易排查的上游环节的单纯设计可靠性及设计问题, 变为更加复杂的下游环节的、如生产个别部件品质或返 对于n个部件串联而成的硬件功能单元CP,其 诊断效率导致的可靠性隐患。后者带有很大的隐蔽性, 为:往能逃过专业设计工程师对部件规格书参数的严格审 ,甚至在部件混用产品样本量充足的前提下,也能通过 规的功能集成测试及产品可靠性应力检验手段的考验。 这样的前提下,在设计阶段得到的新产品的可靠性预测 据故障率λ及平均故障间隔时间MTBF已无法有效覆盖 ,即该功能单元的硬件故因而, 述动态因素。在某些情况下,下游的返修部门仅将上游 于全体部件的故障率之和。 事实上每一具体类别计部门的新产品预测数据作为一个理论参考数据,而根 部件的预测故障率也不 自己部门掌握的实际故障返率修统计,即规定时间内因 确定的常数,而是带有调整因子的变量,即: 量问题返回数量/规定时间内产品销售总数,结合公司 λλπππ=iGiQiSiTi 产品的通用要求制定新产品的设计复评估预警线。这个 其中λ是该部件的基准故障率(标准中对于 Gi理方法孤立了原预测数据,增加了可靠性数据的客观真 别的部件,如电容、电阻、连接器、集成电路、 性,看上去更有道理,但是却拉低了公司整体对新产品 列、线圈、内存等,都有明确的基准故障率参照 靠性问题的响应速度,导致反应迟钝滞后、造成更多的 π是供应商质量等级因子,π是电应力因子,π是 QiSiTi患产品流入市场,隐性增加额外的召回成本。 力因子。如果该功能单元处于室外、运动中等特殊 境要求,单元的总故障率还要考虑π环境因子的影 E 产品的平均故障间隔时间MTBF,也就是通俗 平均故障前寿命,是功能单元的硬件故障率的倒 可靠性预测的后处理 。考虑到组成功能单元的每一具体Telcordia SR-332标准对硬件可靠性的预测方法是基于 联硬件系统,即被预测的硬件功能单元由各部件串联组 部件的故障率只是统计平均值,其样本中每一个部 举例如下:某一消费类接入产品新版本NP 发布于 利于尽早发觉复杂的可靠性问题。 2011年第11周,其中有包括X、Y、Z等多个新功能单元。 2011年5月,采用可靠性预测后处理手段的跟踪数据 看其中的X,在设计阶段中,按照Telcordia SR-332标准计 显示,某远端接入电路板RATB的现场问题剧增,此时返 算得到X的可靠性预测的结果是: 修部门处在对故障返回的RATB分析过程中,初步判定并 -9 λ=15598.64(10 /h) (4) 无明显典型故障,返修部门和现场维护部门的观点并未达 x (5) 成完全一致,该问题按流程仍处于故障调研、再确认阶 MTBF=7.3y Xr X从第12周开始正式批量生产,每周都会有一定数量 段。硬件设计部门根据预测后处理数据,主动收集了一些 的X按合同计划发出公司,产品发货后平均三周左右在运 RATB故障疑似样本,结合现场维护部门对故障的现象描 营现场上电割接完毕。如果将每周的X视为同批样本,则 述,最终发现这些故障疑似样本的多通道以太网数据链路 X的故障返回预测如1所示。 的通讯误码率偏高——以太网端口虽可以正常通信,但在 也就是说,设计部门可提供X故障返回的预测模板, 数据流量高发的瞬间会发生拥塞。限于手段原因,常规的 交由制造部门每周根据实际的X订单发货填写左边两列的 硬件快速检验程序只对RATB的各部件调用预设的硬件自 表1 故障返回预测表 Wk112 Wk113 Wk114 Wk115 Wk116 Wk117 Wk118 Wk119 Wk120 Wk121 Wk122 Wk123 Wk124 发货数量 Wk112 678 0.0 0.0 0.0 1.8 3.5 5.3 7.1 8.8 10.6 12.3 14.1 15.8 17.5 Wk113 1,123 0.0 0.0 0.0 0.0 2.9 5.9 8.8 11.7 14.6 17.5 20.4 23.3 26.2 Wk114 1,566 0.0 0.0 0.0 0.0 0.0 4.1 8.2 12.3 16.3 20.4 24.4 28.5 32.5 Wk115 1,687 0.0 0.0 0.0 0.0 0.0 0.0 4.4 8.8 13.2 17.6 22.0 26.3 30.7 Wk116 1,645 0.0 0.0 0.0 0.0 0.0 0.0 0.0 4.3 8.6 12.9 17.2 21.4 25.7 Wk117 1,726 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 4.5 9.0 13.5 18.0 22.5 0 0 0 2 6 15 28 46 68 90 112 133 155 预测返回故障合计 图1 故障RATB排阻损伤切片的显微镜图和扫描电镜图 程序,只简单判断以太网端口功能的好坏,并无针对端 参考文献: [1] 王少萍. 工程可靠性[M]. 北京: 北京航天航空大 通信的不同传输速率的检验。这就是为何现场维护部门 社, 2003. 定故障,而在返修部门送回生产线复测却不能定位出故 的原因。后来硬件设计部门采用微观失效分析的手段, [2] 姜兴渭,宋吉政,王晓晨. 可靠性工程技术[M]. 哈尔 现了造成RATB多通道以太网数据链路的通讯误码率偏 尔滨工业大学出版社, 2005. 的硬件故障点,是连接以太网物理收发器的设备端的集 [3] MARVIN RAUSAND. 系统可靠性理论:模型、 排阻的阻值发生改变,部分内部独立阻值的原100Ω的 法及应用[M]. 郭强,王秋芳,刘树林,译. 北京: 国 称产生了不大于80Ω的阻值漂移,造成以太网数据链路 出版社, 2010. 误码率偏高。通过切片观察发现,造成阻值漂移的物理 [4] MICHAEL PECHT. 产品可靠性、维修性、保 伤机理是该排阻的故障电阻的电极端薄膜的断口,断口 册[M]. 王军锋,陈云斌,周宪,译. 北京: 机械工业 2011. ? 常细微,常规的Xray检测也无法探知,如图1所示。 针对以上问题,硬件设计部门召集多个部门专家收 过程证据并会诊,找出其原因是某电阻部件供应商在成 优化环节变更了电阻膜的材质。从部件供应商的检测角 作者简介 看,新材质排阻的可靠性与原部件等效,因此该排阻部 规格书中的MTBF指标没有降低。实际上该材质在后续 工程师~硕士毕业梁宏坤,免洗回流焊表贴装配以后,因不能耐受残留驻焊剂的渐 理工大学模式识别及智能 侵蚀而形成电阻膜断裂,造成可靠性大幅滑落。找到原 业~现就职于上海贝尔股份 以后,采购部门协调部件供应商改良制造工艺,制造部 司~主要研究方向为通信设 维修库存RATB产品,现场维护部门协调运营商轮流召 件开发设计。 RATB产品回工厂返修,将故障的影响遏制在了萌芽状 。 从这一可以看出,硬件可靠性预测的后处理方 简化了可靠性问题的反馈流程,在新产品入市初期协助 工程师~硕士毕业管光明, 邮电学院通信与电子系统专 件设计部门敏捷地介入可靠性隐患的分析,是常规返修 就职于中国移动通信集团上 反馈流程的有效补充,可以提高通信设备商和运营商对 公司~主要研究方向为移动 备可靠性的响应速度,从而有力地控制了因硬件故障群 络管理系统的运行管理。 而导致的高额后续补救成本。
/
本文档为【通信设备硬件可靠性预测的后处理】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索