Home>Schools

  • Complex
  • Title
  • Author
  • Keyword
  • Abstract
  • Scholars
Search

[学位]

28纳米系统芯片单粒子效应研究

Share
Edit Delete Claim

Author:

杜雪成 (杜雪成.)

Indexed by:

学位论文库

Abstract:

系统芯片(System-on-Chip,SoC)集成多种功能模块在单个芯片上,具有集成度高、可靠性高、性能高、功耗低、微型化等优点,特别适合航天任务的需求,然而空间辐射效应,特别是单粒子效应(Single Event Effect,SEE),严重影响系统芯片在轨的可靠性和寿命。为了保证航天器能够顺利完成任务,必须采取一定的手段提高系统芯片的抗辐射能力,因此研究系统芯片的单粒子效应有助于理解系统失效的机理,对于SoC系统的抗辐射加固设计具有重要意义。
本论文以28nm Xilinx Zynq-7000 SoC为研究对象,建立了SoC单粒子效应在线测试系统,开展了SoCα粒子单粒子效应加速实验,并结合软件故障注入方法确定了系统内多个模块的软错误敏感电路;采用概率安全分析方法(Probabilistic Safety Analysis, PSA)和故障模式效应分析方法(Failure Mode and Effect Anlysis, FMEA),对Xilinx Zynq-7000 SoC芯片的软错误可靠性进行评估,确定了系统的敏感模块、薄弱环节、以及对系统潜在危害最大的敏感模块和失效模式;开展了SoC重离子微束辐照实验,初步获得了Xilinx Zynq-7000多个功能模块的单粒子效应敏感位置分布;通过开展OpenRISC1200 SoC(OR1200)模拟故障注入实验,获得不同模块的软错误敏感性及其导致的系统失效率,采用贝叶斯网络方法对OR1200和Xilinx Zynq-7000 SoC软错误进行故障诊断,提出了SoC单粒子效应故障诊断系统模型。主要结果如下:
1)α粒子SEE实验获得了Xilinx Zynq-7000 SoC多个功能模块的SEE截面,实验结果表明片上存储器(On-chip Memory,OCM)SEE截面最大,然后依次是可编程逻辑(Programmable Logic,PL)、直接存储器访问(Direct Memory Acess,DMA)、高速数据缓存(DCache),QSPI-Flash控制器单粒子截面最小,实验测得了四种SoC失效类型,分别为数据错误、程序中断、运行超时和系统停止,其中数据错误和程序中断为主要的失效类型,占系统失效总数的90%以上。实验未测得单粒子闭锁效应(Single Event-Latch,SEL)。
2)采用软件故障注入方法,开发了基于Xilinx Zynq-7000 SoC软件故障注入系统,获得了CPU寄存器、存储器、DMA和QSPI-Flash控制器软错误敏感电路和故障分布特征,其中,CPU敏感寄存器和失效类型随测试程序的不同而发生变化,但R11和R15为系统最敏感的寄存器;软错误发生在存储器代码区域容易造成系统控制运行异常,而数据存储区域更容易导致数据错误;对于DMA,源地址寄存器、目的地址寄存器和控制寄存器为敏感寄存器,其中源地址寄存器和目的地址寄存器最为敏感,容易造成大量的数据错误;对于QSPI-Flash控制器,控制寄存器为敏感寄存器。SoC软件故障注入结果可以很好地解释α粒子SEE实验部分实验结果和系统失效机理。
3)采用PSA和FMEA方法对Xilinx Zynq-7000 SoC的软错误可靠性进行评估,通过建立SoC软错误故障树,定量计算了系统、子系统和不同模块的软错误故障频率、不可用度和平均故障前时间(Mean Time to Failure,MTTF),计算结果表明,工作时间为87600h时,SoC封装材料中铀、钍杂质产生的α粒子造成系统的软错误故障频率为1.209×10-9h-1,不可用度为1.059×10-4,MTTF值为8.263×108h,并且处理系统(Processing System,PS)比PL更容易导致系统失效。采用事件树分析方法分析了多种测试程序下,由于OCM单粒子翻转导致系统功能中断的故障序列,确定了不同测试程序下故障频率最高的故障序列。采用FMEA方法,计算了SoC软错误故障率和不可靠度,计算结果与故障树分析方法计算结果一致,并且通过风险等级评估方法发现了对系统危害最大的模块为OCM和危害最大的故障模式为数据错误。
4)通过重离子微束辐照实验,获得了L1Cache、OCM、DMA、算术逻辑单元(Arithmetic and Logic Unit,ALU)SEE敏感位置和敏感位置分布特征。实验结果表明不同模块的SEE敏感位置分布与其使用的硬件资源相关,其中,OCM SEE敏感位置比较集中,具有很好的规律性,排列较为整齐;ALU SEE敏感位置比较分散;DMASEE敏感位置比较集中,但是没有明显的规律性;L1Cache单粒子效应敏感位置最多,并且呈区域性集中分布。通过计算不同扫描区域SEE截面,发现了L1Cache测试时SEE敏感性最高,其次为OCM、ALU和DMA模块。
5)建立基于VerilogHDL语言的SoC模拟故障注入系统,以OR1200为研究对象,开展了不同模块的单粒子翻转(Single Event Upset,SEU)、固定1和固定0故障注入实验,实验获得了不同模块的软错误敏感性和其造成的系统失效概率,实验结果表明不同模块的软错误敏感性与其造成系统失效概率不同;不同故障类型下,也呈现出不同。对于SEU和固定0故障,寄存器文件造成的系统失效概率最高,对于固定1故障,乘法运算单元造成的系统失效概率最高;采用贝叶斯网络方法,构建了OR1200 SEU和Xilinx Zynq-7000 SoC软错误贝叶斯网络模型,通过计算不同模块的后验概率和重要度,开展了OR1200和Xilinx Zynq-7000 SoC软错误故障诊断,结果表明寄存器模块和OCM模块分别为OR1200和Xilinx Zynq-7000 SoC系统失效的最主要原因,也是单粒子效应最敏感单元,最后提出了SoC单粒子效应故障诊断系统模型。

Keyword:

单粒子效应 概率分析 故障注入 系统芯片 重离子辐照

Author Community:

  • [ 1 ] 西安交通大学能源与动力工程学院

Reprint Author's Address:

Show more details

Basic Info :

Degree: 博士

Mentor: 贺朝会

Year: 2017

Language: Chinese

Cited Count:

WoS CC Cited Count: 0

30 Days PV: 29

FAQ| About| Online/Total:304/217462180
Address:XI'AN JIAOTONG UNIVERSITY LIBRARY(No.28, Xianning West Road, Xi'an, Shaanxi Post Code:710049) Contact Us:029-82667865
Copyright:XI'AN JIAOTONG UNIVERSITY LIBRARY Technical Support:Beijing Aegean Software Co., Ltd.