面向人工智能、边缘计算及高可靠嵌入式系统对高速、低功耗与非易失存储的迫切需求,自旋轨道力矩磁随机存储器(SOT-MRAM)成为新一代存储的重要发展方向。北京航空航天大学联合致真存储(北京)科技有限公司在材料、器件、工艺及架构层面开展协同创新,研制全球首颗8 Mb SOT-MRAM芯片。通过自主可控的8 英寸制造平台构建了兼容主流CMOS工艺的混合集成技术路线,并在保持亚纳秒级超快写入、超高可靠性与低功耗优势的同时,实现了容量规模化突破。相关成果为 SOT-MRAM从技术验证迈向工程化与产业化提供了关键路径,对我国新型存储器产业发展具有重要引领意义。
针对GPU平台上稀疏矩阵向量乘(SpMV)操作的性能瓶颈问题,提出了一种基于行重分割的优化算法及其配套性能评估模型。该方法首先基于矩阵行长度与计算资源分配之间的量化映射关系,通过设定动态阈值将原始矩阵划分为长行和短行子矩阵,分别采用线程级和线程块级并行策略进行计算,从而有效缓解GPU SIMT执行特性与稀疏矩阵非规则数据分布之间的矛盾。为量化预处理过程中引入的额外开销,分别建立了针对Atomic Conflict和Padding的性能损失模型,将额外的访存和计算转换为可计算的开销函数。基于上述模型,构建了参数空间搜索算法,通过预先获取硬件性能指标和矩阵非零元分布信息,快速在参数集合中搜索得到最优预处理参数。实验结果表明,该优化算法在多种典型稀疏矩阵数据集上均优于传统的GPU稀疏计算库cuSPARSE,在部分场景下性能提升达1.26倍及1.17倍。此外,参数搜索开销较低,且该方法具备良好的通用性,可适配不同的输入矩阵与GPU硬件架构。
在基于FPGA的高速存储设备中,其设备间的级联能力对设备的兼容性和扩展性至关重要,为此设计了一种基于FPGA的高速存储设备的级联存储系统,系统融合了基于FPGA的高速存储设备的高带宽性和通用存储设备的灵活扩展性。实验结果表明,本级联存储系统在全局时钟同步与令牌轮询的“一主多从”管理模式下,能够维持6.40 GB/s的存储带宽,在大规模数据的连续写入与重演回放测试中,数据均稳定写入且校验无误码,有效实现了存储系统的无感知扩容。
直升机因优越的灵活性和机动性在军事、民用和民生领域得到广泛使用,并且在特定领域具有不可替代的地位。文中针对传统直升机故障检测虚警率高问题,基于EP4CE系列FPGA芯片利用12位8通道模/数转换芯片ADC128S022实现对直升机振动数据的实时采集,将采集数据进行快速傅里叶变换(Fast Fourier Transform,FFT)并提取特征值分析。实验结果表明,系统对直升机故障检测报警准确率高达99%以上。
针对基于QEMU5.1.0的MPC750处理器硬件模拟器在运行ARINC653分区操作系统及应用程序时,无法正确执行分区应用程序的问题,开展了异常原因分析、相关技术研究以及问题代码排查工作。基于QEMU提供的PPC模拟器源码、MPC750处理器说明文档以及ARINC653操作系统相关代码的研究,通过对操作系统异常打印信息分析、模拟器内存状态修改观察、MMU相关状态寄存器值设置试验等步骤,进行了QEMU代码问题定位,实现了在MPC750处理器模拟硬件以及ARINC653操作系统环境下分区应用程序的正常启动运行。
针对机载综合化通信系统在多网络、多总线、多任务环境下对航电数据处理与系统资源调度管理效能的应用需求以及自主可控安全性的迫切需要,提出了一种基于国产FT-2000/4处理器的控制管理平台设计,采用通用化和小型化设计思想,通过FPGA和协议转换桥片扩展了平台的对外通信接口接入能力,同时搭载天脉3嵌入式操作系统实现了面向对象的软件分层设计。测试结果表明,该平台能够高效实现基于SRIO网络的系统控制管理功能,充分满足实时性和可靠性要求,在机载嵌入式平台具有较高的推广价值。
通过研究QEMU虚拟机与宿主机映射的页表机制,并深入分析其页表填充原理以及读/写指令如何触发、区分对不同类型内存的操作流程原理。通过在页属性中增加新的标志位,并在页表填充和指令对内存读/写的helper函数中对该位进行对应的设置和判定,从而实现对具有某一属性地址的定位并进入特定的回调函数。参照QEMU自带leon3例程中添加外设的流程,设计了动态库的接口函数,包括设备创建、初始化、读/写回调函数等。分析了QEMU对MMIO外设的读/写流程和传参特征,得出外设定位原理及回调函数所需的基本参数,在此基础上,设计并给出了对片外MMIO型外设的动态库中读/写回调函数的精确调用位置。最后通过实验对研究的正确性和速度敏感性进行了分析,证明文中方法能够很好地实现外设和QEMU代码的分离,运行结果正确,运行速度能达到外设源码与QEMU源码在一起编译时速度的97%以上,对于虚拟机开发人员以及QEMU开源使用者具有一定的借鉴意义。
间接内存访问在图计算、稀疏线性代数等数据密集型应用中广泛存在,其非规则访存模式因时空局部性差导致缓存性能显著下降。传统流式预取器难以有效捕获通过索引数组动态计算目标地址的访问模式(如x[a[i]])。文中提出动态多模式感知预取器(DMP)来解决这一挑战:DMP采用轻量化移位差分匹配机制,比较索引数据序列与目标地址序列,完成间接访问模式的识别;基于开源玄铁C910 RISC-V处理器的FPGA原型验证表明,DMP使稀疏矩阵向量乘(SpMV)的L1数据缓存缺失率降低了27.3%,算法运行时间加速了1.07~1.22倍。实验结果证明,DMP在提升间接访存性能的同时,保持了低硬件开销与高可移植性,为现代处理器非规则访存优化提供了实用解决方案。
动态可重构技术的应用不胜枚举,但面向DSP芯片的研究却少之又少。文中提出一种基于DSP的局部动态可重构方法,以应用程序中最为频繁修改的函数为重构元素,合理分配拟重构函数占用的DSP的运存空间及FLASH的存储空间,按需在线替换此空间内的函数数据,从而实现局部动态重构。使用国产FT-M6678做测试,结果表明该方法可有效更改拟重构函数的功能,且不影响软件其余模块的运行,为DSP的灵活使用提供了实际的方法和经验,具有较好的应用前景。
地下石油管道会因腐蚀、疲劳、蠕变、冲刷及磨损减薄等诸多因素导致断裂,从而引起巨大损失。针对地下管道断裂的探测问题,设计了基于合成孔径原理的圆环阵列超声周向目标探测电路。该电路包括超声激励模块、阵列探头控制电路、超声波收发电路、数据采集存储电路。超声波激励模块负责将连续的方波激励信号放大加到超声探头两端,阵列控制电路控制超声发射模块,在某时刻采用一发多收的工作模式,而超声波接收电路承担着信号放大和检测部分,最后由数据采集模块采集存储数据并上传PC进行处理。实验结果表明,在空气介质中该电路可对180°范围内的任何物体进行探测,且探测距离大于2 m。
某型应答机是运载火箭测量系统的重要组成部分,可完成两路C频段测速信号的接收及相参转发功能。为完成信号高精度相参转发功能,项目组基于FPGA硬件平台,采用提高量化精度、创新的转发比量化方式及交叉转发工作模式、合理分配设置信号处理时间等方法完成了测速信号的高精度相参转发软件设计。以常用的200 kHz多普勒频率漂移为例,测速精度设计值已达到0.002 3 Hz,并且区别于A支路主站发射-A支路主副站接收及B支路主站发射-B支路主副站接收的独立工作模式,当A/B两路测量信号任一支路无法正常接收时,可通过A/B支路任一主站发射-A/B支路主副站同步接收的设计,实现系统双向不共源测速,提升异常状态下的系统测速精度。
现有嵌入式实时操作系统应用开发的调试功能包括变量查看、断点管理、内存读/写等,基本上满足用户对多任务应用的调试需求。但是在多任务调试过程中,针对指定任务进行调试却少有涉及。特别是当多个任务调用同一个函数时,给用户的调试造成了不便。文中基于一款“魂芯”数字信号处理器的嵌入式实时操作系统和自主调试器软件,实现了一种多任务程序指定任务调试方法,可以大大提高多任务应用调试效率,缩短应用开发周期。