首款NPU和首款64位,德州仪器C2000推出诚意满满的升级路线图

摘要:在刚刚过去的德国慕尼黑电子展上,德州仪器(TI)展示了最新的C2000 MCU新品,包括支持NPU的F28P55X以及业界首款64位MCU F29H85X,同时在慕展嵌入式论坛上,TI还发表了两篇演讲,分别是《利用先进的 CPU 架构重新定义实时控制》,以及《

在刚刚过去的德国慕尼黑电子展上,德州仪器(TI)展示了最新的C2000 MCU新品,包括支持NPU的F28P55X以及业界首款64位MCU F29H85X,同时在慕展嵌入式论坛上,TI还发表了两篇演讲,分别是《利用先进的 CPU 架构重新定义实时控制》,以及《实现高性能实时微控制器的网络安全》。

日前, 德州仪器也专门在中国举办了C2000新品发布会,足见其对于中国的重视。TI中国区技术支持总监师英解读了两款新品,详细介绍了C2000系列在实时控制领域的持续技术创新:首个NPU、首个64位,这两款产品标志着TI C2000在电源和电机行业的重要突破

TI中国区技术支持总监师英,手握中国客户SOLAX开发的F28P55X控制子版,实现5毫秒内的电弧检测

实时控制的难点

“实时控制系统”顾名思义,与普通控制系统最大的区别就在于实时性,而为了实时性,需要从系统角度出发,在各个环节进行创新,以及最终不同系统间的耦合。从C2000上,我们可以看到一个完整的闭环实时控制系统的基础。

在实时控制系统中,系统的性能不仅仅取决于CPU的处理速度,还包括外设的访问速度和对中断的响应速度,这些因素共同构成了所谓的实时信号链的概念。

典型的实时控制信号链图示

如图所示,其中1、2和4(中断响应、文本存储、控制算法)主要由CPU的架构决定,而3和5(ADC、PWM)则同时依赖于CPU和外设的架构。

师英将C2000的各个部分拆解,解读了C2000实时控制的诀窍。首先,系统需要对真实物理世界进行精密的传感,即控制论的输入,通过ADC与采样电路,将模拟信号采集并转化为数字信号。其次是处理单元,将各种电流、电压、位置等信息进行计算。之后是输出执行单元,通过PWM输出至执行结构,另外还需要通信系统以对各个模块进行沟通,包括EtherCAT、以太网、CAN、串行通信等等。

马达驱动与数字电源变换是最为常见的实时控制系统,这两种应用均要求处理器具备极高的实时性。”师英举例道。C2000低延迟的互连技术,支持在单周期内完成ADC读取和PWM更新,这有助于提高实时信号链的性能。更好的信号链性能意味着在电机控制应用中,可以提高直流总线的利用率和电机的运行速度范围;而在数字电源应用中,则可以实现更高的控制环路频率,减少所需组件数量,从而降低成本。

实际上,无论是数字电源还是电机控制开发,无论是否采用C2000,开发者都要接触到这款产品,甚至要从大学时代就已经开始了。

来谈谈带NPU的C2000

关于C2000的历史我们之后再探究,先聚焦于F28P55X,这并不是TI第一个带有AI加速的MCU,也不是业界第一个,但却意义重大。师英指出,NPU可应用在太阳能及供电系统中的电弧检测以及电机驱动的预测性维护上,目前这两大应用都是C2000的主要战场。“F28P55X的故障检测的准确率可高达99%,且相对于CPU,在处理CNN模型时效率提升5-10倍。”师英说道。

F28P55X具体主要参数如下:内置的Flash memory最高可达1.1MB;提供了24个高精度PWM通道以及最多39个ADC通道,未来F28P55X将陆续推出多达40余款型号,以满足市场的多样化需求。

嵌入式处理高级副总裁 Amichai Ron表示:“以智能家居安防摄像头为例,如果您想要检测后院中的物体是猫还是陌生人,使用云 AI 需要将数据发送到云端,进行处理,然后再发回本地进行决策。这一过程不仅耗时较长,而且能耗较高。而在边缘进行决策时,高度集成的嵌入式设备会在本地运行神经网络,从而降低功耗,提高安全性和隐私性。

而对于C2000的这类应用而言,边缘实时性则显得更为必要。师英举例道:“我们的合作伙伴SOLAX已成功开发出基于F28P55X的电弧检测模块,该模块单次电弧判断时间可缩短至5毫秒,且在检测到电弧后的0.2秒内即可迅速自动切断电路,实际产品已经量产,其误报率近乎为零。”

SOLAX Power董事长兼总经理李新富也表示:“我们采用TI的边缘AI技术来提高各种太阳能装置的电弧故障检测准确性。传统的电弧故障检测方法在适应性和灵敏度方面受到限制,会导致误报或漏报实际电弧故障事件,从而对生产力、维护成本和操作员安全产生负面影响。借助TI支持边缘AI的MCU,我们可以在本地训练和执行神经网络算法来识别模式并检测异常,从而提高我们运营的安全性和可靠性。

“这些数据均源自针对特定应用场景的需求,我们与客户携手进行了大量实验与数据采集工作。”师英说道。

谈及NPU和CPU在边缘的区别,师英解释道,在传统的非NPU方案中,通过对直流母线电压与电流进行采样,并设置一系列触发阈值或规则来判断电弧是否发生。这种方法存在诸多限制,检测准确率往往难以提升,一般仅能达到85%左右。检测不准确可能导致两种后果:一是漏报,即实际发生电弧但未被检测到,从而增加火灾或停机的风险;二是误报,即未发生电弧却发出警报,可能导致不必要的停机。另外,传统的电弧检测还需要一颗额外的CPU提供算力。而通过最新内置NPU的F28P55X,可在单芯片中完成DC/DC转换器、逆变器以及MPPT系统,并且提供电弧检测。

一些电机轴承故障监测方法还使用多个器件来实现实时控制,通过振动分析进行监测、温度监控和声学测量。然后,这种离散化方法使用基于数据的规则检测来监测潜在故障,这需要手动解析,并且可能会错过早期故障,或者无法准确检测故障类型。

由于 CNN 模型可以自主从原始或预处理的传感器数据(例如电机振动信号、太阳能直流电流或电池电压和电流)中学习,因此 CNN 模型非常适合用于故障检测和预测性维护的传感器数据分析。无需手动干预即可直接提取有意义的特征,从而实现稳健、准确的检测。同时,可以利用表示可变工作条件和不同硬件变化的传感器数据以及快速傅里叶变换 (FFT) 等不同的预处理算法来提高模型的适应性、抗噪性和可靠性,同时减少总检测或推理延迟。

为了开发便捷性,TI也提供了边缘AI云工具平台TI Edge AI Studio。使用 TI 的 Model Composer GUI 或 Tiny ML Modelmaker 加载和训练模型,以获得高级功能集。C28x 的源代码由这些工具生成,无需手动编码。对于依赖自己的 AI 培训框架的客户,TI 的神经网络编译器可以帮助移植AI 模型,使其与许多基于C28X的MCU兼容。

这个被称为TINIE的NPU是TI第一个严格意义上的NPU,此前TI更多是依靠DSP及MMA等加速器实现CNN,如今试水TINIE,而且直接选择了C2000这条重要产品线,TINIE专注于实时控制的边缘AI,这也看出了TI走差异化NPU的决心。

TINIE支持8位和4位,执行速度为600MOPS,8bWx8bD(@75MHz )或者1200MOPS、4bWx8bD(@75MHz )。虽然看起来并不是性能非常强大的NPU,但是对于这些专门的应用已经足够了,与软件技术相比,可实现高达 10 倍 NN 推理性能改进,并直接提供电弧故障示例及电机故障示例。

F28P55X框架

MCU进入64位新时代

F29H85x则是更为劲爆的一款产品,因为这是“C2000系列CPU多年来的重大迭代”,主要包括两方面内容——处理性能和安全

师英表示,在工业与汽车领域,执行效率的提升速度日益加快,电机的转速也随之不断攀升。随着电机转速的提升,新一代功率半导体的应用使得开关调制频率同步增高。在这样的背景下,实时运算处理器MCU的运算效率亟需实现大幅度提升。

安全性方面除了功能安全,信息安全(Cyber Security)同样变得重要。随着产品的互联性越来越高,包括数据盗窃、拒绝服务、恶意软件注入等状况更加频繁,且攻击面随着软件复杂性的增加而扩大。因此,采用全面的多层安全方法,包括建立信任根、创建可信执行环境、安全密钥管理、上下文隔离和内存保护等,对于保护系统免受攻击、确保数据和IP安全、以及维护系统完整性和可用性至关重要。

在这种对于嵌入式的巨大需求变化下,C29孕育而生。

C29 内核的创新包括:

重新设计的平台:VLIW 架构与全面保护式流水线结合,支持并行执行最多八条指令

新编译器:通过基于 LLVM/Clang 的编译器提升性能

重新设计的中断性能:硬件支持实时中断的快速自动背景保存和恢复。新的中断控制器

增强的平台性能:采用低延迟存储器和外设互连设计,具有内置功能安全和信息安全机制

首先针对处理,其处理位宽从32位跃升至64位,并配备了超长指令级架构,使得单个指令周期最多能并行完成8条指令。“并行运算是DSP架构的一大优势,这也是DSP与通用CPU之间的显著差异之一。”师英说道。

C29 支持多种指令大小(16、32 和 48 位)和可变指令包大小,指令包的大小可以是 16 位到 128 位,从而实现更好的代码密度,以及在单个 CPU 周期内执行最多 8 条 16 位指令。

C29部分特性

师英给出了一系列直观对比,与C28相比,C29在信号链性能上可实现2至3倍的提升。对于马达驱动的数学运算与实时运算而言,其性能可提升2倍;而在电源变换方面,C29的性能则可提升约3倍。若仅就FFT运算而言,C29的运算速度相较于C28可快出5倍,与cortex m7内核比较,则快了6倍;C29 支持常规中断(称为 INT)和称为实时中断 (RTINT) 的优化中断,RTINT 使用专用的硬件中断堆栈,相比于C28提升了4倍。

另外,C29在通用代码特性,包括内存拷贝、数据搬移等方面进行了代码优化,使其不只是DSP,更针对MCU一般内部控制进行了优化。“C29的架构采用按字节寻址方式,其内存访问模式与arm非常接近,这使得C29能够原生支持AUTOSAR,非常适合汽车应用中的复杂多合一系统,也更适合软件由arm迁移至C29内核中。”师英补充道。

C29与其他内核对比

如图所式,TI比对了包括不同的Arm内核、以及C28的比较。即使 F29H85x 以 200MHz 运行,如果将 480MHz 的竞争 MCU 1 视为基准,则 F29H85x 的每个 CPU 核心的有效速度 (eMHz/Core) 为 862MHz (4.31 x 200)。

谈及安全性,师英特别强调到,F29H85x在功能安全方面可达到ISO26262 ASIL-D最高标准;同时,在工业领域也符合IEC61508的SIL-3级别。而在信息安全方面,引入了HSM,使得该系列器件能够满足全球不同地区对于信息安全的严格要求。

为了确保CPU内部的功能安全与信息安全,C29的架构中设计了类似于防火墙的多重隔离机制,加入了功能安全与信息安全单元(SSU),能够对应用程序代码、应用数据、保密内容以及普通内容进行有效的隔离,从而全面满足功能安全与信息安全的要求。

F29H85x 系列框图

得益于CPU性能和安全性的提升,F29H85x可广泛应用于更严苛的实时控制领域,例如,在汽车的OBC、DC/DC以及主机的多合一集成式架构,多电机的牵引逆变器,助力转向系统,光伏逆变器,在线UPS以及机器人等多重领域。

比如,由于F29H85x的中断效率得到提升,因此仅需一颗MCU便能实现OBC+DC/DC+主机MCU的三合一功能。这不仅提升了效率,还减小了尺寸并降低了成本。由于能够更快地进行运算和中断响应,因此对于第三代半导体功率半导体也可以实现更好的支持,进一步提高系统效率。同时,更高的开关频率意味着磁性元器件的尺寸可以减小,使得整个系统的尺寸继续减小。

“在电源变换领域中,我们见证了诸多新兴电源拓扑结构的涌现,其中最为常见的一种便是矩阵转换器,它能够通过一套拓扑结构完成AC到AC、DC到DC的复杂变换。”师英说道,“一方面,这对于功率级、磁性元器件以及大型电容性元器件的需求与传统电源拓扑结构相比发生了诸多变化;另一方面,这同样对嵌入式处理器的实时性、PWM以及ADC通道提出了全新的需求,F29H85x非常适合用于新型的矩阵转换器拓扑结构。”

从安全角度来看,将硬件安全模块 (HSM) 和 SSU 与 C29 内核集成在一起有助于保护设备免受恶意软件的影响。SSU 有助于防止恶意软件中断 MCU 内运行中的功能,同时保护内存和外设,确保不影响实时性能。SSU 自动管理和切换硬件中的存储器和外设访问权限。SSU 与 C29 CPU 配合使用,管理每个独立应用功能的独立堆栈指针和堆栈存储器,并针对恶意软件和其它网络攻击提供安全保护,这对于基础设施或者汽车应用而言都非常重要。

F29H85x MCU 的架构支持 A/B 闪存组,有助于实现实时固件更新 (LFU),停机时间几乎为零。除了编程后对内 容进行基本的闪存控制器验证之外,HSM 还负责验证更新的整体完整性。该架构还支持将软件更新回滚到之前版本,并且可以永久阻止关键安全更新的回滚。

由于C29支持三核架构,因此可以节约MCU,从而节约系统的尺寸和成本。师英举例道,比如一颗F29H85x,通过一对锁存CPU和一个独立内核,就可以实现OBC+HV/LV DCDC+主机的全部功能,其中CPU1和CPU2的锁步运行能够很好地支持ASIL-D级别的功能安全需求,同时两者均可运行AUTOSAR。而CPU3则可以独立承担OBC和DCDC的控制环路,实现单芯片系统。

另外,针对双牵引逆变电机,传统需要两个独立MCU控制不同的电机环路,以及负责功能安全和AUTOSAR的主机,以及旋变解码器电路检测转子位置。采用F29H85x,则可以利用单颗CPU3控制电机,用CPU1和CPU2的锁步运行来完成功能安全和AUTOSAR,另外F29H85x内部集成了旋变解码器的功能,进一步实现了集成化。

庞大的生态系统

C2000的成功除了产品本身,还得益于生态系统的建设。TI提供了从参考设计到硬件和软件的设计源文件,再到开发软件、操作系统和工具的支持。“特别是从F28迁移到F29的过程中,我们提供了专门的迁移工具,帮助客户快速将基于F28的设计系统迁移到F29上。”师英强调道。

如示意图所示,C29已经得到了众多第三方的支持,包括ETAS和MathWorks的建模仿真工具,VECTOR、ETAS以及国内供应商的AUTOSAR支持,VECTOR和伊世智能关于HSM的合作开发等等。

经久不衰的C2000

“C2000为什么能够流行长达30年,最主要的原因就是我们足够聚焦于实时控制,聚焦于电机和电源需求不断迭代。实际上他已经不算是单纯的MCU,更像是ASSP产品。”师英说道。

无论是今天推出的NPU和64位,还是以前的CLA、CLB、FPU、TMU等,TI的C2000一直在自我迭代。

如图所示,在师英分享的C2000产品路线图中,我们可以看到几乎每两年,C2000就会有一次重要革新,近年来的革新速度明显加快。从最初的16位运算位宽,到如今的64位运算位宽,其对于电源和电机的专注从来没变。

通过此次F28P55X及F29H85X的发布,我们也不难看出未来TI不止会发展C29内核,在C28上面还会有更新的路线图,这点也得到了师英的确认。

另外,师英也强调,“随着应用的多样化与增长,对性能的需求也呈现出显著差异。我们会基于不同应用需求来仔细审视,提供多样化的选择。”也正因此,TI推出了多样化的嵌入式处理器产品组合,不止C2000,包括arm内核的AM2X处理器以及MSP430 MCU产品线都可以涉及不同性能的电机环路控制,甚至也有类似UCD3138这类专用的数字电源控制器。

写在最后

师英总结道,为实现通过半导体技术使电子产品更加经济实用的愿景,TI嵌入式业务采取了两大策略。首先,通过与客户紧密合作,深入了解其应用需求,并结合技术优势,共同设计出最优化、最符合当前及未来发展趋势的产品;其次,依托自身的制程技术与工厂产能优势,来提升产品的性价比、可靠性、稳定性。C2000长达30年的流行,也充分体现出了TI的这种精神。

来源:电子工程世界一点号

相关推荐