您的位置首页>IT>

Centaur的新CPU是第一个带有AI协处理器的x86

导读 今天,Centaur会在一段时间内暗示其第一个新x86 CPU,并详细介绍其AI协处理器。SemiAccurate认为带有CNS内核和NCORE AI加速器的新型CHA

今天,Centaur会在一段时间内暗示其第一个新x86 CPU,并详细介绍其AI协处理器。SemiAccurate认为带有CNS内核和NCORE AI加速器的新型CHA SoC是非常有趣的设备。

自Via的Centaur部门拥有新的核心以来已有很长时间了,但是看起来值得等待。该公司现在已在内部安装CHA硅,并且可以正常运行。在CHA / CNS端,除了它是运行在2.5GHz的环形总线上的8核CPU外,没有透露太多信息。核心运动AVX-512和由DDR4 / 3200的四个通道提供的所有最新功能。这不是一个笨拙的内核,它配备了完整的8C边缘服务器CPU,并且第一个具有真正的AI协处理器。更好的是,它们都适合台积电(TSMC)16纳米工艺中<195mm ^ 2的管芯。

在您指出英特尔CPU具有VNNI并且明年将具有BFloat16之前,CNS现在具有BFloat16并且将很快具有VNNI。CHA的NCORE带来的结果是32,768位宽的完整内存,对于厌恶数学运算符的AI加速器,则为4096字节宽。那是疯狂的边界,但它有一些非常有用的好处。如果您对延迟敏感,则在一个时钟中进行4096次计算意味着很少等待。

NCORE单元实际上位于芯片的中间,即使看起来像通过PCIe映射,它也作为对等体位于环形总线上。这样做是为了方便软件,CHA可以运行完整的Ubuntu并使用标准驱动程序,它不是hack或怪异的体系结构,只是普通的x86。拥有首个集成的AI加速器。和16MB的缓存。另外还有44条PCIe3通道,以防您需要将其他东西插入包装盒。

大多数AI加速器只是一堆密集的MAC,其他控制逻辑也是如此。NCORE不走这条路,它是一个真正的协处理器,可以进行DMA并对系统和内存执行其他操作。它具有自己的内部存储器,即慷慨的4K / MAC,总共可以为这些装置提供约20TB / s的速度。这是一个巨大的数目,但是您需要每个周期提供4096个8b计算,如果有数据,NCORE可以在每个周期发出所有4096条指令。如果本地未命中,则NCORE可以直接命中L3,然后根据需要进入内存,但这显然需要更长的时间。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。