近日,后摩智能推出基于存算一体架构的边端大模型AI芯片——后摩漫界™️M30,最高算力100TOPS,典型功耗12W。为了进一步提升部署的便捷性,后摩智能同步推出了基于M30芯片的智算模组(SoM)和力谋®️AI加速卡。

随着AI大模型部署需求从云端迅速向端侧和边缘侧设备迁移,AI芯片的性能、功耗和响应速度面临前所未有的挑战。后摩漫界™️M30芯片兼具高性能与低功耗特性,可满足边端侧大模型部署对高效率和实时性的严苛要求。

M30是一款通用的边端大模型AI芯片,能够支持多种大模型,包括但不限于ChatGLM、Llama2、通义千问等。以Qwen1.5-7B-Chat为例,M30的运行性能可达15-20 Tokens/s。

基于M30芯片的智算模组(SoM)支持PCIe EP模式,以其小巧的体积、强劲的性能和极低的功耗,成为小型化设备和功耗敏感嵌入式场景的理想选择。此外,基于M30芯片的力谋®️AI加速卡作为标准的半高半长PCIe加速卡,能在PC、一体机和服务器中实现快速部署,支持主动散热和被动散热两种模式,确保设备在不同环境下的稳定运行。

后摩漫界™️M30将以“+AI”的方式,为传统的端侧和边缘侧设备注入强大的大模型能力,现已成功适配包括X86、ARM在内的多种主流处理器,可广泛应用于AI PC、边缘AI一体机、智能座舱、商用显示、智能融合网关,NAS(网络附加存储)等领域,为AI技术在更多领域的深入应用注入强大动力。

友情提示

本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!

联系邮箱:1042463605@qq.com