来源:联想创投
近日,联想创投被投企业——光羽芯辰在端侧AI技术领域再添里程碑:继《端侧AI的3D DRAM芯片集成技术规范》团体标准通过上海集成电路行业协会验收后,公司再度作为主要起草单位编写《AI算力场景下高带宽存储芯片性能适配技术规范》、《大模型训练用存储芯片高速读写稳定性评价方法》两项团体标准,进一步主导高带宽和AI专用存储芯片的标准制定。从攻克技术高地到牵头标准制定,光羽芯辰凭借“硬核”实力获得了业界广泛认可,持续夯实端侧AI存储与计算领域的标杆地位。
作为一家成立不满两年的初创公司,光羽芯辰之所以能迅速跃居细分领域龙头并牵头标准制定,关键源自在3D堆叠近存算、SRAM存算、LPU流式处理架构、以及基于RISC-V的AI软件架构四大核心技术的全面突破。随着首颗芯片成功实现工程化落地,公司在端侧AI领域充分展现出从实验室到产品工程化的闭环验证能力。
01
3D 堆叠近存算:
打通带宽 “高速公路”
针对大模型推理的带宽瓶颈,光羽芯辰开发了基于3D DRAM的近存算架构。该技术通过3D堆叠工艺,将NPU计算核心与DRAM存储阵列进行纵向物理融合,从根本上极大地缩短了数据搬运路径、释放带宽潜力。配合自研的分布式计算-分布式存储耦合架构、多层次片上网络(NoC)与智能数据分发机制,充分发挥3D堆叠带来的数万级垂直互联通道优势,确保外部高带宽能够真正转化为计算核心可用的有效吞吐。
02
SRAM 存算技术:
高能效破解推理瓶颈
基于对SRAM存算的工程化研究,光羽芯辰针对VLA模型中计算密集型的矩阵运算,在NPU中集成CIM加速引擎。基于高密度SRAM存算单元实现“存中计算”能力,大幅降低功耗与延迟,显著提升了端侧AI推理计算的能效比。
光羽芯辰存算技术布局03
LPU 流式处理架构:
前瞻布局,高效赋能
对于最近业界火热的LPU流式处理架构,光羽芯辰早在2024年便前瞻性布局并投入研发,目前已在首颗芯片中实现工程化落地。该架构高效支持FFN(前馈神经网络)运算,为端侧大模型的高效推理提供架构支撑。
光羽芯辰LPU架构示意图04
RISC-V AI 软件架构:
轻装上阵,软硬协同
在AI芯片至关重要的软件生态方面,光羽芯辰基于RISC-V开源指令集架构,打造了一套类CUDA兼容的可编程计算平台。该架构兼具专用NPU的高效性与通用GPU的灵活性:RISC-V核心负责控制流调度与通用计算任务,NPU专用单元负责矩阵运算等密集型计算,两者通过高速片上总线实现紧耦合通信。这一架构既保留了RISC-V开源开放、可扩展性强的优势,又通过专用加速单元确保了大模型推理的高效性。
从底层架构研发到行业标准制定,从芯片成功落地到全栈生态构建,光羽芯辰始终致力于深耕端侧 AI 核心赛道。未来,公司将深化四大核心技术创新,持续迭代产品矩阵、引领端侧AI,让每个人都能拥有随身携带的个人大模型,赋能千行百业的智能化升级。
封面图由AI生成