随着人工智能技术的飞速发展,大模型参数规模已迈入万亿级别,GPU与NPU的算力正以惊人的速度迭代,每年提升幅度高达10倍。然而,在这一浪潮中,存力性能的进步却显得相对迟缓,成为制约AI进一步飞跃的关键因素。在近期举办的MemoryS 2025闪存市场峰会上,得一微公司提出了一个革命性的概念——“AI存力芯片”,为芯片行业带来了前所未有的设计思路。
得一微董事长吴大畏在接受专访时强调,AI存力芯片并非简单功能的堆砌,而是从底层架构进行了彻底的革新。这种创新使得存储介质从传统的“被动数据容器”转变为“主动智能中枢”,每比特数据都能发挥更大的智能潜力,实现自我进化。
吴大畏进一步阐述,传统存力主控芯片主要承担数据读写管理的基础功能,采用指令响应式的被动处理架构。而得一微的AI存力芯片则不同,它在芯片层面集成了AI存力智能体单元,实现了存力智能体与算力智能体之间的高效互动,显著提升了数据处理的智能化水平。这不仅仅是给AI配备存力,更是让存力具备了“思考”的能力。
相较于传统的存储加速方案,得一微的技术着眼于提升存储介质的认知能力。通过将神经网络处理器(NPU)与存储控制器深度集成,得一微正在构建一种全新的存算协同智能处理范式,为下一代存储架构的发展提供了创新路径。这一突破不仅为AI应用提供了更强大的存力支持,更为存储技术的未来发展开辟了新方向。
在人工智能的广阔领域,得一微从苹果公司的研究中汲取灵感,积极探索存力芯片如何更好地服务于大型语言模型(LLM)。同时,闪迪的HBF高带宽闪存技术也为业界带来了新的活力,其卓越的性能和创新架构显著提升了数据传输速度和存储效率,为大模型的稳定运行提供了坚实的硬件基础。
得一微认为,稀疏模型架构是未来大模型发展的必然趋势。尽管当前MoE架构在大模型中取得了显著成果,但得一微坚信,神经元级别的稀疏架构与闪存技术的特性高度契合,有望实现大模型在效能和成本方面的全面优化。基于此,得一微正着力研发如何利用闪存技术特性,设计出更高效、更灵活适配神经元级稀疏模型的AI存力芯片架构。
得一微的“AI存力芯片”技术路径通过存储控制、存算互联、存算一体三大核心技术矩阵,正在重构数据流,引领存力芯片的智能化升级。其中,存储控制技术优化了数据存取策略,提高了存储带宽利用率;存算互联技术构建了更高效、更智能的连接通道,缩短了数据传输时间;存算一体技术则探索将部分计算直接放在存储单元内部或近端执行,从根本上提升了能效比并降低了延迟。
基于这三大技术支柱,得一微在AI手机、AI PC、AI汽车、AIoT及AI服务器五大领域构建了完整的存力生态。在AI手机领域,得一微的存力主控芯片已大规模进入核心手机厂商供应链,为智能手机普及AI应用提供了有力支持。在AI汽车领域,得一微的车规级存力芯片已成功应用于多家主流车企,为智能汽车提供安全可靠的存储保障。在AI服务器领域,得一微的AI-MemoryX显存扩展解决方案显著提升了单机显存容量,为AI服务器的高性能运行提供了关键支持。
得一微的SSD存力主控芯片在AI PC领域年出货量数千万颗,新一代PCIe 5.0存力主控芯片即将推出,进一步满足AI PC、边缘计算等场景对存储性能的极致需求。在AIoT领域,得一微的存力解决方案已广泛应用于智能家居、智能安防、工业物联网等多个领域,为万物智联提供高可靠、低功耗的存力支持。
站在技术的前沿,得一微正式启动了“河图计划”,基于存算一体架构的AI存力芯片研发战略。这一计划旨在推动存储介质从“数据容器”向“智能载体”演进,引领存力芯片行业进入全新的发展阶段。吴大畏表示,未来的存储设备将是会“思考”的智能体,它们不仅能存储数据,更能理解数据、优化数据,甚至在休眠状态下持续进行数据价值挖掘和自我进化。这正是存力真正的智能革命。
文章采集于互联网