从人脑到AI:揭秘AI大模子的“硬件神经系统”若

发布日期:2025-04-25 23:57

原创 掌游 德清民政 2025-04-25 23:57 发表于浙江


  我们都晓得,神经系统是聪慧生物的硬件根本,人脑中近千亿的神经细胞(神经元)让人类学会思虑、利用东西、创制言语……最终正在取其他生物的合作中脱颖而出,缔制出光耀文明。那你有没有想过,时下最抢手、以高智商著称的DeepSeek、ChatGPT等各类AI(以下均特指“生成式AI”)的硬件根本,又是什么呢?大部门人的第一反映可能是:算力(GPU/计较单位)。颠末英伟达、OpenAI等科技巨头的轮流鼓吹,算力几乎成为了当下AI最主要的硬件。但现实上,AI的“硬件神经系统”并非显而易见的算力。正在人脑中,神经系统的感化是传输和处置信号,而正在二进制的计较机世界里,担任数据传输和处置的,是无处不正在、早已降生半个多世纪的存储器。现在,SSD(固态硬盘)、DRAM(动态随机存取存储器)、UFS(通用闪存存储)等,都属于最先辈的半导体存储之一。颠末多年成长,很多人敌手机上的UFS、电脑上的SSD都不目生,但人们印象中的“数据仓库”——存储,是若何成为AI“硬件神经收集”的呢?而AI的运转逻辑惊人类似:从云端大模子锻炼到终端及时推理,数据需正在存储、计较单位间高频流动。以ChatGPT-4为例,其锻炼需要挪用2万亿单词的数据集,每次推理需拜候数百GB的模子参数,这就比如大脑挪用回忆时,神经突触必需快速传送电信号——存储系统的带宽、延迟、靠得住性,间接决定了AI“思虑”的速度和精确性。近年来,AI的迸发式增加,让大模子、智能决策和边缘计较等手艺成为核心。但正在这场手艺中,人们往往过度关心算力的“肌肉”(如GPU、TPU)和算法的“聪慧”,却轻忽了存储这一“硬件神经系统”的主要性。以生成式AI为例,锻炼一个千亿级参数的模子需要处置PB级数据,推理时需及时挪用数万条参数;从动驾驶汽车每秒需阐发数十GB的传感器数据;AI手机需正在当地快速加载图像生成模子。这些场景中,存储的带宽、延迟、容量和平安性间接决定了AI可否高效运转。若存储机能不脚,AI的“大脑”再强,也可能因“神经信号”传送迟缓而“瘫痪”。现在,行业正陷入“算力狂欢”,而存储范畴的关心度却相形见绌。正如人脑神经信号传送受阻会导致反映迟缓,存储机能不脚正成为AI落地的“现性”。AI的成长离不开数据,而数据的存储、读取和写入速度间接影响着AI的机能。存储手艺担任将数据快速、精确地传送给AI的“大脑”——处置器,使其可以或许及时进行阐发和决策。因而,从AI模子的锻炼到及时推理,存储都是AI落地的环节环节,是支持AI健康成长的“硬件神经系统”。现在,跟着AI大模子的不竭成长,数据量呈指数级增加,对存储的要求也越来越高。首当其冲的,即是对大容量和高带宽存储的需求越来越高。10亿(1B)参数的模子约需4GB存储空间,例如,1000亿参数的模子理论大小约为400GB。以目前逐步走红的DeepSeek一体机为例,至多需要2684G的存储。另一方面,千亿参数模子也对数据的读取和存储速度提出了更高要求,保守存储方案正在这种超大模子的高频拜候下,容易呈现“数据堵车”,导致生成时间耽误。也是因而,大容量、高带宽存储逐步成为行业支流。以闪迪首款PCIe 5。0 eSSD(企业级固态硬盘)Sandisk DC SN861为例,其基于PCIe Gen 5接口,带来了带宽的无效提拔,随机读取机能比拟上一代产物提拔约3倍,即便处置百亿参数模子,也能实现“即调即用”。虽然AI正正在狠恶改变世界,但正如大脑是人体耗损能量最多的器官,AI也带来了无法轻忽的能耗问题。现在,全球数据核心年耗电量已达2000亿千瓦时,相当于整个英国的用电量。按照高盛的研究,因为AI锻炼取推理对高机能计较的依赖,到2030年,全球数据核心电力需求将因AI使用激增而增加160%,占全球用电量的3%-4%,碳排放较2022年翻倍。虽然人脑无法自从调理神经系统的能量耗损,但完全由人类设想、出产的存储却曾经能够实现相当精准的能耗节制。例如,闪迪DC SN861通过动态电压调理,可以或许实现更低的能耗,供给更高的每瓦特IOPS(IOPS/Watt),其运转模式功耗12W-20W,闲置功耗则低至5W摆布。无论是AI手机、AIPC等小我用户,仍是医疗AI处置的患者影像、金融AI阐发的买卖数据等等,都需要存储系统具备“神经防护盾”,供给硬件级此外数据平安。闪迪DC SN861供给了端到端数据径以及TCG平安和加密等功能,前者从数据写入到读取,整个过程中可确保数据的完整性,及时发觉并纠负数据正在传输和存储过程中可能呈现的错误。而TCG(Trusted Computing Group,可托计较组织)平安和加密手艺,则会对存储的数据进行加密处置,防止数据被未经授权的拜候和窃取可无效确保数据的完整性和平安性。再好比,以闪迪本年推出的合用于挪动智能终端设备的UFS 4。1存储处理方案iNAND MC EU711嵌入式闪存驱动器为例,产物内置的Advanced RPMB硬件加密手艺,就能对数据进行及时校验,破解难度比软件加密高1000倍。简而言之,正在硬件级的数据平安下,相当于为AI的“神经信号”搭建了一条防干扰、防的“公用通道”,守护用户数据平安。大部门AI手艺或算法模子都由全球最伶俐的一圈人打制,通俗人几乎很难理解此中的手艺细节和理论架构。当我们惊讶于AI生成的画做绘声绘色、从动驾驶的决策精准无误时,不该健忘其背后的“硬件神经系统”正派历着如何的手艺。存储早已超越“数据仓库”的保守定位,成为AI取物理世界毗连的“神经枢纽”。将来,跟着存算一体化手艺的冲破,存储节制器大概将内置AI算法,实现数据的智能安排取预处置;车规级UFS 4。1会让汽车成为“四个轮子上的超等计较机”;端侧存储的大容量化将催生“设备即AI从体”的重生态。正如人类神经系统的进化鞭策了认知,存储手艺的每一次跃升,都正在从头定义AI的可能性鸿沟。大概正在不久的未来,我们会健忘“算力”取“存储”的分野——由于高效的数据流动,本就是智能的素质特征。