工联网消息(IItime) 在全球科技飞速发展的大背景下,人工智能作为引领新一轮科技革命和产业变革的战略性技术,正以前所未有的影响力渗透至经济、社会、文化等诸多领域,成为推动各行业高质量发展的关键力量。
2025年初,杭州深度求索公司发布的DeepSeek-R1大语言模型引发全球关注。该模型性能比肩国际顶尖模型,开发成本仅为同类产品的三十分之一。 DeepSeek的突破在于工程化创新,DeepSeek的MoE架构中,每个层级包含256个专家模块,但在实际推理时,每个输入词元(token)仅动态激活8个最相关的专家。这种“按需调用”策略将计算资源消耗降低,同时保持了模型的复杂任务处理能力。
中国工程院院士、鹏城实验室主任高文指出,DeepSeek的突破颠覆了传统大模型依赖头部企业的格局,“它让初创企业也能参与,实现了AI应用平民化”。这一突破直接推动全社会算力需求激增,高文将算力比作“智能汽车的汽油”—— 唯有算力充足供给,才能驱动人工智能持续发展。
高文领导的鹏城实验室是中央批准成立的网络通信领域新型科研机构,主要任务之一就是围绕“东数西算”“数字中国”“全国一体化算力网”等国家重大战略,牵头推进“中国算力网”的研发与建设。
据了解,“中国算力网”建设的初衷就是整合全国超算中心、智算中心及云计算资源,形成一个统一的算力资源池,构建资源方便接入、任务统一调度且具有可持续发展运营模式和机制的数字经济基础设施,从而推动国内自主算力资源迈入“全民共享”的时代,让用户“像用电一样使用算力”。
高文表示,算力网的建设包含三个核心要素:大规模核心算力、超级光网络和算力调度系统。它的理想图景是当我们需要用算力时,只需插上插头,不用关心算力来自哪里,也无需自己比价,系统会自动匹配性价比最高的算力中心。这种模式不仅能提升现有算力资源利用率,还能避免各地重复建设造成的浪费。高文特别提到算力安全防护:“由于算力网中的计算任务可能涉及科学研究、国防、金融等关键领域,防止数据泄露和网络攻击成为算力网建设和运营中的重要任务。”
在开源与竞争这一颇具争议性的话题方面,常常存在不同的看法和讨论。有人会疑惑,将成果开源,意味着把技术、资源等呈现出来,那在竞争如此激烈的当下,这样做是否会让自身处于劣势呢?毕竟,在市场环境中,大家都希望凭借独特的、专属的优势去赢得竞争,而开源似乎打破了这种专属优势的壁垒。
然而,高文有着别样的见解。他通过类比知识的传承来阐述这一问题,过去那些手艺人、工匠所掌握的技艺,大多是通过代代相传的方式延续,如果中间某一辈没能妥善传承,这些宝贵的技艺就很容易失传了。但如今,我们所学习的知识能够被大众广泛获取、学习,正是因为知识实现了“开源”。目前,“鹏城·脑海”大模型的两个版本已向社会开源。高文和团队希望通过模型训练全流程开源开放的方式,将“鹏城·脑海”培育为中国算力网上的一个种子应用。
软件领域其实也是同样的道理,倘若把软件视作一种知识,那么开源就显得尤为重要了。就像OpenAI采取闭源的方式,使得别人若想使用相关技术,只能去请求它,并且还得经过它的同意、签订协议才行。
而开源能够汇聚众多开发者的智慧和力量,大家在已有的开源成果基础上不断进行改进、创新。在这种模式下,整个行业生态会在共享与共同进步中持续向前,并非是削弱了自身竞争力,反而会让参与其中的各方在更广阔的创新土壤里收获更多,推动整个行业更好地发展。