当前,人工智能正加速迈向产业深耕与价值落地的全新阶段,智能化已成为行业客户、伙伴高质量发展的核心引擎。2026年3月20日,华为中国合作伙伴大会——昇腾人工智能伙伴峰会将在深圳国际会展中心举办。本次峰......
2026-03-18 关键字:MLA(Multi-head Latent Attention多头潜在注意力架构)凭借低秩压缩KV缓存设计,实现长上下文推理的显存与带宽双重优化,其有效性已在 DeepSeek-V2 等模型中得到了验......
2026-01-13 关键字:随着大语言模型在文本分析、智能问答等场景的广泛应用,处理1M超长文本推理时,常常面临显存不足、运算速度卡顿的行业痛点,严重限制了超长文本场景的应用。近日,上海交通大学李健教授团队依托上海交通大学 鲲鹏......
2025-11-26 关键字:近日,在华为全联接大会 2025 举办期间,以 “与时代,共昇腾” 为主题的昇腾 AI 人工智能产业峰会在上海顺利召开。......
2025-09-23 关键字:随着人工智能技术的飞速发展,大模型参数量激增。MoE 稀疏大模型因能在提升容量的同时保持训练计算量,成为了当下的研究热点,但推理时的性能瓶颈仍制约着其进一步发展。......
2025-08-20 关键字:在人工智能大模型迅猛发展的当下,大模型参数和计算量呈指数级增长,大规模深度学习模型的训练离不开多硬件设备的分布式计算。在鲲鹏昇腾科教创新卓越中心的算力支持下,北京大学计算机学院崔斌教授团队创新研发了面......
2025-08-01 关键字:随着以 Sora 为代表的视频生成模型技术的演进,长视频生成领域在维持长时序内容一致性以及平衡生成质量与计算资源效率方面面临挑战。......
2025-07-31 关键字:[中国,上海,2025年7月26日] 今日,2025世界人工智能大会(WAIC)在上海世博中心启幕。华为展台全方位展现昇腾算力底座的创新能力、训练及推理解决方案、开源开放的软硬件生态,以及在互联网、运......
2025-07-26 关键字:AI 领域有自己的速度。4月29日凌晨4点,Qwen3 正式发布,并开源全部8款混合推理模型。发布仅2小时,Qwen3 模型在 GitHub 上的 Star 数已近17k。更有趣的是,开源5小时后,华......
2025-07-02 关键字: