深入解读 GPUDirect PCIe P2P 驱动代码:Mailbox 和 BAR1 的实现原理及
训练周期减半:LoongForge 全链路优化 GR00T N1.6 训练,吞吐提升至 2.3 倍
Create2026 百度 AI 开发者大会 - AI Infra 专题论坛同名演讲
随着 AI 算力产业高速发展,高密度算力场景已成为数据中心建设的核心方向,供电系统正迎来关键革新。
如何在保证迁移成功率的同时,缩短迁移时间、降低资源开销、减少用户感知,已成为热迁移技术演进的关键问题
Btune 2.0 用自动化耗时分析打破性能黑盒
百度百舸全栈 AI Infra 助力具身模型加速迭代
多模态模型训练加速,LoongForge 的 DP 负载均衡优化方案详解
LoongForge 多模态异构并行训练加速,从问题到方案的全面解析
企业真正需要的,是一个可信、可控、可审计,并且能持续演进的 Agent 体系。