Highlights 92 items
Filters
Le datacenter IA, trame idéale pour le premier CPU d’Arm
Arm公司推出了其首款面向AI数据中心的服务器CPU——AGI CPU,基于Neoverse V3架构,提供64至136核心配置。该处理器旨在应对未来AI代理工作负载,通过CPU协调任务以释放GPU算力,已获得SK Telecom、Cloudflare及SAP等客户支持,并计划与Meta的MTIA加速器协同优化能效。Arm此举标志着其从IP授权向芯片销售的拓展,目标在两年内实现超10亿美元收入,同
Event
KubeCon 2026 : d’Istio à Dapr, quand tout un écosystème parle d’IA
文章称,Istio 在 2025 年 2 月随 Istio 1.29 进入对 Kubernetes Gateway API 的推理扩展 Beta,新增 InferenceModel/InferencePool,并通过区分负载均衡算法(含 GPU 内存、队列演进、LoRA 适配器亲和性)来优化 AI 推理流量;同时 Istio 的 ambient 多集群也推进到同一阶段,借助 HBONE 头与“na