Databricks 作为 HTAP 替代方案统一事务和分析处理

Databricks joue l’alternative à HTAP pour unifier transactionnel et analytique

Silicon.fr by Clément Bohic 2026-06-19 12:35 Original
摘要
Databricks 宣布将在未来数周内把结合 Neon 与 Mooncake 技术的 LTAP(湖仓事务/分析处理)架构集成到其无服务器数据库 Lakebase 中,实现 OLTP 与 OLAP 的统一。该架构利用 Neon 存储层的闲置 CPU 在写入对象存储时,将 Postgres 实时转换为 Parquet 格式,宣称无需数据管道且避免了传统 HTAP 的性能妥协,从而提供低延迟的统一数据格式。

Databricks 准备在未来几周内,将名为 LTAP(Lake Transactional/Analytical Processing)的全新架构集成到其 Lakebase 无服务器 Postgres 服务中。此举旨在让用户在同一系统上同时运行事务(OLTP)与分析(OLAP)负载,无需构建数据管道或额外扩展,同时避开了 HTAP 方案因统一后端而带来的性能妥协。其核心理念并非合并底层引擎,而是统一数据格式。

LTAP 的诞生逻辑可以简单概括为:以 Neon 为基石,融合 Mooncake 的技术,便得到了这一湖仓事务/分析处理能力。Lakebase 本身就源于 Databricks 在 2025 年 5 月对 Neon 的收购(交易金额约 10 亿美元),此次收购为其带来了基于对象存储的事务处理模块。同年 10 月,Databricks 又收购了 Mooncake,后者恰好提供了 LTAP 的关键转化层——一套将 Postgres 行式数据“即时”转换为 Parquet 列式格式的机制。

该机制巧妙地利用了 Neon 存储层中两个 CPU 消耗极低的服务:safekeepers 负责复制由行记录生成的日志,pagekeeper 则异步重建数据页。LTAP 架构在数据落地至对象存储的瞬间,利用这些服务的空闲 CPU 周期,完成从 Postgres 到 Parquet 的转码,延迟仅约一分钟。pagekeeper 同时充当缓存,继续以 Postgres 格式保存原始数据。这样一来,就形成了一种无拷贝的数据镜像,使得 Databricks 能够宣称以统一格式同时服务于事务和分析场景,而无需维护两套存储。

通过这种格式层的统一而非引擎层的合并,Databricks 向企业提供了一个兼顾低延迟写入与高效分析的选项,有望简化现代数据栈的复杂度,并进一步模糊数据湖与数据仓库的边界。

Summary
Databricks plans to integrate LTAP (Lake Transactional/Analytical Processing) into its Lakebase serverless Postgres offering in the coming weeks, enabling combined OLTP and OLAP without pipelines or performance trade-offs by leveraging idle CPU from its $1B Neon acquisition and on-the-fly Postgres-to-Parquet conversion from the Mooncake acquisition. This architecture unifies data formats rather than back-ends, mirroring data with low latency to avoid the compromises of traditional HTAP.

Databricks is adding LTAP (Lake Transactional/Analytical Processing) to its serverless Postgres service, Lakebase, in the coming weeks. The move promises to merge OLTP and OLAP workloads without ETL pipelines, extensions, or the performance trade-offs typical of HTAP. Instead of unifying back-end engines, LTAP unifies data formats by converting Postgres data to Parquet in real time.

The technology is built from Databricks’ two recent acquisitions. In May 2025, it bought Neon for roughly $1 billion, gaining a transactional layer on object storage. The October 2025 acquisition of Mooncake provided the key mechanism: on-the-fly transcoding from Postgres to Parquet. This works by tapping the low CPU usage of Neon’s storage components. Safekeepers replicate row-based records, while the pagekeeper asynchronously reconstructs pages. LTAP uses the spare CPU cycles on these services to transcode data to Parquet as it lands on object storage, with a claimed latency of about one minute. The pagekeeper also caches the original Postgres format, creating a mirror that Databricks frames as a unified, copy-free data format.

The result is a system that supports both transactional and analytical queries directly on the same data, eliminating the complexity of managing separate pipelines or dual-format storage.

Résumé
Databricks intégrera l'architecture LTAP à Lakebase dans les prochaines semaines, en combinant ses acquisitions de Neon (mai 2025, 1 Md$) et Mooncake (octobre 2025) pour mêler OLTP et OLAP sans pipelines ni compromis HTAP. LTAP exploite le CPU inutilisé des safekeepers et pagekeepers de Neon pour convertir les données Postgres en Parquet à la volée lors du stockage objet, avec une latence d’une minute, offrant un format unifié miroir sans copie. Cette alternative évite les pipelines ETL et les extensions, simplifiant l’infrastructure analytique transactionnelle.

Prenez Neon. Ajoutez-y Mooncake. Vous obtenez LTAP (Lake Transactional/Analytical Processing).

Databricks compte intégrer cette architecture au sein de son offre Lakebase (Postgres serverless) « dans les prochaines semaines ». La promesse : pouvoir mêler OLTP et OLAP sans pipelines ni extensions… et en évitant le compromis de performance qu’implique HTAP. Le moyen : unifier non pas les back-ends, mais les formats de données.

LTAP exploite le surplus CPU de Neon

Lakebase découle de l’acquisition de Neon. Databricks avait finalisé l’opération en mai 2025 pour environ 1 milliard de dollars. Elle lui a apporté une brique transactionnelle sur stockage objet.

Acquis en octobre 2025, Mooncake a procuré le substrat de LTAP : un mécanisme de conversion « à la volée » de Postgres à Parquet. Il exploite deux composants de la couche de stockage de Neon. D’un côté, les safekeepers, qui assurent la réplication des enregistrements générés à partir des lignes. De l’autre, le pagekeeper, qui reconstruit les pages de manière asynchrone.

L’architecture LTAP tire parti de la faible consommation CPU de ces services. Elle utilise les cycles disponibles pour effectuer le transcodage Postgres-Parquet au moment du dépôt sur le stockage objet (latence annoncée : 1 minute). Le pagekeeper fait office de cache conservant le format Postgres. On est donc sur une forme de mise en miroir qui permet à Databricks de revendiquer un format unifié, sans copie.

À consulter en complément :

Bases de données coud : l’abondance de l’offre devient un défi

IBM secoue l’édifice Db2 pour y intégrer l’IA agentique

Face aux bases de données vectorielles, pgvector atteint-il ses limites ?

Injection de prompt et injection SQL : même concept ?

Illustration générée par IA

The post Databricks joue l’alternative à HTAP pour unifier transactionnel et analytique appeared first on Silicon.fr.

AI Insight
Core Point

Databricks 推出 LTAP 架构,通过统一数据格式而非后端,实现在 Postgres 上无性能妥协地混合 OLTP 与 OLAP,即将集成至 Lakebase。

Key Players
  • Databricks — 云数据平台,总部美国旧金山,通过 Lakebase 提供无服务器 Postgres。
  • Neon — 无服务器 Postgres 提供商,2025 年 5 月被 Databricks 约 10 亿美元收购。
  • Mooncake — 数据转换技术公司,2025 年 10 月被收购,提供 Postgres 到 Parquet 的实时转码。
Industry Impact
  • ICT: Medium — 新架构简化数据分析栈,可能减少 ETL 管道与数据副本需求。
  • Computing/AI: Medium — 实时分析能力增强,为 AI 工作流提供更高效统一的数据层。
Tracking

Strongly track — Databricks 若成功交付 LTAP,将直接威胁现有 HTAP 数据库厂商,重塑云原生数据分析架构。

Highlights
Investment / Funding
Related Companies
IBM
mature
neutral
positive
Neon
startup
positive
Mooncake
startup
positive
Categories
软件 云计算 创业
AI Processing
2026-06-19 14:42
deepseek / deepseek-v4-pro