V2AS
问路
意见反馈
↓ 按住下拉
Apache Hudi 元数据字段揭秘
介绍 Apache Hudi 最初由Uber于 2016 年开发,旨在实现一个交易型数据湖,该数据湖可以快速可靠地支持更新,以支持公司拼车平台的大规模增长。 Apache Hudi 现在被业 ......
Hudi
记录
Apache
数据
hoodie
Onetable:统一的表格式元数据表示
概括 Onehouse 客户现在可以将他们的 Hudi 表查询为 Apache Iceberg 和/或 Delta Lake 表,享受从云上查询引擎到顶级开源项目的原生性能优化。 在数据平台需求层次 ......
格式
Hudi
数据
Onetable
Onehouse
Lakehouse
架构指南
你曾经是否有构建一个开源数据湖来存储数据以进行分析需求? 数据湖包括哪些组件和功能? 不了解
Lakehouse
和 数据仓库 之间的区别? 或者只是想管理数百到数千个 ......
数据
Apache
格式
湖表
Delta
华为云 MRS 基于 Apache Hudi 极致查询优化的探索实践
背景 湖仓一体(
LakeHouse
)是一种新的开放式架构,它结合了数据湖和数据仓库的最佳元素,是当下大数据领域的重要发展方向。 华为云早在2020年就开始着手相关技术的预 ......
Hudi
数据
Apache
BloomFilter
优化
基于 Apache Hudi 极致查询优化的探索实践
摘要:本文主要介绍 Presto 如何更好的利用 Hudi 的数据布局、索引信息来加速点查性能。 本文分享自华为云社区《华为云基于 Apache Hudi 极致查询优化的探索实践!》, ......
Hudi
数据
Apache
BloomFilter
MDT
使用部分写时复制提升
Lakehouse
的 ACID Upserts性能
译自:Fast Copy-On-Write within Apache Parquet for Data
Lakehouse
ACID Upserts 传统的写时复制会直接读取并处理(解压解码等)整个文件,然后更新相关数据页并 ......
复制
写时
Apache
Parquet
文件
基于 Apache Hudi + Presto + AWS S3 构建开放
Lakehouse
认识
Lakehouse
数据仓库被认为是对结构化数据执行分析的标准,但它不能处理非结构化数据。 包括诸如文本、图像、音频、视频和其他格式的信息。 此外机器学习和人工智能 ......
数据
Hudi
Apache
Presto
存储
从 Delta 2.0 开始聊聊我们需要怎样的数据湖
盘点行业内近期发生的大事,Delta 2.0 的开源是最让人津津乐道的,尤其在 Databricks 官宣 delta2.0 时抛出了下面这张性能对比,颇有些引战的味道。 虽然 Databrick ......
iceberg
数据
delta
format
开源
Apache Hudi 负载类Payload使用案例剖析
在 Hudi 中可以根据业务场景为 Hudi 表配置负载类Payload,它用于在更新期间合并同一记录的两个版本。本文将深入了解有效负载类的用途以及可以使用的所有不同方式。 ......
Hudi
Apache
payload1
HK1
负载
Apache Hudi vs Delta Lake:透明TPC-DS
Lakehouse
性能基准
1. 介绍 最近几周,人们对比较 Hudi、Delta 和 Iceberg 的表现越来越感兴趣。 我们认为社区应该得到更透明和可重复的分析。 我们想就如何执行和呈现这些基准、它们带 ......
Hudi
Delta
Apache
基准
hoodie
V2AS = Way To Ask
V2AS 一个技术分享与创造的静土
手机扫一扫
移动阅读更方便
近15日热搜文章
解决Avalonia 11.X版本的中文字体问题
#mac安装Homebrew报错问题:curl: (7) Failed to connect to raw.githubusercontent.com port 443: Connection refused
P1013 [NOIP1998 提高组] 进制位
4
一文读懂PRBS定义、生成办法、作用
5
06集合-AngularJS基础教程
6
Java中IO框架——DataInputStream源码解析
7
JavaWeb会话与状态管理之Session机制
8
Kubernetes 学习笔记-- kafka往couchdb里倒东西
9
《MS17-010(永恒之蓝)—漏洞复现及防范》
10
Akka中的三种请求-响应模式