风起半山

不登高山,不知天之高也;不临深溪,不知地之厚也


  • 首页

  • pdf

  • 标签

  • 分类

  • 归档

  • 友链

  • 说说

  • 相册

  • 朋友圈

  • 留言

  • 搜索

lookup join介绍

发表于 2022-12-21 | 分类于 大数据 |
字数统计: 3.8k | 阅读时长 ≈ 15
用数据提升美好事物发生的概率~ 43篇原创内容 公众号 博主会阐明博主期望本文能给小伙伴们带来什么帮助,让小伙伴萌能直观明白博主的心思 博主会以实际的应用场景和案例入手,不只是知识点的简单堆砌 博主会把重要的知识点的原理进行剖析,让小伙伴萌做到深入浅出 1.序篇 源码公众号后台回复 1.13.2 ...
阅读全文 »

维表和流表

发表于 2022-12-21 | 分类于 大数据 |
字数统计: 1k | 阅读时长 ≈ 4
维表是数仓中的一个概念,维表中的维度属性是观察数据的角度,补充事实表的信息。在实时数仓中,同样也有维表与事实表的概念,其中事实表通常为kafka的实时流数据,维表通常存储在外部设备中(比如MySQL,HBase)。对于每条流式数据,可以关联一个外部维表数据源,为实时计算提供数据关联查询。维表可能是会 ...
阅读全文 »

upsert-kafka connector 介绍

发表于 2022-12-21 | 分类于 大数据 |
字数统计: 3.2k | 阅读时长 ≈ 13
在某些场景中,比如GROUP BY聚合之后的结果,需要去更新之前的结果值。这个时候,需要将 Kafka 消息记录的 key 当成主键处理,用来确定一条数据是应该作为插入、删除还是更新记录来处理。在Flink1.11中,可以通过 **flink-cdc-connectors 项目提供的 changel ...
阅读全文 »

Group by高级用法

发表于 2022-12-21 | 分类于 后端 |
字数统计: 1k | 阅读时长 ≈ 5
1.Group By Grouping Sets Group by分组函数的自定义,与group by配合使用可更加灵活的对结果集进行分组,Grouping sets会对各个层级进行汇总,然后将各个层级的汇总值union all在一起,但却比单纯的group by + union all 效率要高 ...
阅读全文 »

Flink 在 subtask 中分配不均的研究

发表于 2022-12-20 | 分类于 大数据 |
字数统计: 2.8k | 阅读时长 ≈ 11
Task与SubTask 一个算子就是一个Task. 一个算子的并行度是几, 这个Task就有几个SubTask 对应关系: 算子=Task 并行度=SubTask Parallelism并行度 默认并行度–cpu核数 关键点 不同的并行度(subtask),肯定在不同的slot,但也可能在不同的 ...
阅读全文 »

Solr vs ElasticSearch

发表于 2022-12-20 | 分类于 后端 |
字数统计: 4.6k | 阅读时长 ≈ 17
Solr和ElasticSearch到底有一些什么不同?我在网上搜索了一些文章,这些文章要么是列出一个表,详细地介绍两者什么功能有,什么功能没有(比较好的一篇博客),要么是从大类出发(其中比较好的一篇文章),比较两者的关注度,社区等等。但看完这些文章,还是没法解决我心中的疑惑。最近由于项目的原因,S ...
阅读全文 »

正确的使用 Java 8 的新特性之 Optional

发表于 2022-12-19 | 分类于 后端 |
字数统计: 1.7k | 阅读时长 ≈ 7
使用 Java8 有一段时间了,对于其中的 Optional 类使用较为频繁,所以写一篇文章记录 1我不会说是因为老记不住调用 Api 才写的 Optional 类主要解决的问题是 Java 常见的的空指针异常 NullPointerException 从创建 Optional 的 API 来看,可 ...
阅读全文 »

DataSource接口

发表于 2022-12-19 | 分类于 后端 |
字数统计: 1.6k | 阅读时长 ≈ 5
来自大佬:https://blog.csdn.net/qq_37781649/article/details/120252496 DataSource接口,一个被大多数程序员忽略的接口 老时代的数据查询 在很久很久以前(反正忘了多久),那个时候程序员连接数据库还是这么个操作 可以清楚的看到,曾经获 ...
阅读全文 »

数仓概念粒度

发表于 2022-12-15 | 分类于 大数据 |
字数统计: 1.8k | 阅读时长 ≈ 6
数仓避坑-整明白粒度 上篇文章 数仓避坑-搞懂维度模型 介绍了维度建模经典的四部曲:选定业务过程、声明粒度、确定维度、确定事实。 第二步中,粒度的概念着实有点抽象,很难理解。但是,如果粒度整不明白,近乎等于数仓没入门,你将会面临一系列问题~ 今天就给大家分享一下,我踩坑粒度的过程。 01 先说说粒度 ...
阅读全文 »

hexo博客添加一级分类相册功能

发表于 2022-12-05 | 分类于 博客 |
字数统计: 6 | 阅读时长 ≈ 1
Here's something encrypted, password is required to continue reading.
阅读全文 »
上一页1…91011…14下一页

137 日志
16 分类
34 标签
RSS
近期文章
  • Sqlite3 net平台
  • 输出信号
  • halcon OCR
  • halcon拟合圆
  • Costura_Fody插件程序打包
0%
© 2024 [email protected] | Site words total count: 249.2k