首页
学习
活动
专区
工具
TVP
发布

JavaEdge

关注公众号:JavaEdge,加入全国最大的后端交流群。
专栏成员
2500
文章
2761804
阅读量
182
订阅数
程序员如何正确学习数据分析?
在专栏里,我会告诉你都有哪些常用的数据源,以及如何获取它们。另外在工具使用中,你也将掌握“八爪鱼”这个自动抓取的神器,它可以帮你抓取 99% 的页面源。当然我也会教你如何编写 Python 爬虫。掌握 Python 爬虫的乐趣是无穷的。它不仅能让你获取微博上的热点评论,自动下载例如“王祖贤”的海报,还能自动给微博加粉丝,让你掌握自动化的快感。
JavaEdge
2024-10-12
1260
当SOA遇到DDD
本文讨论软件设计中的决策,特别是关于将较大的系统拆分为多个可独立部署的服务端点。不会特别讨论【服务端点设计】,但我想探讨一下为创建多个服务应用程序进行构思的阶段。
JavaEdge
2024-08-20
1070
Flink架构
Flink 是一个分布式系统,需要有效分配和管理计算资源才能执行流应用程序。它集成了所有常见的集群资源管理器,如Hadoop YARN,但也可以设置作为独立集群甚至库运行。
JavaEdge
2024-08-03
870
深入理解 Java17 新特性:Sealed Classes
鉴于Java全球影响力和高兼容性承诺,语言功能设计错误代价非常高。如语言功能存在缺陷,保持兼容性不仅意味很难移除或显著改变功能,且现有功能还会限制未来功能发展。新功能要通过实际使用来验证,开发人员的反馈至关重要。为确保在快速发布节奏下有足够的时间进行实验和反馈,新语言功能将通过一或多个轮次的预览来测试,这些功能是平台的一部分,但需要单独选择进入,并且尚未成为永久功能,以便在根据开发人员的反馈进行调整时,不会破坏关键代码。
JavaEdge
2024-07-24
1380
如何防止订单二次重复支付?
用户第一次点击下单操作时,会弹出支付页面待支付。但可能存在用户在支付时发现账户金额不够,后续选择:
JavaEdge
2024-07-23
2180
关注专栏作者,随时接收最新技术干货
JavaEdge
华为 | 软件开发工程师
一文看懂AI的 Transformer 架构!
转换器,一种将输入序列转换或更改为输出序列的神经网络架构。它们通过学习上下文和跟踪序列组件之间的关系来做到这一点。例如,请考虑以下输入序列:“天空是什么颜色的?” 转换器模型会使用内部数学表示法来识别颜色、天空和蓝色这三个词之间的相关性和关系。利用这些知识,它会生成输出:“天空是蓝色的。”
JavaEdge
2024-07-22
1.3K0
Gitlab 实现仓库完全迁移,包括所有提交记录、分支、标签
但这只针对 public 的项目,若你是私有项目,还不行,差一步得填写原 gitlab 账号密码。
JavaEdge
2024-05-26
1.3K0
当Java 22遇到 SpringBoot 3.3.0(下)
这个预览功能是巨大的生活质量提升!尽管结果代码更小,而我非常欢迎它。不幸的是,它目前还与 Spring Boot 不兼容。基本概念是,总有一天你将能够只有一个顶层 main 方法,而不需要今天 Java 中的所有仪式。作为应用程序的入口点,这不是很好吗?没有 class 定义,没有 public static void,也没有不必要的 String[] 参数。
JavaEdge
2024-05-26
1030
05-快速理解SparkSQL的DataSet
可从JVM对象构造Dataset,然后函数式转换(map、flatMap、filter等)操作。Dataset API在Scala和Java中可用。
JavaEdge
2024-05-26
730
当Java 22遇到 SpringBoot 3.3.0!
Java 22 是一个重大的进步,是一个值得升级版本。有一些重大的最终发布功能,如 Project Panama及一系列更优秀的预览功能。我不可能覆盖它们全部,但我确实想谈谈我最喜爱的一些。我们将会涉及到许多功能。如果你想在家里跟着做,代码在这。
JavaEdge
2024-05-26
2170
当Java 22遇到 SpringBoot 3.3.0(上)
Java 22 是一个重大的进步,是一个值得升级版本。有一些重大的最终发布功能,如 Project Panama及一系列更优秀的预览功能。我不可能覆盖它们全部,但我确实想谈谈我最喜爱的一些。我们将会涉及到许多功能。如果你想在家里跟着做,代码在这。
JavaEdge
2024-05-26
1720
03-SparkSQL入门
Spark 的一个组件,用于大规模数据分析的 SQL 查询引擎。Shark 提供了一种基于 SQL 的交互式查询方式,可以让用户轻松地对大规模数据集进行查询和分析。Shark 基于 Hive 项目,使用 Hive 的元数据存储和查询语法,并基于Hive进行了性能优化和扩展。
JavaEdge
2024-05-26
1260
01-Spark的Local模式与应用开发入门
Spark 运行模式之一,用于在本地机器上单机模拟分布式计算的环境。在 local 模式下,Spark 会使用单个 JVM 进程来模拟分布式集群行为,所有 Spark 组件(如 SparkContext、Executor 等)都运行在同一个 JVM 进程中,不涉及集群间通信,适用本地开发、测试和调试。
JavaEdge
2024-05-26
1650
汽车行业电商平台化架构演进之道
随着电商业务迅猛发展,技术人员的增加,到 2016 年技术团队已经有了上百人。单体架构之痛扑来,一个前台商城 git 项目就近 30 个 Maven 的子项目,遇上需求并行开发,经常出现代码的合并冲突、需求上线等待、线上慢 SQL 等问题,整个系统的开发效率和系统稳定性都变差:
JavaEdge
2024-05-26
1320
ClickHouse最大QPS到底咋估算?
ClickHouse是用于分析的OLAP数据库,因此典型的使用场景是处理相对较少的请求 — 从每小时几个到每秒几十甚至几百个不等 — 但会影响到大量数据(几GB/数百万行)。
JavaEdge
2024-05-26
2720
实现悲观协议,除了锁还能咋办?
相对乐观和局部悲观是一体两面的关系,识别它的要点就在于是否有全局有效性验证,这也和分布式数据库的架构特点息息相关。但是关于悲观协议,还有很多内容没有提及,下面我们就来填补这一大块空白。
JavaEdge
2024-05-26
960
离线数仓建设之数据导出
为了方便报表应用使用数据,需将ADS各项指标统计结果导出到MySQL,方便熟悉 SQL 人员使用。
JavaEdge
2024-05-26
900
数仓开发之ODS层
优秀可靠的数仓体系,需要良好的数据分层结构。合理的分层,能够使数据体系更加清晰,使复杂问题得以简化。以下是该项目的分层规划。
JavaEdge
2024-05-26
1190
碾压GPT-4!Claude3到底有多强?
2024年3月4日,官方宣布推出 Claude 3 模型系列,它在广泛的认知任务中树立了新的行业基准。该系列包括三个按能力递增排序的最先进模型:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。每个后续模型都提供越来越强大的性能,允许用户为其特定应用选择智能、速度和成本之间的最佳平衡。
JavaEdge
2024-05-26
2020
tsv文件在大数据技术栈里的应用场景
是的,\t 是指制表符(tab),它通常用作字段分隔符在 TSV(Tab-Separated Values)格式的文件中。TSV是一种简单的文本格式,它使用制表符来分隔每一列中的值,而每一行则代表一个数据记录。
JavaEdge
2024-05-26
1290
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档