大数据开发工程师面试题 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

2019 C++开发工程师面试题大合集

线程则不然，由于同一进城下的线程之间贡献数据空间，所以一个线程的数据可以直接为其他线程所用，这不仅快捷，而且方便。...2）调用 malloc（）函数时，它沿着连接表寻找一个大到足以满足用户请求所需要的内存块。然后，将该内存块一分为二（一块的大小与用户申请的大小相等，另一块的大小就是剩下来的字节）。...4）到最后，空闲链会被切成很多的小内存片段，如果这时用户申请一个大的内存片段，那么空闲链表上可能没有可以满足用户要求的片段了。...若所属自由链表为空，则请求内存池为所属自由链表分配空间；默认情况下，为该自由链表分配20个区块，若内存池剩余容量不足，则分配可分配的最大容量；若内存池连一个区块都无法分配，则调用chunk_alloc为内存池分配一大块区块...支持简单数据类型，需要客户端自己处理复杂对象 2）持久性：redis支持数据落地持久化存储；memcache不支持数据持久存储。)

2K4 1

小米大模型数据开发工程师-武汉

小米大模型数据开发工程师-武汉我对于这个岗位的理解结合这个职位的描述与网上的搜索，对于这个职位我的理解大概是这样的：数据处理：需要使用各种工具（如SQL、Python、Hadoop等）来收集、清洗和处理数据...大模型和大数据的行业前景理解大模型-理解首先是对于大模型的理解，最经典的就是chatgpt，PI AI，claude2, Bard,这些是市面上使用体验最好的大语言模型，这也是我平日生活中工作学习必不可少的部分...就我自己学习和我们老师教学来看，我的理解是后端开发包含大数据开发，但是大数据开发不包含后端开发，也就是干后端开发的往往也可以干大数据开发，但是干大数据开发的很难转到后端开发，我们教学也是这样的，都显示教完...因此，Python常被用于数据分析和大模型的构建，它的灵活性和易用性使得数据科学家和工程师能够更快速地进行原型设计和实现复杂的数据分析任务。...kafka\spark\ETL\maven\gradle 我们可以将大模型数据开发想象成是一家大型的制造厂，而这些技术工具就是厂房中的各种设备。

2491 0

您找到你想要的搜索结果了吗？

是的

没有找到

大数据工程师（开发）面试题(附答案)

我：初始化，资源，数据源，并行化，rdd转化，action算子打印输出结果或者也可以存至相应的数据存储介质补：具体的可看下图： 2. Spark有哪两种算子？...面试官：还有你刚刚写的那个groupByKey哈补：在我们的开发过程中，能避免则尽可能避免使用reduceByKey、join、distinct、repartition等会进行shuffle的算子...你如何从Kafka中获取数据？我：topic 补：分布式消息系统：Kafka 7. 对于Spark中的数据倾斜问题你有什么好的方案？我：可以先分析基数大造成数据倾斜的维度，将其适当的拆分。...面试官：给你个提示，尝试用树这个数据结构。补：此处埋一个坑，学完树的数据结构再回来解决。...非大数据领域，我们可以用ZooKeeper来做些什么？我：ZooKeeper是分布式协调组件，非大数据领域，可以用ZooKeeper来做HA或者存储数据，比如配置信息啥的。

15.3K4 0

java软件开发工程师面试题_软件开发工程师面试题

Java 软件高级工程师笔试题【智力部分】（30分） 1. 烧一根不均匀的绳要用一个小时，如何用它来判断半个小时？（5分）两头同时烧 2. 4，4，10，10，加减乘除，怎么出24点？...（5分）面向对象是基于万物皆对象这个哲学观点，把一个帝乡抽象成类，具体就是你吧一个对象的静态特征和动态特征抽象成属性和方法，也就是把一类事务的算法和数据结构封装在一个类之中，程序就是多个对象和互相间的通信组成的

5321 0

大模型开发工程师 roadmap

大模型开发工程师应该是接下来几年最火的方向之一，今天逛github发现一个很好的学习导图，是一个专业的大模型开发工程师的学习路线图：我翻译了一下，供英文不是很好的同学参考：运行LLMs： LLM...Structuring outputs）构建向量存储：摄入文档（Ingesting documents）分割文档（Splitting documents）嵌入模型（Embedding models）向量数据库

5601 0

大数据开发工程师面试题以及答案整理（二）

2、当业务场景不需要数据持久化时，关闭所有的持久化方式可以获得最佳的性能以及最大的内存使用量。...所以，Cloudera 建议如果数据被多个系统消费的话，使用kafka；如果数据被设计给Hadoop使用，使用Flume。...项目中遇到什么难题，有没有数据丢失，怎么解决难题就是数据丢失 rdd怎么划分stage map,filtre为窄依赖， groupbykey为款依赖遇到一个宽依赖就分一个stage RDD...同时如果数据量十分大，可能还会造成OutOfMemoryError。...kafka 重启是否会导致数据丢失不会因为kafka会做持久化 spark streaming 重启是否会导致数据丢失博客：Spark Streaming和Kafka整合是如何保证数据零丢失

6341 0

Java中级开发工程师面试题？

.✨ 博客首页——猫头虎的博客《面试题大全专栏》文章图文并茂生动形象简单易学！...欢迎大家来踩踩~ 《IDEA开发秘籍专栏》学会IDEA常用操作，工作效率翻倍~ 《100天精通Golang(基础入门篇）》学会Golang语言，畅玩云原生，走遍大小厂~ 希望本文能够给您带来一定的帮助文章粗浅...Java中级开发工程师面试题？

1311 0

测试工程师进阶面试题目大合集

很多软件测试工程师在面试的时候都会遇到考官给的各种各样的面试题，这也反应了测试工程师对企业的重要性，面试通常分为以下几个方面，由于篇幅有限，在这里就只给大家分享一些比较常见的问题。...也要想办法保持淡定，脸上可适当加点微笑，语速放慢，让面试官听清你说的是什么 3、自我介绍时该说的内容内容不能太多和太杂，太杂容易找不到重点，一般内容有：自己的名字、工作经历、有什么能力或技能、获得哪些成绩（最好有数据...包括项目代码规模，需求规模、用例规模，工作量，进度，质量和成本，然后是整体的测试流程，然后再是角色与职责，接下来是在项目中自己的特色，比如做得最好的是、遇到最大的困难时（如何解决）、哪些地方还有待提高，最好有相应的数据进行支持...所以我的职业发展是需要时间积累的，一步步向着高级测试工程师奔去。而且我也有初步的职业规划，前3年积累测试经验，按如何做好测试工程师的要点去要求自己，不断更新自己改正自己，做好测试任务。...在开发的同时测试经理开始编写测试用例，测试文档要参考开发文档，所以开发和测试是不可分割的，少了任何一个都不能开发出产品。 Q：为什要在一个团队中开展测试工作？

1K3 1

超实用Python开发工程师面试题分享

目前Python语言的应用领域非常广泛，主要有系统编程、图形处理、数学处理、文本处理、数据库编程、网络编程、Web编程、多媒体应用、pymo引擎、黑客编程等等。...以下是Python的五大优势： 1、Python 易于学习; 2、用少量的代码构建出很多功能; 3、Python 拥有最成熟的程序包资源库之一; 4、Python 紧挨着 R 语言，都是现代数据科学中最常被使用的语言...Python的各种优势领各大企业公司开始使用Python开发，这就造成了Python开发人才的紧缺，相应的Python开发人员的薪资待遇也在增高。...据统计，目前Python开发人员的薪资待遇为10K以上，这样的诱惑很难让人拒绝。下面就来给大家分享一波面试题： ?...函数可以作为参数传递的语言，可以使用装饰器 python内建数据类型有哪些整型--int 布尔型--bool 字符串--str 列表--list 元组--tuple 字典--dict 简述面向对象中new

5733 0

.NET开发工程师的常见面试题

aspx：页面 ascx：用户控件 asmx：Web Service ashx：一般处理程序 asax：Global.asax，全局应用程序配置 ASP.NET中的六大对象有哪些？...值类型：有符号整数（由小到大）：sbyte、short、int、long 无符号整数（由小到大）：byte、ushort、uint、ulong 浮点型：float、double、decimal 布尔型...这样可以使程序员的关注点转移到程序的功能和业务逻辑，提高了程序的安全性、稳定性、及开发效率。什么是委托？事件跟委托是什么关系? 委托：表示具有一类相同签名的方法的封装类型。...面向对象的三大特征是什么？/面向过程和面向对象的区别封装、继承、多态 ### 抽象类和接口的区别？相同点：不能被直接实例化。可以包含任意个抽象成员。...SQL中数据库事务的四大特性： 1.原子性（Atomicity）原子性是指事务包含的所有操作要么全部成功，要么全部失败回滚，因此事务的操作如果成功就必须要完全应用到数据库，如果操作失败则不能对数据库有任何影响

5.9K3 0

vivo 服务器开发工程师面试题

最近熊哥的一个有大厂开发经验的朋友去面试 vivo 的服务器开发工程师（C++）岗位。熊哥分享一下该岗位一面的算法题，供大家参考，希望对大家有所帮助。...数据范围：n ≤ 1000。要求：空间复杂度 O(1)，时间复杂度 O(n)。

6872 0

2020Java高级开发工程师面试题汇总

2020面试总结工作三年多，面试目标为高级开发工程师前言 9.5–11.13，经过了长达70天的面试，终于有了结果。...以上通过参数设置，整理空间碎片 G1垃圾收集器的优化步骤适当调整内存大小调整最大停顿时间调整启动并发GC时堆内存占用百分比 3.Spring/Spring Boot 设计模式和设计原则六大设计原则...using temporary 用到了临时表关联查询的注意事项小表驱动大表左连接以左表为准右连接以右表为准哪些情况会使索引失效？...10.算法快速排序堆排序（时间复杂度和空间复杂度）获取数组中第K大的数（使用快速排序或者堆）将两个有序数组或链表合并成一个有序的数组或链表（归并排序）判断链表中是否有环...二维数组问题算法问题可以到访问https://leetcode-cn.com/练习总结本文总结了面试高级Java开发工程师的常见问题，涉及的问题仅为自己在面试过程中遇到问题的总结，只是列举出了问题

1.1K2 0

高级大数据研发工程师面试题总结

parquet进行字段的新增或删除，如何进行数据的历史数据中字段的新增或删除（非重跑数据）？...9.Flink watermark 10.HDFS写数据流程、fsimage作用、如何区分HDFS热数据和冷数据 11.数据倾斜（Spark、Hive、HBase） 12.MapReduce原理，...29.如何数据治理？ 30.谈谈你对数据仓库、数据中台、数据湖的理解？ 31.做过实时数仓吗，讲一下 32.数仓建模方法，你公司用的是什么建模方法？为什么采用这种建模方法？...42.Redis数据结构、分布式锁。数据发生更新、是先更新DB再更新redis缓存还是反过来，怎么处理以及为什么？...51.跨数据中心/机房数据迁移方案？ 52.大数据集群运维事项（Hadoop集群节点、配置，HBase集群运维等） 53.为什么离职？什么时间能入职？ 54.对于将来的职业规划？

1.5K3 0

数据库工程师常见面试题

物理结构设计：为设计好的逻辑模型选择物理结构，包括存储结构和存取方法等，建立数据库物理模式。实施和维护：实施就是使用 DLL 语言建立数据库模式，将实际数据载入数据库，建立真正的数据库。...答：索引是若干数据行的关键字的列表，查询数据时，通过索引中的关键字可以快速定位到要访问的记录所在的数据块，从而大大减少读取数据块的 I/O 次数，因此可以显著提高性能。...如果应用程序常执行大容量复制操作或者是发送、接收大量的 text 和 image 数据的话，可以将此值设大一点。如果应用程序接收和发送的信息量都很小，那么可以将其设为 512 字节。...问题 14：表中有 A B C 三列，用 SQL 语句实现：当 A 列大于 B 列时选择 A 列否则选择 B 列，当 B 列大于 C 列时选择 B 列否则选择 C 列。...答：数据库视图的作用主要有：数据库视图隐藏了数据的复杂性。数据库视图有利于控制用户对表中某些列的访问。数据库视图使用户查询变得简单。视图是一个虚拟表，其内容由查询定义。

3.3K4 0

大数据开发工程师岗位分析

最近一年大数据火爆异常，各种培训班开课广告满天飞，很多做开发的朋友也想转到大数据这一行，在投递简历的时候进场被几个岗位搞迷糊，他们是大数据分析师，大数据研发工程师，大数据建模工程师，大数据挖掘工程师...大数据开发工程师腾讯大数据研发工程师职位描述：岗位职责: 负责数据接入、数据清洗、底层重构，业务主题建模等工作；负责金融大数据整体的计算平台开发与应用；岗位要求: 计算机或相关专业本科以上学历...、hdfs、Hive、Spark等，1个以上大数据平台项目实施经验；熟悉Oracle或MySQL数据库技术； 3、具有BI系统的开发实施经验，能够独立开发设计数据仓库、ETL设计、Cube建模、OLAP...平安科技职位描述：工作年限：2年以上职位描述： 1、负责hadoop/spark平台技术引进和推广，并能结合用户需求快速落地推广； 2、负责大数据分析需求设计和开发，包括数据集市、实时分析、数据展示等的开发...横向对比相同的大数据开发工程师职位在不同的互联网公司，岗位职责不一样，相应的岗位要求差异也比较大。不过，核心技能要求相近： 1. 熟悉hadoop集群 2. 熟悉hive 3.

2K2 0

7 个Web开发工程师面试题和回答策略

Web开发人员的职责是什么？解析： Web工程师应该充分了解自己的角色，以及怎样为Web设计和开发做出贡献。这个问题能帮助面试官了解求职者打算怎样配合团队，以及他们是否知道自己要做些什么。...面试官想知道什么：清楚地了解Web开发过程他们强调那些职责他们打算怎样发挥自己的能力参考答案： Web工程师负责设计、开发、增强、测试和部署Web应用，其最终目标是创建引人入胜而且用户友好的站点布局和功能...我非常支持使用 HTTP/2，因为我曾经分析过相关数据，并知道了 HTTP/2 是如何将页面加载时间减少20％的。你熟悉哪种编程语言？...解析： HTML，CSS，SQL，PHP，Ruby，Python 和 JavaScript 是 Web 工程师应该能够轻松驾驭的常见编程语言。这个问题能帮助面试官评估求职者的经验、偏好、优势和劣势。...解析： Web 开发工程师可能面临意想不到的挑战，包括缩短开发周期和面对过于雄心勃勃的客户。清楚地了解求职者如何处理这种情况，将有助于面试官了解他们做事的优先级和思考过程。

7213 0

php开发工程师面试题知识点总结(一)

，网上基本上都是查询max(id) * rand()来随机获取数据。...存储大小为输入数据的字节的实际长度，而不是 n 个字节。所输入的数据字符长度可以为零。二.插入数据 1.char列的NULL值占用存储空间。 varchar列的NULL值不占用存储空间。...插入不为null的数据时，无论插入数据涉及的列是否建立索引，varchar列的插入效率也是明显高出char列。...五.数据检索无论是否通过索引，varchar类型的数据检索略优于char的扫描。那实际开发中，我们使用哪种呢？...当确定字符串为定长、数据变更频繁、数据检索需求少时，使用char；当不确定字符串长度、对数据的变更少、查询频繁时，使用varchar。

1K1 0

CC++工程师面试题（数据库篇）

好处：提高检索速度：索引可以加快数据的检索速度，因为它们允许数据库系统直接定位到存储数据的位置，而不必遍历整个数据表。...优化数据访问路径：索引可以优化数据访问路径，使得查询更加高效。坏处：占用存储空间：索引会占用额外的存储空间，特别是对于大型数据集来说，索引可能会占用相当大的空间。...随着数据库的增长和索引的数量增加，维护成本可能会变得很高。数据库索引的底层数据结构 B+树。在数据库中，B+树的高度一般都在2～4层，效率很高。...，而数据库存储的数据量级可能会非常大，全部载入内存基本上是不可能实现的索引为什么不用红黑树而用 B+ 树索引的底层用的并不是二叉树和红黑树。...例如，选择整数型而不是字符串型存储数字数据。定期优化数据库：定期清理无用数据、重建索引以及收集统计信息等可以提高数据库性能。

1981 0

杨校老师课堂之MySQL数据库面试题【开发工程师面试前必看】

1.说一说三大范式「第一范式」：数据库中的字段具有「原子性」，不可再分，并且是单一职责 ---- 「第二范式」：「建立在第一范式的基础上」，第二范式要求数据库表中的每个实例或行必须「可以被惟一地区分...这个惟一属性列被称为主键> ---- 「第三范式」：「建立在第一，第二范式的基础上」，确保每列都和主键列直接相关，而不是间接相关不存在其他表的非主键信息 ---- 但是在我们的日常开发当中，...「并不是所有的表一定要满足三大范式」，有时候冗余几个字段可以少关联几张表，带来的查询效率的提升有可能是质变的 2.MyISAM 与 InnoDB 的区别是什么？...也就是不存在的数据。...「查询语句方面」避免索引失效合理的书写where条件字段顺序小表驱动大表可以使用force index()防止优化器选错索引 4.

6193 0

PHP工程师面试题

Apache与Nginx大访问下性能描述正确的是？...7.以下的哪一个数据库产品是采用了 pureXML技术的数据服务器： A、SQL Server B、DB2 C、MySQL D、JSON 参考答案：B 答案解析：暂无 8.作为一个管理员，你希望在每一个新用户的目录下放一个文件...9.在MySQL中，可用于创建一个新数据库的SQL语句为（） A、CREATE DATABASE B、CREATE TABLE C、CREATE DATABASES D、CREATE DB 参考答案...：A 答案解析： A选项正确，创建库语句为：CREATE DATABASE 数据库名。...>） B、如果启用了 magic_quotes_runtime，大多数返回任何形式外部数据的函数，包括数据库和文本段将会用反斜线转义引号 C、因为可以在运行时使用ini_set对配置选项进行设置，所以display_errors

4452 0

点击加载更多

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭