Firestore -如何从一个集合中确定地获得多个随机的(非重复的，特定数量的)文档？

Firestore是一种由谷歌提供的NoSQL文档数据库，它可用于存储和同步应用程序的数据。Firestore提供了方便的API和工具，以便开发人员能够轻松地对数据进行增删改查操作，并提供了实时数据同步功能。

要从一个集合中获取多个随机的非重复文档，可以按照以下步骤进行操作：

获取集合的总文档数量。可以使用Firestore提供的collectionGroup查询来统计集合中的文档数量，例如：
获取集合的总文档数量。可以使用Firestore提供的collectionGroup查询来统计集合中的文档数量，例如：
生成要获取的随机文档的索引。根据要获取的文档数量，生成随机的索引值，确保索引值在集合的范围内。
获取随机文档。使用Firestore的limit()和offset()方法结合随机生成的索引来获取随机文档，例如：
获取随机文档。使用Firestore的limit()和offset()方法结合随机生成的索引来获取随机文档，例如：

在上述代码示例中，我们使用orderBy()方法对集合中的字段进行排序，以确保在使用offset()方法时获得的文档是固定的。field是你想要排序的字段名。

对于Firestore的推荐产品和产品介绍链接，由于要求不能提及特定的云计算品牌商，建议你参考Firestore官方文档和相关资源，以获取更多信息和使用指南。

相关·内容

骑上我心爱的小摩托，再挂上AI摄像头，去认识一下全城的垃圾！

大数据文摘出品来源：medium 编译：曹培信垃圾管理是现代城市一个非常有挑战性的任务，每个地区都有其独特的垃圾产生模式，但无论产生垃圾的种类和数量如何变化，优化垃圾的收集方式是降低成本、保持城市清洁的重要手段...但是medium上有位名叫Michele Moscaritolo博主就想，如果有一个智能摄像头可以准确地识别垃圾，那么这个问题就很好解决了。...垃圾的GPS坐标通过简单的gpsd接口从usb模块读取，将数据存储在Google Firestore实时数据库中，这样本地的Google firebase SDK就被用于客户端应用程序开发。...Ionic+Angular让我们可以从一个普通的代码库生产iOS和安卓应用程序，以及一个基于web的可以从任何浏览器访问的应用程序。...Google Firebase则可以让我们将每个GPS点左边作为一个嵌套的集合/文档存储。

10.3K3 0

2021年11个最佳无代码低代码后端开发利器

它们是特殊的字段类型，Airtable处理数值的计算。重复性任务的自动化可以节省大量的时间并减少错误率。在Airtable基础中建立自动化工作流程是通过使用自定义动作来触发一个事件。...此外，它还提供了50多个内置应用程序，可以轻松地与G套件、Outlook、Sendgrid、Slack、Jira等一系列其他应用程序整合。...它们有预先定义的模式，并使用结构化查询语言（SQL）来定义和操作数据。非关系型或NoSQL数据库有动态模式。它们以文件的集合或多个集合的形式存储数据。...它提供了一套有意见的功能，并以NoSQL为基础。 NoSQL范式让你以集合和文档的形式存储数据。每个文档都包含字段。每个字段都有其独特的数据类型。...接口文档规范 Bootstrap实战 - 响应式布局为什么 Redis 的查询很快，Redis 如何保证查询的高效 vue3-vite-elementplus-admin管理后台V1.0.2 知网都搜不到的知识

12.6K2 0

50+个ChatGPT提示词助你成为高效Web开发者（上）

如果你已经感到编写代码的重复和繁琐让你疲惫不堪，想要提高自己的效率，那么你来对地方了。ChatGPT是一款能够帮助你优化工作流程、减少错误并获得提高代码的见解的强大工具。...使用 ChatGPT，您可以轻松地将代码片段从一种语言或框架转换为另一种语言或框架。...这个集合中的每个文档都代表一个房间，会有房间ID、房间类型、价格、是否可用等字段。 - **Bookings**：用于存储所有的预订。...这个集合中的每个文档都代表一个预订，会有预订ID、客人ID、房间ID、预订日期、入住日期、退房日期等字段。 - **Users**：用于存储所有的用户（客人和员工）。...这个集合中的每个文档都代表一个用户，会有用户ID、姓名、电子邮件、密码、角色（客人或员工）等字段。 b. Firebase Authentication：你可以用它来处理用户注册和登录。

9422 1

Flutter 2.8正式版发布了，还不来看看

22.4K3 0

为什么我们一定要用随机权重初始化神经网络

要理解这种解决问题的方法，首先必须了解非确定性和随机算法的作用，以及随机优化算法在搜索过程中利用随机性的要求。在这篇文章中，你会了解为什么神经网络权重必须被随机初始化的全部背景知识。...这篇文章分为4部分; 他们是：确定性和非确定性算法随机搜索算法神经网络中的随机初始化初始化方法确定性和非确定性算法经典算法是确定性的。例如，对列表进行排序的算法。...这些问题往往难到，确定性算法不能用于有效地解决它们。算法当然可以运行，但想要得出结果可能会一直运行到宇宙终结。于是我们使用非确定性算法替换它。这些算法在执行算法时使用随机性元素进行决策。...这个算法使用随机性为正在学习的数据中输入到输出的特定映射函数找到足够好的权重组合。这意味着每次运行训练算法时，特定训练数据的特定网络将拟合具有不同模型技能的不同网络。...评估神经网络配置技能的最有效方法是多次重复搜索过程，并报告模型在这些重复过程中的平均性能。这为配置提供了从多个不同初始条件集搜索空间的机会。

1.6K3 0

【大数据分析与挖掘技术】Mahout分类算法

最后我们使用实例来展示如何将一个数据集进行处理、模型训练和分类应用。一、分类的基本概念分类是使用特定信息（输入）从一个预定义的潜在回应列表中做出单一选择（输出）的过程。...值的类型描述连续型通常是一个浮点值，可能是任何具有具体数值大小的量，比如价格、重量、时间、长度等，而且这个数值大小是这个值的关键属性类别型通常类别型数据从一个已知的集合中进行取值，无论这个集合有多大...(但不能为无穷集合)，常见的集合只有两个元素，例如，布尔型数据{0,1}，也有可能是多个数据的集合单词型单词型值类似于类别型的值，但是它的取值集合是无穷集合，即所有单词文本型文本型值是多个单词型值的序列...（1）构造每颗决策树时，都通过随机方式从N个全部样本中选择N个随机样本（可能会有重复）。...countWords(analyzer, words,reader); reader.close(); } 通过上述代码可以确定文件的四个特征，即新闻组、行数、文件头中单词数和文档主体中单词数

791 0

关于图算法 & 图分析的基础知识概览

当我们需要对图中的特定节点，特定关系，或者特定标签或者属性进行特定分析时，子图就会很有用。路径（Path）是一组节点及他们的关系的集合。...路径搜索（Pathfinding）算法建立在图搜索算法的基础上，并探索节点之间的路径。这些路径从一个节点开始，遍历关系，直到到达目的地。...例如：旅行计划：尽可能降低探索一个国家的旅行成本；追踪流感传播的历史：有人使用最小生成树模型对丙型肝炎病毒感染的医院暴发进行分子流行病学调查随机游走随机游走（Random Walk）算法从图上获得一条随机的路径...随机游走算法从一个节点开始，随机沿着一条边正向或者反向寻找到它的邻居，以此类推，直到达到设置的路径长度。...例如，在一个社交网络中，一个拥有更多 degree 的人（节点）更容易与人发生直接接触，也更容易获得流感。一个网络的平均度（average degree），是边的数量除以节点的数量。

3.2K3 0

如何使用React和Firebase搭建一个实时聊天应用

Firebase是一个由Google提供的后端服务平台，它可以快速地开发和部署iOS、Android和Web应用。...然后，在终端中运行以下命令来安装这两个依赖项：npm install firebase react-firebase-hooks3.使用Firebase Authentication在src文件夹下打开...的rooms集合的变化，并在组件卸载时取消订阅。...每当rooms集合有新的数据时，它会更新messages状态，使其包含最新的聊天室消息。然后，它使用一个无序列表来显示每条消息，并使用Message组件来渲染每条消息的内容。...您可以参考以下资料来了解更多的细节和教程：React官方文档Firebase官方文档react-firebase-hooks库socket.io官方文档我正在参与2023腾讯技术创作特训营第四期有奖征文

6364 1

机器学习如何训练出最终模型

例如，不管是判断猫还是狗的照片，还是明天的估计销售数量；机器学习项目的目标是获得最佳的最终模型，其中“最佳”由以下因素决定：数据：可用的历史数据。时间：在项目上花费的时间。...k-fold交叉验证的目的为什么我们使用k-fold交叉验证？交叉验证是另一种对未知数据进行估计的方法。就像随机划分训练集和测试集。交叉验证法可以在数据集的多个子集上系统地创建和估计多个模型。...如果您使用k-fold交叉验证，您将会估算出模型在平均水平上如何“错误”（或相反地，如何“正确”），以及该错误或正确性的预期扩散程度。这就是为什么您精心设计的测试工具在机器学习中是极其重要的。...重抽样方法，如重复训练/测试或重复k-flod交叉验证将有助于处理方法中有多少变动。如果是一个真正要解决的问题，您可以创建多个最终模型，并从一个预测集合中获得平均值，以减少差异。...您已经克服了确定您的模型的障碍，例如：了解重抽样程序的目标，例如随机训练集和测试集的拆分和k折交叉验证。在所有可用数据上训练一个新模型时，模型的确定。将估计性能的模型与最终确定模型分开。

1.7K7 0

我们弃用 Firebase 了

Firestore 的文档 / 集合架构：它迫使人们仔细考虑数据建模。它还反映了一个直观的导航方案。 Firestore 中的关系数据也是如此。...云 Firestore 安全规则写起来很有趣，在考虑客户端 - 服务器安全方面，这是一个可靠的模型。开箱即用的身份验证很不错。（不过，在我们看来，其内置的 Firebase 邮件验证体验很糟糕）。...由于是闭源的，你不能默认以为 Firebase 始终存在（像 Parse 一样），依赖于特定的 API 版本也不可靠。因此，你也不能真正地在本地运行 Firebase。...这个 Web 片段会将站点配置为使用特定的 Firebase 应用程序，并借助环境变量使我们可以跨项目保留脚手架。...对于这个问题，K-Optional Software 几乎在同一时间收到了多个关于项目（不是我们的项目）的咨询请求，一切都表明，是 API 的突然变化造成了麻烦。

32.7K3 0

一篇文章了解贝叶斯机器学习

然后，我们获得了一些数据，并且用它来更新我们的信念。这个结果被称为后验概率。如果我们获得更多的数据，旧的后验成为一个新的先验并且循环重复。这个过程采用贝叶斯规则： ?...在这个设置中，你不遗余力地更好地使用可用的输入。此外，小数据对于要量化的不确定性是非常重要的，这正是贝叶斯方法擅长的地方。最后，我们将看到，贝叶斯方法通常是计算昂贵的。这又伴随着小数据。...你开始使用一个其中行是文档，列是单词的矩阵，每个元素都是一个给定的文档中给定单词的计数。LDA”factorizes”这个矩阵大小为nxd为两个矩阵，文件/主题（N×K）和主题/词（K x D）。...不同是，你不能把这两者相乘得到原始，但由于适当的行/列总和为一，你可以尝试一个文件。对于第一个单词，一个样本，一个主题，然后从这个主题的一个字（第二矩阵）。重复你想要的单词的数量。...因此，我们希望尽可能少的例子来获得好的东西。模型与推理推理是指你如何学习参数的模型。模型与你是如何训练它是分离的，特别是在贝叶斯世界。

7906 0

干货 | 一文读懂什么是贝叶斯机器学习

然后，我们获得了一些数据，并且用它来更新我们的信念。这个结果被称为后验概率。如果我们获得更多的数据，旧的后验成为一个新的先验并且循环重复。这个过程采用贝叶斯规则： ? ?...在这个设置中，你不遗余力地更好地使用可用的输入。此外，小数据对于要量化的不确定性是非常重要的，这正是贝叶斯方法擅长的地方。最后，我们将看到，贝叶斯方法通常是计算昂贵的。这又伴随着小数据。...你开始使用一个其中行是文档，列是单词的矩阵，每个元素都是一个给定的文档中给定单词的计数。LDA”factorizes”这个矩阵大小为nxd为两个矩阵，文件/主题（N×K）和主题/词（K x D）。...不同是，你不能把这两者相乘得到原始，但由于适当的行/列总和为一，你可以尝试一个文件。对于第一个单词，一个样本，一个主题，然后从这个主题的一个字（第二矩阵）。重复你想要的单词的数量。...数据是很小的，不仅是在维度-通常只有几个参数调整，也在一些数量的例子。每个例子代表一个目标算法的运行，这可能需要数小时或数天。因此，我们希望尽可能少的例子来获得好的东西。

9287 0

AI和机器学习的A～Z：综合术语表

Analytical Validation （分析验证）衡量任务从输入数据中准确可靠地生成预期技术输出的能力。机器学习中的验证技术用于获得ML模型的错误率。...强AI的反面是弱AI。一般AI的反面是狭窄的AI。事实是，这是习惯在大片中看到的AI，在现实生活中无法达到这种智能水平。称之为强大，因为认为它比我们强大，但它只不过是一个不知道如何实现的想法。...AI和ML都是一组算法，但ML只能输入结构化数据，AI可以处理结构化和非结构化信息，以便完成任务而无需编程如何操作。...Classification （分类）在机器学习和统计中，分类是一种监督学习算法技术，允许机器将类别分配给数据点（将数据分类到给定数量的类中）。...这是一个特定的过程，在这个过程中，机器（计算机）通过向他们提供数据并让他们自己学习一些技巧来学习，而没有明确地编程这样做。总而言之，机器学习是人工智能的核心和土豆。

1.4K2 0

初学者的十大机器学习算法

这意味着结合多个不同的弱ML模型的预测来预测新样本。我们覆盖的算法9-10-使用随机森林进行装袋，使用XGBoost进行提升是集合技术的示例。...第3步：重新计算质心：计算新群集的质心。灰色恒星显示旧的质心，而新的质心是红色，绿色和蓝色恒星。第4步：迭代，如果不变则退出。重复步骤2-3，直到没有点从一个簇切换到另一个簇。...我们不打算在这里介绍“堆叠”，但是如果您想详细解释它，请在下面的评论部分告诉我，我可以在其上写一个单独的博客。 9.随机森林套袋随机森林（多个学习者）是对袋装决策树（单个学习者）的改进。...在每个分割点处要搜索的特征的数量被指定为随机森林算法的参数。因此，在使用随机森林的装袋中，使用随机的记录样本构建每个树，并且使用随机的预测变量构建每个分割。...第4步：结合决策树桩：我们结合了之前3个模型中的分离器，并观察到与任何单个弱学习者相比，此模型中的复杂规则正确地对数据点进行了分类。

7263 0

通俗理解LDA主题模型

伯努利分布，又称两点分布或0-1分布，是一个离散型的随机分布，其中的随机变量只有两类取值，非正即负{+，-}。而二项分布即重复n次的伯努利试验，记为 ? 。...区别于下文要介绍的LDA中：样本固定，参数未知但不固定，是个随机变量，服从一定的分布，所以LDA属于贝叶斯派思想），可观测得到，所以对于任意一篇文档，其 ? 是已知的。...但再怎么变化，也依然服从一定的分布，即主题分布跟词分布由Dirichlet先验随机确定。...这就是贝叶斯派的核心思想，把未知参数当作是随机变量，不再认为是某一个确定的值），但其先验分布是dirichlet 分布，所以可以从无穷多个主题分布中按照dirichlet 先验随机抽取出某个主题分布出来...进一步，贝叶斯估计中，参数的多个估计值服从一定的先验分布，而后根据实践获得的数据（例如周末不断跑他家），不断修正之前的参数估计，从先验分布慢慢过渡到后验分布。 OK，相信已经解释清楚了。

20.6K8 2

第 17 章标准库特殊设施

与 pair类似，但 tuple可以有任意数量的成员。它的一个常见用途就是从一个函数返回多个值。 tuple的默认构造函数会对每个成员进行值初始化，也可以提供初始值。...---- 17.2 bitset类型 bitset类，可以方便地将整型运算对象当作二进制位集合处理，并且能够处理超过最长整型类型大小的位集合。可以用以下几种方式进行值初始化。...如果正则表达式中的模式包含一个或多个子表达式时，得到的 smatch对象中还会包含多个 ssmatch对象，表示与模式中每个子表达式的匹配信息。对于多个子表达式，使用括号来进行分组隔开。...C++中解决上述问题的方法是，使用随机数发生器，包括一个随机数引擎（生成 unsigned随机数序列）和分布对象（使用引擎返回服从特定概率分布的随机数）。...IO类型维护一个标记来确定下一个读写操作要在哪里进行，g版本表示正在“获得”（读取）数据，而 p版本表示正在“放置”（写入）数据。

1.1K3 0

数学建模--蒙特卡罗随机模拟

通过在一个正方形内随机生成点并判断这些点是否落在内切圆内，可以估算出圆周率的值。这种方法简单直观，但需要大量的随机抽样以获得较高的精度。如何改进蒙特卡罗方法以提高计算效率和精度？...指定从特定状态开始，然后采取特定动作，在所有可能性上循环采样它们的回报，从而弥补大型状态空间探索的不足。在实际应用中，蒙特卡罗方法如何处理随机性和不确定性？...这种方法可以有效地计算业务风险和预测失败，如成本或调度超支。具体来说，蒙特卡罗方法依赖于大量的随机抽样，通过重复多次模拟来估计不确定事件的可能结果。...在每次模拟过程中，都会为具有不确定性的变量赋值一个随机值，然后运行模型并记录结果。这个过程会重复N次，每次使用不同的变量值进行模拟。...在能源系统方面，例如独立微网优化配置中，蒙特卡罗随机模拟能够很好地模拟风能、太阳能等可再生能源及负荷需求的不确定性，从而有效处理系统不确定性因素。

1601 0

用人工神经网络预测急诊科患者幸存还是死亡

当它们都接近1时，模型的性能就越好; 当它们其中任何一个接近0时，模型的性能就会下降。在最理想的情况下，当模型完美地预测每个标签时，混淆矩阵在非对角线上的项为0。...定义隐层的数量和每层中计算单元的数量。（从一个简单的模型开始。）使用k重交叉验证技术获得基于候选特征的训练集数据和测试集数据。...在根据领域知识去除大多数数据项后，我们最初确定了一组候选特征并且生成了一个LIBSVM格式的数据文件。这是机器学习应用中常用的格式。我们从一个简单的模型开始，该模型有2个隐层，每层5个计算单元。...循环重复10次以下步骤：（i）获得训练和测试数据集（ii）训练模型和测量模型的性能。最后，停止Spark上下文。这就终止了主程序。...当使用ANN作为分类器时，建议特征在数量级保持平衡。事实上，在我们的例子中，除年龄重新编码外以外的所有特征都是二进制的。年龄重新编码从一组离散的8个值中接受值，这个差异在可接受范围内。

1.4K7 0

Redis 数据结构和常用命令

Redis 的主要功能都基于单线程模型实现，也就是说 Redis 使用一个线程来服务所有的客户端请求，同时 Redis 采用了非阻塞式 IO，并精细地优化各种命令的算法时间复杂度，这些信息意味着： Redis...维护一个集合时，提供了比 List 效率高得多的随机访问命令与 Hash 相关的常用命令： HSET：将 key 对应的 Hash 中的 field 设置为 value。...Set 中随机返回 1 个或多个 member，时间复杂度 O(N)，N 为返回的 member 个数 SPOP：从指定 Set 中随机移除并返回 count 个 member，时间复杂度 O(N)，...HyperLogLogs 是一种主要用于数量统计的数据结构，它和 Set 类似，维护一个不可重复的 String 集合，但是 HyperLogLogs 并不维护具体的 member 内容，只维护 member...也就是说，HyperLogLogs 只能用于计算一个集合中不重复的元素数量，所以它比 Set 要节省很多内存空间。

2762 0

「自然语言处理」使用自然语言处理的智能文档分析

什么是智能文档分析? 智能文档分析(IDA)是指使用自然语言处理(NLP)和机器学习从非结构化数据(文本文档、社交媒体帖子、邮件、图像等)中获得洞察。...文本相似性可用于检测文档或文档部分中的重复项和近似重复项。这里有两个例子: 通过比较论文内容的相似性来检查学术论文是否抄袭。匹配求职者和工作，反之亦然。...标签数量-单标签分类将一个项目精确地分类为一个类别，而多标签分类可以将一个项目分类为多个类别。将新闻文章分类到多个主题区域就是多标签分类的一个例子。...关系提取可用于处理非结构化文档，以确定具体的关系，然后将这些关系用于填充知识图。例如，该技术可以通过处理非结构化医学文档来提取疾病、症状、药物等之间的关系。 7....“如果一个人可以在不经过多年培训的情况下学会准确地完成这项任务，那么IDA就有可能通过加快过程、保持一致性或减少体力劳动来带来好处。” 如何处理智能文档分析项目?

2.4K3 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云