首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

疑车无据:大熊猫何时交配才能怀上宝宝?四川学者用音频AI给出预测

更令人惆怅是,雄性熊猫每天将大把时间用来吃饭和睡觉,压根注意不到异性,所以生育率一直很低。 ? 暴饮暴食使我快乐。...他们在自己研究中人工方式定义了 5 种不同熊猫叫声,并基于人工设计声学特征使用聚类方法叫声数据进行分组。...研究者学习到发声特征进行了可视化分析,结果表明新提出方法是有效。作者也预测准确度进行了定量分析,结果表明基于音频自动预测大熊猫交配成功率是可行。这项研究有望更加智能地帮助繁殖大熊猫。...给定一段原始音频序列,作者首先进行了预处理:裁剪出大熊猫叫声,然后根据一个预先设定最大值进行了归一化处理,并将每一段序列长度设定为 2 秒,并且每秒提取出 43 个声学特征。...学习做预测 根据每个采样叫声特征,研究者使用了一个 softmax 层来预测交配成功或失败概率,这会得到一个概率矩阵 P(大小为 86×2),其中第一和第二分别对应于交配成功和失败概率。

2.7K20

使用 Python 相似索引元素上记录进行分组

在本文中,我们将了解并实现各种方法相似索引元素上记录进行分组。 方法一:使用熊猫分组() Pandas 是一个强大数据操作和分析库。...groupby() 函数允许我们根据一个或多个索引元素记录进行分组。让我们考虑一个数据集,其中包含学生分数数据集,如以下示例所示。...语法 grouped = df.groupby(key) 在这里,Pandas GroupBy 方法用于基于一个或多个键对数据数据进行分组。“key”参数表示数据分组所依据一个或多个。...生成分组”对象可用于分别对每个组执行操作和计算。 例 在下面的示例中,我们使用 groupby() 函数按“名称”记录进行分组。然后,我们使用 mean() 函数计算每个学生平均分数。...groupby() 函数根据日期对事件进行分组,我们迭代这些组提取事件名称并将它们附加到 defaultdict 中相应日期键中。生成字典显示分组记录,其中每个日期都有一个事件列表。

19330
您找到你想要的搜索结果了吗?
是的
没有找到

如何使用 Python 分析笔记本电脑上 100 GB 数据

打开一个数据集会生成一个标准数据框,检查它速度是否也很快: ? 纽约市黄色出租车数据预览 再一次注意,单元执行时间非常短。这是因为显示 Vaex 数据只需要从磁盘读取前 5 和后 5 。...注意,数据包含 18 ,但在此屏幕截图中只有前 7 可见 描述方法很好地说明了 Vaex 功耗和效率:所有这些统计数据都是在我 MacBook Pro(15", 2018, 2.6GHz Intel...它在过滤 Vaex 数据时,不会生成数据副本,相反,它只创建原始对象引用,并在其上应用二进制掩码。掩码选择显示哪些并用于将来计算。这为我们节省了 100GB RAM。...一种解决方法是用车费和旅行距离之比平均值热图进行颜色编码。让我们考虑这种方法: ? ?...对于一个超过 10 亿个样本 Vaex 数据,在笔记本电脑上使用四核处理器进行 8 个聚合分组操作只需不到 2 分钟 在上面的单元块中,我们执行一个分组操作,然后是 8 个聚合,其中 2 个在虚拟列上

1.2K21

Pandas 秘籍:6~11

熊猫中,视图不是新对象,而只是另一个对象引用,通常是数据某些子集。 此共享对象可能导致许多问题。...准备 在本秘籍中,我们使用groupby方法执行聚合,创建具有多重索引数据,然后进行处理,以使索引为单个级别,并且列名具有描述性。...最终结果是一个数据,其与原始相同,但过滤掉了不符合阈值状态中。 由于过滤后数据标题可能与原始标题相同,因此您需要进行一些检查确保操作成功完成。...除了查找算术和加权均值之外,我们还查找个 SAT 几何和谐波均值,然后将结果作为数据返回,其中数据是均值类型名称,是 SAT 类型。...在步骤 2 中,我们创建了一个中间对象,可帮助我们了解如何数据内形成组。resample第一个参数是rule,用于确定如何索引中时间戳进行分组

33.8K10

Python pandas十分钟教程

Pandas是数据处理和数据分析中最流行Python库。本文将为大家介绍一些有用Pandas信息,介绍如何使用Pandas不同函数进行数据探索和操作。...下面的代码将平方根应用于“Cond”所有值。 df['Cond'].apply(np.sqrt) 数据分组 有时我们需要将数据分组来更好地观察数据差异。...Pandas中提供以下几种方式对数据进行分组。 下面的示例按“Contour”数据进行分组,并计算“Ca”中记录平均值,总和或计数。...Concat适用于堆叠多个数据。...按连接数据 pd.concat([df, df2], axis=1) 按连接数据 pd.concat([df, df2], axis=0) 当您数据之间有公共时,合并适用于组合数据

9.8K50

如何分析房子?

数据按照每天、每个城市维度分组(group by),分组房源个数进行汇总(count求房源号这一有多少) 2.如何分组?...按“每天分组后如下图: image.png 在第一步基础上,按“每个城市”分组如下图: image.png 这样就完成了从时间和城市个维度分组拆解,分组在SQL中用group by image.png...现在组已经分好了,我们只需要看每个分组房源号个数计数,就完成了分组计数。...计数在SQL中用count(计数字段)来表示,这里count就是一种聚合函数,与分组函数group by常常搭配使用。...image.png 【举一反三】 房源表如下,找出每天每个城市新增房源数大于1城市、日期和新增房源数 image.png 参考答案:分组后对数据筛选用having子句 image.png 查询结果

51500

SQL优化篇:如何成为一位写优质SQL语句绝顶高手!

-----------+ 然后个不同ID分组,分别in一次,然后使用union合并结果,再一次做分组,这样也可以,但实际上会复杂很多很多,其实实现远远没有那么复杂,只需要基于之前SQL,换个字段即可...对于单表查询时也是如此,比如要对数据分组过滤,可以先用where过滤掉一部分不需要数据后,再处理后数据分组排序,因为分组数据量越小,分组性能会更好!...哪面对于这种深分页情况该如何处理呢?有种情况。...3.1MySQL如何使用索引 索引用于快速查找具有特定。如果没有索引,MySQL必须从第一开始,然后遍历整个表找到相关。表越大,成本越高。...当MySQL从中检索任何值时,它读取一个包含该行所有(可能还有其他相邻数据块。保持每一大小并只包含最常用,使每个数据块可以容纳更多

56740

运营数据库系列之NoSQL和相关功能

表样式 ClouderaOpDB是一个宽数据存储,并且原生提供表样式功能,例如查找以及将数百万分组族。 必须在创建表时定义簇。...但不必在创建表时定义,而是根据需要创建,从而可以进行灵活schema演变。 数据类型是灵活并且是用户自定义。...可以将Spark Worker节点共置于群集中,实现数据局部性。还支持OpDB读写。 对于每个表,必须提供目录。该目录包括键,具有数据类型和预定义系列,并且它定义了与表模式之间映射。...目录是用户定义json格式。 HBase数据是标准Spark数据,并且能够与任何其他数据源(例如Hive,ORC,Parquet,JSON等)进行交互。...仅处理一次方式存储计数或聚合地方。

96010

如何分析商品订单?

、付费金额、付费单量 1.题中提到查询“每天数据,涉及到“每个”这类问题要想到《猴子 从零学会SQL》里讲过分组汇总”来解决这里类问题 按“付费时间”分组每天付费人数用汇总函数(count用户...ID这一统计有多少),每天付费金额用汇总函数(sum对付费金额这一求和),每天付费单量要用汇总函数(count订单号这一有多少) 2.上面涉及到用户ID、付费金额、订单号都在“订单明细表...这道题目要我们找到是“注册表”中有注册用户,同时在“订单明细表”中指定日期消费过用户,也就是个表中“用户ID”这一数据有交集数据。...所有需要查找同时出现在张表中共同数据,应该使用多表联结中“内联结”(inner join) image.png 1 select * 2 from 订单明细表 as a 3 inner ...通过“as”语句,自定义表名称,能够比较方便张表进行关联比较。以及如何判断使用哪种联结。 image.png 推荐:如何从零学会SQL? image.png

83420

数据仓库开发 SQL 使用技巧总结

有些需求可以使用窗口函数完成,如下: 排名问题,根据科目进行分组 top n 问题,找出每个科目前三同学进行奖励 增量表问题 某字段某段时间移动平均 某种行为前百分之多少数据 此时可以引入窗口函数...lead 提供当前行之后给定物理偏移量访问 通过这个函数可以在一次查询中取出同一字段前 n 数据 lag 和后 n 数据 lead 作为独立, 更方便地进行进行数据过滤 可用场景...,截止到本行数据,统计数据是多少(最大值、最小值等) 同时可以看出每一数据整体统计数据影响 场景 计算几天内平均数目,累计值,... demo 计算三天内平均金额 with test_tb (t...count 内增加条件 数仓进行各种复杂指标查询,往往需要分组各种指标进行条件匹配在进行 count,常用以下种方式: -- 常用以下种 -- 1 count(distinct case when...sum() 等查询出每天计数据,不在此赘述。

3.1K30

Pandas 秘籍:1~5

准备 此秘籍将数据索引,数据提取到单独变量中,然后说明如何从同一象继承和索引。...此秘籍将与整个数据相同。 第 2 步显示了如何按单个数据进行排序,这并不是我们想要。 步骤 3 同时多个进行排序。...用sort_values替代nlargest 前个秘籍工作原理类似,它们略有不同方式进行排序。 查找数据顶部n值等同于整个进行降序排序并获取第一个n值。...和cumprod 四、选择数据子集 在本章中,我们将介绍以下主题: 选择序列数据 选择数据 同时选择数据 同时通过整数和标签和选择数据 加速标量选择 延迟方式切片 按词典顺序切片...逗号左侧选择始终根据索引选择。 逗号右边选择始终根据索引选择。 不必同时选择。 步骤 2 显示了如何选择所有子集。 冒号表示一个切片对象,该对象仅返回该维度所有值。

37.2K10

Python入门之数据处理——12种有用Pandas技巧

在利用某些函数传递一个数据每一之后,Apply函数返回相应值。该函数可以是系统自带,也可以是用户定义。举个例子,它可以用来找到任一或者缺失值。 ? ?...例如,在本例中一个关键是“贷款数额”有缺失值。我们可以根据“性别”,“婚姻状况”和“自由职业”分组平均金额来替换。 “贷款数额”各组均值可以如下方式确定: ? ?...在这里,我定义了一个通用函数,字典方式输入值,使用Pandas中“replace”函数来重新进行编码。 ? ? 编码前后计数不变,证明编码成功。。...# 12–在一个数据进行迭代 这不是一个常用操作。毕竟你不想卡在这里,是吧?有时你可能需要用for循环迭代所有的。例如,我们面临一个常见问题是在Python中变量不正确处理。...加载这个文件后,我们可以在每一进行迭代,类型指派数据类型给定义在“type(特征)”变量名。 ? ? 现在信用记录被修改为“object”类型,这在Pandas中表示名义变量。

4.9K50

基于FPGAAES256光纤加密设计

传统传输是对数据进行传输,固定长度数据流加上进行判断。一旦丢包,整个全部丢弃,造成了极大浪费。...AES-256算法为例,算法分组长度是256 位,密钥长度同样是256 位,在分组或密钥长度不足256位时,需按照相应补位规则补足256位。...字节代换是通过字节代换表(S)盒)对数据矩阵进行非线性代换,移位是以字节为单位对数据矩阵进行有序循环移位,混合是将混合矩阵与数据矩阵进行一种矩阵乘法运算,子密钥加是将数据矩阵与子密钥矩阵进行按位异或运算...2.2混淆 完成字节替换和位移后进行列混淆,混淆就是通过输入矩阵重新加权再组合形成新输出矩阵。在这个计算过程中,加法运算等价于异或运算,乘法可以进行优化。...其中物理层接口讲述了电气特性和时钟编码等;初始化和错误处理机制则定义了单通道和多通道种情况下,数据传送之前通道进行初始化步骤,同时介绍了在遇到错误代码传输时该如何应对处理机制。

1.4K20

pandas每天一题-题目9:计算平均收入多种方式

我会挑选一些题目,并且提供比原题库更多解决方法以及更详尽解析。 计划每天更新一期,希望各位小伙伴先自行思考,再查看答案。如果你有帮助,记得转发推荐给你好友!...上期文章:pandas每天一题-题目8:去重计数多种实现方式 后台回复"数据",可以下载本题数据集 如下数据数据描述: 此数据是订单明细表。... revenue 求和 但是 groupby + agg 出来结果是一个表,如果直接求平均,会得到一个(遍历所有求平均)。...) .sum() .mean() ) 2:直接计算收入,此时得到(Series) 3:分组,但是里面没有分组依据(order_id),我们可以直接把数据传入。...注意这里不是列名(字符串),而是一数据 4:这里 sum 是 groupby 后操作,表达是每一组统计方式,我们需要求总订单收入 5:上一步得到每个订单收入,仍然是(Series),直接求平均

1K20

最全面的Pandas教程!没有之一!

我们可以用加减乘除(+ - * /)这样运算符个 Series 进行运算,Pandas 将会根据索引 index,响应数据进行计算,结果将会浮点数形式存储,以避免丢失精度。 ?...分组统计 Pandas 分组统计功能可以按某一内容对数据进行分组,并其应用统计函数,比如求和,平均数,中位数,标准差等等… 举例来说,用 .groupby() 方法,我们可以对下面这数据表按...上面的结果中,Sales 就变成每个公司分组平均数了。 计数 用 .count() 方法,能对 DataFrame 中某个元素出现次数进行计数。 ?...最后,on='Key' 代表需要合并键值所在,最后整个表格会该列为准进行归并。 对于个都含有 key DataFrame,我们可以这样归并: ?...Pandas 数据透视表能自动帮你对数据进行分组、切片、筛选、排序、计数、求和或取平均值,并将结果直观地显示出来。比如,这里有个关于动物统计表: ?

25.8K64

python100G以上数据进行排序,都有什么好方法呢

Pandas 排序方法入门 快速提醒一下,DataFrame是一种数据结构,都带有标记轴。您可以按值以及索引 DataFrame 进行排序。...这类似于使用电子表格中数据进行排序方式。 熟悉 .sort_index() 您用于.sort_index()按索引或标签 DataFrame 进行排序。...与 using 不同之处.sort_values()在于您是根据索引或列名称 DataFrame 进行排序,而不是根据这些值: DataFrame 索引在上图中蓝色标出。...这很有用,因为它按分类顺序汽车进行分组,并首先显示最高 MPG 汽车。 根据索引 DataFrame 进行排序 在对索引进行排序之前,最好先了解索引代表什么。...按升序按索引排序 您可以根据索引 DataFrame 进行排序.sort_index()。像在前面的示例中一样按值排序会重新排序 DataFrame 中,因此索引变得杂乱无章。

10K30

Pandas Sort:你 Python 数据排序指南

Pandas 排序方法入门 快速提醒一下,DataFrame是一种数据结构,都带有标记轴。您可以按值以及索引 DataFrame 进行排序。...这类似于使用电子表格中数据进行排序方式。 熟悉 .sort_index() 您用于.sort_index()按索引或标签 DataFrame 进行排序。...与 using 不同之处.sort_values()在于您是根据索引或列名称 DataFrame 进行排序,而不是根据这些值: DataFrame 索引在上图中蓝色标出。...这很有用,因为它按分类顺序汽车进行分组,并首先显示最高 MPG 汽车。 根据索引 DataFrame 进行排序 在对索引进行排序之前,最好先了解索引代表什么。...按升序按索引排序 您可以根据索引 DataFrame 进行排序.sort_index()。像在前面的示例中一样按值排序会重新排序 DataFrame 中,因此索引变得杂乱无章。

13.9K00

Power Query 真经 - 第 7 章 - 常用数据转换

图 7-11 表将 “Measure” 进行了透视,得到了,其好处是后续可以单独任何一进行计算,这是合理。...7.3.2 将拆分为多行 要做下一步是拆分 “Days” ,来将每天分开。做到这一点一个方法是将每天拆分成新,然后这些使用【逆透视】功能 。...幸运是,Power Query 有一个分组功能,允许用户在转换过程中进行分组,使用户能够所需要精确粒度导入数据。这对于减小文件大小非常有用,因为它可以避免导入过多不需要细节行。...在对话框底部聚合部分进行如下操作。 将【新列名】从 “计数” 更改为 “Total Sales $”。 将【操作】从【进行计数】更改为【求和】。...虽然在这个示例中【操作】选项只使用了【求和】功能,但用户在【操作】选项中可以使用选项包括【平均值】、【中值】、【最小值】、【最大值】、【进行计数】、【非重复计数】和【所有】功能。

7.2K31
领券