首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

盘一盘 Python 系列 - Cufflinks (下)

具体选项有 频率 frequency (桶高等于计数) 百分比 percent (桶高等于每桶中计数占总数的比例) 概率 probability (桶高等于概率,桶宽为 1) 密度 density (桶高等于计数除以桶宽...具体选项有计数函数 count、求和函数 sum、平均函数 avg、最小值函数 min、最大值函数 max。...values:字符串格式,将数据帧中的列数据的值设为饼状图每块的面积,仅当 kind = pie 才适用。...第 11 到 13 行定义一个 DataFrame 值为第 9 行得到的 price 列表 行标签为第 8 行得到的 index 列表 列标签为第 6 行定义好的 columns 列表 处理过后,将每个股票的收盘价合并成一个数据帧...下面做了标准化,将起始日的价格设为 100,再进行比较。

4.6K10

Pandas库

Pandas库中Series和DataFrame的性能比较是什么? 在Pandas库中,Series和DataFrame是两种主要的数据结构,它们各自适用于不同的数据操作任务。...我们可以对这两种数据结构的性能进行比较。 Series: Series是一种一维的数据结构,类似于Python中的基本数据结构list,但区别在于Series只允许存储相同的数据类型。...如何在Pandas中实现高效的数据清洗和预处理? 在Pandas中实现高效的数据清洗和预处理,可以通过以下步骤和方法来完成: 处理空值: 使用dropna()函数删除含有缺失值的行或列。...统一数据格式: 确保所有数据列具有相同的格式,例如统一日期格式、货币格式等。 数据加载与初步探索: 使用read_csv()、read_excel()等函数加载数据。...日期特征提取(Date Feature Extraction) : 在处理时间序列数据时,常常需要从日期中提取各种特征,如年份、月份、星期等。

8410
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    利率掉期 (IRS) 中的超级细节

    上面公式中 5 个变量分别代表: PorR:根据接收还是支付现金流,设置其值为 +1 或 -1(注意它从累加符号中单独提出来) Notionali:第 i 期的名义本金 Ratei:第 i 期的等效利率...期限年限 YearFraci:第 i 期的期限年限 每一期都有起始日和终止日,两者之间的天数差是不变的,但是转成相应的年限有可能不一样,由日期计数惯例(Daycount Convention,DC)决定...= 180/360 = 0.5 用 QuantLib 验证: ql.Thirty360().yearFraction(date1, date2) 0.5 ---- 其他的日期计数惯例总结于下图...这样在每一期中有一组利率序列,按重置计算方法将利率序列 Ri, (i=0,1,⋯,n−1) 整合为一个数,即为计算利率。...簿记这种交易时,可以直接将重置频率与计息频率设值,这样在几个计息区间将取到同一天的相同的利率。利率的计算和情况 1 的单利一样。所以这种情况与情况 1 的不同仅在基准利率的获取上。

    3.9K43

    数据导入与预处理-第6章-02数据变换

    等宽法 等宽法将属性的值域从最小值到最大值划分成具有相同宽度的区间,具体划分多少个区间由数据本身的特点决定,或者由具有业务经验的用户指定 等频法 等频法将相同数量的值划分到每个区间,保证每个区间的数量基本一致...基于列值重塑数据(生成一个“透视”表)。使用来自指定索引/列的唯一值来形成结果DataFrame的轴。此函数不支持数据聚合,多个值将导致列中的MultiIndex。...pivot_table透视的过程如下图: 假设某商店记录了5月和6月活动期间不同品牌手机的促销价格,保存到以日期、商品名称、价格为列标题的表格中,若对该表格的商品名称列进行轴向旋转操作,即将商品名称一列的唯一值变换成列索引...,将出售日期一列的唯一值变换成行索引。...(index='出售日期', columns='商品名称',values='价格(元)') new_df 输出为: 2.2.2 melt方法 melt()是pivot()的逆操作方法,用于将DataFrame

    19.3K20

    Python 数据分析(PYDA)第三版(五)

    每个分组键可以采用多种形式,键不必是相同类型的: 一个与被分组的轴长度相同的值列表或数组 DataFrame 中表示列名的值 一个字典或 Series,给出了被分组的轴上的值与组名之间的对应关系...首先,根据smoker的值将tips DataFrame 分成组。然后在每个组上调用top函数,并使用pandas.concat将每个函数调用的结果粘合在一起,用组名标记各个部分。...因此,结果具有一个具有内部级别的分层索引,该级别包含原始 DataFrame 的索引值。...例如,如果您想要一个包含每个月最后一个工作日的日期索引,您将传递 "BM" 频率(月底的工作日;请参阅 Table 11.4 中更完整的频率列表),只有落在日期区间内或日期区间内的日期将被包括: In...许多季度数据是相对于财年结束报告的,通常是一年中的 12 个月的最后一个日历日或工作日。因此,期间 2012Q4 根据财年结束日期的不同具有不同的含义。

    17900

    2024-11-20:交替子数组计数。用go语言,给定一个二进制数组 nums, 如果一个子数组中的相邻元素的值都不相同,我们称

    2024-11-20:交替子数组计数。用go语言,给定一个二进制数组 nums, 如果一个子数组中的相邻元素的值都不相同,我们称这个子数组为交替子数组。 请返回数组 nums 中交替子数组的总数。...我们的目标是计算这个数组中所有交替子数组的数量。 2.交替子数组的定义:交替子数组是指一个子数组中,相邻的元素值必须不同。...4.遍历数组: 4.1.对于给定的数组 nums 中的每一个元素 a,执行以下操作: 4.1.1.非重复情况:如果当前元素 a 与前一个元素 pre 不相等,表示交替状态继续,故将当前计数 cur 加...4.1.2.重复情况:如果当前元素 a 与前一个元素 pre 相等,则交替状态被破坏,将当前计数 cur 重置为 1,表示当前元素 a 作为新的交替子数组的起始元素。...4.1.3.更新 pre 为当前的元素 a,以便于下一次迭代进行比较。 4.1.4.将当前的 cur 值累加到总数 res 中。这将确保包含所有以当前元素为结束元素的交替子数组。

    9820

    设线性表中每个元素有两个数据项k1和k2,现对线性表按一下规则进行排序:先看数据项k1,k1值小的元素在前,大的在后;在k1值相同的情况下,再看k2,k2值小的在前,大的在后。满足这种要求的

    题目: 设线性表中每个元素有两个数据项k1和k2,现对线性表按一下规则进行排序:先看数据项k1,k1值小的元素在前,大的在后;在k1值相同的情况下,再看k2,k2值小的在前,大的在后。...D.先按k2进行简单选择排序,再按k1进行直接插入排序 答题思路: 首先我们要明确题意,这一题的排序是针对k1和k2全体进行的,而不是说我排好k1后,再对每组相同的k1进行k2的排序。...(不知道有没有人有这种想法,反正我第一次做时就是这么想的。但是这种排序方法要多一个对k1分组的时间,时间复杂度增大了)。 另外特别注意“在k1值相同的情况下,再看k2”这句话。...接着讨论要用的算法,题中没有给什么特殊的要求,所以我们要满足的只是“数据项k1,k1值小的元素在前,大的在后;在k1值相同的情况下,再看k2,k2值小的在前,大的在后”。...k1,可能k2不满足“在k1值相同的情况下,再看k2,k2值小的在前,大的在后”。

    12610

    Pandas速查卡-Python数据科学

    Josh Devlin 2017年2月21日 Pandas可以说是数据科学最重要的Python包。...加入/合并 df1.append(df2) 将df1中的行添加到df2的末尾(列数应该相同) df.concat([df1, df2],axis=1) 将df1中的列添加到df2的末尾(行数应该相同...) df1.join(df2,on=col1,how='inner') SQL类型的将df1中的列与df2上的列连接,其中col的行具有相同的值。...df.describe() 数值列的汇总统计信息 df.mean() 返回所有列的平均值 df.corr() 查找数据框中的列之间的相关性 df.count() 计算每个数据框的列中的非空值的数量 df.max...() 查找每个列中的最大值 df.min() 查找每列中的最小值 df.median() 查找每列的中值 df.std() 查找每个列的标准差 点击“阅读原文”下载此速查卡的打印版本 END.

    9.2K80

    Zipline 3.0 中文文档(二)

    返回每个资产自最近事件日期的业务日(非交易日!)数量。 这与 BusinessDaysUntilNextEarnings 保持对称,不使用交易日。 今天宣布或即将宣布事件的资产将产生 0.0 的值。...将在下一个工作日宣布事件的资产将产生 1.0 的值。 事件日期为 NaT 的资产将产生 NaN 值。...对于每个术语: 从工作区获取术语的输入。 计算每个术语并将结果存储在工作区中。 如果结果不再需要,则从工作区中移除以减少执行期间的内存使用。...返回一个字典,形式如下:{ # 我们应应用调整列表的日期在日期中的整数索引。...日期被解释为自 1970 年 1 月 1 日 UTC 午夜以来的秒数。 标识符是行的资产标识符。 每个列中的数据按资产分组,然后在每个资产块内按日期排序。

    23810

    MySQL【第四章】——普通级(函数)

    获取当前日期和时间    2) DAY():获取日期中的天    3) MONTH():获取日期中的月    4) YEAR():获取日期中的年    5) 日期转换函数DATE_FORMAT(...)/STR_TO_DATE()    DATE_FORMAT():将日期转换成字符串    STR_TO_DATE():将字符串转换成日期    查询各学生的年龄,只按年份来算    按照出生日期来算...,当前月日 的月日则,年龄减一    查询本月过生日的学生    查询下月过生日的学生      date_add(NOW(), interval 1 MONTH) 代码案例: 1.日期函数...3) MONTH():获取日期中的月 select Month(now()) from dual; -- 4) YEAR():获取日期中的年 select year(now()) from dual;...2.字符串函数    1) UPPER()/LOWER():大小写互转    2) REPLACE():搜索并替换字符串中的子字符串    3) SUBSTRING():从具有特定长度的位置开始的最一个子字符串

    87420

    用Python验证指数基金定投策略

    Step4 在新建的Notebook中写入代码 获取指数数据函数 导入所需要用到的库 import pandas as pd import matplotlib.pyplot as plt 定义获取指数数据的函数...:param stock_data: 需要筛选出极大值点的指数数据 :param start_date: 筛选范围的开始日期 :param end_date: 筛选范围的结束日期...trade_log['基金净值'] = buy_month['close'] / 1000 # 将收盘价除以1000作为基金净值 trade_log['定投资金'] = 1000 #...# 计算每个交易日的资产(等于当天的基金份额乘以单位基金净值) daily_data = pd.merge(stock_data, temp, left_index=True...# 计算每个交易日的资产(等于当天的基金份额乘以单位基金净值) daily_data = pd.merge(stock_data, temp, left_index=True

    2.4K60

    Pandas库常用方法、函数集合

    (需要连接数据库),输出dataframe格式 to_sql:向数据库写入dataframe格式数据 连接 合并 重塑 merge:根据指定键关联连接多个dataframe,类似sql中的join concat...:合并多个dataframe,类似sql中的union pivot:按照指定的行列重塑表格 pivot_table:数据透视表,类似excel中的透视表 cut:将一组数据分割成离散的区间,适合将数值进行分类...:对每个分组应用自定义的聚合函数 transform:对每个分组应用转换函数,返回与原始数据形状相同的结果 rank:计算元素在每个分组中的排名 filter:根据分组的某些属性筛选数据 sum:计算分组的总和...describe:生成分组的描述性统计摘要 first和 last:获取分组中的第一个和最后一个元素 nunique:计算分组中唯一值的数量 cumsum、cummin、cummax、cumprod:...日期时间 to_datetime: 将输入转换为Datetime类型 date_range: 生成日期范围 to_timedelta: 将输入转换为Timedelta类型 timedelta_range

    31510

    Pandas最详细教程来了!

    Pandas具有NumPy的ndarray所不具有的很多功能,比如集成时间序列、按轴对齐数据、处理缺失数据等常用功能。Pandas最初是针对金融分析而开发的,所以很适合用于量化投资。...但在使用的时候,往往是将列索引作为区分不同数据的标签。DataFrame的数据结构与SQL数据表或者Excel工作表的结构非常类似,可以很方便地互相转换。...所有序列长度必须相同 由Series组成的字典:每个Series会成为一列。...▲图3-9 可以看到,df只接受索引已经存在的值。由于df2中没有索引e,所以是NaN值,而且df2索引为z的值已经丢失了。...函数频率的参数及说明如下所示: B:交易日 C:自定义交易日(试验中) D:日历日 W:每周 M:每月底 SM:半个月频率(15号和月底) BM:每个月份最后一个交易日 CBM:自定义每个交易月 MS:

    3.2K11

    针对SAS用户:Python数据分析库pandas

    该文件包括从2015年1月1日到2015年12月31日中国香港的车辆事故数据。.csv文件位于这里。 一年中的每一天都有很多报告, 其中的值大多是整数。...另一个.CSV文件在这里,将值映射到描述性标签。 读.csv文件 在下面的示例中使用默认值。pandas为许多读者提供控制缺失值、日期解析、跳行、数据类型映射等参数。...它们是: 方法 动作 isnull() 生成布尔掩码以指示缺失值 notnull() 与isnull()相反 drona() 返回数据的过滤版本 fillna() 返回填充或估算的缺失值的数据副本 下面我们将详细地研究每个方法...它将.sum()属性链接到.isnull()属性来返回DataFrame中列的缺失值的计数。 .isnull()方法对缺失值返回True。...通过将.sum()方法链接到.isnull()方法,它会生成每个列的缺失值的计数。 ? 为了识别缺失值,下面的SAS示例使用PROC格式来填充缺失和非缺失值。

    12.1K20

    使用Plotly创建带有回归趋势线的时间序列可视化图表

    重要的是分组,然后按日期时间计数。...最后,作为DataFrame准备的最后一步,通过“计数”将数据分组——我们在处理Plotly之后会回到这个问题上。...代替由点按时间顺序连接的点,我们有了某种奇怪的“ z”符号。 运行中的go.Scatter()图,但未达到预期。点的连接顺序错误。下面图形是按日期对值进行排序后的相同数据。...读取和分组数据 在下面的代码块中,一个示例CSV表被加载到一个Pandas数据框架中,列作为类型和日期。类似地,与前面一样,我们将date列转换为datetime。...这一次,请注意我们如何在groupby方法中包含types列,然后将types指定为要计数的列。 在一个列中,用分类聚合计数将dataframe分组。

    5.1K30

    Pandas 2.2 中文官方教程和指南(二十一·一)

    这些关键字参数将应用于*传递的函数*(如果是标准的 Python 函数)和对每个窗口进行的应用循环。 版本 1.3.0 中的新功能。...如果传递了关键字参数 `pairwise=True`,则为每对列计算统计量,返回一个具有值为相关日期的`DataFrame`的`MultiIndex`(请参见下一节)。...可以通过传递`pairwise`关键字参数来实现这一点,在`DataFrame`输入的情况下,将产生一个具有`index`为相关日期的多重索引的`DataFrame`。...这些关键字参数将应用于传递的函数(如果是标准 Python 函数)和对每个窗口的应用循环。 版本 1.3.0 中的新功能。...如果传递了关键字参数 pairwise=True,则为每对列计算统计信息,返回一个具有MultiIndex的DataFrame,其值是相关日期(请参阅下一节)。

    36100
    领券