大类资产配置是量化中一个重要的领域,本文尝试实现若干资产配置模型。全文纯属瞎配,欢迎指正!
上上周发的那篇资产瞎配模型,事实证明,果然是瞎配,有大佬指出组合净值计算有一定的问题,所以这里对净值计算部分及进行改正,重新计算结果。
这个网站上的文件大都是支持下载的,想象一下,一个经常盯盘的人,他可能每天都需要去看一些公告信息,每天都需要重复的,手动的去打开链接,然后去访问,这样做肯定可行,但是这个过程,完全可以使用Python网络爬虫来帮助解决。今天就教大家爬取该网站的公告,并且实现下载。
5月6日,MSCI在官网宣布,五月份半年度指数审议结果将于5月13日公布,届时将公布纳入和剔除的个股名单。
互联网技术人才招聘分析报告——什么语言的程序员最受CEO青睐? 对每个创业CEO而言,都会花大量的时间寻找支撑业务发展的优秀人才,那到底什么语言的程序员“最抢手”,而招聘什么语言程序员“性价比”最高呢
让我们进行一个常见的分析,您可能自己就可以完成这个分析。假设您想分析股票绩效,那么您可以: 在 Yahoo 金融专区找一支股票。 下载历史数据,保存为 CSV 文件格式。 将 CSV 文件导入 Excel。 进行数学分析:回归、描述性统计或使用 Excel Solver 工具进行线性优化。 很好,但本文为您展示一种更简单、更直观、功能更强大的方法,使用 IPython 和 pandas 进行同种分析。 工具准备 IPython 库是使用 Python 的数据科学家的重要工具之一。该工具与 Excel 的最
投资中最关心的两个问题是预期收益与风险,当对多个资产进行投资时,如何测定组合的风险与收益,如何根据这两项指标进行资产权重配置? 马科维茨理论给出了解决这一问题的框架,被认为是现代金融学的开端。本文首先给出马科维茨均值方差模型的理论说明,随后用股票指数数据绘制组合的有效前沿,最后给出一种应用方法,获取代码和数据请在后台回复“代码”。
作者 tofreebuf 2014年是中国国际互联网成立至今的第20周年。移动通信技术的快速发展导致移动设备的数量呈指数级增长,2014年手机网民大概有5亿人。手机病毒的指数级增长无疑是移动安全的爆发点,具体表现在移动支付安全是移动互联网新的挑战。新的移动应用和新功能,如网上银行、游戏、和手机收费等,为用户带来了私人隐私泄露等安全风险。 目前大多数银行使用自己开发的移动应用软件来运行移动金融业务来为客户提供移动金融服务。不幸的是,由于缺少规范的安全监管标准和流程,许多银行不能对其应用软件充分执行必要的安全性
导读:在Python中,进行数据分析的一个主要工具就是Pandas。Pandas是Wes McKinney在大型对冲基金AQR公司工作时开发的,后来该工具开源了,主要由社区进行维护和更新。
在我们处理数据的时候,有时需要根据某个列进行计算得到一个新列,以便后续使用,相当于是根据已知列得到新的列,这个时候assign函数非常方便。下面通过实例来说明函数的的用法。
本案例中用的数据是小编自行模拟的,主要包含两个数据:订单数据和水果信息数据,并且会将两份数据合并
数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是数据挖掘分析结论有效性和准确性的基础,没有可信的数据,数据挖掘构建的模型将是空中楼阁。
Pine 发自 凹非寺 量子位 | 公众号 QbitAI 数据可视化动画还在用Excel做? 现在一个简单的Python包就能分分钟搞定! 而且生成的动画也足够丝滑,效果是酱紫的: 这是一位专攻Python语言的程序员开发的安装包,名叫Pynimate。 目前可以直接通过PyPI安装使用。 使用指南 想要使用Pynimate,直接import一下就行。 import pynimate as nim 输入数据后,Pynimate将使用函数Barplot()来创建条形数据动画。 而创建这种动画,输入的数据
这个错误是因为在你的循环中,你在每次迭代时都试图将'年月'列设置为索引。然而,一旦你在第一次迭代中将'年月'列设置为索引,它就不再是数据框的一部分,所以在后续的迭代中,你不能再次将它设置为索引。
2014年后半年开始,国内 A 股市场可谓是热火朝天啊,路上的人谈的都是股票。小弟虽然就职金融互联网公司,但之前从来没有买过股票,但每天听着别人又赚了几套房几辆车,那叫一个心痒痒啊,那感觉,就跟一个出浴美女和你共处一室,但你却要死忍住不去掀开浴巾一样。终于,小弟还是”犯了全天下男人都会犯的错误”,还是在 2015.03.19 那天入市了,还记得自己的第一次是献给了一支叫 天建集团 的股票,好像当天还赚了一两百块吧,当时心情那叫一个激动,下班了第一时间就打电话给娘亲了。
选自towardsdatascience 作者:William Koehrsen 机器之心编译 参与:Jane W、蒋思源 作为探索时间序列的第一步,Python 中的加法模型是必经之路。本文使用Facebook 开发的预测工具Prophet和金融数据集探索如何对时序数据进行建模与分析。加法模型可以快速构建与部署,并解释和预测不确定性,是我们进一步采用LSTM等深度模型进行建模的基础。 时间序列是我们日常生活中最常见的数据类型之一。金融产品价格、天气、家庭能源使用量、甚至体重都具有变化规律。几乎每个数据科学
股票市场周期是股票市场长期的价格模式,通常与商业周期有关。 它是技术分析的关键,其中投资方法基于周期或重复的价格模式。 如果我们对股市周期有了更好的理解,我们总能以相对低的价格买入并在每个周期以相对较高的价格卖出,将始终获得正的回报。当然,股票市场没有什么策略可以永远赚钱,但我们基于Python,可以帮助我们更深入、快速地了解隐藏在股市中的周期。
2022年6月29日,IDC发布的《全球公共云服务半年度跟踪报告》显示:2021年全球公共云服务市场同比猛增29.0%,总收入高达4086亿美元(2.74万亿人民币)。 2021年全球公共云服务收入和同比增长: 资料来源:IDC《全球公共云服务半年度跟踪报告》,2021年下半年 这个市场包括基础架构即服务(IaaS)、平台即服务(PaaS)、SaaS–系统基础架构软件(SaaS–SIS)以及SaaS–应用程序。 2021年支出继续呈现高度集中的势态,五大公共云服务提供商(微软、AWS、Salesforce
这是2018年度业余主要学习和研究的方向的笔记:大数据测试 整个学习笔记以短文为主,记录一些关键信息和思考 预计每周一篇短文进行记录,可能是理论、概念、技术、工具等等 学习资料以IBM开发者社区、华为开发者社区以及搜索到的相关资料为主 我的公众号:开源优测 大数据测试学习笔记之Python工具集 简介 在本次笔记中主要汇总Python关于大数据处理的一些基础性工具,个人掌握这些工具是从事大数据处理和大数据测必备技能 主要工具有以下(包括但不限于): numpy pandas SciPy Scikit-L
教程地址:http://www.showmeai.tech/tutorials/33
我们在利用pandas进行数据处理的时候,经常会对数据框中的单行、多行(列也适用)甚至是整个数据进行某种相同方式的处理,比如将数据中的sex字段中男替换成1,女替换成0。自己最近处理数据的时候就遇到不少类似的需求。
在之前写个人年度总结的时候,提到了自己最近半年养成了一个新的习惯——在 Notion 上进行进行各方面的记录,其中就包括了记录每日所做的事情以及账单,这一年做过的事情后面我也会进行数据分析,这篇文章我们来分析一下我过去这半年(从 6 月至今)的账单。
这离不开pandas、numpy、sklearn、TensorFlow、PyTorch等数据科学包,尤其是 Pandas,几乎是每一个从事Python数据科学相关的同学都绕不过去的。
Rolling 对象在处理时间序列的数据时,应用广泛,在Python中Pandas包实现了对这类数据的处理。
Pandas是一个受众广泛的python数据分析库。它提供了许多函数和方法来加快数据分析过程。pandas之所以如此普遍,是因为它的功能强大、灵活简单。本文将介绍20个常用的 Pandas 函数以及具体的示例代码,助力你的数据分析变得更加高效。
统计学是一门研究数据收集、分析和解释的学科,它在数据分析中起着重要的作用。Python作为一种功能强大的编程语言,在数据分析领域拥有广泛的应用。本文将介绍Python数据分析中的重要统计学概念,帮助您更好地理解和应用统计学知识。
Pandas 是 Python 为解决数据分析而创建的,详情看官网 (https://pandas.pydata.org/)。 在使用 pandas 之前,需要引进它,语法如下:
PandasAI是一款数据分析领域的ChatGPT应用,本文对原项目进行翻译旨在进行知识科普和梳理。这个项目的github地址为:https://github.com/gventuri/pandas-ai
Pandas是Python数据分析处理的核心第三方库,它使用二维数组形式,类似Excel表格,并封装了很多实用的函数方法,让你可以轻松地对数据集进行各种操作。
算术运算是最基本的运算,看起来很简单,但也有一些需要注意的地方,本文中会依次介绍。
我们前几篇文章和大家介绍了如何读取Excel,以及如何获取行数据,列数据,以及具体单元格数据。像我们目前只读取了一个Excel表中的一个sheet的数据,这个sheet的数据通常我们在pandas中称其为DataFrame,它可以包含一组有序的列(Series), 而每个Series可以有不同的数据类型,这个等我们后面再详细说,今天和一起针对DataFrame一起做几个小练习。DataFrame后面我们简称为df。
中国互联网络信息中心(CNNIC)于7月23日发布《第36次中国互联网络发展状况统计报告》。1997 年,国家主管部门研究决定由中国互联网络信息中心(CNNIC)牵头组织有关互联网单位共同开展互联网行业发展状况调查,自1997 年至今CNNIC 已成功发布了35 次全国互联网发展统计报告,本次报告是第36 次报告。 小编为大家摘取关键数据,让大家在几分钟内直观了解中国互联网发展现状。 网民数据 总体网民规模 截至2015 年6 月,我国网民规模达6.68 亿,半年共计新增网民1894 万人。互联网普及率
数据从业者有许多工具可用于分割数据。有些人使用 Excel,有些人使用SQL,有些人使用Python。对于某些任务,使用 Python 的优点是显而易见的。以更快的速度处理更大的数据集。使用基于 Python 构建的开源机器学习库。你可以轻松导入和导出不同格式的数据。
Pandas曾经一度是我数据分析的主力工具,甚至在当下也是很多情况下的首选。作为Python数分三剑客之一,Pandas素以API丰富著称,个人也是常常沉醉于其中的各种骚操作而不能自拔(好吧,有些言重了)。近日,发现了一个前期一直忽略了的函数,仔细探索之下,发现竟然还有一些好用的功能,这个函数就是——transform。
超级好用的移动窗口函数 最近经常使用移动窗口函数,觉得很方便,功能强大,代码简单,故将pandas中的移动窗口函数都做介绍。它都是以rolling打头的函数,后接具体的函数,来显示该移动窗口函数的功能。 rolling_count 计算各个窗口中非NA观测值的数量 函数 pandas.rolling_count(arg, window, freq=None, center=False, how=None) arg : DataFrame 或 numpy的ndarray 数组格式 window
最近经常使用移动窗口函数,觉得很方便,功能强大,代码简单,故将pandas中的移动窗口函数都做介绍。它都是以rolling打头的函数,后接具体的函数,来显示该移动窗口函数的功能。
本文主要会涉及到:读取txt文件,导出txt文件,选取top/bottom记录,描述性分析以及数据分组排序;
思路:三层数据数据,叶子节点实现单选,但是如果点击父节点时,会实现叶子节点的全选,需要进行更多的数据处理。因此为了解决这个麻烦。引入disabled属性,让第一级和第二级为不可选中,只有叶子节点可以点击选中,这样来减少数据的判断。
Pandas[1]是用Python分析数据的工业标准。只需敲几下键盘,就可以加载、过滤、重组和可视化数千兆字节的异质信息。它建立在NumPy库的基础上,借用了它的许多概念和语法约定,所以如果你对NumPy很熟悉,你会发现Pandas是一个相当熟悉的工具。即使你从未听说过NumPy,Pandas也可以让你在几乎没有编程背景的情况下轻松拿捏数据分析问题。
作者:ROGER HUANG 本文翻译自:http://code-love.com/2017/04/30/excel-sql-python/ 来源:https://www.jianshu.com/p/51bb7726231b 本教程的代码和数据可在 Github 资源库 中找到。有关如何使用 Github 的更多信息,请参阅本指南。 数据从业者有许多工具可用于分割数据。有些人使用 Excel,有些人使用SQL,有些人使用Python。对于某些任务,使用 Python 的优点是显而易见的。以更快的速度处理更大
apply() 和applymap()是DataFrame数据类型的函数,map()是Series数据类型的函数。apply()的操作对象DataFrame的一列或者一行数据, applymap()是element-wise的,作用于每个DataFrame的每个数据。 map()也是element-wise的,对Series中的每个数据调用一次函数。
(请不要将币混淆成区块链)相比去年的火热,今年确实冷清了不少,很多团队发展困难,甚至解散,区块链技术的应用依旧需要时间的催化。
.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
.dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
Pandas是python中最主要的数据分析库之一,它提供了非常多的函数、方法,可以高效地处理并分析数据。让pandas如此受欢迎的原因是它简洁、灵活、功能强大的语法。
我们将使用三个时间序列模型,它们是使用python建立的超级商店数据集(零售行业数据)。我们将使用jupyter notebook 来构建我们的python代码,然后转移到Tableau。
创建数据- 首先创建自己的数据集进行分析。这可以防止阅读本教程的用户下载任何文件以复制下面的结果。我们将此数据集导出到文本文件,以便您可以获得的一些从csv文件中提取数据的经验
但在使用机器学习之前,时间序列问题需要被转化为监督学习问题。从仅仅是一个序列,变成成对的输入、输出序列。
Selenium是一个自动化测试工具,可以模拟浏览器的行为,如打开网页,点击链接,输入文本等。Selenium也可以用于爬取网页中的数据,特别是那些动态生成的数据,如表格,图表,下拉菜单等。本文将介绍如何使用Selenium Python爬取动态表格中的复杂元素和交互操作。
领取专属 10元无门槛券
手把手带您无忧上云