首页
学习
活动
专区
工具
TVP
发布

数据科学与人工智能

专栏成员
811
文章
1060586
阅读量
171
订阅数
Py4DS|3 列表、元组和字典
列表是一种非原子类型的数据数据结构,它是一个有序的、可变的集合,使用中括号[]来创建列表。列表的操作包括使用索引法访问列表元素,使用循环操作遍历列表的元素,使用一些常用的方法对列表增删改和排序的操作。
陆勤_数据人网
2021-12-04
3660
数据模型的三个要素
数据模型是数据库中用来对现实世界进行抽象的工具,是数据库中用于提供信息表示和操作手段的形式架构。一般地讲,数据模型是严格定义的概念的集合。这些概念精确描述了系统的静态特性,动态特性和完整性约束条件。因此数据模型通常由数据结构,数据操作和完整性约束三部分组成 (1)数据结构
陆勤_数据人网
2020-09-29
1.3K0
数据库学习:数据模型
数据建模就是通过减低数据库设计的复杂度得到各个方面都能理解的数据抽象,包括定义实以及它们之间的关系。接下来学习数据建模的基本概念以及数据模型的发展过程。
陆勤_数据人网
2020-08-27
8380
pandas获取数据子集
数据子集是原始数据集的部分观察或者变量或者部分观察与变量,这是一个数据选择过程(按着业务的目标选择所需的观察和变量)。
陆勤_数据人网
2019-06-15
1.5K0
掌握机器学习中数据准备的六个步骤
当今组织继续寻找快速,准确地准备数据的方法,以解决他们的数据挑战并实现机器学习(ML)。 但在将数据引入机器学习模型或任何其他分析项目之前,确保其数据清晰,一致且准确非常重要。 由于今天的大部分分析都依赖于数据的上下文,因此最好由最接近实际数据的人完成任务; 可以将预感,理论和业务知识应用于数据的业务领域专家。
陆勤_数据人网
2019-01-09
1.7K0
【算法】利用文档-词项矩阵实现文本数据结构化
“词袋模型”一词源自“Bag of words”,简称 BOW ,是构建文档-词项矩阵的基本思想。对于给定的文本,可以是一个段落,也可以是一个文档,该模型都忽略文本的词汇顺序和语法、句法,假设文本是由无序、独立的词汇构成的集合,这个集合可以被直观的想象成一个词袋,袋子里面就是构成文本的各种词汇。例如,文本内容为“经济发展新常态研究”的文档,用词袋模型可以表示为[经济,发展,新常态,研究]四个独立的词汇。词袋模型对于词汇的独立性假设,简化了文本数据结构化处理过程中的计算,被广泛采用,但是另一方面,这种假设忽略
陆勤_数据人网
2018-04-18
3K0
算法与算法工程师,技术与技术人员
在和刘同学长谈之后,我再次对前一段时间的想法进行了反思,结合聊天中的新感受,整理在这里。 (注:标题里的算法,指机器学习算法,或者说“算法工程师”这个职位名称里的“算法”,不是“算法与数据结构”里的那个算法。谁能告诉我有没有什么更好的名字来区别这它们,或许是“机器学习算法”与“传统算法”?) 算法与算法工程师 先来一段我在知乎里回答“做算法工程师是一种怎样的体验?”的答案(其中的思想并非原创,而是山寨自新加坡某大学一门Quantitative Investment课程的ppt) 理想中的算法工程师:提出假设
陆勤_数据人网
2018-02-28
8370
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档