首页
学习
活动
专区
工具
TVP
发布

数据科学与人工智能

专栏作者
811
文章
1016636
阅读量
170
订阅数
人工智能|LightGBM模型详解
LightGBM 是微软开发的 boosting 集成模型,和 XGBoost 一样是对 GBDT 的优化和高效实现,原理有一些相似之处,但它很多方面比 XGBoost 有着更为优秀的表现。官方给出的这个工具库模型的优势如下:
陆勤_数据人网
2022-12-22
1.5K0
金融科技:业务线
信贷业务,是一种基于信用的贷款业务,属于金融机构的资产性业务。我接触的产品形态,小额信贷、大额信贷、消费贷、小微企业贷、信用卡循环授信等。
陆勤_数据人网
2022-01-20
6330
金融科技:技术栈
数据库技术,泛指熟练使用SQL技术,不仅是各种关系型数据库的SQL,还有各种大数据平台的SQL,例如Hive-SQL、Spark-SQL等。 对于SQL技术这块,我们重点要掌握增删改查的四种操作,以及与编程语言的交互。 通过SQL技术,我们可以有效完成如下工作:
陆勤_数据人网
2022-01-20
9800
前沿技术|自动机器学习综述
自从计算机时代开始,科学家和工程师们就一直想知道如何像人类一样,给计算机注入学习的能力。艾伦·图灵是第一批提出智能理论的科学家之一,该理论设想有一天计算机能够达到与人类同等的智能水平。从那时起,机器学习领域发生了一系列巨大的飞跃。我们已经看到机器学习在许多情况下击败或至少匹配特定的人类认知能力,例如在ResNet(一种深度残留的网络架构)的情况下超越了人类在图像识别方面的表现,或者微软的语音转录系统几乎达到人类水平的表现。
陆勤_数据人网
2021-08-06
1.1K0
联邦学习|同态加密:实现数据的“可算不可见”
同态加密(Homomorphic Encryption, HE)是指满足密文同态运算性质的加密算法,即数据经过同态加密之后,对密文进行特定的计算,得到的密文计算结果在进行对应的同态解密后的明文等同于对明文数据直接进行相同的计算,实现数据的“可算不可见”。同态加密的实现效果如图1所示。
陆勤_数据人网
2021-08-06
8.9K0
笔记|李宏毅老师机器学习课程,视频12反向传播算法
感谢李宏毅老师的分享,他的课程帮助我更好地学习、理解和应用机器学习。李老师的网站:http://speech.ee.ntu.edu.tw/~tlkagk/index.html。这个学习笔记是根据李老师2017年秋季机器学习课程的视频和讲义做的记录和总结。
陆勤_数据人网
2021-04-22
4810
笔记|李宏毅老师机器学习课程,视频10逻辑回归
感谢李宏毅老师的分享,他的课程帮助我更好地学习、理解和应用机器学习。李老师的网站:http://speech.ee.ntu.edu.tw/~tlkagk/index.html。这个学习笔记是根据李老师2017年秋季机器学习课程的视频和讲义做的记录和总结。因为这个视频是在Youtube上面,有些朋友可能无法观看,我把它搬运下来放在云盘上面,大家点击阅读原文,就可以直接在手机随时随地观看了。再次,感谢李老师的付出和贡献。
陆勤_数据人网
2021-04-22
4650
笔记|李宏毅老师机器学习课程,视频7梯度下降实例1
李老师以玩世纪帝国AOE这个游戏为例,说明梯度下降算法的运作逻辑,对于这个游戏的玩伴们,可以从梯度下降的思维和逻辑,对游戏做一个重新认识。
陆勤_数据人网
2021-04-02
4070
笔记|李宏毅老师机器学习课程,视频6梯度下降
这门课,共有36个视频,每个视频播放的时间不一。我按着视频播放的顺序,观看,聆听和学习,并结合讲义,做学习笔记。我做学习笔记目的有三:
陆勤_数据人网
2021-04-02
3180
基于Python的语料库数据处理(六)
我们常常需要一次匹配零个、一个或多个字符,因此需要使用一些表示数量的符号,下表列出了常用的表示数量的符号。
陆勤_数据人网
2021-01-28
5660
基于Python的语料库数据处理(五)
正则表达式 regular expression)是用来进行较复杂文本处理,特别是复杂的查找或替换处理的计算机语言。我们在进行计算机编程或者文本处理时,通常需要进行一些文本的查找、替换。如果查找或替换的工作比较复杂,就需要借助正则表达式来完成。又如,我们需要对文本进行清洁处理(如一次删除所有词性赋码)或者提取文本的特定信息时,往往也需要使用正则表达式。因此,正则表达式在语料库语言学或计算语言学研究中使用非常广泛。
陆勤_数据人网
2021-01-13
8920
基于Python的语料库数据处理(四)
列表List是一个序列对象,是一个或多个数据的集合。比如,一个列表可以包含一个或多个字符串或数值元素;一个列表也可以包含一个或多个列表或元
陆勤_数据人网
2020-12-31
5320
网络爬虫(一)
爬虫是按照一定规则,自动地提取并保存网页中信息的程序。通过向网站发起请求获取资源,提取其中有用的信息。爬虫在获取信息、整理数据等方面应用广泛。
陆勤_数据人网
2020-11-26
6090
基于Python的语料库数据处理(二)
语料库处理中,Python语言的字符串运算主要是将词语、句子连接起来,或者将词语、句子重复若干次,如:string1+string2(两个字符串相加),string*n(将该字符串重复n次),具体示例如下:
陆勤_数据人网
2020-11-11
8220
员工流动分析和预测
公司员工,是一家公司成长和发展的关键要素之一。留不住优秀的员工,也就难以打造出卓越的公司。很多公司,比方说,惠普公司,IBM公司等,已经采用数据科学的手段,对内部员工的流动做分析和预测,并且进行提前的干预,以最小化员工流动所带来的的影响。
陆勤_数据人网
2020-11-03
1.2K0
Python相关模块介绍(二)
• 用字典方式来读取或写入:每行是一个字典,列标题是key,value一律是字符串类型。rd = csv.DictReader(csvfile) • for row in rd: #row是一个字典。wr = csv.DictWriter(csvfile, fieldnames=[字段标题列表])。wr.writerow(字典)。
陆勤_数据人网
2020-11-03
5530
例外处理
• 如果希望掌控意外,就需要在可能出错误的地方设置陷阱捕捉错误:try: # 为缩进的代码设置陷阱,except: # 处理错误的代码,else: # 没有出错执行的代码,finally: # 无论出错否,都执行的代码。
陆勤_数据人网
2020-10-23
7780
Python-数据特征分析-(统计量分析)
概要 用统计指标对定量数据进行统计描述,常从【集中趋势】和【离中趋势】两个方面进行分析。 平均水平的指标是对个体【集中趋势】的度量,使用最广泛的是均值和中位数; 反映变异程度的指标则是对个体【离开平均水平的度量】,使用较为广泛的指标是标准差(方差)、四分位间距。 1、集中趋势的度量 (1)均值:均值为所以数据的平均值。若计算n个观察数据的平均数,计算公式为:
陆勤_数据人网
2020-10-23
1.3K0
算法分析
程序和算法的区别。算法是对问题解决的分步描述,程序则是采用某种编程语言实现的算法,同一个算法通过不同的程序员采用不同的编程语言,能产生很多程序。
陆勤_数据人网
2020-09-29
7020
多媒体程序开发(二)
大家好,上期推送中我们初识了Python的游戏模块Pygame Zero模块,并用它制作了一个小游戏。今天我们来更加深入、细致的学习游戏制作的相关知识,然后进行实践,制作另一个游戏——“接宝物游戏”。
陆勤_数据人网
2020-09-22
6590
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档