首页
学习
活动
专区
工具
TVP
发布

数据挖掘

一个分享机器学习和大数据挖掘的栏目
专栏作者
197
文章
383564
阅读量
37
订阅数
python dataframe 一行变多行
'DataFrame' object has no attribute 'explode'
机器学习和大数据挖掘
2022-09-07
1.4K0
爬虫之抓js教程
前面学习了如何在 get 的时候想服务器发送多变的请求数据,从而达到搜索的效果,而实际上 搜索是简单的登陆 !所以本文将要介绍如何向百度服务器发送 post 数据,从而达到模拟登陆百度的效果。
机器学习和大数据挖掘
2019-07-15
3.6K0
window安装jekyll
安装Ruby Ruby 切记添加环境变量: 安装 RubyGems RubyGems 解压后进入目录输入: ruby setup.rb 安装Jekyll gem install jekyll
机器学习和大数据挖掘
2019-07-02
5780
python3百度指数抓取 前言:代码在我的github上面:
哥那么叼的人怎么会被他吓到,于是乎花了零零碎碎加起来大约2天半搞定,在此鄙视一下土福
机器学习和大数据挖掘
2019-07-02
1.2K0
Amazon后台模拟登陆
本文基于python3.4的selenium库打开浏览器,并将浏览器中的登陆cookie保存到本地,那么下次登陆就可以直接利用cookie了:
机器学习和大数据挖掘
2019-07-02
3.9K0
python3倒叙字符串
google测试工程师的一道题: 设计一个函数,使用任意语言,完成以下功能: 一个句子,将句子中的单词全部倒排过来,但单词的字母顺序不变。比如,This is a real world,输出结果为 w
机器学习和大数据挖掘
2019-07-02
5570
Amazon关键词抓取 python之lxml(xpath)
亚马逊的网址构造很简单,几乎算是静态的网页,花费3小时完美收工,不要在意细节! 在python3下利用xpath就可以完美解决 xpath的使用方法请见: python之lxml(xpath)  入口
机器学习和大数据挖掘
2019-07-02
9800
Linux下升级python
原来是没有gcc,我这里是新安装的Linux,所以我需要安装gcc,安装命令如下:
机器学习和大数据挖掘
2019-07-02
2.9K0
python3生成标签云
标签云是现在大数据里面最喜欢使用的一种展现方式,其中在python3下也能实现标签云的效果,贴图如下:
机器学习和大数据挖掘
2019-07-02
1.5K0
python中时间日期格式化符号
python中时间日期格式化符号: import time print(time.strftime('%Y%H%M%S', time.localtime())) 运行结果: 2016092308 %y 两位数的年份表示(00-99) %Y 四位数的年份表示(000-9999) %m 月份(01-12) %d 月内中的一天(0-31) %H 24小时制小时数(0-23) %I 12小时制小时数(01-12) %M 分钟数(00=59) %S 秒(00-59) %a 本地简化星期名称 %A 本地完整星期名称 %
机器学习和大数据挖掘
2019-07-02
2K0
python之chardet库
chardet库是python的字符编码检测器,能够检测出各种编码的类型,例如: 1 import chardet 2 import urllib.request 3 4 testdata = urllib.request.urlopen('http://m2.cn.bing.com/').read() 5 print(chardet.detect(testdata)) 运行结果: {'confidence': 0.99, 'encoding': 'utf-8'} 翻译一下就是: {'精准度': 99%,
机器学习和大数据挖掘
2019-07-02
6610
python小程序:无限求和平均
编写一个程序,重复读取数据,直到用户输入‘done’。一旦输入‘done’,打印总和、个数与平均值。如果用户输入的不是数字,使用try和except捕获异常,打印错误信息,然后跳过继续执行循环。 1 arr = [] 2 num = 0 3 sum = 0 4 while 1: 5 val = input('请输入一个数:') 6 try: 7 if val == 'done': 8 for i in arr: 9
机器学习和大数据挖掘
2019-07-02
6580
python子类分配
原问题是将左边样式变成右边样式: 即有父类和子类,父类包括多个子类,怎样将子类匹配到父类下面的问题 代码如下 1 #!/usr/bin/python3.4 2 # -*- coding: utf-
机器学习和大数据挖掘
2019-07-02
4820
python批量制作雷达图
老板要画雷达图,但是数据好多组怎么办?不能一个一个点excel去画吧,那么可以利用python进行批量制作,得到样式如下:
机器学习和大数据挖掘
2019-07-02
1.7K0
python分割数组里面重复的元素
1 c=[1,1,1,1,2,2,2,3,3,4,4,4,4,4,5,5,5,] 2 a = [] 3 x = [] 4 for i in range(0,len(c)): 5 if i + 1 < len(c): 6 if c[i] == c[i + 1]: 7 x.append(c[i]) 8 else: 9 x.append(c[i]) 10 a.append(x) 11
机器学习和大数据挖掘
2019-07-02
1.3K0
python图像识别--验证码
2、pip3 install pillow or easy_install Pillow
机器学习和大数据挖掘
2019-07-02
1.3K0
python简单粗暴多进程之concurrent.futures
但是今天发现一个封装得更加简单暴力的多进程库concurrent.futures:
机器学习和大数据挖掘
2019-07-02
1.5K0
python-类
# !/usr/bin/python3.4 # -*- coding: utf-8 -*- ''' # 类的应用 class Student(object): def __init__(self, name, score): self.name = name self.score = score def print_score(self): # 如果加上下划线,则外部不能访问 # bart.print_score()报错
机器学习和大数据挖掘
2019-07-02
4210
python百分比数比较大小
python是无法识别百分比的,估计你的百分比是string,所以需要转成int # !/usr/bin/python3.4 # -*- coding: utf-8 -*- # 百分数转为int def percent_to_int(string): if "%" in string: newint = int(string.strip("%")) / 100 return newint else: print("你输入的不是百分比!")
机器学习和大数据挖掘
2019-07-02
2.1K0
python-redistest
# !/usr/bin/python3.4 # -*- coding: utf-8 -*- import redis import time # 这里用来读取ip def getips(): ip = [] # 读取ip file = open("../ip/ip.txt") ips = file.readlines() # 将ip写入数组并加上时间戳 for item in ips: # 标记时间戳 markedtime
机器学习和大数据挖掘
2019-07-02
3240
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档