首页
学习
活动
专区
工具
TVP
发布

机器学习和数学

专栏作者
68
文章
100187
阅读量
31
订阅数
自然语言处理 | 使用Spacy 进行自然语言处理
Spacy的github地址:https://github.com/explosion/spaCy
用户1622570
2018-09-14
7K1
[情人节] jieba分词介绍
jieba 分词我觉得是Python中文分词工具中最好用的一个工具包。想要入门自然语言处理,jieba分词有必要好好掌握一下,今天带大家入门一下jieba分词包。 首先简单介绍一下jieba分词的原理,jieba分词采用的是基于统计的分词方法,首先给定大量已经分好词的文本,利用机器学习的方法,学习分词规律,然后保存训练好的模型,从而实现对新的文本的分词。主要的统计模型有:N元文法模型N-gram,隐马尔可夫模型HMM,最大熵模型ME,条件随机场模型CRF等。 jieba分词包含三个主要的类,分别是jie
用户1622570
2018-04-12
1.9K0
[数据结构与算法] Python实现二分查找
可能有人会问,学习机器学习还要不要学习数据结构,知乎上有个帖子,对这个问题有很多讨论,但是答案基本都是一致的,要学!但是这块其实我掌握的并不好,本科的数据结构就没学好,后来就没学了,直到去年有段时间打算恶补一下,买了《数据结构和算法 python语言实现》,书写的挺好的,就是看着头疼,基本概念可以看懂,就是实现起来不是很明白。然后后来就去实习了,在公司做的是深度学习的东西,根本用不到,所以好久不看就又忘记了,唉,也是醉了。最近各大互联网公司都开始秋招了,如果是做算法方向的,基本笔试题都会涉及数据结构,我参加
用户1622570
2018-04-12
8620
[编程经验] Python正则表达式
Hello,大家好。又见面了,今天给大家介绍一下,正则表达式在Python中是如何使用的。这样说的原因是正则表达式并不是Python所独有的,而是自成体系,在很多地方都有使用。而正则表达式在Python中主要是re模块来实现的,所以学习Python正则表达式主要就是学习re模块,然后需要熟悉正则表达式的语言,这样基本就可以掌握了。 # re模块 re模块中常用的函数有 compile, findall,match,search,sub,split compile函数的作用是编译一个正则表达式模板,返回一个
用户1622570
2018-04-11
7350
[编程经验]python2和python3的区别总结
最近涨粉涨的厉害啊,那天看刚破800,今天打开又有32个新粉丝,有点开心,哈哈哈。说实话,看的人多的话,是我坚持下去最大的动力。。。 = = = print(" 我是分割线") = = = 1. print函数 在py2中print是一个语法结构,而在py3中print是一个函数, print(value, ..., sep=' ', end='\n',file=sys.stdout, flush=False) file可以是文件,也就是可以把打印的东西直接输出到文件,这个就很方便,我经常用。比如:
用户1622570
2018-04-11
9150
[编程经验] Python之collections模块
collections模块是一个不用不知道,一用就上瘾的模块。因为它提供了几种非常方便的数据结构和方法,在有些情况下特别好用。今天给大家总结一下其中的OrderDict和Counter两个方法,在平时我经常用的方法,希望你也能喜欢它。然后还有比如deque,namedtuple,defaultdict等也是很有的方法,了解了以后重点是熟练的使用,灵活的应用到你的具体任务中,是需要掌握的。 1. OrderDict # Example 1 dict_1 = dict() dict_1['A'] = "I lo
用户1622570
2018-04-11
6340
[编程经验] Python 中列表list介绍
列表是Python中非常重要的一种数据结构,使用频率非常高,本文主要介绍对于学习python的新手来说,需要掌握的一些基础知识。 1. 创建列表 列表用中括号来表示,元素之间用逗号隔开,这种类型的数据
用户1622570
2018-04-11
1.3K0
[编程经验] Python 字符串的几种判断方法
Python处理字符串类型功能真的是很强大,遇到了一些我没用过的方法,感觉挺好用的,就写在这里,供大家参考。 s.isalnum() 所有字符都是数字或者字母 s.isalpha() 所有字符都是字母 s.isdigit() 所有字符都是数字 s.islower() 所有字符都是小写 s.isupper() 所有字符都是大写 s.istitle() 所有单词都是首字母大写,像标题 s.isspace() 所有字符都是空白字符、\t、\n、\r s1 =
用户1622570
2018-04-11
6910
[编程经验] 我是如何半自动抓取素材公社图片的
网络爬虫是一件比较繁琐的事情,特别考验人的耐心。但又是非常令人着迷的一件事,因为当你从网络上爬到了自己的想要的数据,满满的成就感油然而生。但是我对爬虫掌握的并不好,所以我只能把我知道了,在这里做个分享,讲的不好,请见谅。记得当时找实习工作的时候,去面试某家公司的Python工程师,去了给了我一份标准的爬虫工程师的试卷,做完一脸懵逼啊!面试官都不想和我说话的感觉(./嫌弃.sh)。我觉得哈,面试者能力在差,你也不能表现出满眼的鄙视吧,这说明什么?!这种公司不去也罢! 简单介绍一下我对爬虫的理解。开始学习爬虫是
用户1622570
2018-04-11
1.2K0
[编程经验]Python中os模块最最常用的方法
最近在搞天池的AI医疗那个比赛,所以没时间写文章了,有没有小伙伴想一起做的,可以找我私聊! ***********print("分割线")*********** 为什么是最最常用的呢,这里是我通过总结大神们的代码,经常被使用的方法,也是在实际工程中,有助于提高效率的必然会使用的方法。我写的所有文章,都是为机器学习服务的,这里不考虑web开发,及其他Python开发工程中使用的方法。 # coding:utf-8 import os # 总结一下os模块中最最常用的方法, """ >>> import os
用户1622570
2018-04-11
7850
[编程经验] Python中处理时间的方法小结
Python有非常完善的时间处理方法,常用的module有datetime, time。接下来主要介绍几个概念和一些常用的方法。 # UTC时间 UTC时间是CUT(Coordinated Universal Time),和TUC(Temps Universel Coordonné)两种简写的合成版,对应的是英语和法语的不同而导致的。UTC表示世界标准时间,也叫世界协调时,格林尼治天文时间。这个貌似是初中地理学过?忘记了。与世界标准时间相对应的就是当地时间,local time,比如我们在东八区,那loc
用户1622570
2018-04-11
1.1K0
[编程经验] Python异常处理小结
想分享的东西很多,但是不知道怎么规划,只能想起一个写一个了。今天分享一下我对Python异常的理解,希望能对大家有所启发。 首先需要知道什么是异常?“异”就是不同,有区别,不太一样等的意思,“常”就是正常,平常,所以“异常”可以理解为和正常情况有所区别的东西!那么和编程语言联系起来就是和预期有区别的输出。简单说异常也可以理解为“bug”,只不过是这个“bug”可以通过程序猿运行程序之前定义好,然后如果发生了异常,那么可以比较合理的打印出异常的信息。 其实今天为啥要讲异常呢!因为今天我遇到了让我
用户1622570
2018-04-11
1.1K0
[编程经验] 利用TensorFlow和argparse模块解析命令行参数
今天的内容主要包括如何用TensorFlow解析命令行参数和利用Python自带的argparse模块解析命令行参数。我会分别写一个例子,通过这个例子彻底学会如何在程序中解析命令行参数。 首先什么是命令行?简单理解一下就是在Windows里面命令行就是我们常说的cmd(Command Processor),而在Linux中就是shell。命令行参数就是可以写在命令行中的参数,而怎么让程序知道你在命令行中写了哪些参数,就是命令行参数解析。在Python中,或者说在机器学习中,程序中经常会涉及一些参数的设置,
用户1622570
2018-04-11
1.1K0
[编程经验]Python生成器、迭代器与yield语句小结
今天要分享的内容是Python的生成器、迭代器与yield语句。主要包括什么是生成器,如何定义一个生成器,如何调用生成器包含的元素。迭代器也是一样的,最后介绍yield语句,以及它和生成器有什么关系,这是本文的重点。 [* ! *] 理解本文需要一定的基础,需要了解Python列表的定义,基本操作,字典,元组,字符串的概念。Python中for循环的语法结构,以及需要知道 if __name__ =="__main__": 的作用是什么? 1. 迭代 首先来看一下迭代的定义: 如果给定一个列表list或元组
用户1622570
2018-04-11
8730
[无聊的软件安装]VMware Workstation和Xshell安装与使用
后台回复 VMware 可以获得word版 虽然说这个挺简单的,但是刚开始接触,还是会走弯路,遇到问题还是不知道怎么解决,所以我就把整个流程整理了一下,供大家参考。 如果你是刚开始学习Ubuntu,或
用户1622570
2018-04-11
1.3K0
[编程经验] Python之hello world!
今天面向的读者是之前没有接触过Python,现在想学习的童鞋。如果你是Python老鸟,可以点左上角的叉叉了。 主要分为以下三个内容:1. Python的安装与程序运行。2. Python学习经验 3. Python书籍与网络资源推荐+作者收藏的资源 1. Python安装与如何运行程序 Python安装主要是在Windows系统中需要安装一下,如果使用Linux系统则不用安装,因为Linux系统自带Python环境。这里建议想入坑机器学习的童鞋早点放弃W
用户1622570
2018-04-11
7800
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档