前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python应用案例

python应用案例

作者头像
py3study
发布2020-01-07 14:58:19
7850
发布2020-01-07 14:58:19
举报
文章被收录于专栏:python3

  生成激活码

代码语言:javascript
复制
#!/usr/bin/env python
#encoding:utf-8
#Author:sean

import string
import random

#激活码中的字符和数字
field = string.letters + string.digits

#获得四个字母和数字的随机组合
def getRandom():
    return ''.join(random.sample(field,4))
    
#生成的每个激活码中有几组
def concatenate(group):
    return '-'.join([getRandom() for i in range(group)])
    
#生成n组激活码
def generate(n):
    return [concatenate(4) for i in range(n)]
    
if __name__ == '__main__':
    print generate(10)

  统计单词

代码语言:javascript
复制
#!/usr/bin/env python
#encoding:utf-8

import re
from collections import Counter
FileSource = './media/abc.txt'

def getMostCommonWord(articlefilesource):
    '''输入一个英文的纯文本文件,统计其中的单词出现的个数'''
    pattern = r'[A-Za-z]+|\$?\d+%?$'
    with open(articlefilesource) as f:
        r = re.findall(pattern,f.read())
        return Counter(r).most_common()
        
if __name__ == '__main__':
    print getMostCommonWord(FileSource)

 提取网页正文

代码语言:javascript
复制
#!/usr/bin/env python
#encoding:utf-8

from goose import Goose
from goose.text import StopWordsChinese
import sys

#要分析的网页url
url = '

def extract(url):
    '''
    提取网页正文
    '''
    g = Goose({'stopwords_class':StopWordsChinese}) 
    artlcle = g.extract(url=url)
    return artlcle.cleaned_text

if __name__ == '__main__':
    print extract(url)
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/09/19 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档