展开

关键词

Web-Fontmin -- 线你需要的

常用的工具是 fontsquirrel,一个体生成器,可以线生成 eot 、woff、ttf、svg 格式的体,相信很多前端用过,具体用法可以官网试试。 上面是官方的说法,通俗地理解有3个作用:部分体转换体格式生成 webfont 和对应 CSS 样式Fontmin 应用场景有时候,我们想给网站的 Logo 、 Slogan 、标题、活动页等的中自定义体 ,我们可以使用 @font-face 引入 Web 体,但是完整的中体库都是 8M 10M ,加载性能非常差,所以我们部分我们使用到的体,这样可以把件变成几KB。 Squirrel 只有单纯的生成不同格式的webfont,且不支持中。Web-fontmin不单止可以转换格式同时支持中,还可以体,并且有更快的上传和转换速度。 Fontmin-app 主要作用是体,需要下载安装,且不支持Linux。Web-Fontmin 拥有Fontmin-app的所有功能,并且线即可用。

4.6K81

Web-Fontmin -- 线你需要的

常用的工具是 fontsquirrel,一个体生成器,可以线生成 eot 、woff、ttf、svg 格式的体,相信很多前端用过,具体用法可以官网试试。 上面是官方的说法,通俗地理解有3个作用:部分体转换体格式生成 webfont 和对应 CSS 样式Fontmin 应用场景有时候,我们想给网站的 Logo 、 Slogan 、标题、活动页等的中自定义体 ,我们可以使用 @font-face 引入 Web 体,但是完整的中体库都是 8M 10M ,加载性能非常差,所以我们部分我们使用到的体,这样可以把件变成几KB。 Squirrel 只有单纯的生成不同格式的webfont,且不支持中。Web-fontmin不单止可以转换格式同时支持中,还可以体,并且有更快的上传和转换速度。 Fontmin-app 主要作用是体,需要下载安装,且不支持Linux。Web-Fontmin 拥有Fontmin-app的所有功能,并且线即可用。

90430
  • 广告
    关闭

    2021云+社区年度盘点发布

    动动手指转发活动或推荐好文,即可参与虎年公仔等百份好礼抽奖!

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Python

    Python符,包含数import rem = re.findall(+, content) print(m)def translate(str): line = str.strip() # 处理前进行相关的处理,包括转换成Unicode等 pattern = re.compile() # 中的编码范围是:u4e00到u9fa5 zh = .join(pattern.split(line )).strip() # zh = ,.join(zh.split()) outStr = zh # 经过相关处理后得到中本 return outStr print(translate(content

    1K20

    Python

    写这个jupyter的原因是好几次自己爬完新闻之后,发现中间有些是html标签代码或者其他多余的英符,自己也不想保留,那么这时候一个暴力简单的方法就是使用 unicode 范围 u4e00 - u9fff 来判别汉unicode 分配给汉(中日韩越统一表意)的范围为 4E00-9FFF (目前 unicode 6.3 的标准已定义到 9FCC )# 判断符是否全是中def ishan(text

    62650

    Gne Online:通用新闻网页正线

    一直以来,GNE 是以 Python 包的形式存,要测试 GNE 的效果,需要使用 pip 先安装,再写代码使用。 要测试 GNE 的功能,你只需要最上面的本框中粘贴网页源代码,并点击按钮即可:? 对于标题、作者、新闻发布时间这种可能发送误的情况,我们可以通过下面对应的Title XPath、Author、Publish Time XPath来输入 XPath 定向。 例如对于今日头条的章:?新闻的作者失误,此时可以指定 XPath:divspantext()来定向,如下图所示。 通过设定Host输入框,可以网页正中的图片为相对路径时,拼上网址。 通过勾选下面的With Body Html复选框,可以返回正的区域的网页源代码。

    33410

    python读pdf和图片

    问题描述如下图所示,一份pdf有几十页,每页九张图片, 出图片并用图片下方的本对图片命名主要涉及问题:图片本识别借鉴了上面本识别的资料,上面图片的顺序不一致,没办法把两个结合起来实现我的需求 pdimport numpy as npfrom PIL import Image # 分页保存成图片def save_page_pic(pdf_path,page_path): # 保存前先清空图片保存件夹 for wj in os.listdir(page_path): os.remove(os.path.join(page_path,wj)) # 二进制读 doc = fitz.open(pdf_path ) # 循环分页处理 for d in doc: #获页码 page = int(str(d).split())+1 # 单页图片命名 pic_name =f page_{page}.png page_pic_path

    8330

    OCR图片中的

    ;即,针对印刷体符,采用光学的方式将纸质档中的转换成为黑白点阵的图像件,并通过识别软件将图像中的转换成本格式,供处理软件进一步编辑加工的技术。 生活和工作中我们也经常需要从图片中信息,比如从扫描件,截图或照片中有用的信息。 分别用上面到的三个工具来识别,看效果 ONLINE OCR?Convertio?tesseract-ocr?总体来说,三个方法都能识别出手机号来,但是中的识别效率各不相同。 Convertio堪称完美,标题,gene名,格式都正确,满意度100%?tesseract-ocr标题识别有点小错误,gene名有几个带有引号或下划线,格式基本保留,满意度90%? 我相信OCR生活中还有很多的应用,比如信件或者包裹拍照,识别邮编之后分拣,手机拍名片自动姓名,手机号添加到通讯录,我相信即使微信里面发图片,敏感信息还是能被后台监测到的,OCR对腾讯来说应该是小菜一碟

    2.1K30

    Python图片内容

    一、前言爬虫的时候,有时候会遇到一些验证码,常见的有滑块验证码和验证码,本所讲内容将为解决验证码做一些准备! 二、easyocr库的安装pip install easyocrEasyOCR 中主页:传送门GitHub地址:传送门三、图片效果以这张图片为例: image.png运行代码:import easyocrreader for i in range(len(result)): article += result # 将列表中的符串依次拼接一起print(article)运行结果如下:妖族中至高无上的存被称之为大圣 解决方案:根据示网址,下载相应的模块。 错误示2:网络连接超时或者连接断开 解决方案:可以直接下载体模型,放到指定的路径中。 模型所放路径Windows:C:Users用户名.EasyOCRmodel其实也可以偷懒,直接搜.EasyOCR,然后点击model,把体模型放这里。然后就解决问题了!

    38910

    这几个免费线工具你一定喜欢:视频线翻译,双幕合并

    不用设置API,也不用等待很久语音识别成幕,也不用费各种心思去翻译幕。双语也不用特别的去找某个播放器去挂载几个件。 今天会用到一个软件、三个线工具,分别幕格式幕翻译,和幕合并视频幕翻译教程1.剪映专业版生成幕首先我们需要用的的工具是剪映,用来识别生成幕,但是是单个语言。没有翻译。 我们需要把剪映生成子的出来。 生成独立的srt格式的幕步骤:先导入视频—本—智能幕—开始识别2.剪映幕这是不同系统的默认目录,即使你的剪映装到其他盘,草稿幕也是这个默认目录里面的Windows 目录:C:UsersYourNameAppDataLocalJianyingProUser 点击加载幕,并点击向下的箭头,页面拉到底,幕全部加载出来,然后点击右键翻译成中,如果想翻译成其他语言,浏览器网址右边可以选择翻译成其它语言。

    1.3K50

    使用pdfminerPDF件中的

    主要介绍pdf读操作中的一种应用,从PDF件中,可以通过pdfminer模块来实现,安装方式如下pip install pdfminer该模块同时还供了一种,命令行的脚本程序,可以方便的 pdf中的,用法如下python pdf2txt.py input.pdf如果之后,需要进一步操作,最好还是通过脚本对程序进行处理,脚本中实现的代码如下>>> from pdfminer.pdfinterp PDFPage.get_pages(fp):... interpreter.process_page(page)...>>> device.close()>>> outfp.close()只需要简单的十几行代码,就可以出对应的 ,然后再根据需求进行后续处理,比如将出的, 利用python-docx模块输入到word档中,从而实现pdf到word档的转换,也可以pdf中的表格,写入到excel中。 生信知识浩瀚如海,生信学习的道路上,让我们一起并肩作战!本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。

    34010

    从爬章 HTML 中出中关键

    1.从 HTML 中出纯本(去掉标签)import org.htmlparser.NodeFilter;import org.htmlparser.Parser;import org.htmlparser.beans.StringBean nList.elementAt( 0).toPlainTextString(); } catch (Exception e) { e.printStackTrace(); return null; } } ** * 获网页中纯本信息 String text = bean.getStrings(); String reg = ; text = text.replaceAll(reg, ); return text; }}2.从纯本中出中关键 (TextRank关键词)import com.hankcs.hanlp.HanLP;import com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary *;import java.util.stream.Collectors; ** * TextRank关键词 * * @author hankcs *public class TextRankKeyword

    68160

    scrapy爬伯乐线

    章列表页中的章url并交给scrapy下载后并进行解析 2. parse.urljoin(response.url, post_url), meta={front_image_url:image_url}, callback=self.parse_detail) # 下一页并进行下载 ), callback=self.parse) def parse_detail(self, response): # article_item = JobBoleArticleItem() # # 章的具体段 match_re: nums = int(match_re.group(1)) else: nums = 0 return numsdef remove_comment_tags(value): #去掉tag中的评论 item.get_insert_sql() cursor.execute(insert_sql, params) class JsonItemExporterPipeline(object): # 调用scrapy供的

    25150

    shell件名或目录名

    1、basenamebasename是专门用于从路径中件名从某个路径中件名(带件尾缀)filename=yourpathfile1.txtecho $(basename $filename )返回file1.txt若从某个路径中件名(不带件尾缀),则需要变量的后面加上后缀名filename=yourpathfile2.txtecho $(basename $filename . txt)返回file22.dirnamedirname用于从路径中出目录名,使用方法为 dirname 件目录filedir=yourpathfile3.txtecho $(dirname $filedir

    49240

    符串

    版权声明:本为博主原创章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原出处链接和本声明。 本链接:https:blog.csdn.netweixin_42449444articledetails89600457 题目描述:请从符串中以最后一个开头、以最后一个结尾的符串,未找到匹配的符串返回 输入描述:可能包含的符串输出描述:截后的符串输入样例1:bbbcccdddeee输出样例1:dddeee输入样例2:abc输出样例2:null解题思路:先找出最后一个的的]所下标j,最后一个的的 ]所下标j才能截符串进行输出(要是i>j就输出null),然后从i开始截(j-i+1)个长度的子符串进行输出即可。 while(getline(cin,str)) { int len = str.length(); int i = str.rfind(,len-1); 最后一个的,len-1) + 5; 最后一个的]所下标

    17720

    怎样用Python图片中的

    点击蓝关注△ 回复“1024”领福利大礼包?有时候数据的时候,需要读网页中图片中的信息。和处理图像、图像相关的机器学习以及创建图像等任务中,Python一直都是非常出色的语言。 安装之后,要用要用tesseract命令Python的外面运行今天使用Tesseract来实现一个图片中信息的程序。下面这张图片,就是我们需要读的对象:? subprocess.PIPE,stderr=subprocess.PIPE)p.wait()f = open(page.txt,r)print(f.read())f.close()运行这个程序,应该会输出图片中的信息 但是,当出现彩色封面上时,结果就不那么完美了。你可以用 Pillow 库挑选图片进行清理,但是如果想把加工成普通人可以看懂的效果,还需要花很多时间去处理。这是只是一个简单的实例。 如果觉得内容还不错,分享给更多朋友,一起升编程技能。

    4.5K20

    网店工商信息图片

    这个我感觉还是比较有意思的,所以选了个网店工商信息图片的题目,然后花四天时间完成,下面主要和大家分享一下问题的解决思路。 1.网店工商信息图片图片内容如下所示,但每张图片中信息出现的位置不尽相同,题目要求所写的程序能够完成如下几个功能点。程序能够识别不同格式的图片,并能够所要求的信息。 从图片之中企业注册号和企业名称信息,并保存到Excel表格之中。程序能够自动读企业工商信息图片所件夹路径。识别速度保持60秒识别50张图片,识别正确率保证95%以上。? System.out.println(result); } catch (TesseractException e) { System.err.println(e.getMessage()); } }}3.网店工商信息图片下载的 4.待优化图片识别方面只做了4天,之前也没有做过相关问题,所以还是有很大的优化空间。利用多线程,识别时间应该能够减少1分钟,达到1分钟30s识别50张(猜测)。

    97120

    python调用百度AI图片

    python本身也有识别图片转的框架,但是相比调用接口,识别的精度就略显不行了;这是 百度AI 的网站: https:ai.baidu.com ;点击右上角的 控制台 ,申请或者登陆;进去之后左侧有 【识别】: ? 点击【创建应用】,创建接口;之后会得到创建的三个连接密钥:AppIDAPI KeySecret Key这三个参数会后面调用的时候会用到;同样,页面也可以找到识别的技术档:  https:ai.baidu.comdocs XXXXXXXXXXXXXXXXXXSECRET_KEY = XXXXXXXXXXXXXXXXXXXXXXXXXXX client = AipOcr(APP_ID, API_KEY, SECRET_KEY) 读图片 (restu1)   但是输出的是  典、列表,此我将结果遍历了一下,从图片中识别的会一行一行显示,剩下的操作看你咋搞了,存入数据也行,生成表格也行;

    1K30

    iOS符串

    1、判断是否有中+ (BOOL)IsChinese:(NSString *)str { for(int i=0; i< ;i++){ int a = ; if(a > 0x4e00 && a < 0x9fff ) { return YES; } } return NO;}2、过滤特殊符串+ (NSString *)isSpecialCharacter:(NSString *)str{ NSCharacterSet *doNotWant = {}%-+=_|~<>$€^•@$%^&()_+]; str = componentsJoinedByString:@]; return str;}3、特定符串-(NSString originalString{ NSMutableString *numberString = init]; NSString *tempStr = init]; NSScanner *scanner = ; 包含 0-9和*#的符串 NSCharacterSet *numbers = ; while (!)

    45330

    127-符串

    有这样的符串:“123#%4hello*world000”,要求:将符串中的所有出来将符串中开头的非符去除 分析:对于母的要求,首先遍历所有的符串,如果符串是母就把它保存到列表中 ,如果要求结果仍然是符串,再把它们拼接即可:>>> s1 = 123#%4hello*world000>>> slist = >>> .join(slist)helloworld列表解析可以将以上代码简化成一行 :>>> >>> .join()helloworld第二个需求是去除符串开头的非符,这个功能的实现只要找到左边第一母的下标,然后切片。 以下通过两个方法完成第二点要求:直接下标>>> s1 = 123#%4hello*world000>>> for i in range(len(s1)):... if s1.isalpha():...

    29620

    python符串中数

    参考链接: Python | 符串rstrip题目:【这是一个复杂问题的简化】如下是一个符串列表,符串中第二个数,并判断是否大于1000,如果是,从列表中删除这一行。  代码: #coding: utf-8oldStr = 1000t1002nnewStr = oldStr#匹配目标数左侧符串t=newStr.index(t)newStr = newStr.lstrip 易错点1:对符串进行strip()后,如果不赋值,符串内容保持不变。  ss=124>>> ss1>>> ss.lstrip(ss)24>>> ss                #ss保持不变1>>> ss=ss.lstrip(ss)        # 赋值之后ss获新值 解决注释报错:如果件里有非ASCII符,需要第一行或第二行指定编码声明:#coding: utf-8

    21600

    相关产品

    • 通用文字识别

      通用文字识别

      通用文字识别(General OCR)提供通用印刷体识别、通用印刷体识别(高精度版)、通用印刷体识别(高速版)、通用手写体识别、英文识别等多种服务,支持将图片上的文字内容,智能识别为可编辑的文本,可应用于随手拍扫描、纸质文档电子化、电商广告审核、智能翻译等场景,大幅提升信息处理效率。

    相关资讯

    热门标签

    活动推荐

      运营活动

      活动名称
      广告关闭

      扫码关注云+社区

      领取腾讯云代金券