在正则表达式中,反斜杠是转义字符,因此不可能出现以反斜杠结尾的正则表达式。...Windows路径的“正统”写法应该是: path = os.path.normcase("c:/mydir/mysubdir/") os.path.normcase在Windows平台下会自动把正斜杠转换成反斜杠...由于正则表达式使用反斜杠来转义特殊字符,而python自身处理字符串时,反斜杠也是用于转义字符,这样就产生了一个双重转换的问题,要匹配字符串中1 个反斜杠应该怎么写正则表达式?"\\",这样行吗?...在python中写正则表达式时用得最多的是raw字符串,原生字符串,什么意思?...就是只有一重转换了,没有字符串转换了,只在正则表达式内部进行转换 了,这样匹配一个反斜杠的正则表达式可以这样写,re_str_patt = r"\\",有人会想,以后写windows的文件路径什么的方便了
[index$] ,位置索引从1开始计算,用于指定对索引相应的实参进行格式化并替换掉该占位符。 [标识] ,用于增强格式化能力,可同时使用多个 [标识] ,但某些标识是不能同时使用的。...n,平台独立的换行符, 也可通过System.getProperty("line.separator")获取。 f,浮点数型(十进制)。显示9位有效数字,且会进行四舍五入。如99.99。...g,浮点数型(比%f,%a长度短些,显示6位有效数字,且会进行四舍五入) 七、对日期时间进行格式化 占位符格式为: %[index$]t转换符 ...日期的转换符 c,星期六 十月 27 14:21:20 CST 2007 F,2007-10-27 D,10/27/07 r,02:25:51 下午 T,14:28:16 R,14:28 b, 月份简称...时间的转换符 H, 24小时制的小时(不足两位补零) k, 24小时制的小时(不足两位不补零) I, 12小时制的小时(不足两位补零) i, 12小时制的小时(不足两位不补零) M, 分钟(不足两位补零
字符串 Unicode字符串 在Python2中,普通字符串是以8位ASCII码进行存储的,而Unicode字符串则存储为16位unicode字符串,这样能够表示更多的字符集。...>>> 从输出可以看到4中字符串的结果是一样的,那为什么要这么麻烦呢?...字符,name是一个标准Unicode名称 取消转义字符的作用——原始字符串 在字符串前使用r前缀,能够使字符串中的转义字符失去转义作用而直接作为字符串输出。...例如: >>> >>> print("C:\nowhere") #我们想输出c:\nowhere C: owhere >>> #结果却发生了转义 >>> #这时应该使用r产生原始字符串: >>> print...whz >>> 然而,在Python3中raw_input以及并入到input中,所以在Python3我们使用input接收到的数据都会被当成字符串储存起来。
1.1、用户输入 在Python3中通常使用的input() 函数直接和用户进行交互,用于等待用户的输入。...在Python2中通常使用raw_input() 函数来和用户进行交互,基本上raw_input() = input() (python3中),python2中的input() 函数基本上不用,因为在Python2...中input() 函数会检查用户输入的是字符还是变量,举个栗子:如果之前定义了name的值,那么name为变量,则当我们输入name的时候,会返回变量name的值,如果之前没有定义name的值则会直接报错...确认将每一个地方的都改掉,不 只是你使用=赋值过的地方。 试着使用更多的格式化字符。例如 %r 就是是非常有用的一个,它的含义是“不管什 么都打印出来”。...salary:3000 Process finished with exit code 0 上述代码就是一个字符串拼接格式化输出的实例,使用加号进行字符串的拼接,但是一般不建议这么写,因为在因为拼接的字符串写法比较差
字符编码 字符编码历史及发展 为什么有字符编码 ''' 原因:人们想要将数据存入计算机 计算机的能存储的信息都是二进制的数据 内存是基于电工作的,而电信号只有高低频两种,就用01来表示高低电频,...所以在保存数据的时候有一个转换过程,要有一个对应关系将我们输入的字符转换成计算机能够存储的二进制数据 人输入的字符 >> 对应关系转换(字符编码表)>> 二进制数据...f.truncate() # 不指定参数是指从当前位置开始截断 之前未测试出效果是因为使用的是a模式,光标在文件末尾 我又没有将光标移动到文件开头...+ 打开一个文件进行更新(可读可写)。 U 通用换行模式(不推荐)。...其实相对路径可能较绝对路径会好一点,比如你把整个项目从D盘移动到了E盘,如果是绝对路径,那么项目运行到文件操作这里可能就会报错了,而相对路径还是没变,就不会有这个问题 # r'' 前面的r 是字符串中的修饰符
8进制hex(x)将整数x转换为16进制字符串chr(i)返回整数i对应的ASCII字符bin(x)将整数x转换为二进制字符串bool([x])将x转换为Boolean类型 二、集合类操作basestring...[key])返回集合中的最小值dict([arg])创建数据字典list([iterable]) 将一个集合类转换为另外一个集合类set()set对象实例化frozenset([iterable])产生一个不可变的...iterable[, initializer]) 合并操作,从第一个开始是前两个参数,然后是前两个的结果与第三个合并进行处理,以此类推reload(module) 重新加载模块setattr(object...2、参数mode:'r'(读)、'w'(写)、'a'(追加)。 3、参数bufsize:如果为0表示不进行缓冲,如果为1表示进行行缓冲,如果是一个大于1的数表示缓冲区的大小 。...推荐使用openprint打印函数raw_input([prompt]) 设置输入,输入都是作为字符串处理
一般常规的我们保存数据为dict类型时,系统会自动帮我们排序;但有时我们想按照输入顺序的key:value保存到dict中,而不想要改变顺序,则我们可以通过使用collecions,进行排序。...1.下面我们先看这个脚本: #从字典转换为Json的方法 from distutils.log import warn as printf from json import dumps from pprint...:1)导入distutils.log.warn()用来应对python2中print语句和python3中print()语句引起的差异;2)json.dumps(),用来返回一个表示python对象的字符串...encoding-把一个Python对象编码转换成Json字符串;decoding-把Json格式字符串解码转换成Python对象。...以上这篇在python中利用dict转json按输入顺序输出内容方式就是小编分享给大家的全部内容了,希望能给大家一个参考。
MD5函数介绍 语法 md5(string,raw) 参数描述string必需。要计算的字符串。raw可选。默认不写为FALSE:32位16进制的字符串。...)){ echo 'OK'; } php弱类型比较产生的漏洞 想要满足这个判断只需要构造出MD5值为0e开头的字符串,这样的话弱类型比较会认为是科学技术法,0的多少次方都是0,因此可以绕过 有一些字符串的...770hQgrBOjrcqftrlaZk 7r4lGXCH2Ksu2JNT3BYM PHP特性 $str1 = $_GET['str1']; $str2 = $_GET['str2']; if (md5...']; $str2 = (string)$_GET['str2']; if (md5($str1) === md5($str2)) { echo 'OK'; } 由于强制类型转换,传数组就不可行了,这里就需要...r,ùíb),这个字符串前几位刚好是 ‘ or ‘6, 而 Mysql 刚好又会吧 hex 转成 ascii 解释,因此拼接之后的形式是select * from ‘admin’ where password
保存的时候起个好听的名字 Header会传输一些我们需要的一些通用的数据,定义好之后,每个接口几乎都是一样的。所以,把这些数据进行预置,这样就不用每新建一个请求,都要重复的添加Header了。...默认的编码方式。所有字符都会进行编码(空格转换为 “+” 加号,特殊符号转换为 ASCII HEX 值)。 multipart/form-data 。...不对字符编码。在使用包含文件上传控件的表单时,必须使用该值。 text/plain。纯文体的传输。空格转换为 “+” 加号,但不对特殊字符编码。...raw 当需要给服务端传递json,xml等数据的时候选择raw,当选择了raw的时候,header里会自动加上 Content-Type: application/json 例如: $.ajax({...) PS:压测文件可以是csv格式跟json格式的 这里还可以在Pre-requestScript"中设置环境变量 “username”, “password”,在Body 中选取"form-data”
loader 本质上是一个函数,该函数对接收到的内容进行转换,返回转换后的结果。 常见的 loader 有: raw-loader:加载文件原始内容。...stringifyRequest:将请求的资源转换为可以在 loader 生成的代码中 require 或 import 使用的相对路径字符串,同时避免绝对路径导致重新计算 hash 值。...,作为 loader 产生的结果的依赖,使其在有任何变化时可以被监听到,从而触发重新编译。...webpack rules 中配置的 loader 可以是多个链式串联的。在正常流程中,链式 loader 会按照从后往前的顺序执行。...3.1 raw-loader 分析 该 loader 是功能非常简单的同步 loader,它的核心步骤是从文件原始内容中取得序列化的字符串,修复 JSON 序列化特殊字符时的 bug,添加导出语句,使其成为
输入输出 交互式输入输出 在很多时候,你会想要让你的程序与用户(可能是你自己)交互。你会从用户那里得到输入,然后打印一些结果。我们可以分别使用raw_input和print语句来完成这些功能。...从文件中读取的每一行都带有一个换行符, 而Python的print默认会在输出结束时加上换行符, 因此打印一行会空出一行。为了解决这个问题,有下面两套方案。'''...从文件中读取的每一行都带有一个换行符, 而Python的print默认会在输出结束时加上换行符, 因此打印一行会空出一行。为了解决这个问题,有下面两套方案。...学习锻炼“读程序”,即对着文件模拟整个的读入、处理过程来发现可能的逻辑问题。 程序运行没有错误不代表你写的程序完成了你的需求,你要去查验输出结果是不是你想要的。...当结果不符合预期时,要学会使用print来查看每步的操作是否正确,比如我读入了字典,我就打印下字典,看看读入的是不是我想要的,是否含有不该存在的字符;或者在每个判断句、函数调入的情况下打印个字符,来跟踪程序的运行轨迹
不转义(保留) 3、字符串抑制转义 myfile=open('C:\new\text.data','w') 这个调用会尝试打开C:(换行)ew(制表符)ext.data的文件,而不是期待的结果。...解决办法,使用raw字符串。如果字母r(大写或者小写)出现在字符串的第一个引号前面,它会关闭转义机制。...三、字符串格式化 格式化字符串的方法: 1)、在%操作符的左侧放置一个需要进行格式化的【字符串】,这个字符串带有一个或者多个嵌入的转换目标,都以%开头(如%d) 2)、在%操作符右侧放置一个对象(...或多个,在括号内),这些对象将会插入到左侧想让Python进行格式化字符串的(或多个)转换目标的位置上去。...方法就是与特定的对象相关联在一些的函数。从技术的角度讲,他们附属于对象的属性,而这些属性不过是些可调用函数罢了。在Python中,对不同的对象类型有不同的方法。字符串方法仅限于字符串对象。
字符串 str 元组 tuple 类型转换 对不同的数据类型之间进行转换。...int(x) # 将对象x转换为int类型 标识符 标识符:Python中已经使用的,具有特殊功能的关键字。 在对Python代码中的变量进行命名时,不能采用这些标识符。...height = input("Please input your height:") # 获取用户输入的信息,并存储到变量height中 注意:在Python3中,input函数将输入的任何值都当作字符串进行处理...;在Python2中,会将输入的任何东西当作代码来进行执行 # Python2中实现相同的功能: height = raw_input("Please input your height:") 字符串...可以看到,Python解释器会自动将 \n 转义成换行。 当不想对字符串进行转义的时候,可以在字符串前面加上r,表示这是一个raw字符串。 print(r'Hello \nWorld!')
在导入模块的时候,你可能会看到有新文件出现-----在本例中是c:\python\hello.pyc。这个是以.pyc为扩展名的文件是经过处理的,已经转换成python能够更加有效地处理的文件。...目录是最佳选择 2.告诉编译器去××× 对以下不适用: 不希望自己的模块填满python解释器的目录 没有在python解释器目录中存储文件的权限 想将模块放在其他地方 标准的实现方法是在PYTHONPATH...注意,extendleft使用的可迭代对象中的元素会反序出现在双端队列中。...进行求值,将结果转换为字符串返回,如果成 功的话,字段就是个表达式,一切正常。...将所有field_pat匹配项用re.sub中的替换函数进行替换,并且打印结果。
webpack内部的loader runner会调用这个函数,然后把上一个 loader 产生的结果或者资源文件传入进去,然后返回处理后的结果 下面会从基本使用开始出发,探究一个loader怎么写,...可以看见它特殊之处: 即使你看得见中间有一个奇怪的字符,但是你再按下enter,还是'ab',\u2028字符串在直观上来看相当于空字符串(实际上字符是存在的,却没有它的带来的效果)。...在实际(从右到左)执行 loader 之前,会先从左到右调用 loader 上的 pitch 方法。...其次,如果某个 loader 在 pitch 方法中返回一个结果,那么这个过程会跳过剩下的 loader pitch方法的三个参数: remainingRequest: 后面的loader+资源路径,loadername..., sourceMap, module)) loadModule方法作用是,解析给定的 request 到一个模块,应用所有配置的 loader ,并且在回调函数中传入生成的 source 、sourceMap
二、使用步骤 1.引入第三方库 2.读入html中的有用的数据 3.一步一步遍历出有用的数据 4.在pycharm终端中打印想要的结果及将get到的内容下载到自建text下 5.完整代码 ---- 前言...引入re python内置模块,re为(正则表达式)引入目的帮助我们在爬取网站内容是进行遍历(以便我们能更加清楚的,有条目的爬取想要的内容) 2.先利用浏览器中的检查或开发者工具找到本网站的请求头(user-agent...replace(r'"','').replace(r''','')#第二次过滤:将一系列的特殊字符删去 #第二种方法用正则表达式re.sub()语句进行字符串的替换 text_2 = re.sub...('\n\u3000\x0c"'','',text_1) 4.在pycharm的终端下先输出get到的结果(进行确认是否是想要的数据),及get到的文件通过python的控制命令自动写入到自建...(r'"','').replace(r''','')#第二次过滤:将一系列的特殊字符删去 #第二种方法用正则表达式re.sub()语句进行字符串的替换 text_2 = re.sub('\n
你可以在 () 之间放入一个你想要作为提示的字符串,如下所示: y = raw_input("Name? ") 这句话会用 “Name?” 提示用户,然后将用户输入的结果赋值给变量 y。...在命令行界面下运行你的程序,然后在命令行输入 pydoc raw_input 看它说了些什么。如果你用的是 Window,那就试一下 python -m pydoc raw_input 。 2....有的版本 Windows 中没有这个命令,也就是说你没法用 pydoc 了。跳过这些加分习题,上网去搜索 Python 文档吧。 %r 和 %s 该用哪个?...记住 %r 是 debug 专用,它显示的是原始表示出来的字符,而 %s 是为了显示给用户。 写成 print "How old are you?" , raw_input() 为什么不行?...你觉得可以,但 Python 不这么认为。
字符串可以用来表示能够像文本那样编辑的任何信息:符号和词语、在入道内存中的文本的内容、Internet网址和Python程序等。...:”Line1\tadded tab\nLine2” • Raw字符串:r”C:\My\new\Directory\file.exe” • Python 3.x中的Byte字符串:b’Te\x01xt’...>>> print(r'C:\newfile\files') C:\newfile\files 这个时候其值会跟写的完全一样,当然,我们也可以写成如下: >>> print('C:\\newfile\\...D o r a E m o n 这个意思是,我们从a字符串(序列)里按顺序提取字符,进行操作。关于循环,后面在函数章节讲解。...用这两个函数,可以对字符串转换进行简单的大小写操作了,比如:把一个字符串里的内容全转换成大些: >>> DORA='' #初始化DORA >>> Dora='DoraEmon' #设置Dora >>
返回x的y次幂 range([start], stop[, step]) 产生一个序列 默认从0开始 round(x[, n]) 四舍五入 sum(iterable[, start]) 对集合求和...oct(x) 将一个数字转化为8进制 hex(x) 将整数x转换为16进制字符串 chr(i) 返回整数i对应的ASCII字符 bin(x) 将整数x转换为二进制字符串 bool([x]) 将x...,设置后可以通过c.x=value等来访问setter和getter reduce(function, iterable[, initializer]) 合并操作,从第一个开始是前两个参数,然后是前两个的结果与第三个合并进行处理...source的初始化数组;2、如果source为字符串,则按照指定的encoding将字符串转换为字节序列;3、如果source为可迭代类型,则元素必须为[0 ,255]中的整数;4、如果source为与...2、参数mode:’r’(读)、’w’(写)、’a’(追加)。3、参数bufsize:如果为0表示不进行缓冲,如果为1表示进行行缓冲,如果是一个大于1的数表示缓冲区的大小 。
Subword粒度 我们理想中的tokenization需要满足: 它能够在不需要无限词汇表的情况下处理缺失的标记,即通过有限的已知单词列表来处理无限的潜在词汇; 此外,我们不希望将所有内容分解为单个字符的额外复杂性...,因为字符级别可能会丢失单词级别的一些含义和语义细节。...subword tokenization不转换最常见的单词,而是将稀有单词分解成有意义的子词单元。...来看看是怎么解决上述问题的 SentencePiece首先将所有输入转换为unicode字符。这意味着它不必担心不同的语言、字符或符号,可以以相同的方式处理所有输入; 空白也被当作普通符号来处理。...Sentencepiece显式地将空白作为基本标记来处理,用一个元符号 “▁”( U+2581 )转义空白,这样就可以实现简单地decoding Sentencepiece可以直接从raw text进行训练
领取专属 10元无门槛券
手把手带您无忧上云