所以我有了sympy版本0.7.3,我相信它是用easy_install安装的。我现在正在尝试将其更新到当前的0.7.6版本。我的操作系统是Windows 8编辑:我正在使用Python2.7。
当我在googled中搜索如何用Python更新模块时,我得到的印象是我应该能够打开命令行并键入easy_install sympy -U,但是当我这样做时,它似乎会检查服务器并最终给出错误。
error: Could not find suitable distribution for Requirement.parse('-U')
我也尝试过easy_install sympy -
我希望从文本串中删除缩略语中的句点,但我也希望o保持正常句点(例如,句子末尾)。
因此,下面一句:
"The C.I.A. is a department in the U.S. Government."
应该变成
"The CIA is a department in the US Government."
是否有一种使用Python的干净的方法来做到这一点?到目前为止,我有两个步骤:
words = "The C.I.A. is a department in the U.S. Government."
words = re.sub(r
我写了这个正则表达式(在Python3中):(?<![\u0410-\u042F])([.!?])(?=(\s)?(\s)?[\u0410-\u042F]|[\u04E8]|["]|[\u201C]|![0-9])
我使用的是python的re.split()
它用西里尔语拆分句子。它们是由\n分隔的。因此,它应该拆分以下内容:
Мамлекеттик айыптоочу Биринчи май райондук сотуна берген бул сунушун диний кастыкты ырбатпоо аракети менен негиздеди. Мусулманд
在一个相当保守的系统(RHEL)上,我决定冒险一试,学习一下virtualenv,并将我的wsgi应用程序从系统的默认2.7迁移到3.6。有很多Python3版本可供选择: $ yum search python3 | egrep '^python3[^-]+\.'
python34.x86_64 : Version 3 of the Python programming language aka Python 3000
python34u.x86_64 : Version 3 of the Python programming language aka Python 300
我想使用python正则表达式来匹配后面跟着一个空格的一系列单个字符。
例如:“我的名字是arun its A R U N jayapal。我要去伦敦。”
这里,正则表达式应该只匹配"A、R、U、N“,而不匹配"I”。请帮帮忙。目前我使用下面的正则表达式,它只匹配A/U/ I。
(?:\sa-zA-Z0-9\s)+
我觉得这是一个非常基本的问题,但在我的一生中,我还是想不出来。
我有一整堆的文字,我正在读,并转换为国际音标。我经常使用re.sub()方法,在许多情况下,这意味着用unicode类型的字符替换字符串类型的字符。例如:
for row in responsesIPA:
re.sub("3", u"\u0259", row)
我得到了TypeError:预期的字符串或缓冲区。Python上的文档说,替换的类型必须与您正在搜索的类型匹配,所以这可能就是问题所在?我试着把str()放在u“\u259”附近,但是我仍然得到类型错误。有什么办法可以替代我吗?
我的正则表达式是(?<![\u0410-\u042F])[.!?](?=(\s)?(\s)?[\u0410-\u042F]|[\u04E8]|["]|[\u201C]|![0-9])
我想把一段话分成几个句子。
我使用re.split()执行正则表达式并打印数组
这是我做的一个示例输入:
Мамлекеттик айыптоочу Биринчи май райондук сотуна берген бул сунушун диний кастыкты ырбатпоо аракети менен негиздеди. Мусулмандарга акаарат келтирип
我试图在基于python3的Crab(一个开放源码推荐系统)上运行一个测试。然后发生了一个错误:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/Users/Dennis/anaconda/lib/python3.5/site-packages/scikits/crab/datasets/base.py", line 201, in load_sample_movies
data_songs[u_ix][i_ix]
我在将ascii字符编码为UTF-8时遇到了一些问题,或者字符串无法识别编码。
import unicodecsv as csv
import re
import pyodbc
import sys
import unicodedata
#!/usr/bin/python
# -*- coding: UTF-8 -*-
def remove_non_ascii_1(text):
text.encode('utf-8')
for i in text:
return ''.join(i for i i
我刚才下载了Python3.7。现在,我正在尝试安装selenium模块。我能够在命令提示符中运行python。但是,当我打字时:
pip install -U selenium
或
pip install selenium
我有语法错误。
Python 3.7.0 (v3.7.0:1bf9cc5093, Jun 27 2018, 04:59:51) [MSC v.1914 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for m
Python将\uxxxx视为字符串文字中的unicode字符转义(例如,u"\u2014“被解释为Unicode字符U+2014)。但我刚刚发现(Python2.7)标准的regex模块不会将\uxxxx视为unicode字符。示例:
codepoint = 2014 # Say I got this dynamically from somewhere
test = u"This string ends with \u2014"
pattern = r"\u%s$" % codepoint
assert(pattern[-5:] == "2
我试图用regex来识别名称,从
Mr.|Mrs.
例如
Mr. A, Mrs. B.
我试过几种表达方式。这些正则表达式是在的在线工具上检查的。所使用的测试字符串是:
"hey where is Mr A how are u Mrs. B tt`"
所述的输出是Python的findall()函数,即
regex.findall(string)
它们各自的regex输出如下。
Mr.|Mrs. [a-zA-Z]+ o/p-[u'Mr ', u'Mrs']
为什么A和B不和先生和夫人一起出现?
[Mr.|Mrs.]+ [a-zA-Z]+ o/p
我有一个Python代码,它从Amazon中提取数据,我需要将这个JSON数据索引到Elasticsearch。目前,我的代码如下所示:
import os
import json
import uuid
import time
import boto.sqs
import boto
from boto.sqs.connection import SQSConnection
from boto.sqs.message import Message
from boto.sqs.message import RawMessage
from ConfigParser import SafeConfi