解析存储在pandas dataframe列中的tweet

文章/答案/技术大牛

发布

1回答

、、、、

我正在尝试解析存储在.csv文件中名为"text“的列中的tweet。我想使用正则表达式、TweetTokenizer等，但所有这些都要求文本是字符串形式的(据我所知)。我看到了这篇文章： Parsing a tweet inside a csv column in Python 但对我来说，代码对于查找标签太具体了。我确实想这样做，但是有谁知道如何更通用地将" text“<em

浏览 31提问于2019-04-02得票数 1

3回答

具有不同长度数组的熊猫

、、、

由于要解析的原始数据的内容，我最终得到了长度不同的“用户列表”和“tweet列表”。当将列表作为数据框中的列写入时，我得到了ValueError: arrays must all be same length。我意识到了这一点，但一直在寻找一种方法来解决这个问题，在较短数组的正确位置打印0或NaN。有什么想法吗？('|'+tweet2) print len(t

浏览 2提问于2015-03-02得票数 7

2回答

我想要在我的数据帧中按字过滤行。我的话是狗。Dataframe包括埃隆·马斯克的推文。我想要按单词过滤这些推文，并拉出过滤后的推文。下面是我的代码算法的最后一部分。wait_on_rate_limit = True) tweets = api.user_timeline(screen_name = "elonmusk", count = 2000,lang = "en", tweet_mode= "ex

浏览 25提问于2021-08-15得票数 0

回答已采纳

2回答

使用来自熊猫DataFrame的数据的Spacy NLP

、、、、

我有一个大型的pandas调查字符串响应数据框架，我们想要试用Spacy的NLP的一些功能。我们目前只是在探索这些功能，但正在努力解决如何将数据格式化为与spacy的nlp功能一起工作的格式。最终，我们希望能够查看针对用户数据的字符串响应中的热门主题。如何在数据帧的列上运行nlp管道？还是我绕错了路？

浏览 2提问于2018-10-19得票数 3

2回答

如何将JSON文件导入Pandas Dataframe

、、、

我已经找出了几种不同的方法将这些数据加载到Pandas中。如果任何人对这些例外情况有任何建议，将不胜感激！当我尝试不同的方法时，在tweet_json.txt和tweet_json.json之间的一些示例中，文件名发生了变化。with open('tweet_json.json', 'r') as f:df_3 = pd.<em

浏览 205提问于2019-02-04得票数 0

回答已采纳

1回答

在将pandas dataframe转换为csv时，如何将dataframe的头部分离到csv-file的不同列？

、、

在得到一个包含100条tweet的列表后，我使用pandas创建了一个包含tweet列表的dataframe。将数据帧转换为csv后，它看起来如下所示： import snscrape.modules.twitter as sntwitter i

浏览 10提问于2021-05-26得票数 0

2回答

如何将JSON字符串解析为tweepy.Status对象？

、、

我想以原始格式在数据库中存储关于tweet的数据，并计算出您可以出于此目的从tweepy.Status中提取jsob，如下所示：如何将json解析回tweepy.Status对象？

浏览 0提问于2018-08-29得票数 1

1回答

如何在PhpMyAdmin中组织CSV的Twitter数据

、、、

我正在开发一个应用程序，在这个应用程序中，我需要在MySQL数据库中存储一个Tweet集合以及诸如tweets、Tweet日期、语言和用户名等属性。这是我想要的图像：为此，我在python中创建了一个程序，该程序可以在Twitter上以JSON文件的形式收集100+ tweet。然后，我使用Microsoft将JSON文件转换为CSV文件。在此之后，我将CSV文件作为一个表导入到PHPMyAdm

浏览 3提问于2017-11-15得票数 0

回答已采纳

1回答

Tweepy:使用twitter v2 api检索用户名信息的问题

、、

我正在尝试获取对tweet的查询，并将它们存储在dataframe中，然后存储在csv文件中，以供以后分析。我用的是：import pandas as pd client.search_recent_tweets任何帮

浏览 3提问于2022-01-25得票数 1

1回答

、、、

作为一名语言学家和python初学者，我希望在我自己的(德语)tweet语料库中找到单词搭配。如何将pandas dataframe (只有一列= tweet)中的tweet转换为单词列表，以便能够使用nltk-collocation-finder？我的版本(如下)创建了一个字母列表，而不是单词列表，只给出了字母搭配。任何建议都是很棒的！这就是我到目前为止所知道的

浏览 2提问于2021-04-04得票数 2

2回答

从for循环的结果构建数据帧

、

如何将此查询的结果放入数据框中。我已经尝试了许多解决这个问题的示例，但没有一个能给出我正在寻找的全部100行。谢谢。from nltk.sentiment.vader import SentimentIntensityAnalyzer sid = SentimentIntensityAnalyzer

浏览 21提问于2020-04-03得票数 0

回答已采纳

1回答

使用for循环将数据添加到熊猫数据中，该循环具有相同的密钥，所有数据数据都已经包含了一些数据

、、、

我用tweepy.I存储了twitter的流媒体数据，我从数据中提取了名字、lang、国家和文本，并存储在一只熊猫的数据中。现在，我想将性别字段添加到相同的数据框架中，这是我通过使用for循环从性别api获得的GEt请求。如何将性别列添加到相同的数据中？ tweets_data包含所有数据，我正在使用名称解析器查找名字。tweets['text'

浏览 0提问于2018-11-22得票数 1

回答已采纳

1回答

如何从潘达斯DataFrame中提取URL？

、、、

我需要从DataFrame列中提取URL，该列是使用以下值创建的2020-06-06 03:01:37,1269102116364324865Kubernetes environment and unders… https://stackoverflow.com/questions/42237666/extracting-information-from-pan

浏览 2提问于2020-06-06得票数 2

回答已采纳

2回答

如何将json文件中的DataFrame推文加载到熊猫中？

、、

我正在尝试使用以下代码读取我的： line = f.readline() df1 = pd.DataFrame(tweet)with open(file, 'r') asf: <

浏览 3提问于2018-01-29得票数 0

点击加载更多