我设置了tweepy来获取tweet,并将其写入主题TWEEPY_TOPIC和从主题中读取的流。 -- Create topic for tweepy to write into id BIGINT, tweet VARCHAR, screen_name VARCHAR>) KAFKA_TOPIC= 'TWEEPY_TOPIC',
我有一个包含一个索引的数据库表,其中keyname是PRIMARY,Type是BTREE,Unique是YES,Packed是NO,Column是ID,Cardinality是728,排序规则是A。下面是删除重复项的脚本部分:
// Removes Duplicates from the MySQL Database Table based on 'Entry_Date'