使用Vertica和Parquet的最佳实践是什么
我的应用架构是: Kafka Topic (Avro Data)。Vertica DB。Vertica的调度程序使用来自Kafka的数据,并将其摄取到Vertica的托管表中。
假设我的Vertica的存储只有一个月的数据。据我所知,我可以使用parquet在HDFS上创建一个外部表,Vertica API也使我能够查询这些表。此场景的最佳实践是什么?我可以添加一些Vertica调度器来将数据从托管表复制到外部表(如parquet)。如何在Vertica中配置滚动数据( 30天前每天下架),谢谢。
https://stackoverflow.com/questions/56446115
复制相似问题