我试图使用GCP中的数据丢失预防工具来自动标记InfoTypes,如PhoneNumber、GCS中的数据和大查询外部表上的EmailId,这样我就可以在Dataplex和Dataplex中获得这些标记。现在的问题是
问题是,我对GCP的理解--数据目录集成只适用于内部大查询表吗?我在这里做错了什么,GCP文档也没有提到这些东西!
此外,在从DLP控制台配置检查作业时,我必须强制提供大查询表is,是否有一种方法可以针对BQ数据集或一组表运行DLP检查作业?
发布于 2022-04-07 19:07:48
关于数据丢失预防服务 in Google ,您的理解是正确的,不能通过复制到外部服务(例如,公共Google存储(GCS)桶或外部BigQuery表)对数据进行过滤。请访问此URL以获得更多参考。
现在,关于如何针对一组表运行DLP检查作业,有两种方法:
url =
String.format(
"jdbc:bigquery://https://www.googleapis.com/bigquery/v2:443;OAuthType=3;ProjectId=%s;",
projectId);
DataSource ds = new com.simba.googlebigquery.jdbc42.DataSource();
ds.setURL(url);
conn = ds.getConnection();
DatabaseMetaData databaseMetadata = conn.getMetaData();
ResultSet tablesResultSet =
databaseMetadata.getTables(conn.getCatalog(), null, "%", new String[]{"TABLE"});
while (tablesResultSet.next()) {
// Query your Table Data and call DLP Streaming API
}以下是此方法的教程。
client = bigquery.Client()
datasets = list(client.list_datasets(project=project_id))
if datasets:
for dataset in datasets:
tables = client.list_tables(dataset.dataset_id)
for table in tables:
# Create Inspect Job for table.table_id使用此线程获取更多参考,以了解针对一系列表运行DLP检查作业的情况。
https://stackoverflow.com/questions/71784598
复制相似问题