文章/答案/技术大牛

发布

社区首页 >问答首页 >我需要将HTML格式的国家/地区列表解析为SQL插入。有没有更简单的方法来做这件事？

问我需要将HTML格式的国家/地区列表解析为SQL插入。有没有更简单的方法来做这件事？
EN

Stack Overflow用户

提问于 2009-03-16 12:01:09

回答 9查看 921关注 0票数 0

大约有2000行这样的代码，所以手动操作可能比找出一种编程的方法需要更多的工作。它只需要工作一次，所以我不关心性能或任何事情。

<tr><td>Canada (CA)</td><td>Alberta (AB)</td></tr>
<tr><td>Canada (CA)</td><td>British Columbia (BC)</td></tr>
<tr><td>Canada (CA)</td><td>Manitoba (MB)</td></tr>

基本上它的格式是这样的，我需要将它分为4个部分，国家名称，国家缩写，部门名称和部门缩写。

为了保持我的完全缺乏效率，我计划在分解HTML标记后对它们执行一次string.Replace，然后找到左方括号的索引，并抓取剩余的空格分隔字符串。然后我意识到我没有办法跟踪哪个是国家，哪个是分区，以及如何按国家进行分组。

那么有没有更好的方法来做到这一点呢？或者更好的是，用国家和省/州填充数据库的一种更简单的方法？我环顾四周，我找到的唯一现成的数据库没有提供国家或省/州的全名，也没有使用IP而不是地理名称。

database

parsing

回答 9

Stack Overflow用户

回答已采纳

发布于 2009-03-16 12:03:44

将其粘贴到电子表格中。某些电子表格会为您分析HTML表。
将其另存为.CSV文件并以此方式进行处理。或。在电子表格中添加一个类似以下内容的列：

=“插入到国家(代码，名称) VALUES=('”& A1 & "'，'“& B1 & "');"

然后您就有了一列可以剪切、粘贴和执行的INSERT语句。

编辑

在粘贴到电子表格中时，请确保包含<table>标签。

<table><tr><th>country</th><th>name></th></tr>
<tr><td>Canada (CA)</td><td>Alberta (AB)</td></tr>
<tr><td>Canada (CA)</td><td>British Columbia (BC)</td></tr>
<tr><td>Canada (CA)</td><td>Manitoba (MB)</td></tr>
</table>

处理CSV文件几乎不需要解析。它有引号和逗号。比XML/HTML更容易使用。

票数 4

Stack Overflow用户

发布于 2009-03-16 12:16:38

/<tr><td>([^\s]+)\s\(([^\)])\)<\/td><td>([^\s]+)\s\(([^\)])\)<\/td><\/tr>/

那么您应该有4个捕获，其中包含来自任何PCRE引擎的4个数据片段:)

或者，像http://jacksleight.com/assets/blog/really-shiny/scripts/table-extractor.txt这样的东西提供了更多的完整性。

票数 2

Stack Overflow用户

发布于 2009-03-16 12:06:15

听起来像是Regex很容易解决的问题。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/651947

复制

「R」ggplot2在R包开发中的使用

https 网络安全编程算法腾讯云测试服务

没有特别系统的学习 tidy evaluation 这方面的高级操作，最近有空准备补一补，学习下这方面的知识。

王诗翔呀

2022/03/30

6.7K0

集成光路中的光栅

硬件开发

所谓光栅，就是通过一定的微加工手段，使得材料的折射率满足一定的分布，从而实现对光操控的一类光器件。典型的光栅结构，示意图如下，

光学小豆芽

2020/08/14

2.3K0

对SVG动画进行异步懒光栅化处理 [每日前端夜话(0x17)]

https canvas 网络安全 svg

在转换 SVG 图像时，浏览器会试着在每一帧上进行渲染，以便使图像尽可能的清晰。不幸的是，SVG渲染可能会很慢，特别是对于较大的图像。

疯狂的技术宅

2019/03/27

1.3K0

光栅图形学的中的算法

编程算法

——对《计算机图形学基础教程》胡事民等著的补充

种花家的奋斗兔

2020/11/13

1.2K0

网页光栅化_光栅净化

https 网络安全 c++

资料：https://blog.csdn.net/luoshengyang/article/details/51348829

全栈程序员站长

2022/11/01

2440

在Exce中使用带有动态数组公式的切片器

函数连接数据数组统计

Excel中，有一些特别的函数仅计算可见行，例如SUBTOTAL函数和AGGREGATE函数。本文示例使用SUBTOTAL函数。

fanjy

2023/08/29

5160

原在PostgreSQL中秒级完成大表添加带有not null属性并带有default值的实验

postgresql linux gcc

近期同事在讨论如何在PostgreSQL中一张大表，添加一个带有not null属性的，且具有缺省值的字段，并且要求在秒级完成。因为此，有了以下的实验记录：首先我们是在PostgreSQL 10下做的实验： postgres=# select version(); version ---------------

王果壳

2018/05/17

8.2K0

sql中带有like时如何使用预编译。

java

Java代码如下： String str = "长江"; Connection conn = null; //比较preparestatement和statement PreparedStatem

geekfly

2022/05/06

9730

在zabbix中实现发送带有图片的邮件和微信告警

微信 python 企业 zabbix

可以手动触发一个报警测试效果，手机上就可以收到带图的报警了，点击消息之后的页面也可以看到历史的图片

没有故事的陈师傅

2019/11/10

2.4K0

GPX数据在mapboxGL中轨迹动画

javascript

喜欢跑步的人都会选择一款APP来自己跑步的，常用的有keep、悦跑圈、华为健康等等，每次跑完步，会根据跑步的轨迹绘制轨迹动画。今天咱们讲讲技术，不扯淡，讲一下在mapboxGL中如何实现类似的效果。

牛老师讲GIS

2020/06/08

2K0

光栅化[通俗易懂]

https java 网络安全

定义一个宽高比（Aspect Ratio）；还有垂直可视角度 vertical field-of-view (fovY) 。垂直可视角度即从相机原点到上顶中点和下底中点的连线的夹角，可视角度大可以类比成广角相机，它张得就比较开，适合拍近距离的物体；可视角度小，透视投影就越不明显，越像正交投影，就很容易能拍到远处的物体。水平可视角度可以类比。

全栈程序员站长

2022/09/06

1.2K0

带有CSS3的动画3D条形图

css

关于如何使用CSS创建动画三维条形图的教程。这一切都是从一个小实验开始的，这个实验受到了来自Nettuts +的教程的启发，它展示了如何使用CSS，图像和JavaScript将3D条形图嵌入到HTML页面中。在阅读完教程之后，我挑战自己将这个想法变成纯粹的CSS，看看我能做多少。最初的挑战是创造一个经典的半透明的6方框3D盒子。最后的挑战是创建一个完整的三维条形图，我们将在本教程中创建。你可以看看我以前做过这里。请注意：本教程的结果只能在支持相应CSS属性的浏览器中按预期方式工作。我们写下一些关

企鹅号小编

2018/01/15

8800

在vscode中配置R的开发环境

ide 编程算法 windows

有时候各位使用R的用户不知道会不会有这样的感觉，visual studio和Rstudio由于负载过重，在打开或者加载R script时会出现加载过慢的情况，但对于很多数据工作者来说，variable inspector和data view这类的数据可视化功能必不可少，而visual studio和Rstudio在这方面做得可以说是非常完善。在这时候笔者就想到了visual studio code，毕竟作为宇宙最强IDE的减配和开源版本（这里形容可能不太准确），各种语言相应的开发插件众多。更加让笔者惊喜的是，目前vscode-R一直处于开发阶段，并且在最近的1.2.0版本结合了vscode关于web view的API，添加了R session watcher——一个集成的数据可视化构架，并且在1.21中完善了windows系统下的extension的bug。我们来看看集成的viewer会有什么样的效果：

用户7652506

2020/08/12

11.8K0

光栅化 (Rasterization)

编程算法 java https 网络安全

上一篇文章讨论了如何在多边形的某一点上分配光强度值，这里主要讨论如何为多边形确定实际的像素，即在栅格屏幕上的对应位置，这个过程称为光栅化(Rasterization)或者扫描转换 (Scan conversion)。

全栈程序员站长

2022/09/20

6800

通过在线平面图网站设计漂亮的平面图

https 网络安全 html

平面图，又称图则，是建筑物工程图的组成部分。当测区面积不大，半径小于10公里（甚至25公里）时，可以用水平面代替水准面。在这个前提下，可以把测区内的地面景物沿铅垂线方向投影到平面上，按规定的符号和比例缩小而构成相似图形，即为平面图。平面图以比例图绘制，表现该建筑物内的客厅、房间、空间及其它硬件的分布，其中包括主力墙、出入口、窗的位置图。

用户5442762

2019/06/10

12K0

使用带有MySQL Router的Replica Set

sql 数据库云数据库 SQL Server

您可以使用MySQL Router 8.0.19和更高版本对replica set进行引导，就像可以引导InnoDB cluster一样,将MySQL路由器与InnoDB Cluster结合使用”。生成的MySQL路由器配置文件的唯一区别是添加了cluster_type选项。将MySQL路由器引导到副本集时，生成的配置文件包括：

卖菜小弟

2020/01/22

2K0

Python在tkinter界面中显示matplotlib动画

matplotlib tkinter

在tkinter应用程序界面中同时显示matplotlib绘制的动态折线图、动态散点图和动态柱状图。

Python小屋屋主

2020/02/23

5K0

点击加载更多

相似问题

平面图动画R中的图像标签

将坐标更改为R中具有多层的一系列光栅

光栅R

在R中输出光栅层

如何使用r中的光栅包在光栅中显示所有列名

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问我需要将HTML格式的国家/地区列表解析为SQL插入。有没有更简单的方法来做这件事？
EN

回答 9

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

平面图动画R中的图像标签

将坐标更改为R中具有多层的一系列光栅

光栅R

在R中输出光栅层

如何使用r中的光栅包在光栅中显示所有列名

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问我需要将HTML格式的国家/地区列表解析为SQL插入。有没有更简单的方法来做这件事？EN

回答 9

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

平面图动画R中的图像标签

将坐标更改为R中具有多层的一系列光栅

光栅R

在R中输出光栅层

如何使用r中的光栅包在光栅中显示所有列名

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问我需要将HTML格式的国家/地区列表解析为SQL插入。有没有更简单的方法来做这件事？
EN