我刚安装了Ruby..。我通常更喜欢C#,但我想为了网页设计而学习它。它正在工作;然后突然(在没有改变任何东西之后)停止工作-提供了错误。
下面是我的(Windows) CMD行的错误报告。下面是我试图运行的代码(它可能有语法错误。我仍然是Ruby的新手)。
Microsoft Windows [Version 6.3.9600]
(c) 2013 Microsoft Corporation. All rights reserved.
C:\Users\Alex>cd C:/Users/Alex/Desktop
C:\Users\Alex\Desktop>ruby r.rb
r
为了将数据导入到应用程序中,我必须解析一系列网页。每种类型的网页都提供相同类型的数据。问题是每个页面的HTML都不同,因此数据的位置也不同。另一个问题是HTML代码的格式很差,因此不可能使用类似XML的解析器。
到目前为止,我能想到的最好的策略是为每种页面定义一个模板,比如:
模板A:
<html>
...
<tr><td>Table column that is missing a td
<td> Another table column</td></tr>
<tr><td>
我有以下代码(doop.py),它剥离了.html文件中所有“无意义”的html脚本,只输出“人类可读”的文本;它将接受一个包含以下内容的文件:
<html>
<body>
<a href="http://www.w3schools.com">
This is a link</a>
</body>
</html>
并给予
$ ./doop.py
File name: htmlexample.html
This is a link
我需要做的下一件事是添加一个函数,如果文件中的任何html参数表示URL