好了,接下来是这样的:我正在开发一个Ruby应用程序,它将从网站获取数据,并将这些数据聚合到一个XML文件中。
我需要获取数据的网站没有任何可以使用的API,所以我唯一能想到的就是登录网站,按顺序加载包含我需要的数据的页面(在本例中是PM;我想将它们存档),然后解析返回的HTML。
问题是,我不知道有什么方法可以通过编程来模拟登录会话。
有没有人有什么建议,或者知道一些行之有效的方法,我可以使用这些方法成功地登录到https页面,然后使用登录时的临时cookie会话以编程方式从站点加载页面?它不一定是Ruby独有的解决方案--我只想知道如何才能真正做到这一点。如果它有帮助,这个网站就是一个使用微软的.NET Passport服务作为登录/会话机制的网站。
欢迎对此问题的任何意见。谢谢。
https://stackoverflow.com/questions/1733829
复制相似问题