我在将URL编码到URI时遇到了困难:
mUrl = "A string url that needs to be encoded for use in a new HttpGet()";
URL url = new URL(mUrl);
URI uri = new URI(url.getProtocol(), url.getAuthority(), url.getPath(),
url.getQuery(), null);
这不符合我对以下URL的期望:
传入字符串的:
http://m.bloomingdales.com/img?url=http%3A%2F%2Fimages.bloomingdales.com%2Fis%2Fimage%2FBLM%2Fproducts%2F3%2Foptimized%2F1140443_fpx.tif%3Fwid%3D52%26qlt%3D90%2C0%26layer%3Dcomp%26op_sharpen%3D0%26resMode%3Dsharp2%26op_usm%3D0.7%2C1.0%2C0.5%2C0%26fmt%3Djpeg&ttl=30d
的出现形式是:
http://m.bloomingdales.com/img?url=http%3A%2F%2Fimages.bloomingdales.com%2Fis%2Fimage%2FBLM%2Fproducts%2F3%2Foptimized%2F1140443_fpx.tif%3Fwid%3D52%26qlt%3D90%2C0%26layer%3Dcomp%26op_sharpen%3D0%26resMode%3Dsharp2%26op_usm%3D0.7%2C1.0%2C0.5%2C0%26fmt%3Djpeg&ttl=30d
已经坏了。例如,%3D
变成了%253D
--它似乎在对字符串中的%进行一些神秘的操作。
怎么回事我在这里做错什么了?
发布于 2011-02-01 02:13:39
首先将(已经转义的)字符串放入URL
类中。任何东西都逃不掉。然后,您将提取URL
的各个部分,这些部分无需任何进一步的处理就会返回它们(因此-自从您将它们放入其中时它们被转义后,它们仍然被转义)。最后,使用URI
类将部分放入multi-argument constructor类中。此构造函数指定为使用百分比编码URI组件。
因此,在这最后一步,例如,":
“变成"%3A
”(好的),"%3A
“变成"%253A
”(坏的)。由于您正在放入已经编码的URL*,所以您不希望再次对它们进行编码。
因此,single-argument constructor of URI
是你的朋友。它不转义任何东西,并要求您传递一个预转义字符串。因此,您根本不需要URL
:
mUrl = "A string url is already percent-encoded for use in a new HttpGet()";
URI uri = new URI(mUrl);
*唯一的问题是,如果您的URL有时不是百分比编码的,有时则是。那你就有更大的麻烦了。您需要决定您的程序是从始终被编码的URL开始,还是从需要编码的URL开始。
请注意,没有这样的事情,如一个完整的URL,而不是百分比编码。例如,您不能将完整的URL "http://example.com/bob&co
“转换成正确编码的URL "http://example.com/bob%26co
”--如何区分语法(不应该转义)和字符(哪个应该转义)?这就是为什么URI
的单参数形式要求字符串已经被转义。如果您有未转义的字符串,则需要在将它们插入完整的URL语法之前对它们进行百分比编码,这正是URI
的多参数构造函数帮助您完成的工作。
编辑:,我错过了原始代码丢弃片段的事实。如果您想要删除URL的片段(或任何其他部分),您可以像上面那样构造URI
,然后根据需要将所有部分提取出来(它们将被解码为常规字符串),然后将它们传递回URI
多参数构造函数(其中它们将被重新编码为URI组件):
uri = new URI(uri.getScheme(), uri.getUserInfo(), uri.getHost(), uri.getPort(),
uri.getPath(), uri.getQuery(), null) // Remove fragment
https://stackoverflow.com/questions/4858108
复制相似问题