首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    nutch 0.7 plug-ins 详解

    最近桂林在关注nutch的进展状况,这里有几个重要的消息要和大家分享: 1、nutch 0.7 发布了; 2、nutch 的java源代码包路径改变成了org.apache... 3、yahoo也使用了nutch,并做了很多的工作。1 2 clustering-carrot2 :            一个搜索结果类聚的代码框架,目前和Egothor等搜  索引擎结合的很好;             地址:http://sourceforge.net/projects/carrot2              相关类:org.apache.nutch.clustering.OnlineClusterer                             Nutch Online Search Results Clustering Plugin                             org.apache.nutch.clustering.carrot2                             Carrot2 Clusterer creativecommons :            一个创作共用的工具集合。地址:http://creativecommons.org/ ;             相关类:                         org.apache.nutch.parse.HtmlParseFilter                         HTML Parse Filter                         org.apache.nutch.indexer.IndexingFilter                         Nutch Indexing Filter                         org.apache.nutch.searcher.QueryFilter                         Nutch Query Filter index-basic :                       相关类:                         org.apache.nutch.indexer.IndexingFilter                         Nutch Indexing Filter index-more : language-identifier : 语言检测工具;                          相关类:                            org.apache.nutch.analysis.lang.LanguageParser                            Nutch language Parser                            org.apache.nutch.analysis.lang                            Nutch language identifier filter                            org.apache.nutch.analysis.lang.LanguageQueryFilter                            Nutch Language Query Filter ontology : 一个概念话的规范,主要是针对人工智能的;                          相关类:                             org.apache.nutch.ontology.Ontology                             Ontology Model Loader parse-ext : parse-html : parse-js :     解析js文档 parse-msword : 解析msword文档 parse-pdf : 解析pdf文档                       相关类:                          org.apache.nutch.parse.pdf.PdfParser parse-rss : 解析Rss格式文档 parse-text : 解析text文档 protocol-file : protocol-ftp : protocol-http : protocol-httpclient : que

    04

    <input type=”file” />浏览时只显示指定文件类型

    1.accept=”application/msexcel” 2.accept=”application/msword” 3.accept=”application/pdf” 4.accept=”application/poscript” 5.accept=”application/rtf” 6.accept=”application/x-zip-compressed” 7.accept=”audio/basic” 8.accept=”audio/x-aiff” 9.accept=”audio/x-mpeg” 10.accept=”audio/x-pn/realaudio” 11.accept=”audio/x-waw” 12.accept=”image/gif” 13.accept=”image/jpeg” 14.accept=”image/tiff” 15.accept=”image/x-ms-bmp” 16.accept=”image/x-photo-cd” 17.accept=”image/x-png” 18.accept=”image/x-portablebitmap” 19.accept=”image/x-portable-greymap” 20.accept=”image/x-portable-pixmap” 21.accept=”image/x-rgb” 22.accept=”text/html” 23.accept=”text/plain” 24.accept=”video/quicktime” 25.accept=”video/x-mpeg2″ 26.accept=”video/x-msvideo”

    03

    对于response.setContentType(MIME)的解释

    response.setContentType(MIME)的作用是使客户端浏览器,区分不同种类的数据,并根据不同的MIME调用浏览器内不同的程序嵌入模块来处理相应的数据。 例如web浏览器就是通过MIME类型来判断文件是GIF图片。通过MIME类型来处理json字符串。 Tomcat的安装目录\conf\web.xml 中就定义了大量MIME类型 ,可以参考。 response.setContentType("text/html; charset=utf-8"); html .setContentType("text/plain; charset=utf-8"); 文本 text/javascript json数据 application/xml xml数据 这 个方法设置发送到客户端的响应的内容类型,此时响应还没有提交。给出的内容类型可以包括字符编码说明,例 如:text/html;charset=UTF-8.如果该方法在getWriter()方法被调用之前调用,那么响应的字符编码将仅从给出的内容类型 中设置。该方法如果在getWriter()方法被调用之后或者在被提交之后调用,将不会设置响应的字符编码,在使用http协议的情况中,该方法设 置 Content-type实体报头。 一般在Servlet中,习惯性的会首先设置请求以及响应的内容类型以及编码方式: response.setContentType("text/html;charset=UTF-8"); request.setCharacterEncoding("UTF-8"); response.setContentType()的String参数及对应类型 value="image/bmp">BMP value="image/gif">GIF value="image/jpeg">JPEG value="image/tiff">TIFF value="image/x-dcx">DCX value="image/x-pcx">PCX value="text/html">HTML value="text/plain">TXT value="text/xml">XML value="application/afp">AFP value="application/pdf">PDF value="application/rtf">RTF value="application/msword">MSWORD value="application/vnd.ms-excel">MSEXCEL value="application/vnd.ms-powerpoint">MSPOWERPOINT value="application/wordperfect5.1">WORDPERFECT value="application/vnd.lotus-wordpro">WORDPRO value="application/vnd.visio">VISIO value="application/vnd.framemaker">FRAMEMAKER value="application/vnd.lotus-1-2-3">LOTUS123 MIME映射策略就是在网页中使用哪个应用程序(即插件),打开哪种文件。另外还有使用权限问题。比如对PDF文档,用“application/pdf “策略。这在动态网页中很常见。出现这种现象,有两种情形:一是使用一个应用程序去打开它不能打开的文档,比如用在标签中定义“DWG”文档用 “application/pdf ”,就会出现无法打开的问题。二是文件扩展名符合要求,但文件内容(格式)不符合要求。你可以检查你浏览的网页源代码,获得出错信息。检查方法是:查看— 源文件。寻找类似于“application/pdf “的字符串,就可以看到,要打开的文件是否与应用程序匹配

    02

    response.setContentType()的作用及参数

    response.setContentType(MIME)的作用是使客户端浏览器,区分不同种类的数据,并根据不同的MIME调用浏览器内不同的程序嵌入模块来处理相应的数据。 例如web浏览器就是通过MIME类型来判断文件是GIF图片。通过MIME类型来处理json字符串。 Tomcat的安装目录\conf\web.xml 中就定义了大量MIME类型 ,可以参考。 response.setContentType(“text/html; charset=utf-8”); html .setContentType(“text/plain; charset=utf-8”); 文本 text/javascript json数据 application/xml xml数据 这 个方法设置发送到客户端的响应的内容类型,此时响应还没有提交。给出的内容类型可以包括字符编码说明,例 如:text/html;charset=UTF-8.如果该方法在getWriter()方法被调用之前调用,那么响应的字符编码将仅从给出的内容类型 中设置。该方法如果在getWriter()方法被调用之后或者在被提交之后调用,将不会设置响应的字符编码,在使用http协议的情况中,该方法设 置 Content-type实体报头。 一般在Servlet中,习惯性的会首先设置请求以及响应的内容类型以及编码方式: response.setContentType(“text/html;charset=UTF-8”); request.setCharacterEncoding(“UTF-8”);

    01

    扫码

    添加站长 进交流群

    领取专属 10元无门槛券

    手把手带您无忧上云

    扫码加入开发者社群

    相关资讯

    热门标签

    活动推荐

      运营活动

      活动名称
      广告关闭
      领券