首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

预训练再次跨界!百度提出ERNIE-GeoL,地理位置-语言联合预训练!

例如,在地图POI搜索引擎中,当用户输入一个query时,除了文本和语义匹配,候选POI的位置,以及它与用户当前所在位置的距离,都是非常重要的排序特征。...而在进行“地理位置-语言”预训练时,主要目标是学习一个地理实体(如“POI-ID1”)的文本属性(如该POI名称“北京西站”、POI地址“北京市丰台区莲花池东路118号”)与其对应地理坐标(该POI的经纬度...该任务的输入为目标POI(下图中红色文字描述的POI)的不同文本描述(下图中黑框白底矩形中的文本),输出则为模型预测出的地理坐标。...后台回复【五件套】 下载二:南大模式识别PPT  后台回复【南大模式识别】 ---- 投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。...方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。 记得备注呦 整理不易,还望给个在看!

88720

大厂技术实现 | 图像检索及其在高德的应用 @计算机视觉系列

图片3)文本依赖性POI 牌匾还有一个独有特性就是对文本强依赖,主要是对 POI 名称文本的依赖。在该场景下,希望两个牌匾不要匹配。这就需要引入文本特征来增强特征区分性。...『视觉分支』的输入是 POI 牌匾的图像信息,使用双分支进行特征提取;『文本分支』的输入是 POI 牌匾的文本信息,使用BERT进行特征提取。...针对文本信息,使用BERT对牌匾的 OCR 结果进行编码,将其作为辅助特征,并与视觉特征融合后进行度量学习。...4.3 文本特征POI 牌匾对文本强依赖,可能存在『仅牌匾名称文本发生变化』的场景。...图片一个优化方向是,通过 Transformer 对图像 Patch 的相关性建模来解决 POI 牌匾在遮挡/截断场景下的匹配效果,并通过对文本特征编码来实现多模特征的融合。

1K22
您找到你想要的搜索结果了吗?
是的
没有找到

Java Apache POI 打印Word文档工具(含文本替换,动态表格功能)

[实用]【更新中】Java Apache POI 打印Word文档工具(含文本替换,动态表格功能) 基于Apache POI对Word进行操作 一、基于Apache POI封装的word文档工具V1.0...) 图片插入 后期可能扩展的方向文本 本工具与网上其他POI打印工具类对比 特点: 文本替换可以灵活的在word文档的任意位置,并且不会受到左右其他文字的影响(网上绝大部分,只是简单封装POI,实际上他们的文本替换需要占据一整行...占位符的约定规则 段落文本替换:@${t_*}@ 静态表格(文本替换): ${at_static_*} 静态文档里面需要文本替换的地方,使用@${t_*}@ 动态表格(行动态): ${at_row...,任何表格除非不需要替换内容,否则都需要在原表格的上方增加一行,并在第一行第一列设置表格名(打印时,第一行会被去掉) 普通文本:@${t_*}@ 是替换文本的内容,这几个字符都必须使用相同的样式,并且他的样式决定了打印后文本替换的样式...,可以是任意字符) (1) 文本替换,使用@${t_*}@的方式(其中两边的@,需要独占一种样式) PS : 两边的@是必不可少的,并且需要使用一种与周围字符样式不同的样式。

3.2K10

美团点评旅游搜索召回策略的演进

问题分析:对问题进行梳理分类,比如无供给问题、误召回问题、意图识别问题、POI排序问题、展示问题等,找出主要问题并明确优化方向。...最后通过离线训练生成模型供线上使用,对用户输入的Query,模型会输出分词后每个Term的tag。...模型方面采用XGBoost进行训练,离线生成模型后供线上使用。 ?...全字段召回 随着粗排序和Rerank的改进优化上线,我们放开了POI类聚检索字段的限制,改为使用所有字段做文本匹配,包括POI城市、名称、品类、商圈,简化了二次召回的逻辑。...由于所有POI文本字段中都不包含“著名”,一次召回无结果,因此扩大POI范围,在无合作POI集合中进行二次检索。

3.3K121

poi-tl实现对Word模板中复杂表格的数据填充

文章目录 前言 what poi-tl why poi-tl How poi-tl 1. 版本问题 2. 集成和使用 3....我们一般可能会倾向于使用 poi 进行操作. 但poi操作比较复杂, 所以就在寻找一种可以快速将内容填充到表格中的工具. 而pot-tl 恰好满足了我们这一需求....what poi-tl poi-tl(poi template language)是Word模板引擎,使用Word模板和数据创建很棒的Word文档....POI Java跨平台 Apache项目,封装了常见的文档操作,也可以操作底层XML结构 文档不全,这里有一个教程:Apache POI Word快速入门 Freemarker XML跨平台 仅支持文本...根据poi-tl 可以操作含有多种类型的复杂 Word 文档, 包括:文本, 表格, 图片, 附件. markdown等.

8.3K20

Java实现word文档在线预览,读取office(word,excel,ppt)文件

想要实现word或者其他office文件的在线预览,大部分都是用的两种方式,一种是使用openoffice转换之后再通过其他插件预览,还有一种方式就是通过POI读取内容然后预览。...coc2HtmlUtil.file2pdf(fileInputStream, "D:/poi-test/openOffice/docx","docx");*/ } } 三、使用poi读取word...* //p1.setIndentationHanging(400);//---首行前进,指定的缩进量,应通过第一行回到开始的文本流的方向上移动缩进从父段的第一行中删除。...* //p1.setIndentationLeft(400);//---整段缩进(右移)指定应为从左到右段,该段的内容的左边的缘和这一段文字左边的距和右边文本边距和左段权中的那段文本的右边缘之间的缩进,...* //p1.setIndentationRight(400);//---指定应放置这一段,该段的内容从左到右段的右边缘的正确文本边距和右边文本边距和左段权中的那段文本的右边缘之间的缩进,

37.5K91

基于机器学习方法的POI品类推荐算法

如何使用这些已校准的POI数据,挖掘出有价值的信息,本文进行了一些尝试:利用机器学习方法,自动标注缺失品类的POI数据。例如,门店名称为“好再来牛肉拉面馆”的POI将自动标注“小吃”品类。...POI名称字段属于文本特征,传统的文本表示方法是基于向量空间模型(VSM模型)[1]: ? 空间向量模型需要一个“字典”,这个字典可以在样本中产生,也可以从外部导入。...考虑到一般的POI名称都属于短文本,本文采用BOOL权重。...本文使用统计机器学习方法,辅助规则方法的特征选择算法,挑选有利于判断POI品类的特征词。...本文需要解决的是POI名称字段短文本的自动分类问题,POI名称字段一般符合这样的规则,POI名称 = 名称核心词 + 品类词。

2.6K50

基于机器学习方法的POI品类推荐算法

如何使用这些已校准的POI数据,挖掘出有价值的信息,本文进行了一些尝试:利用机器学习方法,自动标注缺失品类的POI数据。例如,门店名称为“好再来牛肉拉面馆”的POI将自动标注“小吃”品类。 ?...POI名称字段属于文本特征,传统的文本表示方法是基于向量空间模型(VSM模型)[1]: ? 空间向量模型需要一个“字典”,这个字典可以在样本中产生,也可以从外部导入。...考虑到一般的POI名称都属于短文本,本文采用BOOL权重。...本文使用统计机器学习方法,辅助规则方法的特征选择算法,挑选有利于判断POI品类的特征词。...本文需要解决的是POI名称字段短文本的自动分类问题,POI名称字段一般符合这样的规则,POI名称 = 名称核心词 + 品类词。

1.5K70

学废了系列 - WebGIS vs WebGL图形编程

这是符合现实规律的一种方法,就好比我想找一家便利店,最远不能超过步行30分钟,然后我就从当前位置开始沿着路走啊走,遇到路口就随机选一个方向接着走,运气好的话选的路边有家店,运气不好的话只能回到路口再随机选一个方向试着找找...图中有两个POI点:微电子与纳电子学系(下文简称POI点A)和超导量子信息处理实验室(下文简称POI点B),每个点都有图标和文本两部分,点A和点B的文本都位于图标的下方。...仍然以上图为例,假设点A的权重高于点B: 先渲染点A,图标必须渲染出来; (伪)随机选一个方位放置文本,图中选的是图标下方; 渲染点B,点B的图标与点A的图标和文本都不冲突,正常渲染; 渲染点B的文本,...可选四个方位-上下左右(复杂情况下可选八个方位),使用R-Tree描述文本的矩形盒子,检测发现上左右都会与点A的文本发生位置冲突,只有下方可行。...以上便是使用R-Tree进行位置冲突检测的简易流程。除了POI位置检测以外,绘图中R-Tree另一个使用场景是道路名称的位置标注算法,如下图中的「双清路」「荷清路」文本: ?

1.8K20

干货 | Siri 语音识别的小心机:你在哪里,就能更准确地识别那附近的地址

在我们的类语言模型框架中,主语言模型如其它的类语言模型一样被训练,训练使用文本来自于所有模型支持的领域。...为了提升对非终结符标签的支持,最初我们依赖于使用通过基于特定地理位置的模版认为创建的训练文本,例如「指向\CS-POI」,其中「\CS-POI」为类标签。...新的基于地理位置的语言模型的输出将使我们能够不断为主语言模型中的非终结符提供训练文本。 在基于地理位置的语言模型中,Slot 语言模型是用特定类的实体(POI)训练的。...每个slot语言模型的训练文本由相应区域的本地POI的名称组成。...数据 用来训练通用语言模型对比基线的训练文本(D1)包含从各种数据源收集到的、保密、实时使用的数据。

1.9K20

Android 使用 ApachePOI 组件读写 Word doc 和 docx 文件

由于项目中只是用到了doc和docx的组件,下面也只是介绍这两个组件的使用 一、在Android Studio中如何用POI组件 从POI官网上看,貌似暂并不支持IntelliJ IDE,如下图,所以这里我们采用直接下载...二、实现doc文件的读写 Apache POI中的HWPF模块是专门用来读取和生成doc格式的文件。在HWPF中,我们使用HWPFDocument来表示一个word doc文档。...使用POI从word doc文件读取数据时主要有两种方式:通过WordExtractor读和通过HWPFDocument读。...使用WordExtractor读 在使用WordExtractor读文件时我们只能读到文件的文本内容和基于文档的一些属性,至于文档内容的属性等是无法读到的。...之后我们就可以往HWPFDocument里面新增内容了,然后再把它写入到另外一个doc文件中,这样就相当于我们使用POI生成了word doc文件。

4.2K100

【论文阅读】Geography-Aware Sequential Location Recommendation

它不但可以提高用户体验,增加用户粘性,还能为商家带来潜在的商业利益,已成为推荐系统中最重要的研究方向之一。...POI 的位置信息对于描述 POI 之间的物理距离很重要,并且用户的移动历史通常表现出空间聚集现象。因此需要对位置的精确 GPS 位置进行编码; 稀疏性问题。...另外一方面,网格中不同位置的 POI 可能共享相同的 quadkey,而没有 POI 的网格在嵌入时直接忽略,因此在一定程度上解决了稀疏性问题。...它的基本思想是将文本里面的内容按照字节进行大小为 N 的滑动窗口操作,形成了长度是 N 的字节片段序列。...POI,LuL^uLu表示用户uuu访问的 POI 集合。

68420
领券