首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

2017,那些出现在日记的人:简单文本挖掘

胡言乱语了许多,其实打算研究日记里出现的人名,也是因为想学习和应用一些文本分析和挖掘方法,根据看过文章来实践操作下,而日记是现成语料库,也是最熟悉不过文本,因此有了这样一篇文章。...二、提取人名 首先为了获取文本中出现的人名,根据这篇文章《从天龙八部小说衍生出google语义分析与gephi社交网络》里提供思路,用jieba中文分词Python库尝试从日记文本中提取出TF/IDF...引用一段对共现网络基本原理介绍:“实体间共现是一种基于统计信息提取。关系紧密的人物往往会在文本多段内同时出现,可以通过识别文本已确定实体(人名),计算不同实体共同出现次数和比率。...将数据导入gephi软件: ? 调整节点大小和颜色,并运行布局算法: ? 加上标签,比词云图能看到更多人物姓名: ?...一顿瞎操作,聚焦到文本中人物关系比较接近与频繁部分,主要节点有鲁迅、叶嘉莹、黛玉等等: ? 整个网络中最重要一条脉络如下图所示: ?

38920
您找到你想要的搜索结果了吗?
是的
没有找到

VBA小技巧14:拆分带有换行单元格文本

学习Excel技术,关注微信公众号: excelperfect 在Excel,我们可以使用“分列”功能(即“文本到列”),很容易地将单元格带有特定分隔符文本拆分到不同。...但是,对于使用组合键换行文本,不能够使用这个功能。例如,下图1所示单元格数据,想要将其拆分到不同,“分列”功能对其无效。...下面的VBA代码将当前单元格以换行符分隔文本拆分到其相邻单元格,如下图2所示。...图2 代码如下: Sub SplitText() '拆分当前单元格中使用换行符分隔文本 Dim varSplit As Variant Dim lngTotal As Long...首先,使用Chr(10)作为分隔符拆分当前单元格内容。

3.9K30

使用 Python 和 Tesseract 进行图像文本识别

引言 在日常工作和生活,我们经常遇到需要从图片中提取文本信息场景。比如,我们可能需要从截图、扫描文件或者某些图形界面获取文本数据。手动输入这些数据不仅费时费力,还容易出错。...本文将介绍如何使用 Python 语言和 Tesseract OCR 引擎来进行图像文本识别。...pip install Pillow pip install pytesseract 代码示例 下面是一个简单代码示例,演示如何使用这些库进行图像文本识别。...总结 通过这篇文章,我们学习了如何使用 Python 和 Tesseract 进行图像文本识别。这项技术不仅应用广泛,而且实现起来也相对简单。...希望本文能帮助大家在实际工作更高效地处理图像文本数据。

59730

控制图像文字!AIGC应用子方向 之 图像场景文本编辑与生成

该模型利用渲染素描图像作为先验,从而唤醒了预训练扩散模型潜在多语言生成能力。基于观察生成图像交叉注意力图对对象放置影响,在交叉注意力层引入了局部注意力约束来解决场景文本不合理定位问题。...(STE)旨在替换图像文本,并保留原始文本背景和样式。...为解决这个挑战,本文提出一个三阶段框架,用于在文本图像之间迁移文本。首先,引入一个文本交换网络,它可以无缝地将原始文本替换为期望文本。随后,将背景修复网络纳入到框架。...为验证所提出方法有效性,全面探索了基于ViTSTR编解码器架构、预训练和可扩展性。实验结果表明,带有SegMIMViTEraser在STR上取得了相当大性能。...其中一些研究提出从学习中生成场景文本图像;然而,由于缺乏合适训练数据集,已经探索了无监督框架以从现有的现实世界数据中学习,这可能不会产生稳健性能。

24810

无惧图像文字,TextDiffuser提供更高质量文本渲染

现有 sota 文生图模型生成文本信息可读性较差 经过调研,学术界在这方面的研究较少。事实上,包含文本图像在日常生活十分常见,例如海报、书籍封面和路牌等。...TextDiffuser框架图 模型接受一段文本 Prompt,然后根据 Prompt 关键词确定每个关键词 Layout(也就是坐标框)。...在这个过程,还可以利用 Pillow 现成 API 得到每个字符坐标框,相当于得到了字符级别的 Box-level segmentation mask。...除此之外,他们设置文本区域大于 10%,设置这个规则是为了让文本区域在图像比重不要太小。...例如下图所示,在 Whole-Image Generation 任务,本文方法生成图像具有更加清晰可读文本,并且文本区域与背景区域融合程度较高。

25130

论文推荐 | 很可能出现在下一代PS深度门卷积图像补全技术

欢迎大家前往社区论文板块查阅喔~ ai.yanxishe.com/page/paper (戳文末阅读原文直接进) Free-Form Image Inpainting with Gated Convolution (很可能出现在下一代...PS深度门卷积图像补全技术) Yu Jiahui /Lin Zhe /Yang Jimei /Shen Xiaohui /Lu Xin /Huang Thomas S....说到底这实际上是一种图像内容填充任务——选出图像不需要内容所在区域,然后根据照片中周边物体对这个区域进行填充;如果填充出了好效果,自然就好像选出那些内容“本来就不存在”一样了。...PhotoShop 出品方 Adobe 公司自然知道这种任务是用户核心需求之一,自己也在这方面做着研发工作。没有深度学习时候,自动方法总是差强人意,有深度学习之后大可以追求更高目标。...这篇UIUC和Adobe合作论文就展现了他们在这方面的最新成果——就像我们预想那样,选出(用颜色遮蔽)图像任意大小、任意形状区域,算法就可以自动进行填充。

81920

HTML页面

body 元素包含文档所有内容(比如文本、超链接、图像、表格和列表等等。) 它会直接在页面显示出来,也就是用户可以直观看到内容。 <!...:设置水平线颜色 width:设置水平线宽度 size:设置水平线高度 align:设置水平线对齐方式(默认居中),可取值left|right 图片 标签定义 HTML 页面图像...width:规定图像宽度 height:规定图像高度 title:鼠标悬停在图片上给予提示 图片路径支持:绝对路径,相对路径,网络路径 超链接 HTML使用标签 来设置超文本链接 超链接可以是一个字...,一个词,或者一组词,也可以是一幅图像,您可以点击这些内容来跳转到新文档 链接文本 在标签 中使用了href属性来描述链接地址 默认情况下,链接将以,以下形式出现在浏览器...访问过链接显示为紫色并带有下划线。 点击链接时,链接显示为红色并带有下划线。

23360

理解 Css 布局和 BFC

块格式化上下文(BFC)行为通过一个简单float示例很容易理解。在下面的示例,我有一个框,其中包含向左浮动图像和一些文本。...float示例 如果我删除了一些文本,那么就没有足够内容来包围图像,而且由于浮动被从文档流脱离,所以边框会上升,并在图像下方,直到文本高度。 ?...删除一些文本 这是因为当我们浮动一个元素时,文本所在宽度保持不变,为给浮动元素腾出空间而缩短文本行框。这就是为什么背景和边框会出现在浮动后面的原因。 我们通常有两种方法来解决这个布局问题。... I am text 带有 float 类项被向左浮动,因此 div 文本在它环绕 float 之后。 ?...带有 float 类项 我可以通过将包裹文本 div 设置为 BFC 来防止这种包裹行为。 .text { overflow: auto; } ?

1.4K00

理解 CSS 布局和 BFC

块格式化上下文(BFC)行为通过一个简单float示例很容易理解。在下面的示例,我有一个框,其中包含向左浮动图像和一些文本。...如果我们有足够多文本,它会环绕浮动图像和边框,然后环绕整个区域。...如果我删除了一些文本,那么就没有足够内容来包围图像,而且由于浮动被从文档流脱离,所以边框会上升,并在图像下方,直到文本高度。 ?...这是因为当我们浮动一个元素时,文本所在宽度保持不变,为给浮动元素腾出空间而缩短文本行框。这就是为什么背景和边框会出现在浮动后面的原因。 我们通常有两种方法来解决这个布局问题。... I am text 带有 float 类项被向左浮动,因此 div 文本在它环绕 float 之后。 ?

1.1K00

CSS

Content(内容) - 盒子内容,显示文本图像。 <!...如果图像是右浮动,下面的文本流将环绕在它左边: ? 如果你把几个浮动元素放到一起,如果有空间的话,它们将彼此相邻。 在这里,我们对图片廊使用 float 属性: ?...元素浮动之后,周围元素会重新排列,为了避免这种情况,使用 clear 属性。 clear 属性指定元素两侧不能出现浮动元素。 使用 clear 属性往文本添加图片廊: ? ?...他们也有不同工作方式,这取决于定位方法。 static 定位 HTML元素默认值,即没有定位,元素出现在正常。...静态定位元素不会受到 top, bottom, left, right影响。 fixed 定位 元素位置相对于浏览器窗口是固定位置。 即使窗口是滚动它也不会移动: ?

1.4K60

一文剖析HTML块和内联元素以及DIV容器,运维开发必备前端技能,基本功强化训练。

本篇和大家一起巩固html块元素和内联元素以及DIV容器。 块元素 块元素特点是啥?块级元素在浏览器显示时,通常会以新行来开始(和结束),块级元素只能出现在body元素内。...htmldiv元素就是块元素,我们看看下面的例子: <!...该标签用于组合 HTML 表格表注内容 无序列表 定义视频,比如电影片段或其他视频流 内联元素 那内联元素有啥特点呢?内联元素在显示时通常不会以新行开始。... 定义强调文本 定义斜体字 定义图像 定义输入控件 定义键盘文本 定义 input 元素标注 定义图像映射 定义打字机文本,注意了,在HTML5不支持哦,可以使用CSS代替 定义文本变量部分 典型HTML块元素DIV容器 div容器到底是什么鬼?

70510

CSS混合模式,制作高级特效必备技巧 进入mix-Blend-Mode

根据维基百科: 数字图像编辑和计算机图形混合模式(或混合模式)用于确定两个图层如何相互混合。在大多数应用程序,默认混合模式只是通过用顶层内容覆盖底层来隐藏底层。...HTML Blend Me CSS 为文本元素添加了mix-blend-mode: overlay,从而将其与圆混合。...在此示例,我想探讨文本如何与树叶背景融合。 由于图像包含暗点和亮点,因此在使文本看起来像在每片叶子下移动一样,这将起到非常有用作用。 ?...带有SVG图形文本 个有趣效果是在带有矢量和形状背景上有一个标题。 当形状颜色不同时,它会变得更加有趣。 ? 我们能用这些斑点形状做什么?我使用MorphSVG插件改变每个博客形状路径。...如你所见,文本“ CSS很棒”仅在其父代边界内融合。 外面的东西不会混在一起。 换句话说,它是孤立

3.1K30

CSS 伪元素一些罕见用例

注意以下GIF位置:.hero部分position: relative是如何影响伪元素。 ?...此外,它还可以用于扩展卡片组件可点击区域,该组件具有查看更多链接功能。请注意,文章内容(如标题和图像)将位于伪元素之上,因此它不会影响文本选择或图像保存。 ?...叠加层 假设有一个带有背景图像元素,并且设计中有一个渐变叠加层,并且混合模式设置为color,伪元素可以帮到你。 ?...原因是,使用:before时,该元素不会出现在其他同级项上方,而当元素为:after时,它将出现在其他同级项之上。 事例源码:https://codepen.io/shadeed/pe......在此示例,存在带有“or”分隔符。 在每一侧都有一条线。 使用伪元素和 Flexbox 可以做到这一点。

79640

分享10个超实用高级 CSS 技巧

在下面的示例,我使用 attr() 函数使用其 data-value 属性来显示 span HTML 元素 ::after 伪类文本内容。... Toffees 4.仅使用CSS去除图像背景 为此,我们可以使用 mix-blend-mode CSS 属性。...我将仅使用 CSS 删除图像背景,而不使用任何图像编辑软件。 要从彩色图像删除白色背景,你可以使用带有值乘 mix-blend-mode CSS 属性。...两个图层颜色通过乘以它们值来混合,从而产生更暗且更混合外观。当从彩色图像删除白色背景时,这非常有用,因为白色部分变得透明,显示下面的背景。虽然这会使图像有点暗。....blend-multiply{ mix-blend-mode:multiply; } 要从黑色图像删除白色背景,你可以使用带有值 color-burn mix-blend-mode CSS

11010

广告行业那些趣事系列55:文本图像领域大一统UNIMO模型详解

举例说明,对于下图中问答任务来说,根据图像内容来回答给定问题,通过单模文本语料数据(比如wikipedia)额外提供知识可以大大提升模型在问答任务效果。...UNIMO为了提升CMCL正负例质量,主要使用了文本改写和文本/图像检索两种策略: (1)文本改写 为了增加CMCL中正负例质量,UNIMO将图片描述从语句、短语和词三个粒度进行改写。...2)文本/图像检索 为了进一步增加CMCL正负例质量,UNIMO从海量单模数据检索相似文本或者图像,从而组成弱相关文本-图像对数据用于对比学习,通过这种方式可以增加大量训练语料。...(1)视觉学习 UNIMO视觉学习和BERTMLM任务一致,将多个兴趣区域图像随机进行掩码操作,使用未被掩码图像区域去还原被掩码图像。...UNIMO在单模任务模型效果 下面通过可视化展示了UNIMO模型在文本图像检索任务模型效果,可以看出UNIMO相比于baseline来说对于细节把握和理解更加出色: 图6 UNIMO模型在文本图像检索任务模型效果

60250
领券