首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

数据挖掘的方法很多,实用易懂的就这一种

大数据时代,我们把这样的网络叫关系网络,那么,如何从关系网络中挖掘出有价值的信息?以下为你一一道来。 什么是关系网关系网络有时也叫社会网络,是指社会参与者及其间的关系的集合。...关系网络分析方法 要分析关系网络,从了解一些基本概念开始。 1、“图”的概念 为方便计算机处理关系网络,在计算机理论中,把关系网络抽象为“图”的概念。...下图是《悲惨世界》人物关系,用PageRank为直径表示不同人物的重要性,可以看到,Valjean是其中的核心人物(主角)。 5、中介中心性 中介中心性在我们WonderDM中又称节点影响度。...下图是《悲惨世界》人物关系,用中介中心性为直径表示人物节点。可以看到,Fantine是其中的关键人物。 6、模块化 模块化(Modularity)是关系网络分析中用于分析网络结构的一种方法。...如下图所示,使用K-Core算法,我们在一个复杂的关系网络中,找到若干关联度比较高的客户群体。 小结 现在是万物互联的时代,可谓万物皆有关系,关系网络分析可以应用到几乎所有社会活动当中。

50730

达观桂洪冠:海量文本中挖掘人物关联关系核心技术介绍

人物关联关系挖掘包括通联关系挖掘、人物群体关系挖掘、关系网络关键节点发现以及关联网络关键路径发现。 ...基于构建的关系网络可以做以下统计分析挖掘:图3 多人物关系网络示意图01关键节点发现在构建的关系网络中,以用户为节点,通过PageRank算法量化不同粒度网络结构中不同主体的地位,发掘关系网络中的关键节点...02最短路径查找在构建的关系网络中,选中两个人物,发现两个人物间的最短路径,帮助分析人员快速了解人物间的关联性。03团体发现在构建的关系网络中,选中多个人物,发现多人物的亲密社区。...通过社区发现算法将整个网络中的人物划分成若干个群体。发现潜藏在关系网络中的未知的群体关系网络。...在关系网络的关系类型、层级、强度挖掘基础之上,将利用关联分析技术,协同发现未知群体关系网络,实现关键人物的检测和群体性事件的预警与速报。

63120

Python分析红楼梦,宝玉和十二钗的人物关系

出场率 由于我们只统计宝玉和十二钗(正册)这些人物,因此我们需要实现准备一个人物名单: ? 这个后面的nr是表示人物属性,方便分词工具jieba识别。...人物关系 我们采用共现的技术来建立人物关系,即一段文字中两个人物出现,则给这两个人物的联系记上一笔,若以后在其他语句中再出现,再加上一笔,以此类推,直到找到所有人物关系节点。...我们使用Python中Echarts将人物关系网画出来: ? 这里圆圈的大小代表人物出场的频率,通过将鼠标发在两个人物之间的边上面,可以显示人物之间关联的次数: ?...人物关系网大全 上面展示的分析仅仅是宝玉和十二钗之间的简单分析,并不能看到整个红楼梦的全貌,这里给大家分享一个人物关系网大全: https://grapheco.github.io/InteractiveGraph...在这里你可以看到红楼梦几乎所有人物和关键地点之间的联系。 用鼠标点击人物头像后会出现相关介绍: ? 也可以看到和其他人物之间的关系,和这个人物的主要事件: ?

2.2K30

Ps|文字人物海报

图1.2 素材 2 完成思路 我们可以看到文字人物海报的主要特点在于文字填充进人物轮廓,因此我们首先要制作人物的轮廓图(单一颜色);填充文字:一个一个的文字打在海报上,由于文字数量多且大小不一,会消耗大量时间...,因此可以将文字作为画笔的类型使用,最后要使文字绘出人物的轮廓,我们可以通过先填充文字再对人物使用剪贴蒙版;又或者直接在人物的蒙版内绘画。...3 操作步骤 3.1 插入人物图片并使用裁剪工具调整至合适大小 ? 图3.1 3.2 对当前图层使用阈值,并调整合适参数使人物轮廓清晰 ?...图3.2 3.3 使用色彩范围工具选取人物的选区,并新建图层,并在人物选区下填充黑色以新建人物图层 ? 图3.3 3.4 新建图层并在当前选区下新建蒙版 ?...图3.12 4 总结 本次教程基础原理十分简单,重点在于1.如何制作人物的轮廓;2.如何将文字填充进人物并保证人物的基本轮廓不变;3.线性光的图层混合模式的效果是什么。

1.5K20

干货分享:如何学习关系网络可视化?

这门课配有两个助教(研究领域皆是关系网络可视化),负责解决作业问题与其他课程需求。...这一系列的文章共有7篇(包括本篇),预计一周发一篇(求鞭策hhh),主要梳理了我在这门课学到的知识,从阅读文献到实际做一个关系网络可视化项目: 开篇简介 简要介绍关系网络可视化系列文章的内容。...在课堂的文献阅读中,可以很明显的了解,呈现关系网络可视化主要分成这两个阵营。...node-link(点线)可以呈现较多细节资讯,但容易使关系网络可视化变得很复杂;matrix(矩阵)可以大幅简化关系网络,并清楚呈现两两之间的关系,但同时也遗失了关系网络数据中的部分重要信息,像是无法呈现地理信息...对于我而言,这篇论文的特点在于列举的文献与数理相当具有逻辑,可以从这篇文章的文献综述去了解为何作者要提出一个新的关系网络可视化样式来解决问题;另外,文章中详细讲解一个新的关系网络可视化样式的设计过程以及如何设计实验来检测该可视化

1.5K60

文本挖掘分析《欢乐颂》到底谁和谁堪称好闺蜜、谁和谁又最为般配?

基于这个假设,我们先对原著小说进行文本分词,再将每个段落里出现的人物抓取出来,然后统计每组人物关系出现的频数,以得到我们关注的人物之间的关系网络。 上述分析思路中蕴含的最关键的技术点就是文本分词。...另外我们还将人物关系网络用更直观的网络关系图的形式展现出来,如下图所示: ? 从图上来看,安迪俨然是人生赢家啊,左拥右抱不说,还霸占着辣么多小姑娘,简直羡煞旁人。...在我们的分析中,设定这个参数等于3,即在第i段出现的某个人物,除了和本段的其他人物有关系外,也和i+1段和i+2段出现的人物有关系。...按照这种做法,最终我们得到关系密切程度排在前三名的3组人物关系如下: ? 安迪x樊胜美cp击败了安迪和小包总的官配,笔者不禁感叹,百合大法好! 画出的人物关系网络如下图所示: ?...于是在未来的分析中,可以考虑识别人物在小说中出现的位置,计算人物之间的距离,识别场景/事件里的主要人物和次要人物,以及他们之间的亲疏程度,赋予差异化的权重,从而更准确地反映人物关系的紧密程度。

94970
领券