首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据治理领域最容易混淆的16组术语概念辨析

术语的作用就是统一术语概念的语境,保证人们在给定语境能够使用专门的语言进行精确的交流。术语概念只使用一个最贴切的业务术语表述,避免使用多个近义词引起歧义。...数据需求管理过程识别所需的数据,确定数据需求优 先级并以文档的方式对数据需求进行记录和管理。 3、数据设计和开发:是设计、实施数据解决方案,提供数据应用,持续满足公司的数据 需求的过程。...良好定义的业务术语标准和业务术语字典可以实现业务术语、元数据的追踪,方便数据治理人员查询使用。...通常在软件中实现,或者使用文档模板输入数据,如主数据,通常规定了主数据格式和允许的取值范围。 3、命名规范:是能够完整准确表述业务含义。名称符合、行业内的通用命名习惯。...在一个组织里,术语定义应由业务部门、数据管理部门共同参与制定,并以业务术语标准作为业务术语的载体,通过对业务术语标准的定期复审和修订,保持业务术语的准确性、即时性。

82020

GitHub中文帮助文档上线:统一术语翻译,Fork成“分叉”

新智元原创 来源:GitHub 编辑:鹏飞 【新智元导读】GitHub刚刚推出官方中文帮助文档,这是继日文版之后第二个非英语语种的帮助文档。...GitHub刚刚推出了官方中文帮助文档,这是继日文帮助文档之后,第二个非英语语种的帮助文档。GitHub希望借此来帮助中文开发者更好的理解GitHub操作规范,降低学习门槛。 ?...虽然之前也有不少第三方的汉化文档,但相比而言,微软官方推出的汉化文档无论在汉化程度还是标准程度方面,都是最佳的。 ? Repository:此前有人称其为仓库,有人翻译为版本库,有人则翻译成项目。...目前官方帮助文档中,已将其汉化为“GitHub 赞助者”。 ? 该计划显示,开发者参与的第一年里,GitHub将提供高达5000美元的捐助。...正在读本文的你,觉得汉化的帮助文档真的有帮助吗?习惯了英文,切回中文还习惯吗?欢迎留言评判。 参考链接: https://help.github.com/cn

1.5K30
您找到你想要的搜索结果了吗?
是的
没有找到

CTO也糊涂的常用术语:功能模块、业务架构、用户需求、文档

如果说“功能”和“模块”是模糊的,那么“功能模块”就是错误的,这个词混淆了系统外部和内部的区别,需求和设计的区别。 “功能”是系统对外提供的服务,“模块”是系统的内部结构。...术语03:用户需求 评价:“用户”属于模糊术语,“需求”属于明确术语,“用户需求”属于错误术语。 用户(User)。...图16 对餐馆流程的一种改进 (2)“用户”混淆了演员和观众。 我们先来看用例(Use Case)的一些概念。...“用户”这个词混淆了演员和观众的区别。过去经常说“找用户调研需求”,这是错误的。所谓“用户”,就是上台表演的人类演员。找用户调研,相当于找演员问剧本应该是什么内容,岂不是很荒谬?...术语04:文档 评价:“文档”属于模糊术语。 先列出使用“文档”的一些话语: *你们怎么一上手就写代码,连个文档都没有! *你现在在做什么?我在写文档。 *代码就是文档

1.8K20

谷歌最新机器学习术语表,AB 测试 、混淆矩阵、决策边界……都在这里了!

日前,谷歌发布机器学习术语表,以下术语表中列出了一般的机器学习术语和 TensorFlow 专用术语的定义。...混淆矩阵 (confusion matrix) 一种 NxN 表格,用于总结分类模型的预测成效;即标签和模型预测的分类之间的关联。在混淆矩阵中,一个轴表示模型预测的标签,另一个轴表示实际标签。...例如,下面显示了一个二元分类问题的混淆矩阵示例: 上面的混淆矩阵显示,在 19 个实际有肿瘤的样本中,该模型正确地将 18 个归类为有肿瘤(18 个真正例),错误地将 1 个归类为没有肿瘤(1 个假负例...多类别分类问题的混淆矩阵有助于确定出错模式。例如,某个混淆矩阵可以揭示,某个经过训练以识别手写数字的模型往往会将 4 错误地预测为 9,将 7 错误地预测为 1。...“特征列”是 Google 专用的术语。特征列在 Yahoo/Microsoft 使用的 VW 系统中称为“命名空间”,也称为场。

1.1K60

资源 | 从医疗语音到灾难响应,这八大优质数据集快抱走

我们的目标是利用深度学习算法深入研究,以建立更精准的模型,并应用于其他城市,尤其是停车标志易与人造物体混淆的密集区域。...该数据集包括从PubMed文章摘要中选取的3984个医学相关语句,并标注了不相关术语间的联系。其中“治疗”关系和“因果”关系是主要关注点,共有1043个句子含有治疗关系,1787个句子含有因果关系。...人机闭环标注系统进行向标注者提供两个术语(例如“路易体痴呆(LBD)”和“真性视幻觉”),而标注者则按照要求标注两个术语间的关系(对于上述例子应为“路易体痴呆导致真性视幻觉”)。...这份8.5小时的语音里包含了数以千计的常见症状,比如“膝盖疼痛”、“头疼”等等。...每一条症状语音都由真实的人,基于特定症状提供。这些音频片段可用于培训医疗领域的诊断助理。 Figure Eight通过多作业工作流创建了这个数据集。

65630

因果AI诊断模型登上nature:模拟专业医师思维,诊断罕见疾病,超越SOTA算法

1 关联推理混淆因果 ?...(Judea Pearl 点赞推荐) 在论文的模型介绍部分,作者先概述了相关性诊断(Associative diagnosis)的基本原则和假设,然后提出这种方法会因为因果混淆而导致诊断崩溃。...由于类似例子1和例子2这种混淆的例子越来越多,导致越来越多的人要求将因果知识恰当地纳入健康护理中的决策支持算法。...2 反事实诊断 在论文中,作者对诊断的因果定义如下: 从鉴于患者的病史,识别最有可能引起患者症状的疾病。 也就是,根据患者提供的证据,医生试图确定哪些疾病是症状的最佳解释。...图注:疾病和症状的三种不同的因果结构 在具体实验中,作者使用的疾病模型是贝叶斯网络(BNs),它可以模拟数百种疾病、风险因素和症状之间的关系。

1.3K21

聊一聊大数据的问题和缺陷

这里的问题是人们经常把结果与全知混淆起来。人们对自己的技术非常迷恋,但是当模型出现故障时,它会变得非常难看,尤其是当数据产生的错误是相当大的时候。...例如,如果人们搜索“冷”或“发烧”这样的词,这并不一定意味着他们正在寻找流感样症状。他们可能一直在寻找季节性的疾病。对于谷歌流感趋势不幸的是,它无法从这场灾难中恢复过来,最终导致了2013年的崩溃。...缺乏关于数据处理的文档、存储、策略和其他程序。采用大数据咨询公司的服务是一个好主意,这样企业就可以为自己提供一个清晰的路线图和指导,说明如何处理已经拥有的数据,然后才能克服大数据的挑战。...(2)未定目标和战略 这里有很多IT术语和营销术语,而且在白噪声中难以理解。此外,市场上还有很多大数据产品,选择合适的产品真的很困难。企业在决定任何事情之前,找出实现目标所需的服务和技术非常重要。

1K80

AIGC:人工智能在医学和健康领域的 应用场景

使用 ChatGPT,医生和护士可以口述笔记,模型可以自动总结关键细节,包括症状、诊断和治疗等方面。 医务人员还可以使用 ChatGPT 从患者记录中提取相关信息,例如实验室结果或影像报告。...凭借其先进的语言处理能力,ChatGPT 可以准确快速地翻译医学术语、技术术语和常见表达方式,使患者能够理解他们的诊断、治疗选择和药物使用说明。...7.医学写作和文档 ChatGPT 可以帮助医疗保健专业人员撰写和记录医疗报告,如临床笔记和出院总结。 并提供实时建议和更正。...9.创建症状检查器 症状检查器是对于想要了解自己的症状并确定是否需要就医的患者来说非常有价值的工具。ChatGPT 可以用于开发虚拟的症状检查器,帮助患者识别和解释可能存在的健康问题。...10.患者分诊 ChatGPT 可以通过询问患者有关症状和病史的问题来确定其情况的紧急性和严重程度,从而进行患者分诊。

14610

医疗革命:ChatGPT 在医学和健康领域的 14 个应用

使用 ChatGPT,医生和护士可以口述笔记,模型可以自动总结关键细节,包括症状、诊断和治疗等方面。 医务人员还可以使用 ChatGPT 从患者记录中提取相关信息,例如实验室结果或影像报告。...凭借其先进的语言处理能力,ChatGPT 可以准确快速地翻译医学术语、技术术语和常见表达方式,使患者能够理解他们的诊断、治疗选择和药物使用说明。...7.医学写作和文档 ChatGPT 可以帮助医疗保健专业人员撰写和记录医疗报告,如临床笔记和出院总结。 并提供实时建议和更正。...9.创建症状检查器 症状检查器是对于想要了解自己的症状并确定是否需要就医的患者来说非常有价值的工具。ChatGPT 可以用于开发虚拟的症状检查器,帮助患者识别和解释可能存在的健康问题。...10.患者分诊 ChatGPT 可以通过询问患者有关症状和病史的问题来确定其情况的紧急性和严重程度,从而进行患者分诊。

1.2K30

医疗NLP相关数据集整理

medicine.txt 电子病历常见词汇 1985 emr.txt 链接:https://github.com/xtea/chinese_medical_words 3 中文医学NLP公开资源整理:术语集.../语料库/词向量/预训练模型/知识图谱/命名实体识别/QA/信息抽取/etc 术语集/语料库 medical-news 中文医学新闻爬虫 medical-books 中文LaTex开源医学书籍 THUOCL...中文症状库 这是一个包含症状实体和症状相关三元组的数据集。中文症状库的数据来自8个主流的健康咨询网站、3个中文百科网站和电子病历。它还包含了中文症状与UMLS中概念的链接结果。...CHIP2020 中医文献问题生成 术语标准化 CHIP2019 临床术语标准化任务:医渡云标准化7K数据集 CHIP2020 临床术语标准化任务 相似句对判断 “公益AI之星”挑战赛-新冠疫情相似句对判定大赛...An example as follows: { "originalText": "间质性肺炎的症状?"

10.6K126

Drug Discov Today|挖掘社交媒体数据,促进药物开发的方法和案例

数据标准化是指用适当的技术术语取代社交媒体帖子中常用的不精确的医疗术语和概念。值得注意的是,虽然拼写错误的单词很容易纠正,但俚语和缩写的修订仍然是一个重大挑战。...例如,使用基于规则的算法从帖子中提取患者症状并以结构化格式存储这些症状。 数据简化技术通过功能转换、实例选择和功能选择降低数据维度。...这使得ML方法的操作难以解释和可能导致的混淆难以检测。其次,在典型ML算法中,揭示的关系是相关关系,而不是因果关系。这进一步限制了他们的解释和可靠性。...其中一种方法是LDA(Latent Dirichlet Allocation),它使用概率模型在给定语料库中推断每个文档中的主题。...患者通常不是专业医疗人员,因此他们通常用自己的术语描述自己的健康状况,与医学界使用的术语有显著差异。缺乏医疗培训也可能导致患者表达虚假联想。例如,有些患者经常在区分共同病症和不良事件方面遇到困难。

47220

BP综述:自闭症中基于功能连接体的预测模型

1.3 混淆,扫描环境的可容忍性,和预测建模的结果混杂,或与模型中的自变量和因变量都相关的变量,可以驱动虚假的统计关系,并导致错误的结论。...混淆的确切解决方案取决于分析目标,但我们建议读者参考英国生物银行的混淆检查(以及解决它们的方法)。...收集精确和包容性的人口/临床数据可用于纠正混淆,尽管隐藏的混淆可能持续存在。8. 未来的方向和结论我们已经回顾了预测建模框架如何提供洞察自闭症的神经生物学相关,以及潜在的临床效用。...混淆的确切解决方案取决于分析目标,但我们建议读者参考英国生物银行的混淆检查(以及解决它们的方法)。...收集精确和包容性的人口/临床数据可用于纠正混淆,尽管隐藏的混淆可能持续存在。8. 未来的方向和结论我们已经回顾了预测建模框架如何提供洞察自闭症的神经生物学相关,以及潜在的临床效用。

45930

系统服务化构建-状态码设计要点

从一份接口文档定义开始说起,文档中定义的服务端接口输出格式如下 接口输出格式 返回数据由两部分构成,第一部分是对结果集的说明,第二部分是 data 节点 { "code": 4302, "...客户端排除法 客户端 HTTP 请求的通用方法是采用排除法,什么是排除法,客户端在请求服务端的 REST 接口时,会先在网络层面判断接口是否通,包括 404 或者 200常见几个状态 。...当然是先接收 HTTP 状态码,其次是业务状态码,不混淆,也不能混淆。从软件分层的角度来说,接收 HTTP 状态码在接收业务状态码的上层,通常由拦截器来做,比如 token 过期的 401 阻挡。...总结 本文从接口文档开始,引出了状态码的概念,细分为网络状态码和业务状态码。结合服务器端和客户端的编程角度,介绍了各自的使用场景。...end 2019 年 11 月 参考文档中给出一些资源,有兴趣的读者可以参考阅读。

3.9K30

“游戏障碍”被世界卫生组织正式承认

然而,在反复讨论之后,这一术语才被赋予了合法性,因为世界卫生组织(World Health Organization)选择将其纳入其最新版的《疾病内部分类》(Internal Classification...终止、上下文) 2、在一定程度上,游戏优先于其他的生活兴趣和日常活动,从而增加了游戏的重要性 3、游戏的持续或升级尽管会产生负面的后果 我能听到我的许多朋友的集体声音,他们在听着那些令人毛骨悚然的熟悉的症状...上述效应与世卫组织定义的其他类似成瘾活动(包括赌博障碍)有共同之处: 世界卫生组织在报告中写道:“成瘾行为导致的疾病是可识别的、临床意义重大的综合征,与痛苦或对个人功能的干扰有关,这些症状是由于使用产生依赖物质以外的重复性奖励行为而形成的...尽管看似普遍的症状,但该组织很快指出,世卫组织所定义的游戏障碍的患病率实际上“非常低”。

36120

学习 DDD - 通用语言的模式

语言的鸿沟 虽然领域专家对软件开的技术所知有限,但他们熟悉使用自己的领域术语——可能还具有各种不同的风格。...另一方面,开发人员可能会用一些描述性的,功能性的术语来理解和讨论系统,而这些术语并不具备领域专家的语言所要传达的意思。 开发人员可能会创建一些用于支持设计的抽象,但领域专家无法理解这些抽象。...相互翻译使模型变得混淆 在一个没有公共语言的项目上,开发人员不得不为领域专家做翻译。而领域专家要充当开发人员与其他领域专家之间的翻译。 这些翻译使模型概念变得混淆,而这会导致有害的代码重构。...领域专家使用他们自己的术语,而技术团队使用的语言则经过调整,以便从设计角度讨论领域。 日常讨论所使用的术语与代码中使用的术语不一致。...甚至同一个人在讲话和写东西时使用的语言也不一致,这导致的后果是,对领域的深刻表述常常稍纵即逝,根本无法记录到代码或者文档 中。 翻译使得沟通不畅,并削弱了知识消化。

23120

学习 DDD - 通用语言的模式

语言的鸿沟 虽然领域专家对软件开的技术所知有限,但他们熟悉使用自己的领域术语——可能还具有各种不同的风格。...另一方面,开发人员可能会用一些描述性的,功能性的术语来理解和讨论系统,而这些术语并不具备领域专家的语言所要传达的意思。 开发人员可能会创建一些用于支持设计的抽象,但领域专家无法理解这些抽象。...相互翻译使模型变得混淆 在一个没有公共语言的项目上,开发人员不得不为领域专家做翻译。而领域专家要充当开发人员与其他领域专家之间的翻译。 这些翻译使模型概念变得混淆,而这会导致有害的代码重构。...领域专家使用他们自己的术语,而技术团队使用的语言则经过调整,以便从设计角度讨论领域。 日常讨论所使用的术语与代码中使用的术语不一致。...甚至同一个人在讲话和写东西时使用的语言也不一致,这导致的后果是,对领域的深刻表述常常稍纵即逝,根本无法记录到代码或者文档 中。 翻译使得沟通不畅,并削弱了知识消化。

26720
领券