数据自动分析标注_自动显示MKAnnotation标注_自动数据分析 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Nat. Methods | ilastik:为生物图像分析而生的交互式机器学习平台

来自德国海德堡大学的Hamprecht团队开发了一款使用简便的开源交互式工具—ilastik。ilastik能够给用户提供良好的基于机器学习的生物信息图像分析服务，这对于在计算机专业知识方面有所欠缺而又想使用机器学习来做图像分析的用户来说是一个福音。（文末附ilastik下载链接）

03

阿丘科技之AIDI高级应用讲解一（5）

导入混合图后，图像显示区会显示混合图每张子图，通过方向键左右切换，或者通过标注工具栏中图片id切换

03

您找到你想要的搜索结果了吗？

是的

没有找到

学界 | 专家标注的数据少就少吧，普通人标的数据现在也可以用了

AI 科技评论按：对于缺乏高质量标注数据的专业应用，除了继续花钱标数据之外，常用方法似乎也就只有 ImageNet 预训练 + 任务专用数据 fine-tune，众包让外行去标注更多数据拿来训练是万万不敢的。不过 IBM 的这项最新研究就打破了这个禁忌，普通人标注的数据也可以用来训练医疗影像分析模型。AI 科技评论把 IBM 研究院 Reseach Fellow Simone Bianco 撰写的介绍文章编译如下。

02

入行AI做数据是怎么一回事？

之前的文章《入行 AI，如何选个脚踏实地的岗位》中，我们谈到AI行业内的技术类岗位大致分为三类：做算法，做工程和做数据。本文主要讲一讲，做数据的岗位，日常工作和职业体验是怎样的。本文是@赵亚帆在2017年12月19日众智汇微信群中分享的记录。感谢@王西玲同学的记录整理。我是来自小米公司的赵亚帆，所在团队负责用户反馈的处理。处理用户反馈的核心就是数据标注，及以标注为基础的数据处理等工作。今天在此和大家分享一下我在数据标注工作方面的经验。什么是数据标注数据标注这个岗位，要做的事情包括：借助计算机等工

学习笔记CB007:分词、命名实体识别、词性标注、句法分析树

概率图模型条件随机场适用观测值条件下决定随机变量有有限个取值情况。给定观察序列X，某个特定标记序列Y概率，指数函数 exp(∑λt+∑μs)。符合最大熵原理。基于条件随机场命名实体识别方法属于有监督学习方法，利用已标注大规模语料库训练。

NLP札记1

NLP（Natural Language Processing），自然语言处理，是一门融合了计算机科学、人工智能以及语言学的交叉学科。自然语言和编程语言对比自然语言比编程语言的词汇量丰富自然语言是非机构化的；编程语言是结构化的。结构化指的是信息具有明确的结构关系，比如编程语言中具有类和成员、数据库中的表和字段等，都可以通过明确的机制来进行读写。自然语言存在大量的歧义，这些歧义根据语境的不同变现为特定的义项。自然语言容错性高，编程语言中程序员必须保证拼写、语法绝对规范。编程语言的变化缓慢温和

01

使用Python和自然语言处理技术进行文本分类和标注

在大数据时代，海量的文本数据需要进行自动化处理和分析。文本分类和标注是自然语言处理领域的重要任务，它们可以帮助我们对文本数据进行整理、组织和理解。今天我们就介绍一下如何使用Python和自然语言处理技术实现文本分类和标注，并提供一些实用的案例和工具。

03

文本挖掘的应用场景（下）：内容类应用

以下文章来自知乎，作者Bill Tong。Bill Tong，上海交通大学管理科学与工程博士，曾出版《在线文本数据挖掘》一书。

01

Python项目实战篇——常用验证码标注和识别(需求分析和实现思路)

今天给大家分享的实战项目是常用验证码标注&识别，从想法诞生到实现思路，再到编码实战的整体过程，这个过程我前后整理了上万字，计划分章节来发布。言归正传，一起来看看今天的内容吧！今天这篇内容主要讲解这篇文章的创作灵感、需求分析和实现思路。

02

单细胞的细胞注释要进入AI（GTP-4）时代了吗？

Performance evaluation of GPT-4 in cell type annotation

01

从0到1，NLP 技术如何助力作业帮业务提质增效？

嘉宾｜蒋宏飞编辑｜林晓婷为了提升用户体验，作业帮将 NLP 技术应用到业务的提质增效上，沉淀出了智能质检平台 IQC、文本智能标注平台 FTP 等自研平台，也产出了很多在 NLP 中应用深度学习的可供参考的实践。伴随着深度学习场景的增多，NLP 技术也得到了快速发展，作业帮作为 K12 教育平台，对用户体验提升有很高的诉求，所以他们将 NLP 应用在业务的提质增效上，沉淀出了智能质检平台 IQC、文本智能标注平台 FTP 等自研平台，也产出了很多在 NLP 中应用深度学习的可供参考的实践。 I

02

一文了解自然语言处理的每个范畴用到的核心技术，难点和热点(1)

希望时间的流逝不仅仅丰富了我们的阅历，更重要的是通过提炼让我们得以升华，走向卓越。 1电影Her见识NLP 可能很多朋友看过好莱坞的电影《Her》，电影中讲述的主角耳朵里戴了一个耳机，这是一个人工智能的虚拟助手，能够通过耳机与人工智能来对话。人机交互方式在经历了第一代的键盘鼠标，第二代的触摸屏和按键后，第三代对话式人工智能操作系统正在来临，让用户通过最便捷、简单的方式获取信息和服务。这其中功不可没的就是自然语言处理技术(NLP)，我们熟知的问答系统就是一种最直接的人机交互方式。NLP过去经历了怎样的发

06

吊打labelme，这款AI开发神器的图像标注yyds！

AI 的发展有三大内核：数据、算法、算力。现如今，算法和算力在市面上的差距显然已经没有那么大，能够给 AI 提供充足弹药支持的当属数据了。深度学习算法精度的提升严重依赖于数据，谁的数据既多又准，谁的算法精度就可能领先一步。

03

再见，labelme！

众所周知，AI 的发展有三大内核：数据、算法、算力。现如今，算法和算力在市面上的差距显然已经没有那么大，能够给 AI 提供充足弹药支持的当属数据了。深度学习算法精度的提升严重依赖于数据，谁的数据既多又准，谁的算法精度就可能领先一步。

03

ICLR 2020 | 清华提 NExT 框架，用「神经元执行树」学习可解释性

作者 | 秦禹嘉编辑 | 贾伟 ICLR 2020会议将于 4 月 26 日在非洲埃塞俄比亚（亚斯亚贝巴）举行。本届会议共有 2594篇投稿，其中 687篇论文被接收（48篇oral论文，107篇

02

百亿参数大模型ERNIE加持下，零门槛AI开发平台EasyDL有多强？

随着AI技术的发展，NLP技术已经陆续“上岗”至各类产业应用场景中，自动处理繁杂而重复性的工作，如新闻内容自动分类、智能客服自动回复、评论敏感词审核、用户评论情感分析等。

02

学界 | 结合主动学习与迁移学习：让医学图像标注工作量减少一半

选自arXiv 作者：Zongwei Zhou, Jae Y. Shin, Suryakanth R. Gurudu, Michael B. Gotway, 梁建明机器之心编译参与：Panda 和普通图像的标注不一样，生物医学图像的标注需要有专业知识和技能的人来做，因此难以获得大型的有标注数据集供卷积神经网络学习。近日，IEEE 一篇论文提出可以将主动学习和迁移学习结合起来降低标注任务的工作量，实验结果也证明了这种方法的有效性。机器之心对该论文进行了编译介绍，详细的数学过程和结果分析请参阅原论文。在

05

【“犀牛鸟论道”特邀撰稿】自然语言处理中的知识获取问题

自然语言处理中的知识获取问题哈尔滨工业大学社会计算与信息检索研究中心 1. 引言随着人工智能从感知智能向认知智能升级，自然语言处理（英文为Natural Language Processing，简称NLP）的重要性日益凸显。当前，一方面NLP受到大数据和深度学习的双轮驱动，在各项关键技术方面都有不同程度的进步，另一方面NLP渗透到各个行业，与教育、医疗、法律等知识服务型行业深度整合，同时以虚拟/实体机器人等新型应用模式与线下服务对接。本文聚焦前一话题，试图以知识获取方式的演进为主线，勾勒自然语言处理

中文创意写作能力超GPT-4，「最会写」的中文大模型Weaver来了

ChatGPT 等通用大模型支持的功能成百上千，但是对于普通日常用户来说，智能写作一定是最常见的，也是大模型最能真正帮上忙的使用场景之一。尽管大模型经常能写出看起来像模像样的文字，但是大多数情况下内容的创意程度和文风都经不起深究。尤其是在创作领域，大模型常见的 “GPT 文风” 更是让利用大模型进行创意写作看起来简单，实际却困难重重。

01

学界 | 结合主动学习与迁移学习：让医学图像标注工作量减少一半

选自arXiv 作者：Zongwei Zhou, Jae Y. Shin, Suryakanth R. Gurudu, Michael B. Gotway, 梁建明机器之心编译参与：Panda 和普通图像的标注不一样，生物医学图像的标注需要有专业知识和技能的人来做，因此难以获得大型的有标注数据集供卷积神经网络学习。近日，IEEE 一篇论文提出可以将主动学习和迁移学习结合起来降低标注任务的工作量，实验结果也证明了这种方法的有效性。机器之心对该论文进行了编译介绍，详细的数学过程和结果分析请参阅原论文。在

06

华为自动驾驶平台解决方案

自动驾驶开发需要采集海量道路环境数据，进行算法开发和模型训练，传统专线传输方式效率低且成本高，华为云可以提供高效的数据快递服务和海量可灵活扩展的云存储服务。

02

这个程序员节，我们不写代码

机器之心报道机器之心编辑部每一位开发者，都是华为要汇聚的星星之火。我们经常说「现在是 AI 的时代，是万物互联的时代」，但现实情况是，很多行业在引入 AI、AIoT 的过程中遇到了极高的门槛和各种各样的问题。如何降低 AI 应用的门槛，实现真正的智能世界、万物互联，成了当前各个 AI、IoT 服务平台的核心目标。今年，华为全联接 2020 发布一站式 AI 开发平台 ModelArts 3.0，为开发者提供更全面的数据标注准备、模型训练、模型调优、模型部署等 AI 应用开发服务，进一步降低了 AI

02

平均交付准确率99%以上！又一大厂进军自动驾驶AI数据服务，教AI学会人类标注能力

允中发自凹非寺量子位 | 公众号 QbitAI △AI数据是人工智能行业的燃料，在智能驾驶领域同样扮演着助推技术落地的角色如今自动驾驶成为了人工智能领域最受关注、最具挑战和影响力最为广泛的产业方向，是推动全球汽车工业变革最重要的科技力量。汽车正在向智能化转变，在自动驾驶落地较好的企业往往也具备强劲的市场竞争力。但目前智能汽车想要实现更高等级的自动驾驶，还有许多技术难点有待解决。成熟的自动驾驶技术需要具备感知和决策两方面能力。通过多种融合的车外传感器使汽车具备感知周围行驶环境的能力；决策则是

04

IBM | 基于断开提示的逆向合成语言模型

本文介绍一项IBM欧洲研究所的研究工作。作者首次将提示学习用于化合物逆向合成预测，在标注提示断开位置上进行监督学习，训练出的断开感知模型在断开预测方面性能具有一定提升。同时利用自动标注模型对断开感知模型进行扩展，提升了模型的鲁棒性，并通过实验证明了断开感知模型在酶促反应中的有效性。该模型首次使用人类设计的提示改进逆向合成，将专家知识与深度学习有效结合，在序列语言预测上比基线模型提高了39%的准确率。

01

爱奇艺NLP：BiLSTM_CRF的关键词自动抽取

https://github.com/macanv/BERT-BiLSTM-CRF-NER

01

AI数据也要紧跟MLOps，那个把标注精度提高到99.99%的公司又出手了

梦晨发自凹非寺量子位 | 公众号 QbitAI 当IT行业改变整个世界的时候，DevOps理念从大量产业实践中诞生。如今AI也进入产业化新时代，继承者MLOps或者叫AI工程化也越发火热。 Gartner咨询公司将AI工程化列为2022年十二大战略性技术趋势，IDC则预测到2024年60%的企业将MLOps用于机器学习工作流。 △图源：ml-ops.org 这一波浪潮之中，算法的工程化一如既往的跑在前面，模型的自动部署、持续训练甚至AutoML都有较大进展。与之相对的是，数据的工程化稍显落后。

01

自然语言处理 NLP（2）

词性标注标注语料库；各词性标注及其含义 📷 📷 自动标注器；默认标注器；正则表达式标注器；查询标注器； N-gram标注器；一元标注器；分离训练和测试数据；一般的N-gram的标注；组合标注器；标注生词；储存标注器；性能限制；跨句子边界标注；隐马尔科夫标注器；生成模式；确定模式；非确定模式；隐藏模式；隐马尔科夫模型 HMM 是一种统计模型，用于描述一个含有隐含未知参数的马尔科夫过程，难点在于从可观察的参数中确定此过程的隐含参数，然

03

如何将深度学习与你正在做的事情相结合？

作者 | 李嘉璇文章来源Gitchat，CSDN独家合作发布，点击「阅读原文」查看交流实录前言人工智能是目前各行各业最火热的技术，如果说前两年是『互联网+』，那么这两年一定是『AI+』，利用深度学习的技术，给各行各业赋能，并提高效率，是企业智能化的一个方向。从AI的结合方向来说，一般有2种，一种是行业结合，例如量化投资和智能投顾。量化投资，量化投资就是利用计算机技术并且采用一定的数学模型去实践投资理念，实现投资策略的过程。它能严格执行投资策略，这样可以克服人性的弱点，如贪婪、恐惧、侥幸心理，也可

02

HanLP《自然语言处理入门》笔记--1.新手上路

自然语言处理(Natural Language Processing，NLP)是一门融合了计算机科学、人工智能及语言学的交叉学科，它们的关系如下图所示。这门学科研究的是如何通过机器学习等技术，让计算机学会处理人类语言，乃至实现终极目标–理解人类语言或人工智能。

03

ICCV2023 基准测试：MS-COCO数据集的可靠吗？

论文标题：Benchmarking a Benchmark: How Reliable is MS-COCO?

03

自然语言处理NLP（二）

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

05

如何将深度学习与你正在做的事情相结合？

作者 | 李嘉璇文章来源Gitchat，AI科技大本营合作发布，点击「阅读原文」查看交流实录前言人工智能是目前各行各业最火热的技术，如果说前两年是『互联网+』，那么这两年一定是『AI+』，利用深度学习的技术，给各行各业赋能，并提高效率，是企业智能化的一个方向。从AI的结合方向来说，一般有2种，一种是行业结合，例如量化投资和智能投顾。量化投资，量化投资就是利用计算机技术并且采用一定的数学模型去实践投资理念，实现投资策略的过程。它能严格执行投资策略，这样可以克服人性的弱点，如贪婪、恐惧、侥幸心

【Quick BI VS Power BI】（二）

Quick BI（以下简称Qbi）做数据分析有5个模块：仪表板、电子表格、数据大屏、即席分析和自主取数。其中仪表板和即席分析比较接近于Power BI（以下简称Pbi）制作的报告。本文的比较对象，主要指Qbi的仪表板和Pbi的报告。

01

如何免费获得高质量标注数据？

自从开始了解机器学习以后，想必你已经发现，数据分析领域，标注（annotation）是很重要的。

02

AI自动化标注崛起，数据标注员要失业了？

由于需要标注的数据规模庞大且成本较高，一些互联网巨头及一些AI公司很少自己设有标注团队，大多交给第三方数据服务公司或者数据标注团队来做。

01

斯坦福最新LLM排行榜发布！自家Alpaca垫底，华人团队WizardLM开源第一，GPT-4、Claude稳居前二

除了各类开源模型外，还有GPT-4、PaLM 2等众多「闭源」模型，甚至还开设了一个「准中文」排行榜。

01

详解自然语言处理5大语义分析技术及14类应用（建议收藏）

自然语言处理技术的研究，可以丰富计算机知识处理的研究内容，推动人工智能技术的发展。

01

基于AI的脑电信号独立成分的自动标记工具箱

脑电图（EEG）信号反映了大脑神经元网络的生物电活动，可用于研究睡眠，诊断昏迷和癫痫患者，使用户能够与电子设备进行互动，并帮助人们从中风或其他损害正常大脑活动的状况中恢复。独立成分分析（ICA）是一种从脑电图中排除眼球运动和肌肉伪影等非脑信号的传统方法。独立成分（IC）的排除通常是在半自动模式下进行的，需要专家参与，并且各个专家的意见往往不一致。来自俄罗斯国立高等经济大学生物电接口中心和RAS高级神经活动和神经生理学研究所的研究人员开发了一个工具箱和在线众包平台，用于脑电图中独立成分的自动标记（ALICE）。

02

从图像中检测和识别表格，北航&微软提出新型数据集TableBank

TableBank 开源地址：https://github.com/doc-analysis/TableBank

02

小白系列（1） | 计算机视觉之图像分类

原文：https://viso.ai/computer-vision/image-classification/

01

双雷达数据集：用于自动驾驶的双雷达多模态数据集

文章：Dual Radar: A Multi-modal Dataset with Dual 4D Radar for Autononous Driving

03

TotalSegmentator2022——全身104个解剖器官分割

今天将分享CT图像中全身104个解剖器官分割完整实现版本，为了方便大家学习理解整个流程，将整个流程步骤进行了整理，并给出详细的步骤结果。感兴趣的朋友赶紧动手试一试吧。

01

五款中文分词工具在线PK: Jieba, SnowNLP, PkuSeg, THULAC, HanLP

现在的开源中文分词工具或者模块已经很丰富了，并且很多都有一些在封闭测试集上的效果对比数据，不过这仅仅只能展现这些分词工具在这个封闭测试集上的效果，并不能全面说明问题，个人觉得，选择一个适合自己业务的分词器可能更重要，有的时候，还需要加一些私人定制的词库。

03

创新工场提出中文分词和词性标注模型，性能分别刷新五大数据集| ACL 2020

中文分词和词性标注是中文自然语言处理的两个基本任务。尽管以BERT为代表的预训练模型大行其道，但事实上，中文中基于全词覆盖（whole word masking）的预训练模型比直接使用单字编码的效果更好，所以引入词信息可能会达到更好的效果。

02

NLP学习基础入门（上）

NLP (Natural Langunge Possns,自然语言处理)是计算机科学领域以及人工智能领域的一个重要的研究方向，它研究用计算机来处理、理解以及运用人类语言(如中文、英文等)，达到人与计算机之间进行有效通讯。所谓“自然”乃是寓意自然进化形成，是为了区分一些人造语言，类似C++、Java 等人为设计的语言。

02

自然语言处理在金融实时事件监测和财务快讯中的应用

疫情之下，全球金融市场进入大波动时代，各国金融调控政策、突发事件层出不穷，例如美联储无限量QE、欧央行7500亿复苏基金、中美关闭使领馆、阿塞拜疆和亚美尼亚爆发空战...如何24*7小时全天候自动、智能监控全球新闻事件，从而最快速地做出反应、最大可能地规避风险？

03

AI Insight：有了深度学习就可以包打天下？你想多了

眼下深度学习是整个 IT 领域中最热门的技术之一。虽然它只是机器学习五大学派数十种算法之一，但从媒体关注度、论文发表数量和创业投资热度来说，在人工智能、数据科技领域大有力压群雄、独领风骚之势，以至于现

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭