开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

分析带有法语名称的英文文本

是指对包含法语名称的英文文本进行分析和处理的过程。这种文本可能包含法语人名、地名、机构名、产品名等。

在分析带有法语名称的英文文本时，可以采用以下步骤：

文本预处理：对文本进行清洗和标准化，包括去除特殊字符、标点符号和数字等。
分词：将文本分割成单词或短语，以便后续处理。可以使用自然语言处理（NLP）工具或库进行分词操作。
识别法语名称：通过使用法语词典或语料库，结合词性标注和命名实体识别技术，识别出文本中的法语名称。
翻译：对于识别出的法语名称，可以使用机器翻译技术将其翻译成英文或其他目标语言，以便更好地理解和处理。
上下文分析：根据文本的上下文信息，对法语名称进行语义分析和语境理解，以确定其具体含义和用途。
应用场景：分析带有法语名称的英文文本可以应用于多个领域，如自然语言处理、机器翻译、信息提取、文本分类等。

腾讯云相关产品和产品介绍链接地址：

自然语言处理（NLP）：腾讯云提供了自然语言处理相关的API和工具，包括分词、词性标注、命名实体识别等功能。详细信息请参考：腾讯云自然语言处理
机器翻译：腾讯云提供了机器翻译服务，支持多种语言之间的翻译。详细信息请参考：腾讯云机器翻译
文本智能分析：腾讯云提供了文本智能分析服务，包括情感分析、关键词提取、文本分类等功能。详细信息请参考：腾讯云文本智能分析

请注意，以上提到的腾讯云产品仅作为示例，其他云计算品牌商也提供类似的产品和服务。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

基于神经标签搜索，中科院&微软亚研零样本多语言抽取式摘要入选ACL 2022

机器之心专栏机器之心编辑部这项研究旨在解决零样本下法语、德语、西班牙语、俄语和土耳其语等多语种的抽取式摘要任务，并在多语言摘要数据集 MLSUM 上大幅提升了基线模型的分数。抽取式文本摘要目前在英文上已经取得了很好的性能，这主要得益于大规模预训练语言模型和丰富的标注语料。但是对于其他小语种语言，目前很难得到大规模的标注数据。中国科学院信息工程研究所和微软亚洲研究院联合提出一种是基于 Zero-Shot 的多语言抽取式文本摘要模型。具体方法是使用在英文上预训练好的抽取式文本摘要模型来在其他低资源语言上

02

ACL2022 | 基于神经标签搜索的零样本多语言抽取式文本摘要

每天给你送来NLP技术干货！ ---- ©作者 | 机器之心编辑部来源 | 机器之心这项研究旨在解决零样本下法语、德语、西班牙语、俄语和土耳其语等多语种的抽取式摘要任务，并在多语言摘要数据集 MLSUM 上大幅提升了基线模型的分数。抽取式文本摘要目前在英文上已经取得了很好的性能，这主要得益于大规模预训练语言模型和丰富的标注语料。但是对于其他小语种语言，目前很难得到大规模的标注数据。中国科学院信息工程研究所和微软亚洲研究院联合提出一种是基于 Zero-Shot 的多语言抽取式文本摘要模型。具体方法是使

02

基于神经标签搜索，中科院&微软亚研零样本多语言抽取式摘要入选ACL 2022

来源：机器之心本文约2500字，建议阅读5分钟本文介绍了基于神经标签搜索情况下，中科院和微软亚研的实验进展。这项研究旨在解决零样本下法语、德语、西班牙语、俄语和土耳其语等多语种的抽取式摘要任务，并在多语言摘要数据集 MLSUM 上大幅提升了基线模型的分数。抽取式文本摘要目前在英文上已经取得了很好的性能，这主要得益于大规模预训练语言模型和丰富的标注语料。但是对于其他小语种语言，目前很难得到大规模的标注数据。中国科学院信息工程研究所和微软亚洲研究院联合提出一种是基于 Zero-Shot 的多语言抽取式文本

02

教程 | 将注意力机制引入RNN，解决5大应用领域的序列预测问题

选自MachineLearningMastery 作者：Jason Brownlee 机器之心编译参与：Nurhachu Null、路雪编码器-解码器结构在多个领域展现出先进水平，但这种结构会将输

04

计算机是如何存储数据的？

理清ASCII、Unicode、GBK、UTF-8编码之间的关系 - 织梦笔记 (dedenotes.com)

04

自然语言处理指南（第1部分）

自然语言处理（NLP）包含一系列技术，用以实现诸多不同的目标。下表中列出了解决某些特定问题对应的技术。

08

超全的OCR数据集

http://www.robots.ox.ac.uk/~vgg/data/scenetext/

01

连葫芦娃都数不明白，解说英雄联盟的GPT-4V面临幻觉挑战

在被称为「AI 春晚」的 OpenAI 首届开发者大会拉开帷幕后，很多人的朋友圈都被这家公司发布的新产品刷了屏，比如不需要写代码就能定制应用的 GPTs、能解说球赛甚至「英雄联盟」游戏的 GPT-4 视觉 API 等等。

02

如何用Python做中文分词？

打算绘制中文词云图？那你得先学会如何做中文文本分词。跟着我们的教程，一步步用Python来动手实践吧。

03

超级好用的OCR工具，GitHub Star 7.2K，强烈推荐！

OCR 方向的工程师，一定需要知道这个 OCR 开源项目：PaddleOCR。短短几个月，累计 Star 数量已超过 7.2K，频频登上 Github Trending 日榜月榜，称它为 OCR 方向目前最火的 repo 绝对不为过。

01

快速录入大段文本的正确姿势

https://itunes.apple.com/cn/app/id1243368435

02

Python自然语言处理工具小结

作者：伏草惟存来源：http://www.cnblogs.com/baiboy/p/nltk2.html 1 Python 的几个自然语言处理工具 NLTK:NLTK 在用 Python 处理自然语言的工具中处于领先的地位。它提供了 WordNet 这种方便处理词汇资源的借口，还有分类、分词、除茎、标注、语法分析、语义推理等类库。 Pattern:Pattern 的自然语言处理工具有词性标注工具(Part-Of-Speech Tagger)，N元搜索(n-gram search)，情感分析(senti

07

字符编码笔记

字符编码笔记：ASCII，Unicode和 UTF-8 1. ASCII码我们知道，在计算机内部，所有的信息最终都表示为一个二进制的字符串。每一个二进制位（bit）有0和1两种状态，因此八个二进制位就可以组合出 256种状态，这被称为一个字节（byte）。也就是说，一个字节一共可以用来表示256种不同的状态，每一个状态对应一个符号，就是256个符号，从 0000000到11111111。上个世纪60年代，美国制定了一套字符编码，对英语字符与二进制位之间的关系，做了统一规定。这被称为ASCII码，

09

字符编码笔记：ASCII，Unicode和 UTF-8

1. ASCII码我们知道，在计算机内部，所有的信息最终都表示为一个二进制的字符串。每一个二进制位（bit）有0和1两种状态，因此八个二进制位就可以组合出 256种状态，这被称为一个字节（byte）。也就是说，一个字节一共可以用来表示256种不同的状态，每一个状态对应一个符号，就是256个符号，从 0000000到11111111。上个世纪60年代，美国制定了一套字符编码，对英语字符与二进制位之间的关系，做了统一规定。这被称为ASCII码，一直沿用至今。 ASCII码一共规定了128个字符的编码

05

英文文本挖掘预处理流程总结

在中文文本挖掘预处理流程总结中，我们总结了中文文本挖掘的预处理流程，这里我们再对英文文本挖掘的预处理流程做一个总结。

02

Python用不好英语水平不够？官方中文文档你看不看

Python 作为世界上最好用的语言，官方支持的文档一直没有中文。小伙伴们已经习惯了原汁原味的英文文档，但如果有官方中文文档，那么查阅或理解速度都会大大提升。本文将介绍隐藏在 Python 官网的中文文档～

03

Python用不好？看官方中文文档啦

以前也是有一些第三方维护的 Python 中文文档，不过可能因为人力等限制，并做不到同步更新与维护。目前也有很多高质量的 Python 中文资源，但大部分都是大牛写的书或教程，官方文档的翻译并得不到保证。

02

Python用不好？看官方中文文档啦

以前也是有一些第三方维护的 Python 中文文档，不过可能因为人力等限制，并做不到同步更新与维护。目前也有很多高质量的 Python 中文资源，但大部分都是大牛写的书或教程，官方文档的翻译并得不到保证。

03

ASCII，Unicode和UTF-8

一、ASCII码我们知道，计算机内部，所有信息最终都是一个二进制值。每一个二进制位（bit）有0和1两种状态，因此八个二进制位就可以组合出256种状态，这被称为一个字节（byte）。也就是说，一个字节一共可以用来表示256种不同的状态，每一个状态对应一个符号，就是256个符号，从00000000到11111111。上个世纪60年代，美国制定了一套字符编码，对英语字符与二进制位之间的关系，做了统一规定。这被称为 ASCII 码，一直沿用至今。 ASCII 码一共规定了128个字符的编码，比如空格SPACE

字符编码笔记：ASCII，Unicode和UTF-8

今天中午，我突然想搞清楚Unicode和UTF-8之间的关系，于是就开始在网上查资料。

01

字符编码笔记：ASCII，Unicode 和 UTF-8

今天中午，我突然想搞清楚 Unicode 和 UTF-8 之间的关系，就开始查资料。这个问题比我想象的复杂，午饭后一直看到晚上9点，才算初步搞清楚。下面就是我的笔记，主要用来整理自己的思路。我尽量写得通俗易懂，希望能对其他朋友有用。毕竟，字符编码是计算机技术的基石，想要熟练使用计算机，就必须懂得一点字符编码的知识。一、ASCII 码我们知道，计算机内部，所有信息最终都是一个二进制值。每一个二进制位（bit）有0和1两种状态，因此八个二进制位就可以组合出256种状态，这被称为一个字节（byte）。也就

04

见字如面：AI 赶紧转型做特工吧

在刑侦探案的影视剧里，经常能看到有「笔迹鉴定专家」的出现，这些人会通过现场留下的字迹，来初步判定一个人的身份、年龄、心态。

01

Excelize 开源基础库 2.8.0 版本正式发布

Excelize 是 Go 语言编写的用于操作电子表格办公文档的开源基础库，基于 ISO/IEC 29500、ECMA-376 国际标准。可以使用它来读取、写入由 Microsoft Excel、WPS、Apache OpenOffice、LibreOffice 等办公软件创建的电子表格文档。支持 XLAM / XLSM / XLSX / XLTM / XLTX 等多种文档格式，高度兼容带有样式、图片(表)、透视表、切片器等复杂组件的文档，并提供流式读写支持，用于处理包含大规模数据的工作簿。可应用于各类报表平台、云计算、边缘计算等系统。自 2016 年开源以来已成为云原生应用尤其是 Go 语言开发者在处理电子表格办公文档时的热门选择，正在被广泛应用于大型互联网公司、中小企业客户和初创公司。荣获 2022 年中国开源创新大赛一等奖、入选 2020 Gopher China - Go 领域明星开源项目 (GSP)、2018 年开源中国码云最有价值开源项目 GVP (Gitee Most Valuable Project)。

06

观点 | 从信息论的角度理解与可视化神经网络

选自TowardsDataScience 作者：Mukul Malik 机器之心编译参与：Pedro、思源信息论在机器学习中非常重要，但我们通常熟知的是信息论中交叉熵等模型度量方法。最近很多研究者将信息论作为研究深度方法的理论依据，而本文的目标不是要去理解神经网络背后的数学概念，而是要在信息论的视角下可视化与解读深度神经网络。「Information: the negative reciprocal value of probability.」—克劳德香农编码器-解码器编码器-解码器架构绝不仅仅

05

干货 | 自然语言处理（5）之英文文本挖掘预处理流程

前言自然语言处理(4)之中文文本挖掘流程详解（小白入门必读）干货 | 自然语言处理(3)之词频-逆文本词频（TF-IDF）详解干货 | 自然语言处理(2)之浅谈向量化与Hash-Trick 干货 | 自然语言处理(1)之聊一聊分词原理干货 | 自然语言处理入门资料推荐原文链接：http://www.cnblogs.com/pinard/p/6756534.html 在中文文本挖掘预处理流程总结中，我们总结了中文文本挖掘的预处理流程，这里我们再对英文文本挖掘（English text mi

C4 数据集基本信息速览

参考 Documenting Large Webtext Corpora: A Case Study on the Colossal Clean Crawled Corpus。

01

[AI OpenAI-doc] 语音转文字

音频 API 提供了两个语音转文本的端点，即转录和翻译，基于我们先进的开源大型-v2 Whisper 模型。它们可用于：

01

一个小而实用的 Python 包 pangu，实现在中文和半宽字符（字母、数字和符号）之间自动插入空格

一个小巧的库，可以避免自己重新开发功能。利用 Python 包 pangu，可以轻松实现在 CJK（中文、日文、韩文）和半宽字符（字母、数字和符号）之间自动插入空格。

00

【重磅】Facebook全新机器翻译超越谷歌，用CNN替代RNN创世界纪录（开源）

【新智元导读】 Facebook今天发布了一项新的机器翻译技术，使用CNN技术而非传统的RNN，在翻译准确度超越了此前被认为是2016年10大AI突破技术的谷歌机器翻译，并且翻译速度上快了9倍。Facebook称，创下新的世界纪录。目前，这一技术已经开源。开源地址：https://github.com/facebookresearch/fairseq 论文地址：https://s3.amazonaws.com/fairseq/papers/convolutional-sequence-to-sequen

04

ChatOCR：文心一言/千帆API实现关键信息提取

现在的任务是从OCR文字识别的结果中提取我指定的关键信息。OCR的文字识别结果使用符号包围，包含所识别出来的文字，顺序在原始图片中从左至右、从上至下。我指定的关键信息使用[]符号包围。请注意OCR的文字识别结果可能存在长句子换行被切断、不合理的分词、对应错位等问题，你需要结合上下文语义进行综合判断，以抽取准确的关键信息。输出为json格式。

01

张龙netty学习笔记 P45 P46 字符集编码

什么是字符集字符集分为编码和解码两个操作(decode和encode)。 decode将字节转化为字符，是对字节的一种解释方式。 encode将字符转化为字节，是对字符的一种编码。各种字符集 ASCII 7个字节表示一个字符。会有位缺失（一个字节里最后一个字节没有用）。能表示英文字母、换行符等常用符号 iso-8859-1 8个字节表示一个字符，表示范围包含了ASCII 中文中华人民共和国为了应对iso-8859-1无法表示数量繁多的汉字而制定的编码规则。用两个字节表示一个字符。

02

好文推荐 | 自然语言处理简介

文章转自清华大学刘知远老师的github：https://github.com/zibuyu/research_tao/blob/master/00_nlp.md

02

如何用VOSviewer分析CNKI数据？

学会了用VOSviewer分析Web of Science数据后，想不想知道如何用它分析中文文献？本文用CNKI数据做样例，一步步教你实现步骤。

04

Facebook利用神经网络研发翻译系统，进一步扩张国际化进程

不会英文玩不转Facebook？NO！Facebook推出的实时翻译可以让你玩到high！ 5月24日消息，Facebook正研发新的翻译系统，利用人工神经网络大幅改进自动翻译功能，用户可以方便地阅读

02

字符编码

字符编码知识：Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的？

02

开源社区应该选择什么语言？

| 作者：庄表伟 | 编辑：李明康 | 设计：王福政前传《在开源的世界里，应该讲开发者都能懂的语言！》（https://my.oschina.net/oscpyaqxylk/blog/499143

01

Github Star 8.4K，超级好用的OCR数据合成与半自动标注工具，强烈推荐！

n全新发布数据合成工具Style-Text：可以批量合成大量与目标场景类似的图像，在多个场景验证，效果均提升15%以上。

02

每日学术速递2.15

为时空动作检测任务设计实时框架仍然是一个挑战。在本文中，我们提出了一种新颖的实时动作检测框架 YOWOv2。在这个新框架中，YOWOv2 利用 3D 骨干和 2D 骨干进行准确的动作检测。多级检测管道旨在检测不同规模的动作实例。为了实现这一目标，我们精心构建了一个简单高效的 2D backbone，带有特征金字塔网络，以提取不同级别的分类特征和回归特征。对于 3D 主干，我们采用现有的高效 3D CNN 来节省开发时间。通过结合不同尺寸的 3D 骨干和 2D 骨干，我们设计了一个 YOWOv2 系列，包括 YOWOv2-Tiny、YOWOv2-Medium 和 YOWOv2-Large。我们还引入了流行的动态标签分配策略和anchor-free机制，使YOWOv2与先进的模型架构设计保持一致。经过我们的改进，YOWOv2明显优于YOWO，并且仍然可以保持实时检测。没有任何附加功能，YOWOv2 在 UCF101-24 上以超过 20 FPS 的速度实现了 87.0% 的帧 mAP 和 52.8% 的视频 mAP。在 AVA 上，YOWOv2 以超过 20 FPS 的速度实现了 21.7% 的帧 mAP。

02

中文文本挖掘预处理流程总结

在对文本做数据分析时，我们一大半的时间都会花在文本预处理上，而中文和英文的预处理流程稍有不同，本文就对中文文本挖掘的预处理流程做一个总结。

03

Excelize 2.7.0 发布, 2023 年首个更新

Excelize 是 Go 语言编写的用于操作 Office Excel 文档基础库，基于 ECMA-376，ISO/IEC 29500 国际标准。可以使用它来读取、写入由 Microsoft Excel™ 2007 及以上版本创建的电子表格文档。支持 XLAM / XLSM / XLSX / XLTM / XLTX 等多种文档格式，高度兼容带有样式、图片(表)、透视表、切片器等复杂组件的文档，并提供流式读写 API，用于处理包含大规模数据的工作簿。可应用于各类报表平台、云计算、边缘计算等系统。入选 2020 Gopher China - Go 领域明星开源项目(GSP)、2018 年开源中国码云最有价值开源项目 GVP (Gitee Most Valuable Project)，目前已成为 Go 语言最受欢迎的 Excel 文档基础库。

ES中的中文分词技术，很牛逼！

Elasticsearch是一个流行的全文搜索引擎，能够高效地处理大量的复杂查询。在处理中文文本数据时，需要将文本进行分词处理，并对分词结果进行索引和搜索。ES提供了多种中文分词器，能够适应不同场景和需求。本文将详细介绍ES中的中文分词技术。

02

字符编码笔记：ASCII，Unicode和UTF-8

很久很久以前，有一群人，他们决定用8个可以开合的晶体管来组合成不同的状态，以表示世界上的万物。他们看到8个开关状态是好的，于是他们把这称为"字节"。再后来，他们又做了一些可以处理这些字节的机器，机器开动了，可以用字节来组合出很多状态，状态开始变来变去。他们看到这样是好的，于是它们就这机器称为"计算机"。开始计算机只在美国用。八位的字节一共可以组合出256(2的8次方)种不同的状态。他们把其中的编号从0开始的32种状态分别规定了特殊的用途，一但终端、打印机遇上约定好的这些字节被传过来时，就要做一些约定的动作。遇上00x10，终端就换行，遇上0x07，终端就向人们嘟嘟叫，例如遇上0x1b，打印机就打印反白的字，或者终端就用彩色显示字母。他们看到这样很好，于是就把这些0x20以下的字节状态称为"控制码"。他们又把所有的空格、标点符号、数字、大小写字母分别用连续的字节状态表示，一直编到了第127号，这样计算机就可以用不同字节来存储英语的文字了。大家看到这样，都感觉很好，于是大家都把这个方案叫做 ANSI 的"ASCII"编码（American Standard Code for Information Interchange，美国信息互换标准代码）。当时世界上所有的计算机都用同样的ASCII方案来保存英文文字。后来，就像建造巴比伦塔一样，世界各地的都开始使用计算机，但是很多国家用的不是英文，他们的字母里有许多是ASCII里没有的，为了可以在计算机保存他们的文字，他们决定采用127号之后的空位来表示这些新的字母、符号，还加入了很多画表格时需要用下到的横线、竖线、交叉等形状，一直把序号编到了最后一个状态255。从128到255这一页的字符集被称"扩展字符集"。从此之后，贪婪的人类再没有新的状态可以用了，美帝国主义可能没有想到还有第三世界国家的人们也希望可以用到计算机吧！等中国人们得到计算机时，已经没有可以利用的字节状态来表示汉字，况且有6000多个常用汉字需要保存呢。但是这难不倒智慧的中国人民，我们不客气地把那些127号之后的奇异符号们直接取消掉，规定：一个小于127的字符的意义与原来相同，但两个大于127的字符连在一起时，就表示一个汉字，前面的一个字节（他称之为高字节）从0xA1用到0xF7，后面一个字节（低字节）从0xA1到0xFE，这样我们就可以组合出大约7000多个简体汉字了。在这些编码里，我们还把数学符号、罗马希腊的字母、日文的假名们都编进去了，连在 ASCII 里本来就有的数字、标点、字母都统统重新编了两个字节长的编码，这就是常说的"全角"字符，而原来在127号以下的那些就叫"半角"字符了。中国人民看到这样很不错，于是就把这种汉字方案叫做 "GB2312"。GB2312 是对 ASCII 的中文扩展。但是中国的汉字太多了，我们很快就就发现有许多人的人名没有办法在这里打出来，特别是某些很会麻烦别人的国家领导人。于是我们不得不继续把 GB2312 没有用到的码位找出来老实不客气地用上。后来还是不够用，于是干脆不再要求低字节一定是127号之后的内码，只要第一个字节是大于127就固定表示这是一个汉字的开始，不管后面跟的是不是扩展字符集里的内容。结果扩展之后的编码方案被称为 GBK 标准，GBK 包括了 GB2312 的所有内容，同时又增加了近20000个新的汉字（包括繁体字）和符号。后来少数民族也要用电脑了，于是我们再扩展，又加了几千个新的少数民族的字，GBK 扩成了 GB18030。从此之后，中华民族的文化就可以在计算机时代中传承了。中国的程序员们看到这一系列汉字编码的标准是好的，于是通称他们叫做 "DBCS"（Double Byte Charecter Set 双字节字符集）。在DBCS系列标准里，最大的特点是两字节长的汉字字符和一字节长的英文字符并存于同一套编码方案里，因此他们写的程序为了支持中文处理，必须要注意字串里的每一个字节的值，如果这个值是大于127的，那么就认为一个双字节字符集里的字符出现了。那时候凡是受过加持，会编程的计算机僧侣们都要每天念下面这个咒语数百遍： "一个汉字算两个英文字符！一个汉字算两个英文字符......" 因为当时各个国家都像中国这样搞出一套自己的编码标准，结果互相之间谁也不懂谁的编码，谁也不支持别人的编码，连大陆和台湾这样只相隔了150海里，使用着同一种语言的兄弟地区，也分别采用了不同的 DBCS 编码方案——当时的中国人想让电脑显示汉字，就必须装上一个"汉字系统"，专门用来处理汉字的显示、输入的问题，但是那个台湾的愚昧封建人士写的算命程序就必须加装另一套支持 BIG5 编码的什么"倚天汉字系统"才可以用，装错了字符系统，显示就会乱了套！这怎么办？而且世界民族之林中还有那些一时用不上电脑的穷苦人民，他们的文字又怎么办？真是计算机的巴比伦塔命

01

做项目一定用得到的NLP资源【分类版】

原文链接：https://github.com/fighting41love/funNLP

04

如何用Python做情感分析？

商品评论挖掘、电影推荐、股市预测……情感分析大有用武之地。本文帮助你一步步用Python做出自己的情感分析结果，难道你不想试试看？

02

干货 | 一文轻松了解NLP所有相关任务简介！

本文根据自己的学习以及查阅相关资料的理解总结，简要的介绍一下自然语言处理(nlp)一些相关技术以及相关任务，nlp技术包括基础技术和应用技术。后续会抽空继续分专题完善这一个系列。限于作者水平有限，其中难免有错漏之处，欢迎读者斧正。

02

05.序列模型 W3.序列模型和注意力机制

序列模型和注意力机制（Sequence models & Attention mechanism）

01

初学者|NLP相关任务简介

本文根据自己的学习以及查阅相关资料的理解总结，简要的介绍一下自然语言处理(nlp)一些相关技术以及相关任务，nlp技术包括基础技术和应用技术。后续会抽空继续分专题完善这一个系列。限于作者水平有限，其中难免有错漏之处，欢迎读者斧正。

07

你真的会用wordcloud制作词云图吗？

对于文本分析而言，大家都绕不开词云图，而python中制作词云图，又绕不开wordcloud，但我想说的是，你真的会用吗？你可能已经按照网上的教程，做出来了一张好看的词云图，但是我想今天这篇文章，绝对让你明白wordcloud背后的原理。

02

UTF-8编码规则_库德巴码编码规则字符编码笔记：ASCII，Unicode和UTF-8

UTF-8是Unicode的一种实现方式，也就是它的字节结构有特殊要求，所以我们说一个汉

03

如何用Python做词云？

临渊羡鱼，不如退而结网。我们步步为营，从头开始帮助你用Python做出第一张词云图来。欢迎尝试哦！

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭