首页
学习
活动
专区
工具
TVP
发布

信数据得永生

专栏作者
1385
文章
1544549
阅读量
53
订阅数
普林斯顿算法讲义(三)
一个有向图(或有向图)是一组顶点和一组有向边,每条边连接一个有序对的顶点。我们说一条有向边从该对中的第一个顶点指向该对中的第二个顶点。对于 V 个顶点的图,我们使用名称 0 到 V-1 来表示顶点。
ApacheCN_飞龙
2024-03-16
970
ChatGPT 调教日记(一):Markdown 解析器
我最近打算写个Markdown 解析器来普及 Makrdown 的扩展标准。在自己思考之前,我打算首先问 ChatGPT,然后先问它几个简单的问题来了解它是否真的知道这个标记语言。我觉得 Markdown 是全世界用的第二多的标记语言(仅次于 HTML),它不可能不知道。
ApacheCN_飞龙
2023-05-09
6530
Python 自动化指南(繁琐工作自动化)第二版:七、使用正则表达式的模式匹配
我们每天还会识别各种其他文本模式:电子邮件地址中间有@符号,美国社会保障号码有九位数字和两个连字符,网站 URL 通常有句点和正斜杠,新闻标题使用标题大小写,社交媒体标签以#开头且不包含空格,等等。
ApacheCN_飞龙
2023-04-04
6.5K0
数据科学和人工智能技术笔记 十二、逻辑回归
scikit-learn 的LogisticRegressionCV方法包含一个参数C。 如果提供了一个列表,C是可供选择的候选超参数值。 如果提供了一个整数,C的这么多个候选值,将从 0.0001 和 10000 之间的对数标度(C的合理值范围)中提取。
ApacheCN_飞龙
2022-12-02
7010
Kaggle word2vec NLP 教程 第一部分:写给入门者的词袋
NLP(自然语言处理)是一组用于处理文本问题的技术。这个页面将帮助你从加载和清理IMDB电影评论来起步,然后应用一个简单的词袋模型,来获得令人惊讶的准确预测,评论是点赞还是点踩。
ApacheCN_飞龙
2022-12-02
1.5K0
JavaScript 编程精解 中文第三版 十二、项目:编程语言
希望通过本章的介绍,你能发现构建自己的编程语言其实并不是什么难事。我经常感到某些人的想法聪明无比,而且十分复杂,以至于我都不能完全理解。不过经过一段时间的阅读和实验,我就发现它们其实也并没有想象中那么复杂。
ApacheCN_飞龙
2022-12-01
6550
复杂性思维第二版 三、小世界图
现实世界中的许多网络,包括社交网络在内,具有“小世界属性”,即节点之间的平均距离,以最短路径上的边数来衡量,远远小于预期。
ApacheCN_飞龙
2022-12-01
6980
笨办法学 Python · 续 练习 33:解析器
想象一下,你将获得一个巨大的数字列表,你必须将其输入到电子表格中。一开始,这个巨大的列表只是一个空格分隔的原始数据流。你的大脑会自动在空格处拆分数字流并创建数字。你的大脑像扫描器一样。然后,你将获取每个数字,并将其输入到具有含义的行和列中。你的大脑像一个解析器,通过获取扁平的数字(记号),并将它们变成一个更有意义的行和列的二维网格。你遵循的规则,什么数字进入什么行什么列,是你的“语法”,解析器的工作就是像你对于电子表格那样使用语法。
ApacheCN_飞龙
2022-12-01
5430
笨办法学 Python · 续 练习 32:扫描器
我的第一本书在练习 48 中非常偶然涉及到了扫描器,但现在我们将会更加正式。我将解释扫描文本背后的概念,它与正则表达式有关,以及如何为一小段 Python 代码创建一个小型扫描器。
ApacheCN_飞龙
2022-12-01
5010
笨办法学 Python · 续 练习 31:正则表达式
正则表达式(RegEx)是一种简洁的方式,用于确定字符序列应如何在字符串中匹配。通常大家都认为它们是“可怕”的,但是,正如你所知道的,任何包含在恐惧中的东西通常都不是这样。正则表达式的事实是,它们是大约八个符号的集合,告诉计算机如何匹配模式串。简单来说,他们很容易理解。人们遇到困难的地方是,尝试使用难以置信的复杂的正则表达式,其中解析器实际上会更好。一旦你明白了这八个符号和正则表达式的限制,你就会看到它们根本不可怕。
ApacheCN_飞龙
2022-12-01
3910
笨办法学 Python · 续 练习 9:`sed`
在这个练习中,我们将采取这一改进计划,并进一步跟踪一些指标。你一直在使用小型命令行工具,阅读并确定其功能,然后花费45分钟来实现一个简单的黑魔法。现在你可以列举你的功能,确定优先级,然后确定在45分钟内可以完成的功能。事实上,你可以回溯目前为止所做的所有项目,以及你的更改笔记,并计算出这一指标,看看你是否在改进。
ApacheCN_飞龙
2022-12-01
2220
笨办法学 Python · 续 练习 7:`grep`
find命令在 45 分钟内应该可能是一个挑战,但它是一个很好的挑战。到了这个时间,你应该可以去掉尽可能多的,阻止你开始的障碍。你可能会发现,当你清除一些障碍时,你的技能会变得更糟。例如,我以前在开始工作之前先走路去喝咖啡。这花了我大约 30分钟,非常好,但 30 分钟多了会变成几个小时。我决定停止这样做,但是我的工作就费劲了。原来我还需要咖啡,所以我买了一台不错的咖啡机,学会了如何制作我自己的拿铁咖啡。现在我站了起来,给自己做一杯拿铁咖啡,然后去画一些画,这让我处于创意工作的模式。
ApacheCN_飞龙
2022-12-01
2210
django 1.8 官方文档翻译: 3-1-1 URL调度器
简洁、优雅的URL 模式在高质量的Web 应用中是一个非常重要的细节。Django 允许你任意设计你的URL,不受框架束缚。
ApacheCN_飞龙
2022-11-27
1.2K0
django 1.8 官方文档翻译: 1-2-3 编写你的第一个Django应用,第3部分
本教程上接 教程 第2部分 。我们将继续 开发 Web-poll 应用并且专注在创建公共界面 – “视图 (views )”。
ApacheCN_飞龙
2022-11-27
1.8K0
# ApacheCN 校对活动参与手册
本手册充分研究了神经翻译引擎的特点,结合了社区成员的先进经验,使单人可在一周内校对完五本书,而无需逐字阅读。
ApacheCN_飞龙
2022-06-19
2370
数据科学 IPython 笔记本 7.13 向量化字符串操作
Python 的一个优点是它在处理和操作字符串数据方面相对容易。Pandas 构建于此之上,并提供了一套全面的向量化字符串操作,它们成为处理(阅读“清理”部分)实际数据时所需的重要部分。在本节中,我们将介绍一些 Pandas 字符串操作,然后使用它们来部分清理从互联网收集的,非常混乱的食谱数据集。
ApacheCN_飞龙
2022-06-03
1.6K0
通过示例学 Golang 2020 中文版【翻译完成】
原文:GolangByExample 协议:CC BY-NC-SA 4.0 阶段:机翻(1) 人最大的痛苦就是说一些自己都不相信的话。——燕京学堂鹿会 在线阅读 在线阅读(Gitee) ApacheCN 学习资源 目录 通过示例学 Golang 2020 中文版 关于 Golang 关于 Golang GO 的安装 设置工作区和你好世界程序 变量 变量 理解var关键字 变量的作用域 变量和常量的命名约定 理解:=符号或短变量声明 你好世界 常量 常量 常量在声明后可以重新赋值吗 内/外作用域
ApacheCN_飞龙
2022-04-02
6.2K0
JavaScript 编程精解 中文第三版 九、正则表达式
九、正则表达式 原文:Regular Expressions 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 部分参考了《JavaScript 编程精解(第 2 版)》 一些人遇到问题时会认为,“我知道了,我会用正则表达式。”现在它们有两个问题了。 Jamie Zawinski Yuan-Ma said, ‘When you cut against the grain of the wood, much strength is needed. When you prog
ApacheCN_飞龙
2018-05-16
1.6K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档