原创分享计划特约作者
暂无搜索历史
想做健身博主的算法工程师
腾讯 · 后台开发 (已认证)
https://www.cnblogs.com/klchang/p/17352911.html
是时候把之前学习NLP的知识整理下了。大模型火了后,又涌出好多Transfomer相关的文章,回想当时刚接触NLP的时候,还是从word2vec开始...很久前...
import应该是python代码中比较常见的模块了。import就是导入其他文件中的类,方法,变量,我认为除了主流程逻辑,其他代码文件模块就是为了给别人imp...
前段时间做可一些用户画像方面的工作,对用户画像技术有了初步了解。如果你是一个对大数据和用户画像技术完全不了解的小白,希望这篇文章可以提供一点帮助。
腾讯云 · 产品运营 (已认证)
腾讯云开发者社区官方账号
本文主要介绍了RFM模型,以及使用pyspark实现利用RFM模型对用户分层的简单应用~让大家对RFM有一个更深刻的认识
有一天发现,在腾讯文档中想搜索之前写的东西需要收费了。这钱非花不可吗?好像不用。我们可以利用langchain+chatGLM在本地搭建自己的知识库,除了能搜索...
本文主要介绍ChatGLM-6B 的本地部署,提供更保姆级别的教程,让完全不懂技术的同学,也能在本地部署大模型~
huaban/jieba-analysis是java版本最常用的分词工具。github上很详细的介绍了使用方法。
我们在使用python处理中文字符串时总会遇到一些问题,特别是一些老项目需要用到python2,中文显示乱码,文件读写异常等问题时常发生。
本文我们主要介绍pyspark的核心概念和原理,后续有时间会持续介绍pyspark的使用。
首先我们实现两个排序算法,如果想统计耗时比较,需要在每个算法中添加耗时统计逻辑。如果有10个排序算法,每个算法中都需要重复这种逻辑操作。
函数传参是最常用的方法,但是你真的掌握python里参数的传递和使用了吗?之前文章我们介绍了传参的拷贝情况,会不会引起传入参数的变化。本文详细介绍python的...
在实操大数据之前,我们可以先在本地进行一些小型数据库的操作,对sql和spark进行一些初步了解。本文就先介绍下mysql和workbenck的安装和使用,以及...
本文主要介绍在win10上如何安装和使用pyspark,并运行经典wordcount示例,以及分享在运行过程中遇到的问题。
佰钧成技术有限责任公司 · 架构师 (已认证)
一名合格的、二把刀的、科班的程序猿
腾讯 · 高级研究员 (已认证)
暂未填写学校和专业
暂未填写个人网址