sladesal

LV1
发表了文章

文本相似性的总结

说到文本相似性可以有很多种划分的方式,从文章的长短可以分别处理,从计算的方式可以分为深度学习和机器学习方式,从实现目的上可以分为去重和匹配...

sladesal
发表了文章

快速上手关键词抽取的算法

在自然语言处理领域,我们有一种类型的问题是如何在一堆文本中提取出核心词/句子。而无论是对于长文本还是短文本,往往几个关键词就可以代表整个文本的主题思想。同时,在...

sladesal
Java编程算法推荐系统
发表了文章

Bert需要理解的一些内容

mask+attention,mask的word结合全部其他encoder word的信息

sladesal
自然语言处理机器学习神经网络深度学习AI 人工智能
发表了文章

xDeepFM架构理解及实现

本文主要是为了讲解xDeepFM的框架,及如何用tensorflow去实现主干部分,如果需要直接拆箱可用,可以参考:xDeepFM,我的部分代码也来自于其中,这...

sladesal
批量计算
发表了文章

集成学习需要理解的一些内容

本系列为深入篇,尽可能完善专题知识,并不会所有的都会出现在面试中,更多内容,详见:Reflection_Summary,欢迎交流。

sladesal
机器学习神经网络线性回归
发表了文章

LR需要理解的一些内容

本系列为深入篇,尽可能完善专题知识,并不会所有的都会出现在面试中,更多内容,详见:Reflection_Summary,欢迎交流。

sladesal
线性回归机器学习神经网络深度学习
发表了文章

Auto Machine Learning初探

最近在看AutoML,业界在 automl 上的进展还是很不错的,个人比较看好这个方向,所以做了一些了解:

sladesal
机器学习神经网络深度学习AI 人工智能编程算法
订阅了专栏

腾讯云自媒体分享计划

3 文章3.4K 关注者
关注了用户

腾讯云自媒体分享计划

腾讯 · 产品运营 (已认证)

申请条件:至少有 20 篇或以上符合投稿要求可迁入腾讯云专栏的原创技术文章。

3 文章0 回答3.4K 关注者
发表了文章

Python自用工具包PyTls

做这件事的初衷是发生了一个星期要用python同时开发3个项目的情况,我发现了两个现象:1.有很多定制化的需求是极度高频反复重写的;2.有很多功能之前写过,可能...

sladesal
Python测试服务 WeTestGit
发表了文章

语音转译文本后的意图识别(YMMNlpUtils)

现在由于业务需求,又新增了一个语音对话过程中是否存在手机号交换行为意图的识别,所以更新了一个版本YMMNlpUtils==0.1.1。实际拿来用的数据比想象中的...

sladesal
GitGitHub开源编程算法
发表了文章

Python踩坑指南(第二季)

本期围绕jieba讲一个我遇到的实际问题,在同一个服务里,存在两个不同接口A和B,都用到了jieba分词,区别在于两者需要调用不同的词库,巧合中,存在以下情况:

sladesal
发表了文章

Python踩坑指南(第一季)

最近在python开发的过程中,发现了一些比较有意思的问题,确实让自己在开发过程中被恶心了一把,所以开了这个连续的更新博文,之后会持续的按第一第二第三这种版本下...

sladesal
编程算法Python
发表了文章

中文语境下的手机号识别

最近在做一个关于中文大段文本中的手机号码识别,由于属于对抗性的一个文本,发现传统的手机号码识别方法,比如正则匹配并不是很适用。

sladesal
Git
发表了文章

PKUseg在货运领域的评测

给大家的建议就是,如果大家赶时间求稳定适应范围需要非常广的时候,目前来说jieba是非常好的选择,如果说在面临一些精细化领域的特殊需求的时候,可以用PKUseg...

sladesal
Git
发表了文章

pandas数据读取的问题记录

最近发现pandas的一个问题,记录一下: 有一组数据(test.txt)如下:

sladesal
其他
发表了文章

YoutubeNet的数据答疑

实在是太忙了,抽空给大家解析一下之前写的YoutubeNet的数据是怎么构造的,协助大家可以自行构造一下。

sladesal
数据处理
发表了文章

GolVe向量化做文本分类向量化文本分类

第一种是常规方法的one-hot-encoding的方法,常见的比如tf-idf生成的0-1的稀疏矩阵来代表原文本:

sladesal
其他
发表了文章

Google团队在DNN的实际应用方式的整理

很荣幸有机会和论文作者Emre Sargin关于之前发的Deep Neural Networks for YouTube Recommendations进行交流...

sladesal
其他
发表了文章

Stanford Word Segmenter问题整理

最近在做一些nlp相关的项目,在涉及到Stanford CoreNLP工具包处理中文分词的时候,发现耗时问题很严重:

sladesal
其他

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券