首页
学习
活动
专区
工具
TVP
发布

AI科技时讯

专栏作者
251
文章
220741
阅读量
28
订阅数
AI资讯
2023年刚刚过完一个月,美国科技公司就有超过6万名员工被裁,其中很多来自微软、谷歌、亚马逊、IBM、Paypal、Meta等大型企业。而算上去年末被裁的,已经有超过10万人在最近几个月的科技公司裁员浪潮中失业。从大公司被裁掉的人员总数,占硅谷总裁员人数的75%。 https://36kr.com/p/2114613782497670
用户3578099
2023-02-14
5720
数据不平衡问题
对于一些二分类问题或者多分类问题,部分类别数据相较于其它类别数据而言是要小得多的,这种现象就是数据不平衡问题。数据不平衡问题会导致什么情况呢?假如是基于一些特征判断病人是否患有该疾病,且该疾病是一个小概率获得的疾病,假设概率为0.0001, 那么表明有10000个来看病的人中只有一个人患有该疾病,其余9999个人都是正常病人。如果用这样的一批数据进行训练模型算法,即使该模型什么都不学,都判定为正常人,其准确率高达0.9999, 完全满足上线要求。但我们知道,这个模型是不科学的,是无用的模型。这种数据分布严重不平衡的情况下,模型将具有严重的倾向性,倾向于数据样本的多的类别,因为模型每次猜样本多对应的类别的对的次数多。因此,如果直接将严重数据不平衡的数据拿来直接训练算法模型,将会遇到上述问题。一般在10倍以上可以判定为数据不平衡问题。
用户3578099
2023-02-14
6260
反欺诈黑产总结
羊毛党专注于市场上各类机构的营销活动,以低成本甚至零成本换取高额奖励,其主要活跃在 O2O 平台或电商平台。
用户3578099
2022-11-25
1.8K0
LeetCode:122. 买卖股票的最佳时机 II
链接: https://leetcode.cn/problems/best-time-to-buy-and-sell-stock-ii
用户3578099
2022-11-25
2690
算法-数组-两数之和
给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数,并返回它们的数组下标。
用户3578099
2022-06-10
6350
leetcode每日一题:689.三个无重叠子数组的最大和
来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problems/maximum-sum-of-3-non-overlapping-subarrays
用户3578099
2021-12-11
2980
leetcode每日一题:766. 托普利茨矩阵
https://leetcode-cn.com/problems/toeplitz-matrix/
用户3578099
2021-03-11
3510
leetcode每日一题:714. 买卖股票的最佳时机含手续费
https://leetcode-cn.com/problems/best-time-to-buy-and-sell-stock-with-transaction-fee/
用户3578099
2020-12-30
4980
使用挤压、哈哈镜、扭曲进行文字图像增强
在做ocr项目时候,会涉及到两个部分,文字区域检测与文字图像识别。在之前的文章中有
用户3578099
2020-12-14
1.5K0
HuBMAP: 识别人体肾脏组织图像中的肾小球
近日Kaggle新上了一个比赛:HuBMAP: Hacking the Kidney ,(入侵肾脏),是人类生物分子图谱计划HuBMAP的一部分,希望以单细胞分辨率绘制人类肾脏图谱开始。
用户3578099
2020-11-30
1.2K0
Scaled-YOLOv4 介绍
分享一篇新出的重要文章:Scaled-YOLOv4: Scaling Cross Stage Partial Network,作者出自YOLOv4的原班人马,其聚焦于针对YOLOv4的模型缩放(model scale)。
用户3578099
2020-11-30
1.2K0
图像凹凸算法(代码全)
图像压效果本质的图像坐标的非线性变换,将图像向内挤压,挤压的过程产生压缩变形,从而形成的效果。
用户3578099
2020-11-19
1.4K0
OCR文本图像合成工具
在进行文字识别时候,需要使用的数据集样式为一张含有文本的图片以及对应文本内容的标签。但是一般而言,实际情况是构建的文本字典中,每个字至少要出现200次才能有好的识别效果,因此,先对所有的label进行单字统计,看每个字出现的个数是否超过200次,如果不满足,则需要进一步收集数据。
用户3578099
2020-11-03
1.8K0
Pymysql 连接池操作
在用python写后端服务时候,需要与mysql数据库进行一些数据查询或者插入更新等操作。启动服务后接口运行一切正常, 隔了第二天去看服务日志就会报错,问题如下:
用户3578099
2020-11-03
3.9K0
DSSM: Learning deep structured semantic models for web search
DSSM是Deep Structured Semantic Model的缩写,即我们通常说的基于深度网络的语义模型,其核心思想是将query和doc映射到到共同维度的语义空间中,通过最大化query和doc语义向量之间的余弦相似度,从而训练得到隐含语义模型,达到检索的目的。DSSM有很广泛的应用,比如:搜索引擎检索,广告相关性,问答系统,机器翻译等。
用户3578099
2020-09-29
6120
Python从入门到熟练(2):Python简介
在1989年的圣诞节,吉多决定开发一种新的脚本解释语言,作为ABC语言的继承。ABC语言是由吉多参加设计的一种教学语言,但是随着时间的推移,ABC语言因为自身封闭的语言特性,而没有广泛流行起来。
用户3578099
2020-09-10
5900
计算机视觉经典网络回归--AlexNet
AlexNet模型来源于论文-ImageNet Classification with Deep Convolutional Neural Networks,作者Alex Krizhevsky,Ilya Sutskever,Geoffrey E.Hinton.
用户3578099
2020-04-01
1K0
南京大学吴建鑫教授「卷积神经网络CNN」笔记,35页pdf初学者学习指南理解CNN数学原理
【导读】卷积神经网络是深度学习中的基础模型。南京大学吴建鑫教授的「卷积神经网络CNN」笔记,35页pdf初学者学习指南理解CNN数学原理。
用户3578099
2020-03-04
1.4K0
YOLO 目标检测从 V1 到 V3 结构详解
在目标检测中,IoU 为预测框 (Prediction) 和真实框 (Ground truth) 的交并比。如下图所示,在关于小猫的目标检测中,紫线边框为预测框 (Prediction),红线边框为真实框 (Ground truth)。
用户3578099
2019-12-06
5610
Python学习笔记(4):Python语言规范及code review注意事项
任何编程语言,都有很多从业人员使用。在任何行业,都有一些规定,这些规定有些成文,有些不成文。比如在以前,古懂行,买定离手,买对买错也不要再回头去找买家或卖家,不然没有脸面在这个行当中混下去了。现如今,有了消费者保护法,这些不成文的规定也就不再适用了。好在编程行业没有这些虚实,都是一些成文的规定,只需要按照相应的规定及习惯遵守并与时俱进就好。 Python语言也有语言规范,一般这种行内的语言规范都是由各自公司或者遵守业内顶尖公司制定,一般大都相同。语言规范映射到代码上就是代码规范化,代码规范是比较重要的,这是由于每个人写代码的思维方式,思路,方法,技术水平随着时间而变化,这时候确实需要有较为正式的编码规范作为约束。 根据谷歌公司提供的代码规范,有以下内容
用户3578099
2019-12-05
4330
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档