首页
学习
活动
专区
工具
TVP
发布

AI科技时讯

专栏作者
252
文章
222616
阅读量
28
订阅数
Facebook开源Llama2人工智能模型,为企业和创业者提供机会
Facebook 宣布将免费向公众开放其最新的人工智能模型 Llama 2。Llama 2 是一个大型语言模型,使用来自开放互联网的数十亿个单词进行训练。这是 Facebook 对 Google Palm-2 和 OpenAI GPT4 的回应。应用程序开发人员将能够直接从 Facebook 下载该模型,或通过微软、亚马逊和开源人工智能初创公司 Hugging Face 等云提供商访问该模型。
用户3578099
2023-09-01
7280
使用ChatGLM记录
ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。
用户3578099
2023-09-01
5770
AI资讯
2023年刚刚过完一个月,美国科技公司就有超过6万名员工被裁,其中很多来自微软、谷歌、亚马逊、IBM、Paypal、Meta等大型企业。而算上去年末被裁的,已经有超过10万人在最近几个月的科技公司裁员浪潮中失业。从大公司被裁掉的人员总数,占硅谷总裁员人数的75%。 https://36kr.com/p/2114613782497670
用户3578099
2023-02-14
5720
LSTM介绍及反向传播算法推导
LSTM(Long short-term memory)通过刻意的设计来避免长期依赖问题,是一种特殊的RNN。长时间记住信息实际上是 LSTM 的默认行为,而不是需要努力学习的东西!
用户3578099
2020-11-04
9960
FM:Factorization Machines
我们先从Logistic Regression出发,回顾一下LR的Score Function
用户3578099
2020-09-29
7040
1.3MB的超轻YOLO算法!全平台通用,准确率接近YOLOv3,速度快上45%丨开源
这是个模型非常小、号称目前最快的YOLO算法——大小只有1.3MB,单核每秒148帧,移动设备上也能轻易部署。
用户3578099
2020-09-11
9680
图像检索:基于内容的图像检索技术(二)
相同物体图像检索是指对查询图像中的某一物体,从图像库中找出包含有该物体的图像。这里用户感兴趣的是图像中包含的特定物体或目标,并且检索到的图片应该是包含有该物体的那些图片。如1.3图所示,给定一幅”蒙娜丽莎”的画像,相同物体检索的目标就是要从图像库中检索出那些包含有”蒙娜丽莎”人物的图片,在经过相似性度量排序后这些包含有”蒙娜丽莎”人物的图片尽可能的排在检索结果的前面。相似物体检索在英文文献中一般称为物体检索(Object Retrieval),近似样本搜索或检测(Duplicate Search or Detection)也可以归类于相同物体的检索,并且相同物体检索方法可以直接应用到近似样本搜索或检测上。相同物体检索不论是在研究还是在商业图像搜索产业中都具有重大的价值,比如购物应用中搜索衣服鞋子、人脸检索等。
用户3578099
2020-03-04
1.3K0
深度学习用于图片的分类和检测总结
1. CNN用于分类:具体的过程大家都知道,无非是卷积,下采样,激活函数,全连接等。CNN用于分类要求它的输入图片的大小是固定的(其实不单单是CNN,很多其它的方法也是这样的),这是它的一个不足之处之一。目前的大部分CNN都是用来做分类比较多。
用户3578099
2019-08-16
9400
深度学习任务面临非平衡数据问题?试试这个简单方法
对于数据科学或机器学习研究者而言,当解决任何机器学习问题时,可能面临的最大问题之一就是训练数据不平衡的问题。本文将尝试使用图像分类问题来揭示训练数据中不平衡类别的奥秘。
用户3578099
2019-08-16
7200
机器学习在实时性欺诈检测中的应用案例
“机器学习”是一门计算机科学,指的是机器对数据进行学习,并执行一些通常来说需要人类智力来完成的任务。现在,该技术正在快速发展的阶段:据Gartner称,到2022年,超过一半的数据和分析服务将由机器代替人来完成,将会比现在增长10%。
用户3578099
2019-08-16
1.2K0
仅用四行代码实现RNN文本生成模型
文本生成(generating text)对机器学习和NLP初学者来说似乎很有趣的项目之一,但也是一个非常困难的项目。值得庆幸的是,网络上有各种各样的优秀资源,可以用于了解RNN如何用于文本生成,从理论到深入具体的技术,都有一些非常好的资源。所有的这些资源都会特别分享一件事情:在文本生成过程中的某个时候,你必须建立RNN模型并调参来完成这项工作。 虽然文本生成是一项有价值的工作,特别是在学习的该过程中,但如果任务抽象程度高,应该怎么办呢?如果你是一个数据科学家,需要一个RNN文本生成器形式的模块来填充项目呢?或者作为一个新人,你只是想试试或者提升下自己。对于这两种情况,都可以来看看textgenrnn项目,它用几行代码就能够轻松地在任何文本数据集上训练任意大小和复杂的文本生成神经网络。 textgenrnn项目由数据科学家Max Woolf开发而成。 textgenrnn是建立在Keras和TensorFlow之上的,可用于生成字符和文字级文本。网络体系结构使用注意力加权来加速训练过程并提高质量,并允许调整大量超参数,如RNN模型大小、RNN层和双向RNN。读者可以在Github上或类似的介绍博客文章中阅读有关textgenrnn及其功能和体系结构的更多信息。
用户3578099
2019-08-16
6460
数据科学求职建议:掌握5种类型的数据科学项目
一年一度的秋招已经打响了发令枪,从去年的薪酬排行来看,算法工程师和数据分析等工作排在前列,很多相关专业的学生一直在自学一些网络上的公开课并阅读一些专业书籍,比如“西瓜书”、“花书”等,如果你现在仍然什么也没有准备的话,然而还想从事数据科学领域这个似乎令人望而生畏的工作话,现在就要抓紧补补相关的知识了。在这里要提示一点,自我完善的知识不要局限于数据分析相关的知识,还要额外补充下相关领域的知识。另外,简历上展示个人技能的最佳方式是使用技能组合的形式,这样能让雇主相信你可以使用你已经学习的技能。为了展示这些技能,以下是你应该着重补充的5种数据科学项目组合类型:
用户3578099
2019-08-16
4840
深度学习技巧与窍门
本文是根据自身构建深度学习模型总结而来,可能读起来比较干巴,但干货确实不少。闲话少叙,直接进入相关内容。
用户3578099
2019-08-16
7940
银行业AI:炒作背后的现实——“尽管对新技术感到兴奋,但银行业态度非常谨慎”
随着人工智能的发展,越来越多的行业都或多或少会受到该技术的影响。在博主之前的文章中,分析了人工智能、大数据以及VR对教育行业的影响,本文将分析人工智能对银行业的影响。
用户3578099
2019-08-16
4900
将算法进一步开发吗?手把手教你搭建基于CNN模型的Flask Web应用
对于机器学习和人工智能研究人员而言,好多人都只是构建好模型后就没有进一步处理了,停留在一个比较粗糙的模型上面,没有将其变成一个产品,其实好多创业型人工智能公司都是设计好模型后,将其转化成产品,之后再推向市场。每一个深度学习研究者心中或多或少都想成为一名创业者,但不知道超哪个方向发展。那么,本文将从最简单的网页应用开始,一步一步带领你使用TensorFlow创建一个卷积神经网络(CNN)模型后,使用Flash RESTful API将模型变成一个网页应用产品。 本文使用TensorFlow NN模块构建CNN模型,并在CIFAR-10数据集上进行训练和测试。为了使模型可以远程访问,使用Python创建Flask web应用来接收上传的图像,并使用HTTP返回其分类标签。
用户3578099
2019-08-16
9440
如何从机器学习数据中获取更多收益
对于深度学习而言,合适的数据集以及合适的模型结构显得至关重要。选择错误的数据集或者错误的模型结构可能导致得到一个性能不佳的网络模型,甚至可能得到的是一个不收敛的网络模型。这个问题无法通过分析数据得到很好的解决,只能是通过一次次的制作数据集、搭建模型并进行仿真实验才能发现如何最好地利用数据集以及选取什么样的模型结构。  本文讲解一些有关于数据集的实用知识,通过本文你将了解以下三点:
用户3578099
2019-08-16
8.3K0
使用AR、AI以及大数据改革教育体系——为每位学生打造自己的私人定制学习路线
教育一直以来都是社会大众讨论的热门话题,人们所喊得口号基本没有太大的变化,比如“给孩子们减负”、“还孩子一个美好童年”等。相关的教育部门也为此制定了一些政策,比如“不准开办补习班”等。但是,这些变革并没有从本质上对教育产生较大的影响,家长和学生仍然对相关部门有所怨言。人们对课堂的第一印象一直停留在现场课堂教学那种方式,这一教学方式可能导致学生学习时会比较呆板,无法将课堂学习到的内容与社会相结合,进而无法体验学习的乐趣。随着时代的进步以及相关技术的发展,新的学习方式将重点关注于将课堂与社会体验二者结合为一体,为学生们的学业发展提供一个更好的未来。
用户3578099
2019-08-16
3980
隐私与机器学习,二者可以兼得吗?——隐私保护模型PATE给出了答案
最近关于互联网隐私引发大众的关注于讨论,前有Facebook“数据门”,小扎不得不换下常穿的灰色短袖和牛仔装,换上深蓝色西装参加国会听证;后有百度总裁李彦宏称中国用户愿用隐私方便和效率引发网友强烈反感,网友评论说,牺牲隐私不一定换来效率,还可能换来死亡,比如搜索到莆田医院,还可能换来经济损失,比如大数据杀熟等等;近来有知乎强制隐私搜集条款,引发部分用户卸载APP,国内很多APP若不同意给予相关权限,则无法正常使用,这真是陷入两难境地。为什么现在很多应用会收集数据呢,《未来简史》这本书中给了答案——未来的世界数据为王,人类可能只是放大版的蚂蚁,用于产生数据。有了数据后,加上合适的算法可以完成很多事情,这些技术均与机器学习、深度学习以及数据科学相关。人们担心自己的数据被收集后会被泄露或者是被不正当使用,因此,如何将隐私数据很好地保护起来是公司需要考虑的主要问题之一。本文将分析隐私与机器学习二者的关系,并设计了一种PATE框架,能够很好地避免被动地泄露用户隐私数据,下面带大家一起看看吧。 在许多机器学习应用中,比如用于医学诊断的机器学习,希望有一种算法在不存储用户敏感信息(比如个别患者的特定病史)的情况下,就可以完成相应的任务。差分隐私(Differential privacy)是一种被广泛认可的隐私保护模型,它通过对数据添加干扰噪声的方式保护锁发布数据中潜在用户的隐私信息,从而达到即便攻击者已经掌握了除某一条信息以外的其它信息,仍然无法推测出这条信息。利用差分隐私,可以设计出合适的机器学习算法来负责任地在隐私数据上训练模型。小组(Martín Abadi、 Úlfar Erlingsson等人)一系列的工作都是围绕差分隐私如何使得机器学习研究人员更容易地为隐私保护做出贡献,本文将阐述如如何让隐私和机器学习之间进行愉快的协同作用。 小组最新的工作是PATE算法(Private Aggregation of Teacher Ensembles,PATE),发表在2018年ICLR上。其中一个重要的贡献是,知道如何训练有监督机器学习模型的研究人员都将有助于研究用于机器学习的差分隐私。PATE框架通过仔细协调几个不同机器学习模型的活动来实现隐私学习,只要遵循PATE框架指定程序,生成的模型就会有隐私保护。
用户3578099
2019-08-16
2.9K0
机器学习研究人员需要了解的8个神经网络架构(上)
在这篇文章中,我想与大家分享8个神经网络体系结构,我相信任何一个机器学习的研究人员都应该熟悉这一过程来促进他们的工作。
用户3578099
2019-08-16
5470
机器学习研究人员需要了解的8个神经网络架构(下)
上文讲述了机器学习的功能和神经网络的概念,以及简要介绍了感知器和卷积神经网络,接下来继续介绍另外6种神经网络架构。
用户3578099
2019-08-16
4790
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战,赢鹅厂证书、公仔好礼!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档