首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

针对Python开发人员的10个“疯狂”的项目构想

它甚至是最适合用于实现 人工智能 和 机器学习 算法的语言。 因此,在过去的几周里,我为 Python 开发人员收集了一些独特的项目构想。这些项目构想很有可能会让你对这门神奇的语言产生兴趣。...交互示例——原图来自 [Unsplash](https://unsplash.com/?...你甚至可以获得类似 Leela Zero 这样程序的 源码。 我想表达的一点是,人工智能正在变得比我们更聪明。这意味着它可以通过考虑所有的可能性并从过去的经验中学习来更好地预测一些事情。...交易——图片来自 [Unsplash](https://unsplash.com/?...结论 通过这些独特的编程项目来挑战自己,可以让自己保持活力,提高技能,并能帮助你探索新的可能性。 我上面提到的一些项目构想也可以用作你的毕业设计。

53830

从背景中学习:基于区域自适应实例归一化的图像和谐化方法

作者:凌军 这是我们最近发表在CVPR2021的工作,主要功能是图像后期融合处理,让组合图像看起来更和谐,实验效果如图1所示。...在实际应用中,很多图像处理工作可能只需要编辑局部图像,例如将一张原始图像中的目标区域抠取并粘贴到另一张目标图像上。...然而,原始图像中的目标区域与目标图像可能存在视觉特征不和谐、不融洽的问题,这便容易产生不真实感,即不和谐(具体例子见图2)。...[7]提出一个大规模的数据集,并且提出一种域判别损失,对和谐的前景背景图像与不和谐的前景背景图像计算对抗损失,从而来辅助生成器映射网络预测出更和谐的结果。 Why?...多样化的前景特征风格与不和谐的组合图像及其和谐化结果 How?

2.1K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    10个我经常逛的小网站,嘿嘿!!!

    前言 你的文件夹里有没有一些私人喜好的小网站?嘿嘿!!!必须有啊!分享10个我经常使用、能够提高工作效率、美化图片、绘制流程图的网站,你可能也用得上喔。....# 随机美图 https://unsplash.com/ 写文章没配图?其他地方找担心有版权问题?那这个网站绝对值得收藏,它有海量免费照片供你选择。...别担心,推荐一个能将正则表达式可视化的工具,是不是写起来简单多了?....# 海量CDN资源 https://cdnjs.com/ 有时候想本地写个例子不想安装各种依赖,一个在线cdn.js就可以帮我们搞定,但是哪里有海量又稳定的资源呢?没错就是这里啦。...甚至它连代码都给你写好,直接复制粘贴搞定。 10.# 插图也很美 https://www.manypixels.co/gallery 也许你不经常使用,但真的超级实用,一个免费海量的插图网站

    1.8K10

    从迁移学习到图像合成

    图像合成 (image composition) 是指把一张图片的前景剪切下来,粘贴到另外一张背景图片上,得到一张合成图。...但是得到的合成图可能会有很多问题,比如前景和背景颜色光照不一致,前景的位置大小不合理等,这些都会让合成图看起来不真实,影响合成图的质量。...之前的相关工作致力于解决其中一个或者多个子问题,但是非常零散,不成系统,并且没有统一的数据集,不利于图像合成领域的发展。 ? 我之所以对图像合成这个领域感兴趣主要有以下几点原因:1....相比较图像合成,图像生成的关注度要高很多,但图像生成的精细程度有时候很难满足人的需求,比如想生成一只特定的猫,即使在生成器里加很多条件信息 (conditional information),也未必能够生成完全符合预期的猫...BargainNet和DoveNet相比,方法更简洁,训练更稳定,并且可以预测一张合成图的不和谐程度。这是一个非常实用的功能,给定一张合成图,如果预测出来的和谐程度很高,就没必要再做图像和谐化了。

    91520

    ICCV2019最佳论文SinGAN全面解读,看这一篇就懂了

    SinGAN是第一个非条件式的、使用单张自然图像训练的生成式模型。也就是说,训练后的SinGAN可以接受一个随机噪声的输入,生成新的自然图像。...为了知道变换后的分布是不是如我们所愿接近训练数据的分布,GAN引入了一个新的模块D,输入一个样本点x,输出D(x)代表着x是来自训练数据分布的概率。...reconstruction loss的目的是希望存在一组随机噪声输入,最终输出的图像就是原图。为此,作者选取这组特定的随机噪声如下: ? 其中z*是训练前随机选取的一个值,之后不再改变。...在图像中加入“不和谐”因素(如一个非常“不和谐”的飞船),输入某中间尺度生成器后,输出的结果实现了图像整体风格的和谐化。...希望这篇文章可以让大家更好地理解SinGAN的思想,为手头的研究工作提供新的可借鉴的思路。 — 完 —

    3.1K10

    TEN Agent 一键让 Coze Bot 开口说话,这下AI助手终于能跟我聊天了。

    最近在刷技术社区的时候, 发现了一个超级有意思的更新 - TEN Agent 悄悄地支持Coze Bot了! 它可以让Coze Bot直接开口说话了!这个消息对我来说是意外之喜。...之前我写过一个文章是搭建实时语音助手,用到的实时语音助手官网也是有工作流和知识库支持的,但扣子这个AI智能体平台无疑是当前NO.1。...在TEN Agent 界面填入Bot ID、粘贴API Token、点击连接 然后... 就没有然后了 ! 我的Coze机器人真的开口说话了! 而且声音清晰自然, 延迟低到让人惊喜。...如果你也想让自己的Coze Bot开口说话, 赶紧去试试吧。我已经等不及要看到更多有趣的应用了!...想换个更好听的声音? 换个TTS模块就行。想让AI能看懂图片? 加个图像识别模块就搞定。 对了, 如果你也想试试, 有两种方式: 第一种是直接用在线Demo: 1.

    44710

    CVPR | 让合成图像更真实,上交大提出基于域验证的图像和谐化

    图像合成 (image composition) 是图像处理的常用操作,把前景从一张图上剪贴下来粘贴到另一张图上,获得一张合成图。...合成图可以用来获取感兴趣的目标图像,也可以用于数据增广,有着广泛的应用的前景。但通过这种方式得到的合成图存在诸多问题,比如前景的大小或位置不合理、前景和背景看起来不和谐等等。...[1] 中的策略,具体来说,给定一张真实图,选择一个前景进行调整使其和背景不和谐,得到一张人造的合成图。...对前景进行调整使其和背景不和谐并不困难,简单的改变前景亮度即可快速生成大量的合成图。然而,如果要保证合成图的合理性和多样性并且接近实际的应用场景,则非常困难。...图像和谐化的任务是调整合成图的前景,使其与背景和谐。 域 (domain) 是一个非常宽泛的概念,在不同的应用任务中被赋予了不同的含义。

    1.2K20

    CVPR 2020 | 让合成图像更真实,上交大提出基于域验证的图像和谐化

    图像合成 (image composition) 是图像处理的常用操作,把前景从一张图上剪贴下来粘贴到另一张图上,获得一张合成图。...合成图可以用来获取感兴趣的目标图像,也可以用于数据增广,有着广泛的应用的前景。但通过这种方式得到的合成图存在诸多问题,比如前景的大小或位置不合理、前景和背景看起来不和谐等等。...[1] 中的策略,具体来说,给定一张真实图,选择一个前景进行调整使其和背景不和谐,得到一张人造的合成图。...对前景进行调整使其和背景不和谐并不困难,简单的改变前景亮度即可快速生成大量的合成图。然而,如果要保证合成图的合理性和多样性并且接近实际的应用场景,则非常困难。...图像和谐化的任务是调整合成图的前景,使其与背景和谐。 ? 域 (domain) 是一个非常宽泛的概念,在不同的应用任务中被赋予了不同的含义。

    85420

    深度学习遇上稀缺数据就无计可施?这里有几个好办法!

    用一些传统模型(如随机森林)进行实验通常不会花费很长时间,而这将有助于评估深度学习的所有潜在提升,并针对你的问题提供更多权衡深度学习方法和其他方法的视角。...二、获取更多数据 这听起来可能很荒谬,但是你真的考虑过自己能否收集更多的数据吗?我经常向公司提出获取更多数据的建议,但他们视我的建议如疯人疯语,这让我很吃惊。...自编码器的基本思想是建立一个预测输入的神经网络。 八、先验知识 ? 图 4:摄影作者 Glen Noble,来源 Unsplash(网站链接:https://unsplash.com/?...你也可以使用域知识来限制对网络的输入,以降低维度或将网络体系结构调整的更小。 我将其作为最后的选择,是因为结合先验知识可能是一个挑战,通常也是最耗费时间的。...九、让深度学习在小数据上也能变得很酷 希望本文为你提供了一些关于如何在有限的数据上使用深度学习技术的思路。我个人认为,这是一个目前没有得到足够讨论的问题,但它具有令人非常兴奋的意义。

    1K20

    实战生成对抗网络:简介

    为了让在实验中所开发的生成器网络与判别器网络双方渐渐成长茁壮,设计成最初仅能生成低解析度的马赛克图像,随着训练进行,渐渐生成高解析度的图像。...但是生成对抗网络(GAN)的出现,让事情发生了变化。GAN采用半监督学习的方式,自动从源数据中学习。...小结 仅从原理上看,GAN比较容易理解,实际上GAN还是有数学理论基础的,但没有一定数学基础的人,估计也很难理解。本着从工程的角度,我还是想探讨其实现以及在现实中的应用。...在后续的文章中,我将从一个最简单的生成手写数字开始,探索GAN的应用,预期将包含如下内容: 采用DCGAN(深度卷积生成对抗网络)优化手写数字的生成 使用SSGAN(半监督学习生成对抗网络)实现图像生产生成...利用CGAN(条件生成对抗网络)生成时尚衣柜 利用CycleGAN(循环一致生成网络)实现图像风格的转换 从文本构建逼真的图像 我的数学能力有限,因此主要以代码实例为主,不会过多深入理论,敬请关注。

    85230

    谷歌Up主自制秃头生成器张东升躺枪,而这款生发GAN让你发际线前进一公里!

    想转行的同学,可以作为参考。 ? 霸王不防脱?SC-FEGAN:让你的发际线前进一公里 很多同学表示,如果学完MarsLUL推荐的一堆课程,秃头生成器就不用了。 ?...当然可以用GAN来完成了,GAN的精髓就一个字,给我数据,干! 前面的那款GAN让张东升的发际线后移了一公里,今天我们就来介绍一款GAN把那些年遗失的头发给种回去!...这款植发器就是SC-FEGAN,它采用全卷积网络,使用SN-patchGAN判别器来修缮不和谐的边缘,可以进行端到端的训练,训练时不光使用了一般的GAN损失,还用了风格损失,所以图像补全和风格化都做的很好...训练时,随机将一个眼睛或头发的掩模作为起点,表达被遮盖的部分。具体算法如下: ? 创新的数据预处理方法,是SC-FEGAN成功的最大功臣。 论文作者使用HED边缘检测器生成与用户输入相对应的草图。...有意思的是 ,这篇论文的输入不是传统的512x512x3,而是一个尺寸为512×512×9的张量,这个张量是由5部分构成,首先是被覆盖残缺的RGB图像,其次是提取得到的草图,图像的颜色域RGB图,掩码图

    65410

    img标签随机获取高质量图片

    博主打算为自己在vps上挂载的服务, 建立一个导航页, 于是写一个静态页面, 贴了几个超链接 后来, 感觉不美观, 就放了几张图片 服务器存储的图片看了几遍就看腻了, 于是找了一个高质量图片的api,...每次打开导航页都能看到随机的封面 开源图片api的使用 我想获得300*300, 关于book和library的图片" https://source.unsplash.com/300x300/?...book,library 将随机图片嵌入到html中 随机封面测试地址(页面每次刷新,都能看到不同的封面): http://zhaoolee.com 页面部分源码: ...如果你对图片的质量有极致的追求,https://source.unsplash.com 提供了丰富的接口参数设置,可以定制化随机图片的范围, 当然也可以在unsplash.com 注册一个账号, 订阅特别主题的图片

    2.2K10

    我们分析了超过50万首诗歌,教你用代码写诗

    为了找出方法,我做了一个实验。 首先,我知道如果我的机器人想写诗,首先要让它读诗。...我联系了一些写了许多诗的诗人,并问他们是否愿意和我一起进行一个有趣的实验:他们是否允许我的机器人读他们的作品,让它可以从中学习出诗歌的形式和结构,从而可能学会自己写诗?...可能一个层负责识别直角,另一个层负责识别平行边。它们同时存在时图像才是正方形。神经网络通过训练数百万张正方形图像,从中学习到这些层。...如果想深入了解LSTM是如何工作的,可以查看这个很赞的帖子,作者是谷歌大脑的Chris Olah。 与许多用LSTM生成文本的例子相同,机器人生成文本时每一时刻生成一个字符。...在keras的例子中,这个例子从训练数据中选择一个随机的字符序列作为种子,输入到训练好的网络中。我要的是一个可以自己写诗的机器人,而不是完成其他诗人的提示!因此,我在文本生成步骤中尝试了不同的种子。

    91070

    为什么智能自动化对政府的未来至关重要

    智能自动化就是要去掉员工不喜欢做的单调日常任务,让他们的精力投入到更需要人类的判断和经验的、更令人满意的任务。 那么为什么智能自动化对政府如此重要呢?...美国总务管理局(General Services Administration)正在使用聊天机器人招募新员工。...首先确定需要使用三类智能自动化中的哪一类。如果是为了自动执行日常重复性任务,比如把数据从一个表单剪切粘贴到另一个表单,考虑入门级:机器人过程自动化(RPA)。...一个例子是在机构网站上使用聊天机器人,可以帮助公众通过文字或语音聊天获得信息。 复杂程度最高的级别是推理性认知自动化,有望利用人工智能、机器学习和自然语言处理来进行学习和解决问题。...最后,领导者应该记住,对于那些主张解决眼前的文化和治理问题的机构来说,引入智能自动化可能会给机构带来不和谐的变化。智能自动化不仅仅是一个技术问题,整个机构的领导者都应该参与到规划中。

    77280

    【深度强化学习突破】OpenAI Gym 玩游戏达到人类水平

    这听上去有些不可能 现在我想让你感叹一下RL问题有多么困难。我们有100800个数字(210*160*3)输入到策略网络中(它很容易就会包含像W1和W2中那样的数十万个参数)。...监督式学习 在我们继续深入策略梯度的解决方案之前,我想让你简单地回忆一下监督式学习;这是因为,我们很快就会看到,RL与监督式学习非常相似。参见下面的示意图。...策略梯度溯源 我也想稍微谈一下策略梯度从数学上是如何得到的。策略梯度是更通用的得分函数梯度估计(score function gradient estimator)的一个特例。...这个想法在《视觉注意的递归模型》一文中首次出现,文中的模型使用一系列来自一小片视觉注意区的低分辨率影像来处理图像(受到人类视网膜的启发)。...在此,我想以一些笔记收尾: 推进人工智能发展 我们看到了这个算法首先使用暴力搜索的方式随机跳跃地进行搜索,并且必须至少一次偶然地进入回报情景(rewarding situation),最好能经常进入,然后不停地重复这个过程直至策略分布调整了它的参数来增加目标行为的重复概率

    2.3K60

    元学习的崛起

    随着对抗性噪声的注入也不会错分,这样的事情已经不足以让人感到惊奇,但深度卷积网络在进行模拟图像训练(左下图)到实际视觉数据(右下图)时,无需改动参数就不会过拟合。 ?...后一种方法称为域随机化。下图来自Tobin等人在2017年的论文中很好地说明了这一想法: ?...与视觉随机化的想法类似,这些物理随机化包括诸如立方体的大小/质量和手指在机器人手中的摩擦(有关更多详细信息,请参见附录B用机器人手解决Rubik立方体的问题)。...这种转移元学习是策略网络中用于训练机械手控制的LSTM层的结果。我认为与自动优化相比,元学习的这种使用更像是记忆增强网络的一个特征。我认为这说明了统一元学习和确定术语的单一定义的困难。...结束语 魔方的成功显然是引人注目的,因为它展示了机器人手的协调能力。然而,这项研究更有趣的部分是元学习数据的随机化。这是一个在设计训练数据的同时进行学习的算法。

    81420

    3D电影化照片背后的技术揭秘

    为了能够在不是双目多视角拍摄的已有图片上使用电影照片,我们训练了一个具有编解码结构的卷积神经网络来从单个 RGB 图像预测深度图。...由于单目深度估计数据集通常是为 AR、机器人和自动驾驶等领域设计的,因此它们主要倾向于街景或室内房间场景,而不是普通摄影中更常见的人、宠物和物体等,这些特征具有不同的构成和构图。...然而,这也带来了新的挑战,因为来自不同数据集的 ground-truth 深度可能会因为一个未知的缩放因子和偏移而有所差异。幸运的是,电影照片效果只需要场景中物体的相对深度,而不是绝对深度。...电影照片效果对人物边缘的深度图的准确性特别敏感。深度图中的错误可能导致最终渲染效果中产生不和谐的 artifacts。...总结 通过电影照片,我们实现了一个算法系统——对每个机器学习模型进行公平性评估——它们一起工作,让用户以一种新的方式重温他们的记忆,我们对未来的研究和功能改进感到很兴奋。

    78041

    MIT推出拾物机器人「最强辅助」,少量训练样本即可实现自然语言控制

    MIT的这项新成果,让取物机器人变得更聪明了! 不仅能理解自然语言指令,还可以拾取没见过的物体。 麻麻再也不用担心我找不到东西了!...视频 研究人员将2D特征嵌入了三维空间,构建出了用于控制机器人的特征场(F3RM)。 这样一来,在2D图像中构建的图像特征和语义数据,就能被三维的机器人理解并使用了。...比如这个杯子,我们可以指定机器人抓住杯身或者杯把。 除了拾取问题,还可以让机器人把拾到的东西放到指定位置。 比如把杯子分别放到木制和透明的支架上。 团队提供了完整的,没有经过筛选的实验结果。...那么,如何利用F3RM帮助机器人工作呢? 将2D特征投射到三维空间 下面这张图大致描述了利用F3RM帮助机器人拾取物品工作流程。 F3RM是一个特征场,要想让它发挥作用,首先要得到有关数据。...经过这样的过程,就得到了低样本量的语言控制取物机器人。 团队简介 研究团队成员全部来自MIT的CSAIL实验室(计算机科学与人工智能实验室)。

    20230

    上交开源业界首个两阶段物体阴影生成网络,自建数据集DESOBA,入选AAAI 2022

    图像合成 (image composition) 是指把一张图片的前景剪切下来,粘贴到另外一张背景图片上,得到一张合成图。...广义来讲,把来自不同图片的多个视觉元素嫁接到同一张图片上,都属于图像合成的范畴。图像合成有着广泛的应用场景,比如人像换背景、虚拟社交、艺术创作、自动广告等等。下图展示了得到一张合成图的过程。...,可以视为图像到图像翻译 (image-to-image translation) 的任务。...具体来说,iHarmony4 为了构建成对的和谐图片与不和谐图片,把真实图片作为目标图片,对前景用颜色迁移方法调整颜色和光照,使其和背景不和谐,获得伪造合成图,通过这种方式得到成对的合成图和目标图。...因为数据量有限,在训练的时候采用了一种数据增广的方式,随机选择图片中的若干物体打包成一个前景物体,增加前景物体的丰富程度。实验证明了这种数据增广方式的有效性。

    69930

    三角兽马宇驰:技术壁垒和落地场景才是硬科技的“硬道理”

    它是一个系统底层功能,不是一个装机。 咱们用手机的时候有两个触碰,一个点击,一个是语音助手,我们对文本的操作、移动光标的目的是接下来把它复制到另一个当中去干点什么事,才有复制粘贴。...比如我们开一个会到一个酒店,基于一段话做很多动作,复制、粘贴、退出,比如买票、搜索,而我们做的,无论是单指还是双指点进去就可以,不会打断你在APP当中的阅读。...语义做的是文本,对于计算机来说只能识别文本,这个功能极有可能是明年替代在安卓系统复制粘贴的一种操作习惯,不是一个单纯能力的问题。...有了屏可以带来二次消费的机会,有屏的音箱是一个势在必行的趋势。 我要听歌,我要打开电视,这是任务型对话,任务型的对话都要有个明确目的。...你问它如何,机器也可以问你,都可以聊天,用户画像建立在产品的样本数量上。同时还可以交互,了解你是谁,有什么兴趣爱好。 另外我要谈下客服机器人平台。

    95720
    领券