因为工作上的诉求,需要查询WORD,PDF等文件中的具体内容。考虑到写博客时的体验,尝试了一下用Atom来打开word文件,结果当然是以失败告终。之前按照超哥的推荐使用了一下docfetcher,使用体验谈不上有多好,在求助了万能的百度贴吧,吾爱论坛,知乎以后,几经周折,找到了一款叫FileLocate,功能基本满足了日常使用需要,虽然和理想的博客式文件树管理尚有出入,但是毕竟文件类型不兼容,凑活着用吧。
大数据文摘授权转载自果壳 作者:俞佳霖 编辑:biu 绘图:陈淇 我用了外公生前的文字记录和影音资料,再整合几个成熟的 AI 技术,就让他“复活”了。 那天,我突发奇想,在搜索引擎查找“用 AI 复活逝者”,看到了 Joshua“复活”他未婚妻 Jessica 的故事。 2012 年,Jessica 在等待肝脏移植过程中病情恶化,抢救无效死亡。而那时 Joshua 恰巧在外,错过了死别,他因此自责了八年。直到 2020 年,他看到了“Project December”,这个网站提示只要填写“语句样例”和“人
程序员的日常,总有一个自己的项目,不管是博客,还是一些日常应用,还是好久都不维护的一些奇怪的想法,总是需要一些前端页面去做一些应用展示,目前前端工程化已经逐渐普遍,需要打包,部署等一系列的操作。
网络上很多精明的PPT都转成PDF格式,PDF格式是不能编辑不能修改的,给了我们使用带来很大不变。有没有办法让PDF转PPT并且能还原原来的格式呢?今天小编给推荐大家使用【PaperCloud】文档转换功能中的PDF转PPT,专业的第三方转换器,能够保证PDF转PPT格式不混乱。而且无需安装软件,页面打开即可使用。
Chris Olah,谷歌大脑研究员,OpenAI团队leader,和Jeff Dean、Yoshua Bengio都有密切的学术渊源。
神经架构搜索 (NAS) 改变了构建新神经网络架构的过程。这种技术可以自动地为特定问题找到最优的神经网络架构。「最优」的定义可以看成是对多个特征之间的权衡过程进行建模,例如网络的大小和准确率 [1]。更令人印象深刻的是,现在 NAS 在单个 GPU 上仅需执行 4 个小时,过去在 800 个 GPU 上需要执行 28 天。而实现这一飞跃只花了两年时间,现在我们不需要成为 Google 员工就可以使用 NAS。
OFFICE及其他的软件产品,几乎在2011年左右之后,已经没有中文版提供,只有英文版,能看到的多数是机器翻译的拗口晦涩文章。
幕后英雄总是容易被大家所忽略。在这看脸的世界,大家都以为脸就是全部了,你总是相信你所看到的就是事物的全部,可是你往往看到的只是冰山的一角而已。
不知道多少人还记得《是"塔"!是"塔"!就是"它",我们的双塔!》那篇,那篇介绍了国内外各个大厂做召回的用的双塔模型,其中提到一篇《Embeding-based Retrieval in FaceBook Search》,还跟大家强烈建议,该篇必读,不知道有多少炼丹师认真读了?什么?你还没读!没关系,十方今天就给大家解读这篇论文。
今天为大家带来的分享是:小程序实时音视频在互动教育场景下的应用。我个人一直在做基础方面的研究,接触音视频也比较早,2013年的时候就开始做包括直播在内的相关产品,有多个音视频研究的相关经验。目前我们关注教育、医疗方向的音视频,以及有关这方面的应用。
之前写过一篇 使用 jsDelivr 免费加速 GitHub Pages 博客的静态资源,在那之后,又陆续想到并实施了几点利用 jsDelivr 进一步加速静态资源加载的措施,新起一篇作为记录和分享。
在后端 SpringBoot 开发中,都需要一个接口测试工具,从一开始的 Postman,到现在的国产测试工具,例如 Apifox、Apipost,数不胜数,而最方便的莫过于在 IDEA 中就可以调试,因为 IDEA 插件中有能力分析出当前项目所编写的 Controller 数据,可以进行统计,更方便我们发起 http 请求,不需要复制 url 到别的测试工具了,今天就推荐一款名叫 Cool Request 的 IDEA 插件,开源免费。
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 随着深度神经网络的不断发展,DNN在图像、文本和语音等类型的数据上都有了广泛的应用,然而对于同样非常常见的一种数据——表格数据,DNN却似乎并没有取得像它在其他领域那么大的成功。参加过Kaggle等数据挖掘竞赛的同学应该都知道,对于采用表格数据的任务,基本都是决策树模型的主场,像XGBoost和LightGBM这类提升(Boosting)树模型已经成为了现在数据挖掘比赛中的标配。相比于DNN,这类树模型好处主要有: 模型
随着开源语言大模型(LLM)的百花齐放,模型的性能和效率关乎到产品的成本和服务体验的均衡。那么,有没有办法让语言大模型变得更高效、更优秀呢?
本文集合一些搜索的小技巧和个人搜索习惯,大家如果有一些更加优雅或者高效的技巧,欢迎文末留言分享。
iOS电量测试 活动时间:2017年11月15日 斗鱼直播 活动介绍 TMQ在线沙龙第三十三期分享 本次分享的主题是:iOS电量测试 共有69位测试小伙伴报名参加活动! 想知道活动分享了啥吗, 请往下看吧! 嘉宾 张锦铭,从12年开始跟进iOS性能相关测试,在iOS性能相关领域有比较多的了解和尝试。曾在iOS平台上提供成熟的电量、响应速度、内存等的自动测试解决方案。 分享主题 1、iOS接口层电量测试 2、基于sysdialog电量测试 3、QQ浏览器电量测试举例 4、关于电量排行榜 问答环节 1
好的代码,往往不是又臭又长,而是小而精悍。用更少的代码,实现相同的功能。不管是自己还是同事日后阅读,都不会感到困惑。
最近有朋友问我,有没有什么可以提升效率的chrome插件推荐一下。我看了一下我的插件库,好用的还真不少。既然要推荐给一个人,还不如整理出来,分享给所有需要的人。毕竟,极致利他才能最终利己嘛。
工欲善其事,必先利其器,作为大学生或者从业人员,如果能熟练地使用各种工具来提高自己的工作学习效率必然是一件好事!!!
---- 新智元报道 来源:arXiv 编辑:好困 【新智元导读】你有没有发现,每当AI发现了偷懒的小技巧之后,就不再去学习那些有挑战的问题并开始「躺平」?北大的研究人员表示:最好去看看你的训练集了。 在训练人工「智障」的时候,AI最后经常会学到一些莫名其妙的方式来完成人类的的任务。 有一些AI就会去学习如何通过「卡bug」来快速通关。 还有一些AI学会了「只要把游戏暂停了,我就不会输」这个终极哲学。 AI也想「躺平」 为了让模型能够提高准确性,通常会设置相应的奖励,但有时候模型在前期
相信每一个人都有一个自己博客的梦想,有些朋友可能在上大学,没有钱,空有技术,但是不想买花钱买服务器搭网站,今晚,我来教大家怎么免费搭一个博客.
开发最懊悔的事莫过于:自己费尽脑汁、花费了很长时间解决了问题,原来别人在社区或者别的地方早已经给出了更优化的方案。
众所周知,现在很火的ChatGPT3.5是无法联网的,所以如果想使用自己的功能实现联网搜索并给出回答,总结PDF、基于某个视频进行问答等功能是无法实现的。也有人会说现在Chat GPT4.0是可以,但是它也是收费的呀,并且价格不菲,由于众所周知的原因充值也很麻烦。也有人可能会说,AutoGPT自己可以去产生新想法的;它们其实都是一个自动化AI agent的一个概念。这个agent的概念就是它作为一个节点,能够自主的去根据你所定义的这个任务去生发出一些新的任务,然后完成它。那么,在这个应用的背后啊,必然隐藏了一个很重要的技术。本篇文章就来为你揭秘。他就是LangChain,通过了解它,我们便可以使用自己的功能实现联网搜索并给出回答,总结PDF、基于某个视频进行问答等功能的。
Hello,上个周末没能搞事情,被一个代码需求给绊住了:朋友在平时工作中会经常重复性地打开不同PDF文件,选取其中特定的几组信息复制粘贴到不同的Word文档中,完成一份PDF文件平均耗时15分钟,想试试Python代码能否帮忙。
而人类能轻易地把「大写字母」单词剔除问题,识别出藏在混乱的大写字母中的真正问题,做出回答,从而通过测试。
连胜老师在自己的微信小程序开发群里,也经常帮人解答问题,在这里整理一下最频繁被问到的小程序问题。本篇是《开发小程序被问到最频繁的问题(上)》的续篇。 9、用户不登录小程序时,能否有唯一标识? 其实这里说的“唯一标识”,如果是想获取到设备号、IMEI、序列号等信息,通过设备信息来做唯一标识,小程序目前做不到。 在小程序里是有唯一标识的——unionid,但是unionid是需要用户登录之后才能获取到。 所以,在不登录小程序时,是没办法获取到唯一标识的。 10、个人能否申请小程序,个人类型和企业类型有何区
今天周六了,菜鸟小白带着家里一起去游乐场玩去了,所以今天没有办法给大家分享编程小项目了,今天就给大家推荐一些非常好用的网站吧。
它是公认的分享文档的最佳格式。但是,这种格式的文件,必须用专门的阅读器打开,而且不能编辑,所以对使用者来说,会遇到很多问题。
原文链接:https://github.com/fighting41love/funNLP
在GitHub上查看一个项目的源代码,需要一个目录一个文件的点击查看,效率很低,没有层次,那么有没有办法可以像开发IDE一样的阅读体验呢?下面我们就介绍一款浏览器插件。 Octotree一款增强 Gi
12月15日,由腾讯云主办的首届“腾讯云+社区开发者大会”在北京举行。本届大会以“新趋势•新技术•新应用”为主题,汇聚了超40位技术专家,共同探索人工智能、大数据、物联网、小程序、运维开发等热门技术的最新发展成果,吸引超过1000名开发者的参与。以下是小程序分会场的演讲内容,稍作整理,分享给大家。
面对一堆堆的复杂SQL语句,你需要把它写成.NET程序,是不是有点厌烦了? 我们的DAL代码和具体的数据库,SQL语句紧密耦合,有没有办法分离开? 如果你有一个想法,这些复杂的SQL统统都交给DBA
正如大多数矢量搜索供应商所宣传的那样,语义搜索系统的基本设计有两个简单的(这很讽刺) 步骤:
对于关注数据科学的同学来说,Kaggle 上庞大的数据集是一个极好的资源池,但是这么多的数据,如何进行更精准的搜索?近日,Kaggle 官方博客就刊登了 Rachael Tatman 的一篇文章,向大家安利如何更高效的搜索数据集,具体怎么操作?AI研习社将文章编译整理如下。 目前,在 Kaggle 上有成千上万的数据集,而且每天都会有新的增加。虽说 Kaggle 是一个非常棒的资源池,但是想在这么多的数据集里精准地找到与自己感兴趣的主题相关的,有时会有点棘手。在过去的几个月里,我学到了一些技巧和小窍门,或许
AI科技评论按:对于关注数据科学的同学来说,Kaggle上庞大的数据集是一个极好的资源池,但是这么多的数据,如何进行更精准的搜索?近日,Kaggle官方博客就刊登了Rachael Tatman的一篇文章,向大家安利如何更高效的搜索数据集,具体怎么操作? AI科技评论将文章编译整理如下: 目前,在Kaggle上有成千上万的数据集,而且每天都会有新的增加。虽说Kaggle是一个非常棒的资源池,但是想在这么多的数据集里精准地找到与自己感兴趣的主题相关的,有时会有点棘手。在过去的几个月里,我学到了一些技巧和小窍门,
在 Confluence 的页面中,你可以对 Confluence 进行下面的一些操作:
因为最近有读者投稿,用的是印象笔记,文件格式为 .enex ,一般发文章都用 markdown 格式,这叫我好生苦恼,于是乎,Google 搜了一下,找到了如下解决办法。
cat 跟 more 命令 cat 123.txt more 123.txt 在123.txt内容不多的情况下,一样显示. 如果123.txt文件内容.超过了一页.那么使用more则会提示你 已经显示了多少.后面还有多少.只需要按空格键继续显示才可以.
问: 有一台闲置的 服务器,搭点什么服务比较有意思呢? Huginn ,主要用来价格监控和 RSS 订阅 有没有一种爬虫服务,只需要我指定网站和规则,就可以定时爬数据,并且可以提供我指定格式的 json api 的,本人比较喜欢看自然科学相关的文章,经常看环球科学的网站,加上我是做 iOS 开发的,所以我想用 swift 做一个 app 方便看文章。本来是想自己做全栈的,包括设计和前后端(前后端全用 swift),但是由于我对爬虫方面的知识不太了解,我想先完成 app,后期再用 Perfect 自己学习写爬
场景介绍:对于无法消除的森林火灾问题,AI 技术结合卫星图像,能够在救灾过程过程中作出及时合理的见解,帮助人们将损失降到最低。
BERT 在 33 亿文本的语料上训练语言模型,再分别在不同的下游任务上微调,在11个不同的 NLP 任务均得到了目前为止最好的结果。
上篇文章讲解了xss的一些基础知识,这篇文章继续研究学习。上篇文章提到了一些理论性的东西,看完估计感觉很快也忘了。简单回顾一下,讲了xss分类:存储型XSS,反射型XSS,DOM XSS。讲了几个简单的payload,也只是理论性的东西。这篇先不继续看理论了,先来尝试尝试如何使用payload~ 玩起~~
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 一个从 中文自然语言文本 中抽取 关键短语 的工具,只消耗 35M 内存。 1.抽取关键短语 在很多关键词提取任务中,使用tfidf、textrank等方法提取得到的仅仅是若干零碎词汇。 这样的零碎词汇无法真正的表达文章的原本含义,我们并不想要它。 For example: >>> text = '朝鲜确认金正恩出访俄罗斯 将与普京举行会谈...' >>> keywords = ['俄罗斯', '朝鲜', '普京',
埋点是数据产品经理(分析师)基于业务需求,对用户在应用内产生的页面和位置植入相关代码,并通过采集工具上报统计数据。这些埋点数据是推动产品优化和运营的重要参考。而按照埋点采集数据类型不同,可以把埋点采集的数据分为以下几类:
我知道会有续集,但也没想到续集来得这么快!今天收到了一个生信技能树公众账号铁杆粉丝(我们之间有过9次邮件交流)的求助信,下面我们首先一起帮他解决一下碰到的问题。随后和大家分享一下可以提高搜索效率和准确率的Google搜索技巧。 他的困惑 他遇到的问题很简单,就是我无法使ggplot2画出的曲线从坐标轴原点(0,0)出发,因为图像Y轴不是在(0,0)上,所以曲线不于Y轴贴合而是空出了一截,使得图片非常难看! 他还在邮件中补充道,根据我发的文章认真做了搜索,但是没有找到解决方案。 如何通过Google来使用gg
要说最近最郁闷的公司,谷歌肯定算得上一个:自家的 Gemini 1.5 刚刚发布,就被 OpenAI 的 Sora 抢尽了风头,堪称 AI 界的「汪峰」。
艺术家 Krista Kim 以相当于人民币 334 万的价格出售了自己的虚拟建筑作品 Mars House 火星屋。Mars House 成为了第一个商品意义上的 NFT 虚拟建筑,原来,虚拟建筑还可以确权交易。
领取专属 10元无门槛券
手把手带您无忧上云