【新智元导读】当今计算机科学领域哪位科学家的影响力最大?由微软联合创始人保罗·艾伦创立的艾伦人工智能研究所推出Semantic Scholar学术搜索引擎,使用机器学习算法,告诉你你对谁的影响最大,谁又对你的影响最大。 2015年秋天,由微软联合创始人保罗·艾伦创立的艾伦人工智能研究所(Allen Institute for Artificial Intelligence)发布了一款名为Semantic Scholar的搜索服务,其瞄准的竞争对手是Google Scholar、PubMed和其他在线学术搜索
前言 上文讲解了http协议及httpd的一些特性,是学习web服务需要掌握的一些基础知识,接下来让我们进一步了解httpd相关功能的配置,本文讲解的是虚拟主机,访问控制及https等功能的配置。 httpd之虚拟主机 虚拟主机共分为三种模式:基于IP、基于端口、基于主机名(FQDN) 实验环境介绍 开始之前,先介绍一下httpd在CentOS6.6版本及文件: 版本: httpd-2.2.15(CentOS7升级为2.4系列) 配置文件: /etc/httpd/conf/httpd.conf
本文作者Denny Britz按时间总结的深度学习比较重要的idea集锦,推荐新人看,几乎给自12年以来最重要的idea 都列了出来,这些 idea 可以说得上是养活了无数人,大家都基于这些发了无数的论文,它们依次是:
前言 作为运维人员,当面对几十台或上百台服务器需要修改某个参数或部署某个平台,你将从何入手呢?ansible的出现很好的解决了这一困扰,ansible基于Python开发,集合了众多运维工具(puppet、cfengine、chef、func、fabric)的优点,实现了批量系统配置、批量程序部署、批量运行命令等功能。本文带来的是基于Ansible Role实现LAMP平台批量部署。 ansible简介 特性 No agents:不需要在被管控主机上安装任意客户端 No server:无服务器端,使用
前言 在Tomcat集群中,当一个节点出现故障,其他节点该如何接管故障节点的Session信息呢?本文带来的解决方案是基于MSM+Memcached实现Session共享。 相关介绍 MSM MSM–Memcached Session Manager是一个高可用的Tomcat Session共享解决方案,除了可以从本机内存快速读取Session信息(仅针对黏性Session)外,同时可使用Memcached存取Session,以实现高可用。 工作原理 Sticky Session(黏性) 模式下的工作
前言 与传统的cp、tar备份方式相比,rsync具有安全性高、备份迅速、支持增量备份等优点, 通过rsync可以解决对实时性要求不高的数据备份需求,但随着文件数量的增大和实时同步的要求,rsync已不能满足需求,随之 rsync+inotify便应运而生。本文将讲解rsync的基础知识和如何基于rsync+inotify实现数据实时同步传输。 rsync相关介绍 rsync(remote sync)是一款快速增量备份工具(远程同步),支持本地复制,或者与其他SSH(安全传输)、rsync主机同步。
身为一个科研工作者,上网查查文献或者论文是一件很平常的事。虽然各大学校的图书馆都会买一些数据库供学生使用,不过,还是以国内文献居多。又由于一些众所周知的原因,国内是打不开谷歌搜索和谷歌学术的,其实,有一批又一批的人前仆后继,为我们打开了另一扇可以使用谷歌学术的大门,那就是——搭建使用谷歌/谷歌学术的镜像站。
又是一篇菜鸡笔记 在学校很多毫无意义的事情要忙没那么多时间 自己学习效率也有待提高 今天正好有时间 加上课上也讲到了这些东西 还是比较难记的 所以总结一下 没有多少时间了 加油呀
ICDM2006-介绍:数据挖掘领域最有影响力的18个算法 ICDM是数据挖掘领域的顶级会议之一,在数据挖掘理论与应用领域具有相当影响力。 Classification ============== #1. C4.5 Quinlan, J. R. 1993. C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers Inc. Google Scholar Count in October 2006: 6907 #2. C
从事深度学习的人数比以往任何时候都要多。在过去几年中,Journal和arXiv提交的内容增加了约5倍。如果你考虑的是未以学术论文形式发表其结果的从业者,从事与AI相关的工作的人数可能会增加10-25倍。这是我们不久前对arXiv订阅进行的简要分析:
近三十年来发布了很多图像和视频编码标准,如 JPEG, JPEG2000, BPG, MPEG, H.264/AVC, HEVC 等。YCbCr 色彩系统因其各通道间较低的相关性而被大多数编码标准采用。然而从图像整体层面这并不是最优策略,因此产生了许多基于亮度对色度进行预测的方法。此外,一些基于 PCA 的颜色变换方式可以进一步去除通道间相关性,进而降低编码码率,然而这需要为每幅图像保存一个 PCA kernel 并进行计算,复杂度高,因而没有得到广泛应用。
前言 前面我们讲解了httpd在CentOS6上(httpd-2.2)的相关功能配置,而 CentOS7上采用了httpd-2.4的版本,那么httpd-2.4增加了哪些特性呢?接下来让我们在CentOS6.6上手动编译安装一下 httpd-2.4.9,看一下和httpd-2.2有什么不同,顺便补充说一下httpd的其它功能。 环境及新特性介绍 环境介绍 系统环境:CentOS6.6 所需软件包:apr-1.5.0.tar.bz2、apr-util-1.5.3.tar.bz2、httpd-2.4.9
虽然说我们也有国产的百度学术,但和站在巨人肩膀上的Google Scholar相比,只能说是拙劣的模仿者。
翻译 | AI科技大本营(rgznai100) 参与 | Joe,焦燕 2000年早期,Robbie Allen在写一本关于网络和编程的书的时候,深有感触。他发现,互联网很不错,但是资源并不完善。那时候,博客已经开始流行起来。但是,Youtube还不是很普遍,Quora、 Twitter和播客同样用者甚少。 在他转向人工智能和机器学习10年过后,局面发生了天翻地覆的变化:网上资源非相当丰富,以至于很多人出现了选择困难,不知道该从哪里开始(和停止)学习! 为了使大家能够更加便利地使用这些资源,Robbie A
Science11月11日报道,艾伦人工智能研究院Semantic Scholar的人工智能搜索学术引擎近日推出了神经科学学术领域最有影响力的10位学者。 Science11月11日报道,艾伦 人工智能 研究院Semantic Scholar的人工智能搜索学术引擎近日推出了神经科学学术领域最有影响力的10位学者。伦敦大学学院 (UCL)独占鳌头,排名前三的科学家都来自该校,前10名的研究者全部来自英、美和加拿大三个国家。此前,Semantic Scholar曾对计算机科学领域进行过排名,在前10 的名单中,
新生搜索神器Microsoft Academic Search与Google scholar、PubMed、wos、embase大PK!
这个包需要使用梯子访问谷歌。关于设置代理,可以参考[[73-R工具指南20-优雅地在R中設置代理]],如果你实在没有一个梯子,也可以参考我下面关于tinyscholar 的介绍。
【新智元导读】Science11月11日报道,艾伦人工智能研究院Semantic Scholar的人工智能搜索学术引擎近日推出了神经科学学术领域最有影响力的10位学者。伦敦大学学院 (UCL)独占鳌头,排名前三的科学家都来自该校,前10名的研究者全部来自英、美和加拿大三个国家。此前,Semantic Scholar曾对计算机科学领域进行过排名,在前10 的名单中,Jordan 位列第一,吴恩达第二。(文内包含计算机科学领域最有影响力50人名单)。Jordan对此系统的评价是:圈子决定命运。 2016年4月,
前言 随着访问量的逐渐增大,一台web服务器可能已经无法满足需求,这就需要增加web服务器的数量了,于是问题就来了:如何保证两台服务器数据同步呢?本文将讲解如何基于NFS实现web服务器的负载均衡及数据同步。 NFS服务介绍 NFS(Network File System)网络文件系统,允许一个系统通过网络共享目录和文件,通过使用NFS,用户和程序可以像访问本地文件一样访问远端系统上的文件。NFS本身没有提供数据传输的功能,必须借助于远程过程调用(RPC)协议来实现数据的传输。 配置文件 NFS在
前言 随着信息社会的发展,越来越多的信息被数据化,尤其是伴随着大数据时代的来临,数据呈爆炸式增长。传统存储在面对海量数据存储表现出的力不从心已经是不争的事实,例如:纵向扩展受阵列空间限制,横向扩展受交换设备限制,节点受文件系统限制等。而分布式存储的出现在一定程度上有效的缓解了这一问题,目前比较流行的分布式文件系统有:GFS、HDFS、GlusterFS、MooseFS、Lustre、TFS、MogileFS和FastDFS等,本文带来的是MogileFS基于Nginx反向代理实现分布式存储与访问 相关介
前言 随着信息社会的发展,越来越多的信息被数据化,尤其是伴随着大数据时代的来临,数据呈爆炸式增长。传统存储在面对海量数据存储表现出的力不从心已经是不争的事实,例如:纵向扩展受阵列空间限制,横向扩展受交换设备限制,节点受文件系统限制等。而分布式存储的出现在一定程度上有效的缓解了这一问题,目前比较流行的分布式文件系统有:GFS、HDFS、GlusterFS、MooseFS、Lustre、TFS、MogileFS和FastDFS等,本文带来的是MogileFS基于Nginx反向代理实现分布式存储与访问 相关介绍
身为半个科研工作者,上网查查文献或者论文是一件很平常的事。虽然各大学校的图书馆都会买一些国内外数据库供学生使用,不过,这还是不够。由于一些众所周知的原因,国内各大搜索引擎是不怎么让人放心的,又由于一些众所周知的原因,国内是打不开谷歌搜索和谷歌学术的,其实,有一批又一批的人前仆后继,为我们打开了另一扇可以使用谷歌学术的大门,那就是——搭建使用谷歌/谷歌学术的镜像站。
谷歌学术是目前感觉最好的学术搜索引擎,谷歌学术档案提供了学者的个人学术信息,不过通常情况我们无法查看和使用这个信息。Y 叔写的 scholar[1] 包虽然提供了齐全的功能,但由于网络限制在国内基本无法使用。
目前有超过3.4万种同行评议学术期刊,这些期刊每年合计发表的文章数约250万篇。据估计,一名研究人员每年约能阅读其中的270篇文章,具体取决于所研究的学科。 科学家们永远追赶不上学术文章发表的速度,因而会错过一些重要的学术见解。幸运的是,美国艾伦人工智能研究所(Allen Institute for Artificial Intelligence,AI2)的新研究成果有助于克服这一难题。AI2将其基于人工智能的搜索引擎Semantic Scholar扩展到了神经科学领域。此功能的推出意味着AI2向其长期愿景
开发者希望通过帮助科学家从大量文献中发现联系从而解放科学家,让他们专注于发现和创新。
# install.packages("scholar", lib="D:/R.Rstudio/R/R-3.6.1/R-3.6.1/library") library("scholar") jn = c("bioinformatics", "methods in ecology and evolution", "molecular biosystems", "molecular biology and evolution") get_impactfac
作为像深度学习这样高产领域的研究人员,我们经常会发现自己被论文的汪洋所淹没。这些论文是如此之多,想全部读完并跟踪最新研究似乎很难很难。我觉得形成这种局面的一个重要原因是,我们没有充分利用现有工具和服务来让工作变得更加简单。另一个原因是缺少能够在一个界面下满足我们所有需求的真正好产品,不过说到这个就得另写一篇博客了。
第一次写论文,有点方,发现了一些不错的网站,mark 选择正确的英文词语 语料库:Linggle和 Netspeak 方便地查询杂志影响力和本领域有哪些杂志:Scimago Journal & Country Rank 获取全文利器:Sci-Hub: removing barriers in the way of science 更精确定位的学术搜索引擎(目前只有计算机类):Semantic Scholar 提升LaTeX效率的小工具:Detexify LaTeX handwritten symbo
Hey!是你们的猫头虎博主!大一新生们,刚入学感觉是不是有点懵圈?🌀 不知道哪些学习资源是真正有用的?别担心,为了助你们快速适应大学生活,我特意为大家整理了一份“大一新生学习资源大推荐”!希望你们在SEO或其他搜索引擎上搜索相关资源时,能首选这份宝藏清单。🎉
最新折腾了一下黑苹果 刚刚把博客迁移过来 所以才想起写这篇文章 Hexo+GitHub搭建静态博客
经测试,VVC 编码标准比 HEVC 有 50% 的码率节省,并广泛支持各种视频内容和用例。与 HEVC 不同的是,第一版 VVC 标准已经具备屏幕内容编码、高层语义划分等功能,并支持各种特殊视频格式:10 bit 位深的高动态范围 (High Dynamic Range, HDR)、可选的色度采样格式 (包括 4:4:4)、分辨率缩放和参考帧重采样。目前,VVC 标准的第二版制定工作正在进行中,该版标准将支持 10 bit 以上位深和更高分辨率视频编码。
本期推送第四篇:如何通过文献掌握学术动态,感兴趣的同学可以直接在Github上阅读。
地址 https://github.com/zibuyu/research_tao
本期将为大家介绍UC Santa Cruz VLAA Lab招聘博士的相关信息。 实验室简介 Vision · Learning · Assured Autonomy (VLAA) Lab是由谢慈航教授和周郁音教授两位导师共同指导。实验室目前有4名博士生以及多名访问学者。我们的研究兴趣集中在计算机视觉、深度学习和这些技术在医疗领域的应用。在成立的过去一年里,我们实验室发表了14篇顶会/期刊,包括4篇CVPR、3篇NeurIPS、2篇ECCV、2篇ICLR、2篇TPAMI和1篇AAAI。我们的实验室学生也都
影响因子是某一期刊的文章在特定年份或时期被引用的频率,是衡量学术期刊影响力的一个重要指标。许多著名学术期刊均会在其网站上注明期刊的影响因子,以表明其在对应学科的影响力;许多知名学府也以学术期刊的影响因子作为评判研究生毕业的主要标准。
随着人工智能技术的发展,目标检测和跟踪任务在端到端视频架构中逐渐普及。下图是端到端智能视频处理架构的一个示例:系统边缘的智能相机中部署了入侵者检测、人脸/目标检测等算法,并将提取到的信息随压缩的视频流一起传输到视频网关 (video gateway),然后在网关执行更复杂的视频分析任务,如人脸识别、车辆检测等,并将得到的分析数据与转码的视频流一起传输到边缘云服务器 (edge cloud)。边缘云对得到的视频语义信息进行进一步分析处理,最终的分析结果会被送到云端的视频应用服务器。云端对收到的码流数据进行两方面处理:1) 将视频转码为低分辨率版本,并保存副本;2) 分析视频,并与收到的视频语义信息进行对应关联。
【新智元导读】谷歌学术昨天发表了2018年最新的学术期刊和会议影响力排名,CVPR和NIPS分别排名第20和第54。在排名第一的Nature里,过去5年被引用次数最高的论文,正是深度学习三大神Hinton、LeCun和Bengio写的《深度学习》一文,而CVPR里被引次数最高的,则是ResNet,引用次数超过了1万次。
前言 软件负载均衡一般通过两种方式来实现: 基于操作系统的软负载实现 基于第三方应用的软负载实现 LVS是基于Linux操作系统实现的一种软负载,而HAProxy则是基于第三方应用实现的软负载。 HAProxy相比LVS的使用要简单很多,但跟LVS一样,HAProxy自己并不能实现高可用,一旦HAProxy节点故障,将会影响整个站点。 本文带来的是HAProxy基于KeepAlived实现Web高可用及动静分离。 相关介绍 HAProxy HAProxy是一款提供高可用性、负载均衡以及基于TCP和HTTP应
前言 相信你一定对“云主机”一词并不陌生吧,通过在Web页面选择所需主机配置,即可快速定制一台属于自己的虚拟主机,并实现登陆操作,大大节省了物理资源。但这一过程是如何实现的呢?本文带来OpenStack Icehouse私有云实战部署。 OpenStack 简介 OpenStack是由网络主机服务商Rackspace和美国宇航局联合推出的一个开源项目,OpenStack的目标是为所有类型的云提供一个易于实施,可大规模扩展,且功能丰富的解决方案,任何公司或个人都可以搭建自己的云计算环境(IaaS),从此打破了
前言 随着IT行业的迅猛发展,传统的运维方式靠大量人力比较吃力,运维人员面对日益增长的服务器和运维工作,不得不把很多重复的、繁琐的工作利用自动化处理。前期我们介绍了运维自动化工具ansible的简单应用,本期带来的是运维自动化神器puppet基于Master/Agent模式实现LNMP平台部署。 Puppet 简介 Puppet是基于ruby语言开发的一种Linux、Unix、Windows平台的集中配置管理系统,可以C/S模式或独立运行,使用自有的puppet描述语言,可管理配置文件、用户、cron任务、
【新智元导读】今天,机器学习诸多理论的主要奠基人、美国三院院士 Michael I. Jordan受聘为清华大学访问教授,同时发表主题报告。Jordan认为,大数据的增长对传统的数据科学理论提出了改变的需求,特别是统计学和计算学的相关理论,应该呈融合式的发展。Jordan 特别提到,要在明年1月正式发布他们研究室的分布式机器学习框架 Ray,集统计推理、机器学习、大数据处理、计算等为一体,超越 Spark。 12月20日,清华大学正式宣布聘请计算机科学机器学习领域顶级学者 Michael I. Jordan
http://www.1point3acres.com/bbs/thread-83337-1-1.html **前言: ** 数据科学越来越火了,网页是数据很大的一个来源。最近很多人问怎么抓网页数据,据我所知,常见的编程语言(C++,java,python)都可以实现抓网页数据,甚至很多统计\计算的语言(R,Matlab)都有可以实现和网站交互的包。本人试过用java,python,R抓网页,感觉语法各有差异,逻辑上是一样的。我准备用python来大概讲讲抓网页是什么概念,具体的内容要自己看手册或者go
简单记录一下。 示例数据 📷 示例代码 import requests from bs4 import BeautifulSoup from tqdm import tqdm from pybtex.database import BibliographyData, Entry from pybtex.database.input import bibtex import pandas as pd import time import json import random def search
继 Google Scholar(Google 学术搜索)之后,Google 又为科研工作者推出了一款重磅产品—— Google Dataset Search(Google 数据集搜索)。
工欲善其事,必先利其器。充分发挥每个工具的优势可以显著提高我们的工作效率。为了更好的工作和科研,今天给大家介绍一些提高效率的工具。
机器之心报道 参与:泽南、淑婷 自 2012 年起,谷歌学术(Google Scholar)每年都会发布一次全球学术出版物重要指数排名。近日,谷歌公布了 2018 年的最新排名。随着人工智能的火热,
前言: 数据科学越来越火了,网页是数据很大的一个来源。最近很多人问怎么抓网页数据,据我所知,常见的编程语言(C++,java,python)都可以实现抓网页数据,甚至很多统计\计算的语言(R,Matlab)都有可以实现和网站交互的包。本人试过用java,python,R抓网页,感觉语法各有差异,逻辑上是一样的。我准备用python来大概讲讲抓网页是什么概念,具体的内容要自己看手册或者google别人的博客,这里算是抛砖引玉了。水平有限,出现错误或者有更好的办法,欢迎讨论。 步骤一:熟悉Python的基
学校简介 舒凯 (Kai Shu) 博士于2020年入职伊利诺伊理工大学 (Illinois Institute of Technology) 担任计算机科学系讲席助理教授。 伊利诺伊理工大学是美国研究性私立大学。该校教学团队及校友中曾先后涌现出4位诺贝尔奖得主, 1位图灵奖得主(2021年的图灵奖得主Jack Dongarra)。此外,磁记录技术之父Marvin Camras,无线电天文学先驱Grote Reber,摩托罗拉创始人Paul Galvin与手机之父Martin Cooper等也毕业于该校。校
新冠病毒在地球上已经肆虐了快半年了,检测行人是否戴了口罩的AI系统终于诞生了。该系统可以通过眼睛、鼻子、嘴巴和耳朵的特征来判断行人是否佩戴了口罩。行人的照片由个人或犯罪数据库提供。
领取专属 10元无门槛券
手把手带您无忧上云