AI 科技评论按:Microsoft 学术图表使得获取关于其中的任何实体,如出版物、作者、机构、主题、期刊和会议里面的分析性见解成为可能。最近,微软学术使用Microsoft 学术图表呈现了历年 NeurIPS 会议的历史趋势数据分析。他们的分析数据是从 1996 年到 2018 年的会议数据。AI 科技评论编译如下。
新生搜索神器Microsoft Academic Search与Google scholar、PubMed、wos、embase大PK!
AAAI的英文全称是 Association for the Advance of Artificial Intelligence。是人工智能领域的顶级会议。第一届会议在1994年召开,到2019年已经是第33届。
1.核心期刊 CCL,全国计算语言学学术会议 ACL,国际计算语言年会 NIPS,神经信息处理系统进展大会 SCI SCI即《科学引文索引》(Science Citation Index),是由美国科学信息研究所(Institute for Scientific Information 简称ISI)创建的,收录文献的作者、题目、源期刊、摘要、关键词,不仅可以从文献引证的角度评估文章的学术价值,还可以迅速方便地组建研究课题的参考文献网络。SCI创刊于1961年。经过40年的发展完善,已从开始时单一的印刷
机器之心原创 作者:蛋酱 在计算机领域,有一个广为人知的故事:1973 年,在施乐公司帕克研究中心(The Xerox PARC),第一台个人电脑 Alto 诞生了,这台电脑首次使用了桌面比拟(Desktop metaphor) 和鼠标驱动的图形用户界面(GUI)技术。接下来的几十年,Alto 极大地影响了个人电脑的设计,包括苹果的 Macintosh。 后来,乔布斯在 1995 年的一次采访中提到,Alto 的很多想法并不是完全正确的,但它最关键的一点是提供了关于图形用户界面的最初灵感:「Alto 有世界
NeurIPS(前称NIPS)可谓人工智能年度最大盛会。每年的圣诞前夕,全球的人工智能爱好者和科学家都聚集起来发布最新研究,并进行热烈探讨。这不仅是一次大的party,也是一次重要的技术发展指向,大会的技术往往这未来几年就会演变成真正的研究甚至应用成果。
在快速增长的学术大数据背景下,社交网络技术最近引起了学术界和工业界的广泛关注。学术社会网络的概念正是在学术大数据的背景下产生的,指的是由学术实体及其关系形成的复杂的学术网络。有大量的学术大数据处理方法来分析学术社交网络丰富的结构类型和相关信息。现在各种学术数据都很容易获取,这让我们更容易分析和研究学术社交网络。本研究调查了学术社交网络的背景、现状和趋势。我们首先阐述了学术社会网络的概念和相关研究背景。其次,基于节点类型和时效性分析模型。第三,我们回顾分析方法,包括相关的指标,网络属性,和可用的学术分析工具。此外,我们还梳理了一些学术社交网络的关键挖掘技术。最后,我们从行动者、关系和网络三个层面系统地回顾了该领域具有代表性的研究任务。此外,还介绍了一些学术社交网站。本调查总结了当前的挑战和未解决的问题。
介绍 您是否曾经想过如何使用Sentence Transformers创建嵌入向量,并在诸如语义文本相似这样的下游任务中使用它们在本教程中,您将学习如何使用Sentence Transformers和Faiss构建一个基于向量的搜索引擎。代码地址会在本文的最后提供 为什么要构建基于向量的搜索引擎? 基于关键字的搜索引擎很容易使用,在大多数情况下工作得很好。你要求机器学习论文,他们会返回一堆包含精确匹配或接近变化的查询结果,就像机器学习一样。其中一些甚至可能返回包含查询的同义词或出现在类似上下文中的单词的结
目前,在国际科学界,如何正确评价基础科学研究成果已经引起了越来越广泛的关注。而被SCI和SSCI收录的科技论文数量,被认为是衡量一个国家基础科学研究水平、科技实力和科技论文水平的重要评价指标。那么,究竟什么是SCI和SSCI? 一、SCI
转载自微软研究院 AI 头条 机器之心报道 论文编译:黄小天 今年 2 月,微软研究院与剑桥大学宣布合作开发了一种名为 DeepCoder 的新算法,可以根据问题的输入输出自动编写解题程序。但事实上,DeepCoder 的实现是基于一种原创的、极其精简的语言,还不能独立处理较为复杂的问题,目前业界使用的编程语言对于它来说还难以掌握。所以广大程序员们完全不用担心会被机器取代! 那么除此以外程序员们最担心的是什么呢?大概就是调 Bug 了吧~ 鉴于机器已经可以完成简单的编程任务,我们当然希望能利用它更好地辅助
EndNote 20是一款专业的文献管理软件,旨在帮助用户轻松组织和管理各种类型的参考文献。它支持包括Mac在内的多个平台,并能够与主流的文字处理软件无缝集成,如Microsoft Word和Pages。除了提供全面的文献搜索和引用功能外,EndNote 20还可以让用户创建自己的参考文献库、生成参考文献标准格式和快速查找想要的文献等功能。同时,EndNote 20还支持在线同步,让用户可以随时随地访问他们的参考文献库。
新发现、新理论的研究论文发表数量呈指数型增长,并且论文被引用量(H-index)通常被学术界衡量论文的影响力贡献程度。然而,随着学术界的竞争越来越激烈,部分期刊中出现了一种“强制引用”的情况,也是就论文作者需要引用该期刊的相关文章,以提高期刊的影响因子。这些行为是对任何科学家和技术人员所要求的最高诚信的冒犯,并且如果任其发展,可能会破坏公众的信任并阻碍科学技术的未来发展。该竞赛是该系列竞赛中的第一场竞赛,探讨了网络搜索和数据挖掘技术在多大程度上可以用来区分多余的引文和真实的引用识别。赛题详解可参考:https://biendata.com/competition/wsdm2020/
强烈使用EndNote软件的情况:参考文献数量较多,要切换Style,甚至要经常修改引用文献,常见于格式要求严格的文章,如硕博毕业论文、要投稿的文章等等。
【新智元导读】从小有“学术天才”之称的 Kamil Tamiola 将计算生物学和机器学习相结合,组建了自己的创业公司。他表示,当年最痛苦的事情就是“科学写作”,他曾经认为那是浪费时间。但今天,他大声疾呼,认为自己当年大错特错,并痛陈如今 AI/ML 论文写作中的一些普遍问题。 我的机器学习之旅从高中开始。我很幸运地翻开了几本关于人工神经网络的老教科书。那是2000 年,电视上正热播《老友记》,痞子阿姆的说唱传遍大街小巷。我则沉迷于对象识别系统不能自拔,那玩意儿当时还是边缘科学。我的第一篇论文写于18岁,题
---- 新智元报道 编辑:David 【新智元导读】历时五年,29家出版商参加的学术参考文献的「开放获取」运动,大功初成! 经过为期5年的努力,学术出版物参考文献的「付费墙」有望彻底打破! 引用数据是学术论文的重要指标之一,虽然近年来论文「唯指标化」的现象有所改善,但作为最常用、标准化程度最高的标准之一,被引用数仍然是评价论文质量不可或缺的标准。 如果知道你的论文是否比其他人的引用率高,就需要查询相关基础数据,而要想获得基础数据,就得付钱。 过去几十年来,可靠的、结构化的论文作者和参考文献列表
ISI每年出版JCR期刊引用报告 (Journal Citation Reports)评估期刊的影响力。
在上文《 Milvus 最佳实践之如何设置系统配置项 (2) 》中,针对 Milvus 0.6.0 版本的关键系统配置项给予了详细说明。本文针对 Milvus 0.6.0 版本的 API 关键参数进行详细说明与测试验证,并给予如何设置的建议。
影响因子是某一期刊的文章在特定年份或时期被引用的频率,是衡量学术期刊影响力的一个重要指标。许多著名学术期刊均会在其网站上注明期刊的影响因子,以表明其在对应学科的影响力;许多知名学府也以学术期刊的影响因子作为评判研究生毕业的主要标准。
EndNote X9是目前行业中使用最多的一款文献管理软件,可以将所有参考和参考相关材料保存在可搜索的个人库中,通过EndNote可进行文献批量下载和管理、写作论文时添加索引、分析某篇文献的引文索引、分析某领域或者学术课题等。另外EndNote可以透过Cite While You Write TM功能在Microsoft Word中编排引用文献、图表等资料。当您在撰写文章初稿中插入引用文献时,随即在文末建立您的参考文献与图表清单。
例如清华大学从去年的第28名上升到了26名;北京大学从去年的第51名跃至第45名。
在IT世界中,有很多刻板印象,例如“ PHP是最糟糕的语言”或“ Python是针对初学者的”。幸运的是,我们可以使用github和来自开发人员调查的数据找到真相。
---- 新智元报道 编辑:LRS 【新智元导读】一次学完所有生成式模型! 过去的两年时间里,AI界的大型生成模型发布呈井喷之势,尤其是Stable Diffusion开源和ChatGPT开放接口后,更加激发了业界对生成式模型的热情。 但生成式模型种类繁多,发布速度也非常快,稍不留神就有可能错过了sota 最近,来自西班牙科米利亚斯主教大学的研究人员全面回顾了各个领域内AI的最新进展,将生成式模型按照任务模态、领域分为了九大类,并总结了2022年发布的21个生成式模型,一次看明白生成式模型的发展
为什么一个领域每年发表的太多论文会导致停滞而不是进步。新论文的泛滥可能会剥夺审稿人和读者充分认识和理解新想法所需的认知能力。许多新想法之间的竞争可能会阻碍集中注意力到一个有希望的新想法。
---- 点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 新智元 授权 【导读】英语不行,怎么搞研究?作为科学研究领域的世界通用语言,英语的重要性不言而喻。Nature介绍了几款小工具,对于英语非母语的研究人员来说,不妨试试。 当Yanina Bellini Saibene在阿根廷拉潘帕的国家农业技术研究所开始她的数据科学事业时,她的英语并不流利。她在中学时学过一点英语,但她的家庭不富裕,上不起英语补习班。 她说,因为英语不行,她的科学研究之路多了很大阻碍。英语是科学的世界通用语言,但她却只能在西
---- 新智元报道 编辑:David 【新智元导读】英语不行,怎么搞研究?作为科学研究领域的世界通用语言,英语的重要性不言而喻。Nature介绍了几款小工具,对于英语非母语的研究人员来说,不妨试试。 当Yanina Bellini Saibene在阿根廷拉潘帕的国家农业技术研究所开始她的数据科学事业时,她的英语并不流利。她在中学时学过一点英语,但她的家庭不富裕,上不起英语补习班。 她说,因为英语不行,她的科学研究之路多了很大阻碍。英语是科学的世界通用语言,但她却只能在西班牙语期刊上发表文章,使
(建议把软件Styles目录下不常用的期刊都删除,这里就不会显示这么多了,方便查找!)
来源:新智元 极市平台本文约3800字,建议阅读5分钟本文总结了2022年发布的21个生成式模型,一次看明白生成式模型的发展脉络! 过去的两年时间里,AI界的大型生成模型发布呈井喷之势,尤其是Stable Diffusion开源和ChatGPT开放接口后,更加激发了业界对生成式模型的热情。 但生成式模型种类繁多,发布速度也非常快,稍不留神就有可能错过了sota。 最近,来自西班牙科米利亚斯主教大学的研究人员全面回顾了各个领域内AI的最新进展,将生成式模型按照任务模态、领域分为了九大类,并总结了2022年发
GPT-4是OpenAI GPT系列研究最新里程碑,GPT-4接受图像和文本输入, 是一个大型多模态模型(接受图像和文本输入,输出为文本)。本文结合OpenAI官方Blog、技术报告微软Copilot发布会内容,详细介绍GPT4的接入方式、升级能力以及接入微软Office全家桶Copilit产品应用。
2017年8月,清华大学和微软研究院联合发布的 OAG v1,具体来说包含了来自 MAG 的 166,192,182 篇论文和来自 AMiner 的 154,771,162 篇论文的元数据信息。
BypassMergeSortShuffleWriter 就如其名,旁支的sort-baesd Shuffle, 他是采用Hash-style实现的Sort based Shuffle。在map阶段records会按分区写入不同的文件, 一个分区一个文件。然后链接这些分区文件形成一个output文件,并生成其index。reducer通过IndexShuffleBlockResolver 查找消费输出文件的不同分区。
文章背景: 最近发现有些办公电脑打开一些excel文件(xls格式)时,会弹出一个对话框,显示""隐藏模块中出现编译错误:<module name>"。在网上查阅一些资料后,发现早期的VBA代码存在兼容性问题。
大数据文摘作品 作者:Richard Van Noorden 编译:Shan LIU、大茜、叶一、Yawei Xia 究竟有多少学术最终以“零次”引文终结命运?最近,《Nature》学术期刊做了一个研究,分析了那些0引用的学术论文。今天,文摘菌带大家一起来看一看那些被打入“冷宫”的科学文献:发布在哪里的文章更难被引用?哪些领域的论文更容易被打入冷宫?哪些国家的论文更不被知晓? 插画作者SERGE BLOCH 遗传学家奥利佛•史密斯今年1月逝世,享年91岁。这位诺贝尔获奖者常以一段著名的失败经历自嘲: 他发表
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。ElasticSearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET(C#)、PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr,也是基于Lucene。
自从开始了解机器学习以后,想必你已经发现,数据分析领域,标注(annotation)是很重要的。
近期,意大利SCI期刊《ACTA MEDICA MEDITERRANEA》一口气撤下了17篇论文,并且同时开除3名杂志社编委会成员。撤回的17篇文章中,有14篇文章的第一作者是巴勒莫大学的 Agata Maltese。
打破「注水」传言,质量与数量并重。 作者 | 王玥 编辑 | 陈彩娴 近日,日本国家科学技术政策研究所 (NISTEP) 公布了一项统计分析结果:全球被引次数排名前 1% 的论文中有27.2%出自中国学者,数量达到世界第一。 通常情况下,一篇研究论文被引用次数越多,就越证明其含金量受到学界公认。在论文中引用次数排名前1%的圈层,我们便能常常见到诺贝尔奖得主的身影。由于被引次数排名前1%的精英文章往往非常国际化,由来自多个国家的作者合作完成,因此每个国家功劳多少的计算也变得相应复杂。 在这项研究中,NISTE
题记 由于之前已经梳理过Elasticsearch基础概念且在项目中实战过Elasticsearch的增删改查、聚类、排序等相关操作,对ES算是有了一定的认知。 但是,仍然对于一些底层的原理认知模糊
选自Authorea 机器之心编译 参与:路雪、刘晓坤、李亚洲 arXiv 是当前最流行的预印本库。自 1991 年创办以来,arXiv 为研究者提供了一个在正式同行评议之前分享预印本文章的平台。新技术使文档创建和分发更加便捷,文化实践推动合作和数据共享,这使得 arXiv 快速发展,日渐流行。arXiv 在研究交流和 Web 历史上占据独特的位置,但是它自创建以来几乎很少改变。在此文章中,我们看一下 arXiv 的优势和缺点,进而探讨新技术可以给 arXiv 带来怎样的改变。 日前,在最新的 Google
大数据文摘转载自AI科技评论 作者:王玥 编辑:陈彩娴 近日,日本国家科学技术政策研究所 (NISTEP) 公布了一项统计分析结果:全球被引次数排名前 1% 的论文中有27.2%出自中国学者,数量达到世界第一。 通常情况下,一篇研究论文被引用次数越多,就越证明其含金量受到学界公认。在论文中引用次数排名前1%的圈层,我们便能常常见到诺贝尔奖得主的身影。由于被引次数排名前1%的精英文章往往非常国际化,由来自多个国家的作者合作完成,因此每个国家功劳多少的计算也变得相应复杂。 在这项研究中,NISTEP 使用一种称
2019年常见ElasticSearch 面试题解析(上)
本文将详细介绍Elasticsearch Index Monitoring监控命令之Index Stats API。
上篇文章将Prompt提示工程大体概念和具体工作流程阐述清楚了,我们知道Prompt工程是指人们向生成性人工智能(AI)服务输入提示以生成文本或图像的过程中,对这些提示进行精炼的过程。生成人工智能是一个根据人类和机器产生的数据训练的机器人,它不具备筛选你正在交流的内容以理解你实际在说什么的能力。也就是说你说的就是你得到的。那么我们使用Prompt在不进行高成本的调参,显得尤为重要,因此有很多Prompt策略适用于不同的语言大模型中,在图像大模型中Prompt策略可谓是核心必学科目了。那么本章我们将了解Prompt主流策略有什么。
下面这张在网上流传的图片展示了吉娃娃和松饼之间惊人的相似之处。这些图像通常在人工智能(AI)行业(包括我自己)的演示中共享。 但有一个问题没有人回答过:在消除像吉娃娃或松饼这样的图像的不确定性时,到
Zotero 是一个免费易用的 Firefox 扩展与客户端软件, 可以协助我们收集、管理及引用研究资源, 本文记录相关内容。 简介 📷 Zotero 是一个免费易用的 Firefox 扩展与客户端软件,可以协助我们收集、管理及引用研究资源,包括期刊、书籍等各类文献和网页、图片等。 与 Endnote 等不同的是,它既可以单独使用,也可以内嵌于 Firefox 与 Google 浏览器等环境下使用。随着互联网的发展,我们获取文献资源大都是通过浏览器,而 Zotero 与浏览器的密切结合使我们
文 | 王通讯 来自光明日报 (作者系中国人事科学研究院原院长) 微软公司的一位副总裁说:大数据与“云计算”就像一枚钢镚儿的两个面,相辅相成。大数据相当于储有海量信息的信息库;“云计算”相当于计算机和操作系统。大数据与“云计算”二者结合起来,将给世界带来一场深刻的管理技术革命。当然,人才工作也包括在内。 A.让人才培养不再凭直觉 人才培养要靠教育与培训。但是以往一个很大的弊端是,教师不知道学生和学员是不是真正把课听懂了。如果问一声大家懂了吗?一般回答都会说懂了。这里就掩盖了有的学生、学员因为羞于回答不懂而带
科技论文写作的最后一部分就是参考文献,引用的文献正确与否,一方面,从一定程度上反映了作者的学术态度,而另一方面,编辑和审稿人也喜欢从这部分挑刺儿。目前参考文献管理软件有多种,EndNote是Thomson Reuters 公司开发的SCI 数据库采用的官方软件,也是最受科研工作者青睐的参考文献管理软件。EndNote的功能十分强大,支持近4000种国际期刊的参考文献格式,拥有几百种写作模板,可在word中快速插入参考文献。除此之外,EndNote 还可以轻松管理成千上万条参考文献,对所有文献进行快速分类保存、查看和引用。因此,今天小编重点介绍下Endnote的主要功能以及在科技论文写作过程中可能出现的问题,希望能帮助到同在科研一线奋斗的小伙伴们。
说到这些E-SCI、SCI和SCI-E词汇,就不得不提一下汤森路透集团,它是全球专业的智能信息提供商。汤森路透集团最早推出了的三个期刊引文索引数据库,分别是科学引文索引『Science Citation Index Expanded, SCIE』,社会科学引文索引『SocialScience Citation Index,SSCI』和艺术与人文引文索引『Arts & Humanities Citation Index,A&HCI』。这三大类期刊引文索引数据库,就是大家俗称的“SCI”。
科学知识主要存储在书籍和科学期刊中,通常是 PDF 格式。然而,PDF 格式会导致语义信息丢失,尤其是数学表达式。为此,MetaAI 最新提出了 Nougat (Neural Optical Understanding for Academic Documents),这是一个 Visual Transformer,可执行光学字符识别(OCR)任务,将科学文档处理成标记语言。
在科学研究中,从方法论上来讲,都应“先见森林,再见树木”。当前,人工智能学术研究方兴未艾,技术迅猛发展,可谓万木争荣,日新月异。对于AI从业者来说,在广袤的知识森林中,系统梳理脉络,才能更好地把握趋势。为此,我们精选国内外优秀的综述文章,开辟“综述专栏”,敬请关注。
人工智能顶会论文之争越来越激烈了,CVPR、AAAI、ICLR等各大会议虽然录取率逐年降低,但是投稿论文数量却在逐年增加。
领取专属 10元无门槛券
手把手带您无忧上云