Predicting myocardial infarction through retinal scans and minimal personal information
来源:Stanford News 编译:常佩琦 【新智元导读】李飞飞领导的斯坦福大学视觉研究室近期将人工智能的研究成果应用到人口统计学中。研究人员通过算法对谷歌街景图像中各社区的汽车类型和位置数据进行分析,在此基础上可为人口统计提供重大参考,其中包括可以预测社区人员的政治倾向。利用谷歌街景的人工智能算法分析几乎可以实时生成分析结果,相较社区调查优势显著。 "You are what you drive." 从低调的宾利到实用的皮卡,美国人认为你所开的汽车就代表了你的个性。俗话说,"You are what
工作:为此,我们提出了一个深度多任务多通道学习 (DM2L) 框架,用于同时进行脑疾病分类和临床评分回归,使用 MRI 数据和受试者的人口统计信息。
Mysql数据库中CASE WHEN语句,是用于计算条件列表并返回多个可能结果表达式之一。
选自Stanford News 机器之心编译 参与:刘晓坤、李泽南 斯坦福大学的研究者们正在使用计算机视觉系统,利用谷歌街景图片上街边汽车的型号来识别给定社区的政治倾向,其识别准确率超过了 80%。这项研究的论文已发表在《美国科学院论文集》上,研究人员表示,新的研究不仅可以节省大量人力开支,也可以为人口统计任务提供前所未有的实时数据。 从奢华的宾利到经济家用的 MPV,再到实用的皮卡,每个美国人驾驶的汽车都或多或少是他们个性的外在表述。就像俗话说的:你就是你所开的汽车,斯坦福大学的研究人员正在把这一思想提升
由于ZocDoc,SimplyBook和Doodle等服务,寻找初级保健医生比过去更简单。但是,找到符合你(或家人)个性的临床医生是另一回事。
威廉·法尔(William Farr,1807-1883),英国统计学家和人口统计制度的奠基人。
沃尔特·弗朗西斯·威尔科克斯(Walter Francis Wilcox,1861—1964),美国统计学家。
Anaconda(专注于数据分析的 Python 发行版创建者)最近发布了一份关于数据科学现状调查结果的报告。该报告总结了来自 133 个郡县的近 3500 名学生、学者和专业人士的回复,内容涵盖受访者人口统计征、工作以及社区趋势等话题。
DataEase 是开源的数据可视化分析工具,帮助用户快速分析数据并洞察业务趋势,从而实现业务的改进与优化。DataEase 支持丰富的数据源连接,能够通过拖拉拽方式快速制作图表,并可以方便的与他人分享。DataEase的官方介绍请体跳转至官网—>https://dataease.io/
因为工作需要,最近有在学习商品搜索引擎的东西。会涉及到系统推荐、个性化推荐和排序推荐。
范围是一种限制应用程序访问用户数据的方法。与其授予对用户帐户的完全访问权限,不如让应用程序能够代表用户请求更有限范围内允许它们执行的操作,这通常很有用。
在上一篇数据库提取教程中,小编教大家提取了“肺栓塞”患者的实验室指标,具体步骤可以参考MIMIC数据库提取教程-提取某种疾病下的实验室指标。
WorldPop于2013年10月启动,将AfriPop,AsiaPop和AmeriPop人口绘图项目结合在一起。它旨在为中美洲和南美洲,非洲和亚洲提供一个开放的空间人口统计数据集存档,以支持发展,灾害应对和卫生应用。 平台中的WorldPop数据集提供了2000年至2020年的全中国的人口统计数据,包含两个数据集,分辨率分别是1公里和100米。本数据集的分辨率100米和1公里两个版本。前言 – 床长人工智能教程
最近网上盛传两千万酒店用户数据泄漏,出于好奇,我也从网上下载了一份下来。本次下载纯粹是出于学习和研究用,不会做什么坏事,不要问本人要下载地址,大家自己找。由于本人并不是学统计和数据挖掘方面的,所以只能浅显的做做统计分析,下面开始我们的学习和研究。
推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣,因此大量的用户行为数据就称为推荐系统的重要组成部分和先决条件。很多在开始阶段就希望有个性化推荐应用的网站来说,如何在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题。
作者:徐晗曦 原文:写给大家看的机器学习书(第五篇)—— 机器学习为什么是可行的(中) (https://zhuanlan.zhihu.com/p/25869080) 本次转载已获得作者授权,尊重原创,若需转载请联系作者本人。 责编:王艺 CSDN AI记者,投稿、寻求报道、深入交流请邮件wangyi@csdn.net或扫描文末二维码添加微信。 编者按:读晗曦的文章,总会让人有茅塞顿开的感觉。上一秒读到一段看似很浅显的文字,下一秒就会恍然大悟,于晗曦的良苦用心会心一笑。正如他自己所说,写这一系
image.png 警察能够用分析移动数据的方式来提升预测犯罪事件的能力吗?最近,来自意大利、西班牙和MIT的研究人员给出了肯定答案。研究人员表示,使用移动数据并不是推测犯罪事件的唯一途径,但确实是大大提高了准确率。这意味着,如果你有不良的上网习惯,相关部门将会“密切留意”你。 image.png 目前,有关部门采用犯罪统计和当地人口统计数据来预测犯罪事件。但这套系统已经相当陈旧,升级成本高昂,实际意义已经不大。而作为现在每个人贴身之物的手机却能实时手机用户的性别、年龄、位置和网页浏览习惯等关键信息
译者:李晓艳 审校:陈明艳 本文长度为2136字,预估阅读时间5分钟 摘要:创建用户画像是我们进行广告精准定向的一个重要步骤,本文向我们介绍了如何利用Facebook Insights创建用户画像。 众所周知,Facebook拥有巨大的用户数据。在过去18个月中,他们通过他们的平台“受众洞察(Audience Insights)”,分享了比以往任何时候更多的信息。 因此,除了时间、精力和Facebook帐户之外,我们也可以开始以非常低的成本开始构建用户画像了。 这篇文章将围绕我们如何开始利用“受众洞察”
1.FACET: Fairness in Computer Vision Evaluation Benchmark
最近在看关于大数据、数据仓库 、数据架构的《数据架构:大数据、数据仓库以及Data Vault》一书,关于大数据有些思考,结合FineBI的Spider引擎,可看看Spider引擎对于大数据的阐释,以及在大数据平台架构中,可以处于什么样的位置。
国家“十四五”规划纲要、“十四五“数字经济发展规划等文件提出,要积极完善城市信息模型平台和运行管理服务平台,构建城市数据资源体系,推进城市大脑建设,以因地制宜为原则探索建设数字孪生城市。
在实时编辑器中,可以创建随代码一起显示代码输出的实时脚本。添加格式化文本、方程、图像和超链接用于增强记叙脚本,以及将实时脚本作为交互式文档与其他人共享。
李杉 编译 news.stanford 量子位 出品 | 公众号 QbitAI “什么样的人,开什么样的车。” 宾利、MPV、皮卡,不同的汽车都能透露出车主的个性差异。 而斯坦福研究人员则将这种思
《本文同步发布于“脑之说”微信公众号,欢迎搜索关注~~》 公开数据库对于促进科学研究的快速发展意义重大,公开数据的建立可以让全世界各国的领域内研究者对某些问题进行更深入更全面的研究。在大数据时代,数据库的开放和共享已逐渐成为研究领域的趋势之一,目前很多国外期刊杂志也鼓励投稿者共享和开放研究数据。上述情况对于脑科学领域的研究也是如此。此外,我们个人同样可以利用各类脑科学公开数据库方便地进行各种研究。 笔者在这里较为全面地盘点目前免费的EEG/MEG/MRI/ fNIR公开数据库,希望对大家的研究有所帮助。
患者在癌症治疗开始方面的延误会导致临床结果恶化,引发痛苦。然而,近年来患者面临更频繁的延误问题。这种延误更常见于弱势群体,包括来自未充分服务的种族和民族群体、收入较低的人以及居住在资源匮乏、高度贫困社区的人。导致延误的因素是复杂多样的,涉及多个层面,通常不仅受到临床因素的影响,还受到社会健康决定因素(SDOH)的影响。鉴于及时的癌症治疗对患者健康至关重要,而且会加剧健康不平等问题,一些认证机构现在将其视为一项质量指标,研究人员也将其作为评估政策干预效果的一个指标。
任何对AI偏见的审查都需要意识到一个事实:这些偏见主要源于人类固有的偏见。我们创建、训练的模型和系统就是我们人类自己的真实写照。
任何需要做两方权衡并且最终寻求一种平衡的问题其实都可以转化为对抗学习的范式,比如图像生成任务中既要保证生成图片的质量又要确保判别器的识别精度;推荐任务中既要保证用户的隐私不受侵害又要确保推荐质量的可靠。
可视化是数据分析的重要一环,也是python比较擅长的工作,本笔记系列尽可能采用统一的数据源和基于matplotlib原生版本进行可视化。
二级分区的情况,相比一级分区复杂一些。下面我们来看下不同的组合情况。(其中,一级hash的情况是比较特殊的,我们先来看下)
一个人的大脑的发育和成熟与生活环境有关。社会经济地位(SES)是生活环境的一个重要部分,它评估了物质资源的获得和社会声望。以前对社会经济地位和大脑之间关系的描述主要集中在人一生的早期或者晚期(比如:儿童,老年人)。
研究目的:颞叶癫痫(TLE)影响大规模的灰质和白质网络,这些变化导致许多患者出现言语记忆障碍。在本研究中,作者通过多模态影像探究颞叶癫痫患者大脑的改变,并评估不同成像技术对研究言语记忆损伤的敏感性。该研究发表在Epilepsia杂志。
本届算法大赛的题目来源于一个重要且有趣的问题。众所周知,像用户年龄和性别这样的人口统计学特征是各类推荐系统的重要输入特征,其中自然也包括了广告平台。这背后的假设是,用户对广告的偏好会随着其年龄和性别的不同而有所区别。许多行业的实践者已经多次验证了这一假设。然而,大多数验证所采用的方式都是以人口统计学属性作为输入来产生推荐结果,然后离线或者在线地对比用与不用这些输入的情况下的推荐性能。本届大赛的题目尝试从另一个方向来验证这个假设,即以用户在广告系统中的交互行为作为输入来预测用户的人口统计学属性。
LandScan全球人口分布数据来自于East View Cartographic,由美国能源部橡树岭国家实验室(ORNL)开发。LandScan运用GIS和遥感等创新方法,是全球人口数据发布的社会标准,是全球最为准确、可靠,基于地理位置的,具有分布模型和最佳分辨率的全球人口动态统计分析数据。 Landscan全球人口分布数据集提供了2000年至2017年的全球人口统计数据,空间分辨率接近1km*1km。前言 – 人工智能教程
翻译 | SHAWN 编辑 | Donna 斯坦福大学的研究人员开发出了一种可以进行观察和学习的算法,他们用这种算法分析了百万张公开的Google街景(Google Street View)图像。经过这种训练后,算法可以识别给定社区的车辆,判断社区居民的政治倾向。 从低调奢华的宾利到可靠的家庭休旅车,再到实用的皮卡,美国人深知汽车能反映车主的性格。正如那句西方谚语所说:You are what you drive(人如其车)。斯坦福大学的研究人员将这句谚语的含义延伸到了新的层面——开什么车代表你投哪个党
系统算法详解 基于人口统计学的推荐算法 用户画像
机器学习、人工智能、区块链、预测分析——所有令人惊叹的技术都承诺将革新商业和社会。
比特币的创造者是中本聪,这大家应该都知道,但在比特币诞生至今,冒充他、疑似他的人都很多。不过今天要讨论的并非“谁是中本聪”,是要说说关于加密资产所有权的问题。
原文链接如下 - https://www.qsrmagazine.com/outside-insights/voice-first-revolution-takes-shape-restaurants
1.受棱镜门影响,各界对Aadhar的质疑从是否将威胁人民隐私与安全,转而聚焦在 Aadhar 搜集、储存以及处理资料的方法,以及美国新创公司 MongoDB 在计划中扮演的角色。 2.MongoDB 为 NoSQL 数据库,该公司去年获独立非营利机构 In-Q-Tel 资助,而众人担忧的重点在于 In-Q-Tel 为美国 CIA 与其他情资单位支持的机构。 3.印度众家媒体皆引述政党与政治运动份子的观点,质疑由 Infosys 共同创办人 Nandan Nilekani 所领导的 Aadhar 如何
Lin, Huang, et al. [@lin2024effect],本文的研究重点是探讨性行为对HIV-1血清转换的影响,以及肠道微生物组和促炎细胞因子在这一过程中的中介作用。研究使用了多种统计方法来分析数据,以下是一些关键的统计方法学亮点:
选自BAIR 作者:Lydia T. Liu、Sarah Dean、Esther Rolf、Max Simchowitz、Moritz Hardt 机器之心编译 参与:刘天赐、晓坤 由于机器学习系统容易受到历史数据引入的偏见而导致歧视性行为,人们认为有必要在某些应用场景中用公平性准则约束系统的行为,并期待其能保护弱势群体和带来长期收益。近日,伯克利 AI 研究院发表博客,讨论了静态公平性准则的长期影响,发现结果和人们的期望相差甚远。相关论文已被 ICML 2018 大会接收。 以「最小化预测误差」为目的训
原文地址:Who plays mobile games: Player insights to help developers win 原文作者:Allen Bevans 译文出自:掘金翻译计划 本文
我们把x求解出来仿佛就能做出来。但是这样做的不精确。学过高数的同学应该明白,这里有导数和微分的概念。而数值微分中中心差商公式就是用离散方法近似计算函数的导数值或偏导数值。
BERT等Transformer模型在自然语言处理领域大放异彩之后,将Transformer应用在各个领域变成了一种潮流,包括之前文章中介绍的 Image Transformer 和本文要介绍的,在搜索推荐领域排序算法阶段,利用高阶特征组合的AutoInt、对用户行为序列建模的BST、Transformer在工业界中的应用和Transformer在数据算法竞赛(2020年腾讯广告算法大赛)中惊人表现等。
保险行业正在迅速地从评估未来风险以及基于历史记录和人口统计(年龄,性别等)的定价的传统模式中转变。几十年来,承保人依靠这些数据来预测任何事情,从个人的预期寿命到驾驶员发生事故的概率。但是,正如今天许多行业一样,技术正在破坏这种长期的做法。就保险而言,物联网现象引发了这场革命。
正如我们对人工智能和招聘的调查所报道的那样,现在有一个家庭手工业使用人工智能聊天机器人来面试和筛选潜在的候选人。LinkedIn 可以说是最受求职者和专业人士欢迎的平台,该公司在一篇博客文章中表示,该公司最近推出了一款新的人工智能聊天机器人,招聘人员可以提示该机器人,以便“更快地找到合格候选人的简短名单” 。去年 4 月,人力资源科技公司 SeekOut推出了一款名为 SeekOut Assist 的招聘工具,该工具使用生成式人工智能来创建特定职位描述的候选人排名列表。 这些服务可能会帮助公司筛选过多的候选人,但存在一个重大问题:偏见。生成式人工智能在维持刻板印象方面有着充分记录的历史,这些刻板印象被融入到用于训练它的在线数据中。例如,让人工智能图像生成器向你展示一位首席执行官,它可能更有可能假设这是一名男性。然而,了解这些偏见如何在招聘等高风险场景中发挥作用是一个挑战。求职者没有办法自己审核雇主的招聘流程,而人工智能系统通常是黑匣子,即使对于构建它们的人来说也是如此。 为了破解黑匣子,我们设计了一项实验,可以系统地测试招聘环境中这些人工智能模型中潜在的嵌入偏见。我们决定重点关注简历中的名字,这些名字已经被一次又一次地证明在 招聘过程中具有重要意义。我们还选择关注 OpenAI 的 GPT,这是最著名的生成式 AI 工具,也是一项已被 SeekOut Assist 等服务使用的技术。 我们复制了招聘工作流程的简化版本,将一组八份虚构简历输入 GPT - 保持所有资格相同,仅更改简历顶部的虚构姓名。然后我们要求该工具告诉我们谁是特定职位列表的最佳候选人。我们要求 GPT 根据财富 500 强公司的四份真实职位清单来评估这些潜在候选人:人力资源业务合作伙伴、高级软件工程师、零售经理和财务分析师。 我们对 GPT-3.5 和 GPT-4 分别执行了 1,000 次,使用了 800 个人口统计上不同的名称:男性和女性各 100 个与黑人、白人、西班牙裔或亚洲人相关的名字。每次我们向 GPT 询问特定工作的最佳人选时,代表特定人群的每份虚构简历都有同等机会被评为最佳候选人。 至关重要的是,我们必须确保每个名字都更有可能映射到种族和性别的特定交叉点。借鉴成熟的 社会科学研究的方法,我们分别从北卡罗来纳州选民登记和美国十年一次的人口普查中计算出每个人群特有的 100 个最流行的名字和 20 个最独特的姓氏。从那时起,每个组的名字和姓氏被随机配对,从而产生 800 个人口统计上不同的名字。美国国家经济研究局 一项关于招聘歧视的研究的作者之一埃文·罗斯表示,研究歧视和偏见的研究人员经常使用具有种族特色的名字来表示种族或族裔,我们从该研究中获得了灵感。罗斯告诉我们,多年来,这种方法已经在美国劳动力和住房市场上发现了种族歧视的一致证据。“这就是为什么名字作为信号确实有用,”他说。在我们自己的实验中,我们发现了基于姓名的歧视的明显迹象。当被要求对简历进行 1,000 次排名时,GPT 3.5 比其他人群更倾向于某些人群中的名字,以至于无法通过用于评估受保护群体的就业歧视的基准。除了按 GPT-4 排名的零售工人外,我们测试的每一份职位列表都发现至少有一个受到不利影响的人口群体。OpenAI 则表示,开箱即用使用 GPT 的结果可能无法反映其客户如何使用这些工具。例如,使用该技术的企业可以选择进一步微调人工智能模型的响应。人工智能公司普遍试图寻找减少系统偏差的方法,OpenAI 也不例外。但问题仍然存在——与此同时,生成式人工智能只会继续进入越来越重要的把关服务。
韩国新剧《鱿鱼游戏》风靡全球,成为全球爆款。其发行商 Netflix 宣布,“鱿鱼游戏正式拥有 1.11 亿粉丝——这是我们有史以来最大的系列发行!” 它在包括美国在内的 90 个不同国家/地区的排行榜上名列前茅,并被称为“口碑全球轰动”,在新闻和社交媒体中随处可见。
人脑连接组计划,该数据库目前被试数约1200人,包括结构MRI、静息态MRI、任务态fMRI、MEG等数据模态,其他数据还包括人口统计学数据、神经心理学数据、基因数据。
法国有一家名叫Idemia的公司,它的人脸识别软件已经在为美国、澳大利亚和法国的警方提供服务。
领取专属 10元无门槛券
手把手带您无忧上云