首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何解决抽样调查过程中所面临的难点和问题?——以政治学研究为例

论文| 量化研究方法 政治学抽样调查面临概念抽象、复杂,难以测量,理论假设中的关系结构复杂,不得不较多依赖面访式概率抽样调查的难点。受这些难点所限,一些调查中发生了概念不清、社会期许偏差、评价参照系偏差、覆盖偏差、无回答偏差,以及抽样成本高昂和无应答率居高不下等问题。针对这些难点和问题,学者们利用列举实验法、随机化回答技术、虚拟情境锚定法来解决社会期许偏差和评价参照系偏差问题;利用地址抽样来解决覆盖偏差问题,以空间单元格和夜间灯光亮度来降低高昂的抽样成本;以并行数据的应用来降低访员效应,处理无应答,构建应答

02
您找到你想要的搜索结果了吗?
是的
没有找到

针对语言翻译系统的数据投毒攻击

随着现代神经机器翻译 (NMT,neural machine translation) 系统的广泛部署,它们的安全漏洞需要仔细审查。最近发现 NMT 系统容易受到有针对性的攻击,导致它们产生特定的、未经请求的甚至有害的翻译。这些攻击通常在白盒设置中被利用,在这种情况下,已知目标系统会发现导致目标翻译的对抗性输入。然而,当目标系统是黑盒并且攻击者不知道时(例如,安全的商业系统),这种方法不太可行。在本文中展示了基于毒化一小部分并行训练数据的对黑盒 NMT 系统针对性攻击是可行的。表明这种攻击实际上可以通过有针对性地破坏为形成系统训练数据而爬取的网络文档来实现,然后分析了在两种常见 NMT 训练场景中靶向投毒的有效性:from-scratch训练和预训练和微调范式。结果令人震惊:即使在使用海量并行数据(数千万)训练的最先进系统上,在令人惊讶的低投毒预算(例如,0.006%)下,攻击仍然成功(超过 50% 的成功率)。最后,讨论了应对此类攻击的潜在防御措施。

05

腾讯混合云存储 TStor 系列再添新成员,并行存储一体机正式发布

最近国内某大型互联网公司依靠其数据优势成功上市,可见数据的重要性,而数据和存储密不可分,您真的知道自己需要更高性能存储吗? 在当今数据爆发式增长的时代,数据已经成为很多行业最重要的资源,没有之一。 数据左右着很多新兴企业的命脉,收集数据、分析数据和应用数据的循环已经变为企业发展的根本,依靠数据创造更大的价值,并持续的加强和优化数据管理流程,让数据型驱动的行业不断进化。 常规的存储只能满足数据保存的基本需求,或者顺带一些基本的数据混合管理,而要真正挖掘数据的价值,采用高性能的存储必不可少,以支撑高性能

03

一周极客热文:从分析8000条软件工程师招聘信息所学到的

Aline Lerner 过去以编程谋生,现在从事招聘工程师的工作。去年,她通过参考全年的有效招聘数据编写了一篇文章,总结如下: 如果可以的话,尽可能让招聘信息更个性化。谈论你从事什么工作,候选人已经做的事情与招聘内容有什么样的关系,你为他们在做一些事情的原因。攀亲带顾,人造的个性化不算在内。 即使是创始人的亲自招聘也并没有从本质上增加价值,除非他们是个性化的和有针对性的。 写好招聘信息是很难的,并且当工程师和创始人作为招聘人员,他们不一定比专职招聘人员做的更好。在另一方面优秀的招聘人员是更有价值的。专

08

总结过去三年,MIT发布AI加速器综述论文

过去这一年,无论是初创公司还是成熟大厂,预告、发布和部署人工智能(AI)和机器学习(ML)加速器的步伐很缓慢。但这并非不合理,对于许多发布加速器报告的公司来说,他们花三到四年的时间研究、分析、设计、验证和对加速器设计的权衡,并构建对加速器进行编程的技术堆栈。对于那些已发布升级版本加速器的公司来说,虽然他们报告的开发周期更短,但至少还是要两三年。这些加速器的重点仍然是加速深层神经网络(DNN)模型,应用场景从极低功耗嵌入式语音识别和图像分类到数据中心大模型训练,典型的市场和应用领域的竞争仍在继续,这是工业公司和技术公司从现代传统计算向机器学习解决方案转变的重要部分。

02

如何用SPSS分析问卷?用SPSS分析调查问卷数据的方法

问卷调查是一种针对目标对象群体的意见调查方式。是一种写好一连串的小问题,搜集被调查者的意见、反应、感受,和对事物的认知等等。当研究者想经过社会调查来探究一个现象的时候,就能用问卷调查法来搜集数据。《贵阳大数据培训中心》 当我们的调查问卷在把调查数据拿回来后,我们该做的工作就是用相关的统计软件进行处理,在此,我们以SPSS为处理软件,来简要说明一下问卷的处理过程,它的过程大致可分为四个过程:定义变量﹑数据录入﹑统计分析和结果保存。下面将从这四个方面来对问卷的处理做详细的介绍。《贵州大数据培训中心》 第一,定义

07

[算法前沿]--003-AGI通用人工智能模型对安全的影响和开源的大模型

2023年虽然才开始不久,但毫无疑问ChatGPT是今年最重大的科技话题之一。Chat GPT是生成式人工智能的开山之作,出道即巅峰,是继PC互联网、移动互联网之后又一次革命性创新,其创新性在于突破之前决策式AI基于规则的算法模型框架,跳出之前“数据搬运工”的传统模式,即在海量数据中寻找符合规则策略的数据,经过比对计算,基于当前的环境、条件和状态,准确的找到符合条件的数据,一步一步的走向算法和程序的终点,得出一个确定的决策。 生成式AI为决策式AI赋予了灵魂和思想,决策式AI需要在海量数据中挑选并使用符合规则的数据,自身并不创造新的数据,生成式AI的革命性创新的根本在于将逻辑和伦理以算法的形式植入,并产生新的数据,相当于为算法植入了思想和灵魂,尽管其智能水平与高水平人类仍有较大差距,但生成式AI在可无限扩展的算力和数据加持下,其成长性和发展前景将无比光明。 从2022年底至今,Chat GPT已经从3.0快速迭代到3.5,从3.5迭代到4.0,配合市场营销的宣传,ChatGPT已经成功打造了几个标签: l 高富帅:超级算力+海量数据+机器学习+资本追捧 l 自学成才:自我学习,自我提升,快速进阶 l 会推理:读懂复杂问题,具备逻辑能力

03

系统架构师论文-论信息系统的架构设计

本文讨论医保通零距离实时赔付系统项目的架构设计。该系统主要实现了中国人寿保险公司通过与医院合作,让中国人寿客户在出险住院并完成治疗后,即可获得实时的健康险理赔服务,从而在提升保险公司服务的同时减轻病人经济负担、减少客户理赔困难。在医保通实时赔付系统设计架构中,整个系统中分为B/S结构的管理中心端与C/S结构的医疗机构前端两部份。在管理中心端采用J2EE架构,使用了与传统EJB为核心的重量级架构有所不同的轻重级架构方式,其中主要使用Spring框架作为系统的基础平台,充分体现了 Sping的高开发效率、易测试维护性及应用服务的可移植性等优点。同时,在架构设计中,充分考虑了系统的可扩展性、稳定性、安全性、可维护性、灵活性等因素。 在本项目的开发过程中,我担任了系统架构设计与项目管理的工作。该项目从目前推广与应用情况看,达到了项目的预期目标,得到了各级公司的一致好评。

01
领券