性能影响长倍。为什么C会默认选择64位而不是硬件的80位？

答案：

关于 C 语言默认选择 64 位而不是硬件的 80 位，主要原因是为了兼容性和通用性。早期的计算机硬件使用 8 位（80 位）的二进制位数表示一个数字或字符。然而，由于 64 位（8 位）的位宽较大，因此 C 语言选择了 64 位作为默认的位宽，以获得更好的数据表示和存储能力。

此外，64 位架构的处理器已经成为了市场上的主流，并且被广泛应用于服务器、计算机和其他高性能计算设备中。因此，选择 64 位作为默认位宽，可以让编写的代码更加通用，适应性更强。

名词解释：

位宽：指计算机或其他设备处理数据时，一次可以处理二进制数的位数。
64 位：一种计算机系统架构，使用 64 位的二进制位数表示数据。
80 位：一种计算机系统架构，使用 80 位的二进制位数表示数据。
兼容性：指一种系统或设备能够与其他系统或设备兼容，以便进行数据交换或使用。
通用性：指一种系统或设备能够适用于不同的应用场景，具有广泛的适用性。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

相同型号物理机容器性能不如虚拟机？

根因分析代码有 Bug ，启动都会 fullGC ，都有启动失败的概率，但是容器 fullGC 耗时长，请求会不断堆积，而虚拟机过段时间可以自行恢复这里主要定位，为什么容器 fullGC 时间长...需要你具备很高的业务能力，包括对业务流程的熟悉度、对软件架构及软件内实现逻辑的理解程度，甚至是对OS和硬件原理都要有深入的理解。...如上图：排除业务层和软件架构两层，相同代码，相同物理机型号，相同机房的情况下，现在需要识别软硬件性能瓶颈。...为保证服务性能应选用 performance 模式，将 CPU 频率固定工作在其支持的最高运行频率上，从而获取最佳的性能，一般都是默认 powersave，可以通过 cpupower frequency-set.../storcli64 /c0 /v0 set rdcache=ra 经验教训上线前，基准测试的重要性 & 基准测试要包含应用的，以应用感知为准。下篇会详细服务器性能压测指标及方法。

861 0

干货 | 携程酒店RSocket实践

作者简介刘诚，携程酒店研发性能架构师。2014年加入携程，致力于通过架构的演进，控制企业硬件成本。一、初识RSocket 在QCon2019北京大会上第一次得知RSocket。...印象深刻的是Netifi公司通过他们研发的RSocket帮助企业实现微服务，在40,000RPS的场景下，Istio需要每月3495美金，而Netifi每月只要388美金，同时性能提升10倍，这无疑对任何企业都是极具吸引力的...是不是压测方式有问题，为什么性能一点也没有提高？三、RSocket的定义在解答上面的问题之前，我们先来看看RSocket到底是什么？...至此就能理解为什么性能没提高了，在我们实践的场景中，只是把原来基于HTTP的请求方式变成了基于TCP的实现。就生产结果而言，并没有性能大幅提升，更别提10倍的提升。...例如：当上游服务调用下游服务，而下游服务来不及处理的时候，可以选择性的限制上游服务的调用。 ?

2.4K2 0

CPU和GPU双低效，摩尔定律之后一万倍 ——写于TPU版AlphaGo重出江湖之际

而我，也改变了自己悲观的预期，相信在不远的将来，“摩尔定律结束之后，性能提升一万倍”，将不会是科幻，而是发生在我们眼前的事实。这是不是太疯狂了？设计计算机硬件的技术宅男们，凭什么做到这一点？...它之所以还能体现出相当的优势，是因为在一个软硬件系统中，算法的影响远大于硬件架构，而硬件架构的影响又远大于电路——在电路级别做“通用”付出的代价，比起在架构级别做“通用”的代价，还是小得多了。...内行人都知道ASIC效能远超FPGA，但仍然有很多人不敢选择ASIC，为什么？自己做ASIC的风险太大：周期长，投入多，门槛高。一旦芯片做错，就和石头无异，落个血本无归。...现在大家应该相信，在一个足够重要应用领域中，完全可以把优化和定制做到晶体管级别，而不是只做到某种现成的芯片架构的级别。这不但可行，而且必要，因为你不这么做，竞争对手也会这么做。...硬件的开源时代摩尔定律的通俗表示是：每一美元所能买到的电脑性能，将每隔18-24个月翻一倍以上。过去三十年，拜摩尔定律所赐，我们见证了超过百万倍的性价比提升。

1K7 0

Android 中图片压缩分析（上）

Android 在之前从某种程度来说使用的算是 libjpeg 的功能阉割版，压缩图片默认使用的是 standard huffman，而不是 optimized huffman，也就是说使用的是默认的哈夫曼表...，而不是算数编码。...但是，现在 Android 手机性能比以前好很多，所以目前性能往往不是瓶颈，时间和压缩质量反而成为更重要的指标了。...八、总结首先，从 Android 7.0 版本开始，optimize_code 标示已经设置为了 TRUE，也就是默认使用图像生成哈夫曼表，而不是使用默认哈夫曼表。...而至于这个标志所产生的体积差距也没有 5-10 倍那么大，大约可以在原图的基础上缩小 10%～50% 的体积，经过修改前后不同 Android 版本实测，数据吻合。

3.9K3 1

尤雨溪回应：Vite 真的比 Turbopack 慢 10 倍？

也有用于冷启动性能的 benchmarks，但是由于没有发现冷启动速度是 Vite 10 倍的比较，因此我们只能假设“10 倍快”是基于 HMR 的性能。...在不同的硬件上的性能因为这是一个涉及 Node.js 和和原生 Rust 部分的复合测试，在不同的硬件上会有非凡的差异。我发布的结果是在我的 M1 MacBook Pro 上收集的。...Vercel 的 benchmark 使用更新模块的“浏览器 eval 时间”作为结束时间戳，而不是 React 组件重新渲染时间。...该应用程序包含超过30k个模块 Benchmark 只测量热更新模块被评估的时间，而不是实际应用更改的时间。什么是“公平”比较？...用户更关心端到端的 HMR 性能，即从保存到看到反映的更改的时间，而不是理论上的“模块评估”时间。当看到“更新速度快 10 倍”时，一般用户会考虑前者而不是后者。

1.2K1 0

为什么 Linux 和 macOS 不需要碎片整理

，碎片整理可能不仅对提高读写性能没有显著的帮助，还不利于硬件的使用寿命；文件系统 Linux 一般都使用 Ext2、Ext3 和 Ext4 文件系统，今天的大多数 Linux 发行版都选择了 Ext4...，然而这种机制并不是没有副作用，在系统断电或者崩溃时可能会丢失更多的数据。...固态硬盘的顺序 I/O 和随机 I/O 在性能上虽然也有差异，但是差距可能在十几倍到几十倍之间，而固态硬盘的随机 I/O 延迟也比机械磁盘好几十倍甚至上千倍，到现在来看整理固态硬盘上的碎片虽然有收益，但是也比较有限...硬件的演进和革新深深地影响着上层软件的设计，想要设计出通用的系统是异常困难的，在设计文件系统时如果不考虑底层硬件的特性，也就无法充分利用硬件提供的性能并得到期望的结果。...；固态硬盘的随机读写性能远远好于机械硬盘，随机读写和顺序读写虽然也有性能差异，但是没有机械硬盘的差异巨大，而频繁的碎片整理也会影响固态硬盘的使用寿命；到最后，我们还是来看一些比较开放的相关问题，有兴趣的读者可以仔细思考一下下面的问题

1.3K3 0

MySQL 基准测试

不过有时候不需要了解整个应用的情况，而只需要关注 MySQL 的性能，至少在项目初期可以这样做。基于以下情况，可以选择只测试 MySQL：需要比较不同的 schema 或查询的性能。...并发性的测量完全不同于响应时间和吞吐量，它不像是一个结果，而更像是设置基准测试的一种属性。「并发性测试通常不是为了测试应用能达到的并发度，而是为了测试应用在不同并发下的性能」。...2.3.2 基准测试应该运行多长时间基准测试应该运行足够长的时间，如果需要测试系统在稳定状态时的性能，那么当然需要在稳定状态下测试并观察，而如果系统有大量的数据和内存，要达到稳定状态可能需要非常长的时间...很多因素，包括外部的压力、性能分析和监控系统、详细的日志记录、周期性作业以及其他一些因素，都会影响到测试结果。在每次测试中，修改的参数应该尽量少。如果必须要一次修改多个参数，那么可能会丢失一些信息。...另外，基于 MySQL 的默认配置的测试没有什么意义，因为默认配置是基于消耗很少内存的极小应用的。最后，如果测试中出现异常结果，不要轻易当做坏数据点而丢弃。应该认真研究并找到产生这种结果的原因。

7992 0

CMU普林斯顿推Mamba新架构，解决致命bug推理速度暴增5倍

左右滑动查看而另一位一作Tri Dao介绍了如何利用硬件感知设计应对这一挑战，以及Mamba在语言方面的强大性能。...需要注意的是，对于Mamba（和一般的SSM），这种方法只能在SRAM中实现扩展状态，而不是在主存储器中。...通过选择改进SSM将选择机制纳入模型的一种方法是：让影响序列交互的参数（例如 RNN 的循环动态或 CNN 的卷积核）依赖于输入。算法1和2说明了研究者使用的主要选择机制。...实证评估合成任务：选择性复制复制任务是用来测试序列模型，特别是循环模型记忆能力的经典合成任务。 LTI SSM（线性递归和全局卷积）可以通过只关注时间而不是推理数据轻松地解决这个任务。...另外，图5（右）显示，Mamba能够利用更长的上下文，甚至长达1M的极长序列，并且其预训练困惑度会随着上下文的增加而提高。另一方面，鬣狗DNA模型会随着序列长度的增加而变差。

9121 0

Python确实比较慢，但我不在乎

运行时间不再是最昂贵的资源。企业目前最为昂贵的资源是雇员的时间。或者换种方式来讲，最重要的是让雇员在规定时间内将程序完成，而不是让程序运行速度更快。...但web服务器的好处是，你可以无限地负载均衡。换句话说，可以装更多的硬件。当然，Python可能比C语言等其他语言需要的硬件要多。用硬件来解决CPU的问题吧，硬件比你的时间可便宜多了。...换句话说，如果我们有两个大O（log n）即log n级的函数，但是一个比另一个慢两倍，这没什么影响，因为随着数据量的增加，它们会以相同的速率减慢。...从这个逻辑出发，你可以认为，凭借“速度”因素为应用程序选择一个编程语言完全属于过早的优化，你实际选择的是“据说”很快的编程语言，而没有去测试、没有理解影响速度的瓶颈是什么。...选择一个语言/框架/架构可以使你的快速开发（例如Python）。不要选择那些仅仅是运行很快的技术。当你的确有性能问题时，找到你程序的瓶颈在哪里。程序的瓶颈通常不是CPU或者Python语言本身。

7504 0

Golang适合高并发场景的原因分析

这既得益于软件的进步, 也得益于硬件性能的提高，现在应该扩展讨论的是应该是C10M问题了。参考资料：千万级并发实现的秘密：内核不是解决方案，而是问题所在！...主进程负责监听和管理连接，而具体的业务处理都会交给子进程来处理。 ? 种架构的最大的好处是隔离性，子进程万一crash并不会影响到父进程。...//wenku.baidu.com/view/c527582a453610661ed9f40f.html Apache的问题 Apache的问题在于服务器的性能会随着连接数的增多而变差关键点：性能和可扩展性并不是一回事...比方说，你升级硬件并且提高处理器速度到原来的2倍。发生了什么？你得到两倍的性能，但你没有得到两倍的处理规模。每秒处理的连接可能只达到了6000。你继续提高速度，情况也没有改善。...甚至16倍的性能时，仍然不能处理1万个并发连接。所以说性能和可扩展性是不一样的。问题在于Apache会创建一个CGI进程，然后关闭，这个步骤并没有扩展。 为什么呢？

2.4K8 1

比Mojo慢68000倍，Python性能差的锅该给GIL吗？

Mojo 的最初设计目标是比 Python 快 35000 倍，近期该团队表示，因为结合了动态与静态语言的优点，Mojo 一举将性能提升到了 Python 的 68000 倍。...鹅厂工程师真实使用感受》这不是第一个号称比 Python 更快的编程语言，相信也不会是最后一个。那么问题来了，为什么是个编程语言就比 Python 快呢？...这里需要明确的一点是，从 Python 语言标准的角度看，GIL 并不是必须的，但 Python 的默认实现是 CPython，这是我们去官网下载 Python 时获得的默认实现，也是绝大多数 Python...当我们考虑一个技术选择是否合理的时候，不能只以当下的目光去审视过去，而需要回到当时的场景中去考虑问题。...硬件的风向转变影响了软件开发，开发者们希望 Python 也能提供充分利用多核硬件来实现并行计算的能力。

5624 0

灵魂拷问：Kubernetes会影响数据库性能吗？

本篇文章着眼于 Linux 页面大小对数据库性能的影响，以及如何优化数据库 Kubernetes 节点。大多数流行的数据库都受益于 Linux 大页面。...下图显示了使用 Linux 大页面对数据库性能的影响有多大。上图显示，对于相同的数据库，相同的数据，相同的工作负载，使用Linux 2MB页面而不是4K页面时吞吐量可以提高8倍。...尽管页面遍历是高效的 C 代码，但它比通过 TLB 缓存在硬件中进行映射要慢得多。 为什么 TLB 缓存未命中对数据库很重要所有数据库最终都需要访问内存中的数据进行读取或写入。...Lake CPU 的 L1 CPU 缓存大 256 倍，L2 CPU 缓存大 512 倍减少 TLB 缓存未命中的数量可以对数据库性能产生显著的积极影响。...而不是 TCP 套接字来访问数据库这种配置意味着没有磁盘 IO 或网络处理，因此工作负载会在 CPU 和/或内存访问上出现瓶颈。

1.2K4 0

为什么 Linux 和 macOS 不需要碎片整理

，碎片整理可能不仅对提高读写性能没有显著的帮助，还不利于硬件的使用寿命；文件系统 Linux 一般都使用 Ext2、Ext3 和 Ext4 文件系统，今天的大多数 Linux 发行版都选择了 Ext4...，然而这种机制并不是没有副作用，在系统断电或者崩溃时可能会丢失更多的数据。...固态硬盘的顺序 I/O 和随机 I/O 在性能上虽然也有差异，但是差距可能在十几倍到几十倍之间，而固态硬盘的随机 I/O 延迟也比机械磁盘好几十倍甚至上千倍，到现在来看整理固态硬盘上的碎片虽然有收益，但是也比较有限...硬件的演进和革新深深地影响着上层软件的设计，想要设计出通用的系统是异常困难的，在设计文件系统时如果不考虑底层硬件的特性，也就无法充分利用硬件提供的性能并得到期望的结果。...；固态硬盘的随机读写性能远远好于机械硬盘，随机读写和顺序读写虽然也有性能差异，但是没有机械硬盘的差异巨大，而频繁的碎片整理也会影响固态硬盘的使用寿命原文链接：本文转自开源世界，点击访问。

1.8K1 0

2021-03-05：go中，io密集型的应用，比如有很多文件io，磁盘io，网络io

2021-03-05：go中，io密集型的应用，比如有很多文件io，磁盘io，网络io，调大GOMAXPROCS，会不会对性能有帮助？为什么？福哥答案2021-03-05：这是面试中被问到的。...答案2： GOMAXPROCS 用默认的，就是CPU的硬件线程数目，对于大部分IO密集的应用是不合适的。至少应该配置到硬件线程数目的5倍以上, 最大256。...补充说明：调度器迟钝不是M迟钝，M也就是操作系统线程，是非常的敏感的，只要阻塞就会被操作系统调度（除了极少数自旋的情况）。但是GO的调度器会等待一个时间间隔才会行动，这也是为了减少调度器干预的次数。...那么，GOMAXPROCS 很大，超过硬件线程的8倍，会不会有开销呢？答案是，开销是有的，但是远小于Go运行时迟钝的调度M来抢夺P而导致CPU利用不足的开销。...【GO语言】合理配置GOMAXPROCS提升一倍以上的性能 GOMAXPROCS你设置对了吗？

8401 0

基因组大数据计算：CPU和GPU加速方案深度评测

为什么没选择GATKGATK是变异检测流程的行业金标准，但它是用Java写的，所以不是性能的金标准。...图片在功耗方面，c6i.metal 实例中的两颗Intel Xeon Platinum 8352M 处理器的功率是370W，而 p4d.24xlarge 实例中的八个 NVIDIA A100 Tensor...Parabricks 要达到最佳性能，相较于Intel纯CPU硬件环境需要8.6倍的功率和 3.0 倍的成本，但分析效率相较于Intel 3rd Gen Xeon Platinum 8352M CPU来说...，仅有1.5 倍的性能提升。...图片评测结论Sentieon软件是通过改进算法模型实现性能加速(纯CPU环境，支持X86/ARM)，不依赖于昂贵高功耗的专用硬件配置（GPU/FPGA），不依赖专有编程语言；同时Sentieon软件针对几乎所有的短读长和长读测序平台进行了优化

9015 0

出大事了！DPU厂商打起来了

）你可能会问：这有什么区别？好吧，特定领域的处理器是从头开始研发的，允许整个I/O服务在I/O处理器内执行，而不是主要在通用内核中运行I/O服务，对数据路径中的某些功能进行硬件加速。...在这项测试中，我们比较了最新的商用产品，即Pensando DSC-200和NVIDIA的ConnectX-6 Dx，测试速率为100G。 为什么不是BlueField-2？...对于无法进行硬件加速的流量，DSC-200的性能比CX-6 Dx好13倍。这是由于架构的性质决定的：DSC通过硬件中的P4引擎来处理包括连接跟踪在内的所有带状态的防火墙服务。...即使CX-6 Dx存在硬件能力，软件也必须能够对流量进行编程。当软件或硬件不能执行这些功能时，数据包处理就会落在CPU内核上，这与ASIC的性能不匹配，因此对性能有负面影响。图4....其他方案会面临严峻的选择：要么忍受性能的降低，要么部署新的硬件（通常需要18-24个月的时间来开发，更不用说验证和部署了）。

9463 0

初创公司如何训练大型深度学习模型

幸好 OpenAI 有一个由微软提供的 NVIDIA V100 GPU 的高带宽集群，这让 OpenAI 可以在几个星期而不是几年内就能训练 GPT-3。这个集群到底有多大？...32 个 NVIDIA V100s 训练一个模型 为什么我们这个模型的训练需要如此长的时间和如此多的 GPU？主要原因有三个： 1....某些操作或自定义损失函数可能不支持较低的精度，可能需要大量的超参数调整，以使你的模型在 FP16 下收敛，而且较低的精度也可能会影响模型的总体精度。...自购硬件如果你对管理自己的硬件感到满意（我们不推荐这么做），那么购买诸如 NVIDIA TITAN X 之类的消费级 GPU 是一个比较便宜的选择。...成本可能很高，迭代时间也可能很慢，而且如果你不小心，它们会严重影响你的创业进程。

1.4K1 0

和TensorFlow一样，英伟达CUDA的垄断格局将被打破？

虽然 TensorFlow 现在也默认使用 Eager 模式，但研究社区和大多数大型科技公司都选择使用 PyTorch。...将英伟达 2016 年的 P100 GPU 与最新的 H100 GPU 进行比较，我们会发现内存容量增加到原来的 5 倍（16GB → 80GB），FP16 性能增加到 46 倍（21.2 TFLOPS...这导致许多人担心 H100 的利用率会很低。A100 需要很多技巧才能绕过内存墙，而 H100 还需要实现更多技巧。...随着模型架构的稳定和来自 PyTorch 2.0、OpenAI Triton 和 MLOps 公司（如 MosaicML）的抽象成为默认，芯片解决方案的架构和经济性开始成为购买的最大驱动力，而不是英伟达高级软件提供的易用性...此外，代码针对性能进行了更优化，内存带宽和容量要求得到了显著降低。研究人员们需要的不是只支持 GPU 的编译器，而是想要支持各种硬件后端。

9151 0

为什么都说C++太复杂？

作为对比，C语言，截止到C11，关键字是44个显然，C++比C复杂，其关键字比C多一倍有余。 ? 但也有观点认为，C++只有在被孤立看待的时候，才会觉得复杂性。设计任何一门语言都是有背景的。...C++面向的是这样的特定用户：应对各种复杂问题写出运行相当长时间的解决方法解决方案要满足任意的性能要求工作在不同的硬件和操作系统上和许多已存在的系统共存虽然人们都希望有简单的语言，但是人们真正需要的是有助于解决问题的语言...由于C++相当流行，因此得到结论：人们愿意为了语言所提供的强大表现力和高效率而放弃对简单性的要求。既然如此，那为什么要解决的问题越复杂，工具就不得不复杂？原因有三个。...比如有一些C++的库会提供一种叫片的类，如果有某一个对象包括了某种数据结构，那我们可以创建一个指向该数据结构某部分的片，给这个片赋值，就会影响原数据结构中被选中的那部分。...部分语言假装复杂性不存在而选择忽略它，给用户提供了一个干净整洁的接口。如果世界上有些地方不符合他们所设想的模型，就干脆直接忽略掉。还有一些语言则是把复杂性直接扔给用户。

5211 0

【技术】Hadoop选择：可供参考的几大因素

这可能会让你感到惊讶，因为并不是所有创建出的Hadoop分布系统都一样。...在我的另一篇文章中曾讲到，增加250毫秒的延迟可能会毁掉整个线上销售的旺季，我们可以了解一下为什么性能的低下(高延迟)会让人难以忍受。...正如你在下图看到的那样，将MapR M7版本与另一个Hadoop发行版对比，在延迟上的差别意味着性能的不同，而不同发行版之间性能差距也是惊人的。...单个NameNode的执行情况也需要使用商业级NAS，而不是预算友好型的商品化硬件。对于单一NameNode体系结构有一种更好的选择——使用分布式元数据结构。...下面提供两种体系结构的可视化比较：正如你所看到的那样，分布式元数据架构使用的完全是商品化硬件，不仅节省了成本，它还使性能提升了10-20倍，摆脱了文件瓶颈，使文件数上限达到了10亿，比单个NameNode

6674 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

性能影响长倍。为什么C会默认选择64位而不是硬件的80位？

相关·内容

相同型号物理机容器性能不如虚拟机？

干货 | 携程酒店RSocket实践

CPU和GPU双低效，摩尔定律之后一万倍 ——写于TPU版AlphaGo重出江湖之际

Android 中图片压缩分析（上）

尤雨溪回应：Vite 真的比 Turbopack 慢 10 倍？

为什么 Linux 和 macOS 不需要碎片整理

MySQL 基准测试

CMU普林斯顿推Mamba新架构，解决致命bug推理速度暴增5倍

Python确实比较慢，但我不在乎

Golang适合高并发场景的原因分析

比Mojo慢68000倍，Python性能差的锅该给GIL吗？

灵魂拷问：Kubernetes会影响数据库性能吗？

为什么 Linux 和 macOS 不需要碎片整理

2021-03-05：go中，io密集型的应用，比如有很多文件io，磁盘io，网络io

基因组大数据计算：CPU和GPU加速方案深度评测

出大事了！DPU厂商打起来了

初创公司如何训练大型深度学习模型

和TensorFlow一样，英伟达CUDA的垄断格局将被打破？

为什么都说C++太复杂？

【技术】Hadoop选择：可供参考的几大因素

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐