pybind11_Pybind11类定义_安装pybind11后“没有名为pybind11的模块” - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

跟我一起学习pybind11 之一

pybind11是一个轻量级的“Header-only”的库，它将C++的类型暴露给Python，反之亦然。主要用于将已经存在的C++代码绑定到Python。pybind11的目标和语法都类似于boost.python库。利用编译时的内省来推断类型信息。

Python & C++ - pybind11 实现解析

IEG 自研引擎 CE 最早支持的脚本是 Lua, 在性能方面, Lua是有一定优势的. 但除此之外的工程组织, 以及现在即将面临的 AI 时代的语料问题, Lua 都很难很好的解决. 在这种情况下, 支持工程组织和语料更丰富的 Python, 就成了优先级较高的任务了. 由于Python的虚拟机以及相关的C API较复杂, 我们选择的方式是将 pybind11 - 一个Python社区知名度比较高, 实现质量也比较高的 Python 导出库与我们引擎的 C++ 反射适配的整合方式, 这样可以在工作量较小的情况下, 支持好 Python 脚本, 同时也能比较好的利用上引擎的C++反射实现. 在做好整合工作前, 我们肯定需要先较深入的了解 pybind11 的相关实现机制, 这也是本篇主要讲述的内容.

ImportError: dynamic module does not define module export function (PyInit_tradecpt)

编译输出的文件名必须与PYBIND11_MODULE(tradecpt, module)的tradecpt保持一致

DeepMind 一次性开源 3 个新框架！深度强化学习应用落地即将迎来春天？

重磅！DeepMind 一次性开源 3 个新框架！深度强化学习应用落地即将迎来春天？

HugeCTR源码简单走读

这段时间除了开发算子之外，还在做一些推荐系统相关的工作，这期间主要看的是HugeCTR的代码，其性能优异，系统不复杂，代码结构较扁平，整体还是比较清晰。在这段时间看源码的过程中也算是对HugeCTR有一点了解，这篇博客主要梳理下HugeCTR代码的结构，以及他在MLPERF中做的一些优化。

PyTorch中的C++扩展实现

在正式开始前，我们需要了解 PyTorch 如何自定义module。这其中，最常见的就是在 python 中继承torch.nn.Module，用 PyTorch 中已有的 operator 来组装成自己的模块。这种方式实现简单，但是，计算效率却未必最佳，另外，如果我们想实现的功能过于复杂，可能 PyTorch 中那些已有的函数也没法满足我们的要求。这时，用 C、C++、CUDA 来扩展 PyTorch 的模块就是最佳的选择了。

C++到Python全搞定，教你如何为FastDeploy贡献代码

大家好，我是Zheng_Bicheng。很高兴和大家分享黑客松比赛中“No.80瑞芯微RK3588：通过Paddle2ONNX打通5个飞桨模型的部署”任务的一些心得体会。  RKNPU2是瑞芯微Rockchip推出的针对RK356X/RK3588/RV1103/RV1106的C++推理工具。在参加黑客松比赛时，FastDeploy仓库[1]还没有集成RKNPU2的引擎。开发者需要使用RKNPU2从头编写代码。在参加完黑客松之后，我为FastDeploy仓库贡献了RKNPU2的后端推理引擎的代码，现在能直接使用FastDeploy快速开发基于RKNPU2的代码。本次教程将以贡献SCRFD模型[2]为例，教你如何给FastDeploy贡献代码。

python打包二进制文件（pyd\dll\exe）

使用cython编译pyx文件输出c和h文件（带cdef public等定义才会输出头文件）,pyx添加

Swift 响应式编程：简化 KVO 观察与 UI 事件处理 | 开源日报 No.110

RxSwift 是 Reactive Extensions 标准的 Swift 特定实现，它提供了 Observable 接口来表达计算的通用抽象。该项目旨在为 Rx API 提供真正以 Swift 为先的 API，并允许轻松地组合异步操作和数据流。其主要功能包括 KVO 观察、异步操作、UI 事件等各种数据流都统一封装成序列进行处理，使得 Rx 简单、优雅且强大。

Python又添一大科学计算库，基于Armadillo矩阵库的PyArmadillo发布

作为 C++ 中与 Eigen 并驾齐驱的一大科学计算库， Armadillo 因其简单易用的特性深受广大程序员和科学家的喜爱，也获得了 Facebook、NASA、Boeing、Siemens、Deutsche Bank、MIT、 CMU、Stanford 等公司和高校的广泛使用。此外， Armadillo 的主作者和 Rcpp 的主作者联合开发了 RcppArmadillo，作为 R 语言中的主要科学计算库，在 Github 每月下载量高达 97.2 万次。除此以外，Armadillo 还在著名开源机器学习库 mlpack 中被用作主要的依赖库之一，获得了极高的知名度。

树莓派4B安装Tensorflow的方法步骤

Tensorflow官方在2018年宣布，正式发布支持树莓派版本的Tensorflow，编者开始直接用：

随笔 | 写代码时极有可能面临的焦虑

本科学管理，被诸如《市场营销学》这类课程的作业搞得焦头烂额时，就会羡慕学计算机（或更广一点如「工科」）的同学：工程问题，有绝对的标准与尺度；不像这种经管的作业，没有明确的基准，辛苦写好的作业到底能得多少分，怕是只有老师的心情说的算。

Pytorch拓展进阶(二)：Pytorch结合C++以及Cuda拓展

之前的文章中：Pytorch拓展进阶(一)：Pytorch结合C以及Cuda语言。我们简单说明了如何简单利用C语言去拓展Pytorch并且利用编写底层的.cu语言。这篇文章我们说明如何利用C++和Cuda去拓展Pytorch，同样实现我们的自定义功能。

Python调用C++代码

今天在研究PyTorch中Tensor的一些操作的时候，发现其底层Tensor的操作都是用C++写的，并使用pybind11进行C++和Python的桥接。所以，我就想着探索一下Python中如何调用C++代码？

Python + Docker 还是 Rust + WebAssembly？这并不难选

作者｜Sam Liu，Second State 工程师，CNCF WasmEdge 维护者 & Miley Fu，CNCF 大使，WasmEdge DevRel

PyTorch 1.5上线：加入稳定C++前端，高级自动梯度API

今天，PyTorch 1.5 宣布上线，此版本主要包括几个新的 API 的添加和改进。新版 PyTorch 包括对 C++前端的重大更新，用于计算机视觉模型的「channels last」存储格式，以及用于模型并行训练的分布式 RPC 框架的稳定版本。该版本还提供了针对自动求导机制中黑塞和雅可比的新 API，以及受 pybind 启发，允许用户创建自定义 C++类的一个 API。另外，torch_xla 已可在 PyTorch 1.5 版中使用，并在 1.5 版本中进行了测试，可提供成熟的 Cloud TPU 体验。

PyTorch自定义CUDA算子教程与运行时间分析

最近因为工作需要，学习了一波CUDA。这里简单记录一下PyTorch自定义CUDA算子的方法，写了一个非常简单的example，再介绍一下正确的PyTorch中CUDA运行时间分析方法。

Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

Matterport3DSimulator 可以使用视觉信息（RGB-D 图像）开发与真实 3D 环境交互的 AI Agent，它主要应用于深度强化学习的研究以及自然语言处理和机器人技术的结合技术。

012

使用pyWannier90计算局域化Wannier函数

Wannier函数是周期性体系里和分子轨道对应的概念。很多固体物理教材都详细介绍了Wannier函数，如南京大学教材《固体理论》[1]的第八章。Wannier函数定义为Bloch函数的一个傅立叶变换：

《HelloGitHub》第 86 期

这里有实战项目、入门教程、黑科技、开源书籍、大厂开源项目等，涵盖多种编程语言 Python、Java、Go、C/C++、Swift...让你在短时间内感受到开源的魅力，对编程产生兴趣！

PaddlePaddle踩坑指北系列——Linux安装（一）

本周我们在社区中精选出开发者在使用PaddlePaddle过程中遇到的技术难题，希望能帮助广大用户在Linux安装过程中解答疑惑。

一文带你使用即时编译（JIT）提高 PyTorch 模型推理性能！

在之前的分享中，我们介绍了 torch jit 是如何通过 trace 转换模型，使用 subgraph rewriter 优化计算图，以及如何使用 aliasDB 来避免别名造成的优化错误。通过这些步骤，由 Python 描述的模型变成了更适合部署的计算图。这次分享我们将目标转向运行时，看看 PyTorch 如何使用生成的计算图进行推理。

python和c交互

CDLL(“dll_name.dll”,winmode=0)加载dll，还有WINDLL、PYDLL

PyTorch 2.2 中文官方教程（十二）

PyTorch 提供了大量与神经网络、任意张量代数、数据处理和其他目的相关的操作。然而，您可能仍然需要更定制化的操作。例如，您可能想使用在论文中找到的新型激活函数，或者实现您作为研究的一部分开发的操作。

已开源！GraphVite 超高速图表示学习系统，1 分钟可学百万节点

8 月 5 日晚，GraphVite 开发者 @唐建（MILA 实验室助理教授，曾获 ICML 2014最佳论文、WWW16 最佳论文提名）在社交平台上公布了这个图表示学习系统开源的消息。他表示，在百万节点的图上，使用该系统仅需 1 分钟左右就可以学习节点的表示。该系统的目标是为广泛的嵌入方法系列提供通用和高性能的框架，这将非常有利于图学习算法的研究与部署。雷锋网 AI 开发者将其具体介绍及相关地址编译如下。

《PytorchConference2023 翻译系列》4-探索PyTorch在MPS后端的最新增强功能：提升应用程序性能

大家好，我叫Kulinseth，我在苹果的MPS团队工作，今天我将讨论PyTorch中MPS后端的改进。接下来，我将介绍MPS后端进入Beta Stage的新功能。我们添加了一些新功能，如支持分析器、自定义内核和MPS开发者API，这些都是MPS后端的新特性。

深度强化学习框架-OpenSpiel(DeepMind开源28种DRL环境+24种DRL算法实现)

在Alphabet大额资金支持下，DeepMind一直以实现AGI为为目标的公司在各个领域不断的尝试，做出了很多基础研究。其中最为出名的当属在强化学习方面的探索，从2013年的Atari游戏到AlphaGo的横空出世，再到终极AlphaZero的实现，完成了一次次巨大的挑战，但一个完善的环境对强化学习的发展来说是非常重要的，而DeepMind就拥有这样一个杀手锏。

你的专属音乐生成器「GitHub 热点速览」

如果你制作视频，一定会碰到配乐的问题。虽然网上找的一些免费配乐能勉强满足需求，但是如果有个专属的配乐生成器，根据你的视频画面生成对应配乐是不是不错呢？audiocraft 也许能帮助你，把相关画面用文本描述一下，它就能生成相对应的音乐。

Jetson Nano Installation

https://developer.nvidia.com/zh-cn/embedded/learn/get-started-jetson-nano-devkit

手把手教你如何高效地在 MMCV 中贡献算子

不知道大家在使用 MMCV 的过程中有没有遇到这种情况：MMCV 没有提供自己需要的 CPU/CUDA 算子，于是希望提一个 PR（Pull Request），将这个算子加入 MMCV，但是又不知从何处下手。本文以最简单的 TensorAdd 算子为例，向大家展示为 MMCV 贡献算子的全过程，希望能够帮助大家更好地理解 MMCV 算子的

如何构建高性能可视化架构？一个交互式实时数据引擎的架构设计

在分析 SecDB、Athena、Quartz 几个实时金融与风险分析平台的时候，发现了 Perspective —— 一个 FinTech 开源基金会 FinOS 旗下开源的交互式分析和可视化组件库，由摩根大通（J.P. Morgan Chase）公司开源出去的流式数据可视化组件库。所以，从某种意义上来说也是《金融 Python 即服务：业务自助的数据服务模式》的后续展开，也可以算是低延迟架构的后续探索。

Jetson Nano安装tensorflow2.5（英伟达版本）

今天给我们的小主角安装tensorflow，一直为没舍得让它跑高算力东西，今天安装一下。

Python中的SWIG入门

SWIG (Simplified Wrapper and Interface Generator，简化封装和接口生成器) 是一个开源工具，用于将C/C++代码转换为各种高级编程语言的接口代码。它允许开发人员在Python等脚本语言中直接使用底层的C/C++代码，以提高开发效率和灵活性。

PyTorch & MMCV Dispatcher 机制解析

假设一个团队有一个项目经理和三个程序员，甲方正在疯狂地提各种需求，然后项目经理要做的就是根据每位程序员的专长，将不同的需求分配给不同的程序员来做，但是项目经理自己不会去实现需求，此时我们可以说，项目经理就是一个 Dispatcher。

首次线上直播，TF Dev Summit 都讲了啥？

场景描述：今日凌晨，一场技术直播引来了无数人的围观，甚至不惜肝到天明，到底是什么让开发者如此激动？原来是一年一度的 TensorFlow 技术峰会，这场线上直播的盛会，带来了哪些关于 TensorFlow 的信息，本文就将从几个重点进行一次深入的回顾。

RNAvelocity1：RNA速率简介及scVelo安装

测量单个细胞中的基因活性需要破坏这些细胞以读取其内容，这使得研究动态过程和了解细胞命运决定具有挑战性。La Manno et al. (Nature, 2018)[1]引入了 RNA 速率的概念，利用新转录的未剪接的前体 mRNA 和成熟的剪接 mRNA 可以在常见的单细胞 RNA-seq 流程中区分的事实，可以恢复定向动态信息，前者可通过内含子的存在检测。这种不仅测量基因活性，而且测量它们在单个细胞中的变化（RNA 速率）的概念，开辟了研究细胞分化的新方法。最初提出的框架将速率作为观察到的剪接和未剪接 mRNA 的比率与推断的稳态的偏差。如果违反了共同剪接速率的中心假设和对具有稳态 mRNA 水平的完整剪接动力学的观察，则会出现速率估计错误。

OpenAI/Triton MLIR 第四章: ROCm-triton配置

最近在整理python-based的benchmark代码，反过来在NV的GPU上又把Triton装了一遍，发现Triton的github repo已经给出了对应的llvm的commit id以及对应的编译细节，然后跟着走了一遍，也顺利的安装成功，只需要按照如下方式即可完成NV GPU上的安装，

视频抽帧的全流程GPU异构加速实践

视频已成为内容和广告的主要媒介形式，但目前的视频内容理解或审核等AI能力，主流依然是先抽帧，再基于图像帧做特征提取和预测。抽帧由于步骤多、计算重，在视频AI推理场景很容易成为性能瓶颈。因此，有必要使用硬件加速等手段，来对视频抽帧做极致的性能优化。

020

VPF：适用于 Python 的开源视频处理框架，加速视频任务、提高 GPU 利用率

同时，由于 Python 绑定下的 C ++代码，它使开发者可以在数十行代码中实现较高的 GPU 利用率。解码后的视频帧以 NumPy 数组或 CUDA 设备指针的形式公开，以简化交互过程及其扩展功能。

PyTorch如何加速数据并行训练？分布式秘籍大揭秘

在芯片性能提升有限的今天，分布式训练成为了应对超大规模数据集和模型的主要方法。本文将向你介绍流行深度学习框架 PyTorch 最新版本（ v1.5）的分布式数据并行包的设计、实现和评估。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐