linux内核 sin cos - 腾讯云开发者社区

、

我的OpenCL内核将经常使用它们，因此我想在常量内存中定义它们。( N_RADIAN), sin( N_RADIAN)), // N(float2)(cos(E_RADIAN), sin( E_RADIAN)), // E (float2)(cos(SE_RADIAN), sin(S

浏览 3提问于2013-09-29得票数 0

回答已采纳

3回答

Sin和Cos还是Sin和Sqrt？

、、、、

第一个问题：英特尔数学内核库为标准数学函数计算提供了非常好的函数，因此存在一个函数vdSinCos()来以一种非常优化的方式解决这个问题，但是英特尔编译器不是免费的。在linux发行版中有没有开放源代码库(C，C++，Fortran)可以提供这些函数，我可以简单地链接到它们，并拥有最优的实现？注意:我不想讨论指令调用，因为并不是所

浏览 0提问于2013-09-14得票数 5

1回答

我可以相信NVCC在返回类型中优化std::pair吗？

、、、、

有时，人们想要编写一个(小) CUDA设备端函数，它返回两个值。在C中，您可以让该函数获取两个输出参数，例如：但是在C++中，惯用的方法是返回一个std::pair (嗯，也许是一个std::tuple，或者是一个结构，但是C++元组很笨重，结构又不够通用)：我的问题是:我是否可以信任NVCC (使用--expt-relaxed

浏览 17提问于2020-02-11得票数 1

2回答

MSVC下有调用__libm_sse2_sincos的接口吗？

、、、

我目前正在对MSVC下的一些C代码进行优化，其中执行了一些sin()和cos()计算。我使用的SSE实现如下：但是，当我稍后检查反汇编代码时，我发现Microsoft编译器将cos(w)和sin(w)解释为：...其中分别调用cos和sin。但我希望编

浏览 0提问于2011-09-01得票数 2

回答已采纳

1回答

在没有输入数据或使用3维的情况下执行OpenCL

、、、

我可以也应该执行一个没有输入数据而只有一个id的内核，在这个内核中可以计算数字参数，还是应该为前3个参数发送3维整数数据，然后计算每个工作项中的其余参数。

浏览 1提问于2011-07-16得票数 0

回答已采纳

1回答

如何在kernlab包的ksvm中定制内核函数？

、、、

我有纬度和经度，所以我需要将RBF内核重新定义为exp(-1/2||sophere distrance|^2)，这意味着我需要自己重写内核函数。我写我的内核如下： sigma <- 1 R <- 1 a <- (sin( (x[1]-y[1])/2 ))^2+cos(x[1])*cos(y[1])*(sin((x[2]-y

浏览 6提问于2013-06-12得票数 7

回答已采纳

3回答

错误-11 OpenCL

、

checkerror(clBuildProgram(program, deviceidcount, deviceids.data(), nullptr, nullptr, nullptr)); //const int i = get_global_id(0); //x[i] = cos(smallyaw)*cos(pitch)*x1 + sin

浏览 3提问于2016-08-16得票数 1

回答已采纳

1回答

在CUDA中使用sincos()的最佳方法

、

我到处都找过了，但似乎一致的看法是，它比单独计算sin和cos要好。下面是我的内核中使用sincos的基本内容。然而，当我将它与单独做的sin和cos进行计时时，它出来的速度会更慢。; d_im[idx - lower] = - sinValue; //d_im[idx - l

浏览 0提问于2012-07-20得票数 0

回答已采纳

2回答

用n个变量的乘积替换幂N的变量

、、

\)\^2/\1\*\1/g'cos(2*a)^2+sin(3*b)^2+m1^2*m2^2*cos(4*c) cos(2*a)*cos(2*a)+sin(3*b)*sin(3*b)+m1*m1*m2*m2*cos(4*c) cos(a)^3 +m1^4cos(a)*cos(a)*cos(a)+m1*m1*

浏览 3提问于2015-06-14得票数 1

回答已采纳

1回答

AMD OpenCL内核中的展开循环

、、、、

我试图评估OpenCL与.I之间的性能差异，在内核中有hough的内核，在运行内核时我有两个#语用展开语句，不产生任何加速 for(int theta=0; theta<360;theta++) y0=(int) ro

浏览 3提问于2013-11-05得票数 1

回答已采纳

1回答

在c#中创建gabor纹理

、、

for (int y = 0; y < size; y++) double sin_term= 0.5*(double)Math.Sin(10 * 3.14159 * ((double)x / (double)size));

浏览 2提问于2015-09-29得票数 1

1回答

sklearn.gaussian_process.kernels中的哈维正弦距离

、、、、

有没有一种内置的方法来传递自定义的距离函数，以供可以用于高斯过程模型的内核使用？特别是，我有经度/经度坐标的地理数据，因此使用欧几里得距离不会给出点之间的精确距离。现在，我已经编写了一个新的Kernel子类，其中我将RBF内核源代码中的pdist(metric='sqeuclidean')和cdist(metric='sqeuclidean')调用中的度量参数替换为您可以在实例化内核时设置的参数最终，似乎你应该能够将任意的距离函数传递给所有这些内核，但我还没有弄清楚如何做到

浏览 4提问于2018-04-11得票数 1

4回答

C:更快地访问查找表？

、、、

现在每帧只需执行8次sin / cos调用和19200次查找调用，而不是12000次sin()调用。我使用启用了-O3标志的gcc进行编译。目前，查找表位于顶部，是程序全局范围的一部分。float c2_sin, c2_cos; static float c4_sin, c4_cos; clock_gettimec2_cos

浏览 4提问于2014-01-03得票数 16

3回答

使用本地内存进行速度计算

:)__kernel void sum(__global float* a, __global float* b, __global float* c)} 它很好用。(sin(tmpa[lid])

浏览 14提问于2013-11-27得票数 1

1回答

CuPy -多个函数会导致多个内核吗？

、、、

randomUniformUnitary(N): phi = cp.random.rand(N) * cp.pi y = cp.sin(phi) * cp.sin(theta) output = cp.stack(((他们说的是动态内核创建，但没有解释) 内核

浏览 4提问于2021-03-14得票数 0

回答已采纳

1回答

CUDA内核:当循环数增加10%时，性能下降10倍。

、、、、

我有一个简单的CUDA内核来测试循环展开，然后发现了另一件事:当循环计数为10，内核执行34毫秒，当循环计数为90，则需要59毫秒，但当循环计数为100时，则需要423毫秒！(x) + cos(x); y = sqrt(abs(x)) + sin(x) + cos(x); x = x

浏览 5提问于2020-06-18得票数 2

回答已采纳

1回答

为什么c++ CUFFT结果没有频率和振幅信息？

、、、

5 || cos: 0.5961 || sin: -0.19057 || cos: 0.1607 || sin: -0.18509 || cos: 0.1558 || sin: 0.2642 10 || cos: 0.3750 || sin: 0.36

浏览 2提问于2018-10-19得票数 0

回答已采纳

1回答

如何使用python找到三角表达式的值？

、、、

)+1.2sin(60)sin(80)cos(90)+0.158((−(−sin(60)cos(80)cos(90)+sin(80)cos(60))sin(90)+(sin(60)sin(80)cos(90)+cos(60)cos(80))cos(90))cos(200)+(sin(60)<e

浏览 18提问于2022-01-10得票数 0

1回答

在球面坐标中旋转

、、

R=Rz*Ry Rz = cos (增量)，-sin (增量) ,0 sin (增量)，cos (增量)，0 0，0，1 比如这些东西..。

浏览 17提问于2017-08-03得票数 1

回答已采纳

1回答

程序太慢，需要优化反演算。

考虑以下代码： T01 = [cos(t1) -sin(t1)*cos(alpha1) sin(alpha1)*sin(t1) a1*cos(t1);sin(t1) cos(t1)*cos(alpha1) -cos(alpha1)*sin(t1) a1*sin(t1);0 sin(alpha1) cos(alpha1) d1 ;0 0 0 1];

浏览 2提问于2017-07-26得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

OpenCL中常数数组初始化器中的三角函数

Sin和Cos还是Sin和Sqrt？

我可以相信NVCC在返回类型中优化std::pair吗？

MSVC下有调用__libm_sse2_sincos的接口吗？

在没有输入数据或使用3维的情况下执行OpenCL

如何在kernlab包的ksvm中定制内核函数？

错误-11 OpenCL

在CUDA中使用sincos()的最佳方法

用n个变量的乘积替换幂N的变量

AMD OpenCL内核中的展开循环

在c#中创建gabor纹理

sklearn.gaussian_process.kernels中的哈维正弦距离

C:更快地访问查找表？

使用本地内存进行速度计算

CuPy -多个函数会导致多个内核吗？

CUDA内核:当循环数增加10%时，性能下降10倍。

为什么c++ CUFFT结果没有频率和振幅信息？

如何使用python找到三角表达式的值？

在球面坐标中旋转

程序太慢，需要优化反演算。

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐