腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
OpenCL中常数数组初始化器中的三角函数
、
我的OpenCL
内核
将经常使用它们,因此我想在常量内存中定义它们。( N_RADIAN),
sin
( N_RADIAN)), // N(float2)(
cos
(E_RADIAN),
sin
( E_RADIAN)), // E (float2)(
cos
(SE_RADIAN),
sin
(S
浏览 3
提问于2013-09-29
得票数 0
回答已采纳
3
回答
Sin
和
Cos
还是
Sin
和Sqrt?
、
、
、
、
第一个问题:英特尔数学
内核
库为标准数学函数计算提供了非常好的函数,因此存在一个函数vdSinCos()来以一种非常优化的方式解决这个问题,但是英特尔编译器不是免费的。在
linux
发行版中有没有开放源代码库(C,C++,Fortran)可以提供这些函数,我可以简单地链接到它们,并拥有最优的实现? 注意:我不想讨论指令调用,因为并不是所
浏览 0
提问于2013-09-14
得票数 5
1
回答
我可以相信NVCC在返回类型中优化std::pair吗?
、
、
、
、
有时,人们想要编写一个(小) CUDA设备端函数,它返回两个值。在C中,您可以让该函数获取两个输出参数,例如:但是在C++中,惯用的方法是返回一个std::pair (嗯,也许是一个std::tuple,或者是一个结构,但是C++元组很笨重,结构又不够通用):我的问题是:我是否可以信任NVCC (使用--expt-relaxed
浏览 17
提问于2020-02-11
得票数 1
2
回答
MSVC下有调用__libm_sse2_sincos的接口吗?
、
、
、
我目前正在对MSVC下的一些C代码进行优化,其中执行了一些
sin
()和
cos
()计算。我使用的SSE实现如下:但是,当我稍后检查反汇编代码时,我发现Microsoft编译器将
cos
(w)和
sin
(w)解释为:...其中分别调用
cos
和
sin
。但我希望编
浏览 0
提问于2011-09-01
得票数 2
回答已采纳
1
回答
在没有输入数据或使用3维的情况下执行OpenCL
、
、
、
我可以也应该执行一个没有输入数据而只有一个id的
内核
,在这个
内核
中可以计算数字参数,还是应该为前3个参数发送3维整数数据,然后计算每个工作项中的其余参数。
浏览 1
提问于2011-07-16
得票数 0
回答已采纳
1
回答
如何在kernlab包的ksvm中定制
内核
函数?
、
、
、
我有纬度和经度,所以我需要将RBF
内核
重新定义为exp(-1/2||sophere distrance|^2),这意味着我需要自己重写
内核
函数。我写我的
内核
如下: sigma <- 1 R <- 1 a <- (
sin
( (x[1]-y[1])/2 ))^2+
cos
(x[1])*
cos
(y[1])*(
sin
((x[2]-y
浏览 6
提问于2013-06-12
得票数 7
回答已采纳
3
回答
错误-11 OpenCL
、
checkerror(clBuildProgram(program, deviceidcount, deviceids.data(), nullptr, nullptr, nullptr)); //const int i = get_global_id(0); //x[i] =
cos
(smallyaw)*
cos
(pitch)*x1 +
sin
浏览 3
提问于2016-08-16
得票数 1
回答已采纳
1
回答
在CUDA中使用sincos()的最佳方法
、
我到处都找过了,但似乎一致的看法是,它比单独计算
sin
和
cos
要好。下面是我的
内核
中使用sincos的基本内容。然而,当我将它与单独做的
sin
和
cos
进行计时时,它出来的速度会更慢。; d_im[idx - lower] = - sinValue; //d_im[idx - l
浏览 0
提问于2012-07-20
得票数 0
回答已采纳
2
回答
用n个变量的乘积替换幂N的变量
、
、
\)\^2/\1\*\1/g'
cos
(2*a)^2+
sin
(3*b)^2+m1^2*m2^2*
cos
(4*c)
cos
(2*a)*
cos
(2*a)+
sin
(3*b)*
sin
(3*b)+m1*m1*m2*m2*
cos
(4*c)
cos
(a)^3 +m1^4
cos
(a)*
cos
(a)*
cos
(a)+m1*m1*
浏览 3
提问于2015-06-14
得票数 1
回答已采纳
1
回答
AMD OpenCL
内核
中的展开循环
、
、
、
、
我试图评估OpenCL与.I之间的性能差异,在
内核
中有hough的
内核
,在运行
内核
时我有两个#语用展开语句,不产生任何加速 for(int theta=0; theta<360;theta++) y0=(int) ro
浏览 3
提问于2013-11-05
得票数 1
回答已采纳
1
回答
在c#中创建gabor纹理
、
、
for (int y = 0; y < size; y++) double
sin
_term= 0.5*(double)Math.
Sin
(10 * 3.14159 * ((double)x / (double)size));
浏览 2
提问于2015-09-29
得票数 1
1
回答
sklearn.gaussian_process.kernels中的哈维正弦距离
、
、
、
、
有没有一种内置的方法来传递自定义的距离函数,以供可以用于高斯过程模型的
内核
使用?特别是,我有经度/经度坐标的地理数据,因此使用欧几里得距离不会给出点之间的精确距离。现在,我已经编写了一个新的Kernel子类,其中我将RBF
内核
源代码中的pdist(metric='sqeuclidean')和cdist(metric='sqeuclidean')调用中的度量参数替换为您可以在实例化
内核
时设置的参数最终,似乎你应该能够将任意的距离函数传递给所有这些
内核
,但我还没有弄清楚如何做到
浏览 4
提问于2018-04-11
得票数 1
4
回答
C:更快地访问查找表?
、
、
、
现在每帧只需执行8次
sin
/
cos
调用和19200次查找调用,而不是12000次
sin
()调用。我使用启用了-O3标志的gcc进行编译。目前,查找表位于顶部,是程序全局范围的一部分。float c2_
sin
, c2_
cos
; static float c4_
sin
, c4_
cos
; clock_gettimec2_
cos
浏览 4
提问于2014-01-03
得票数 16
3
回答
使用本地内存进行速度计算
:)__kernel void sum(__global float* a, __global float* b, __global float* c)} 它很好用。(
sin
(tmpa[lid])
浏览 14
提问于2013-11-27
得票数 1
1
回答
CuPy -多个函数会导致多个
内核
吗?
、
、
、
randomUniformUnitary(N): phi = cp.random.rand(N) * cp.pi y = cp.
sin
(phi) * cp.
sin
(theta) output = cp.stack(((他们说的是动态
内核
创建,但没有解释)
内核
浏览 4
提问于2021-03-14
得票数 0
回答已采纳
1
回答
CUDA
内核
:当循环数增加10%时,性能下降10倍。
、
、
、
、
我有一个简单的CUDA
内核
来测试循环展开,然后发现了另一件事:当循环计数为10,
内核
执行34毫秒,当循环计数为90,则需要59毫秒,但当循环计数为100时,则需要423毫秒!(x) +
cos
(x); y = sqrt(abs(x)) +
sin
(x) +
cos
(x); x = x
浏览 5
提问于2020-06-18
得票数 2
回答已采纳
1
回答
为什么c++ CUFFT结果没有频率和振幅信息?
、
、
、
5 ||
cos
: 0.5961 ||
sin
: -0.19057 ||
cos
: 0.1607 ||
sin
: -0.18509 ||
cos
: 0.1558 ||
sin
: 0.2642 10 ||
cos
: 0.3750 ||
sin
: 0.36
浏览 2
提问于2018-10-19
得票数 0
回答已采纳
1
回答
如何使用python找到三角表达式的值?
、
、
、
)+1.2
sin
(60)
sin
(80)
cos
(90)+0.158((−(−
sin
(60)
cos
(80)
cos
(90)+
sin
(80)
cos
(60))
sin
(90)+(
sin
(60)
sin
(80)
cos
(90)+
cos
(60)
cos
(80))
cos
(90))
cos
(200)+(
sin
(60)<e
浏览 18
提问于2022-01-10
得票数 0
1
回答
在球面坐标中旋转
、
、
R=Rz*Ry Rz =
cos
(增量),-
sin
(增量) ,0
sin
(增量),
cos
(增量),0 0,0,1 比如这些东西..。
浏览 17
提问于2017-08-03
得票数 1
回答已采纳
1
回答
程序太慢,需要优化反演算。
考虑以下代码: T01 = [
cos
(t1) -
sin
(t1)*
cos
(alpha1)
sin
(alpha1)*
sin
(t1) a1*
cos
(t1);
sin
(t1)
cos
(t1)*
cos
(alpha1) -
cos
(alpha1)*
sin
(t1) a1*
sin
(t1);0
sin
(alpha1)
cos
(alpha1) d1 ;0 0 0 1];
浏览 2
提问于2017-07-26
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Linux内核解读
Linux内核出现漏洞
Linux 内核原子操作
Windows 内核和 Linux 内核的区别(二)
Windows 内核和 Linux 内核的区别(一)
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券