首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

为什么cut()把我的POSIXct向量变成一个因子向量,我能做些什么来阻止它呢?

cut()函数是R语言中用于将连续变量划分为离散区间的函数。当使用cut()函数时,如果输入的变量是POSIXct类型的向量(表示日期和时间),则cut()函数会将其转换为因子向量。这是因为cut()函数默认将连续变量划分为等距离的区间,并将结果表示为因子。

如果你不希望cut()函数将POSIXct向量转换为因子向量,可以通过设置参数labels为FALSE来实现。具体来说,你可以使用以下代码来阻止cut()函数将POSIXct向量转换为因子向量:

代码语言:txt
复制
cut(x, breaks, labels = FALSE)

其中,x是输入的POSIXct向量,breaks是划分区间的边界值。

通过设置labels为FALSE,cut()函数将返回一个整数向量,而不是因子向量。这样可以保留POSIXct向量的类型。

需要注意的是,如果你希望将POSIXct向量划分为具有特定标签的离散区间,你可以自定义标签,并将labels参数设置为你自定义的标签向量。

总结起来,为了阻止cut()函数将POSIXct向量转换为因子向量,你可以使用labels = FALSE参数。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

R Tricks: 如何处理Gaps & Islands问题?

提 出问题 话说有个擅长使用SQL小伙伴在StackOverflow上提出了这样一个问题,他说,Gaps & Islands问题在SQL中很容易解决,那么在R中也高效解决吗?...慢着——什么是Gaps & Islands问题?这个小伙伴举了个栗子来说明,让我们看一下。假如我们有如下数据集: ? 这是一个记录时间数据集。...实际上,大猫听说在处理基因数据时候也常遇见这个问题,但是大猫自己没有接触,欢迎有经验小伙伴分享经历哦。 那么,如何处理Gaps & Islands问题?...顾名思义,记录了每个ID中结束时间累计最大值: ▶ dat[, etime.max := as.POSIXct(cummax(as.numeric(etime)), origin = '1970-01...其中,stime[2, .N]表示截取stime向量第2个元素至最后一个元素,etime.max[1, (.N - 1)]表示截取etime.max向量第1个元素至倒数第二个元素。

1.1K20

论程序员怎么拥有咪蒙文笔

虽然很讨厌咪蒙,但不可否认是,咪蒙有很好文笔~ 作为半个程序员,是怎么训练文笔?...为了简化,“辞藻华丽程度”量化为一个段落里“形容词密度”,写一段代码用来统计各段落形容词密度,然后徐志摩几篇散文放进去,让输出辞藻华丽程度Top5段落,结果如下: Top1 《北戴河海滨幻想...什么伟大深沉鼓舞清明优美的思想根源不是可以在风籁中,云彩里,山势与地形起伏里,花草颜色与香息里寻得?......由此想到词向量应用,如果你学过线性代数应该知道向量这个东西,词向量实际就是一个变成一个高维向量变成向量好处之一,是通过计算两个向量相似度,近似于他们在语料里边相似度。...比如你想学金庸描写手法,可以用词向量他对一件事物描写手法全部枚举出来。 试试枚举跟笑相关描述 ?

53240

基于Spark Tensorflow使用CNN处理NLP尝试

主要好处有: CNN自动抽取出一些高级特征,减少了特征工程时间 使用WordEmbedding技术将词汇表达为向量后,可以很方便将文本表示为类似图片2D向量 神经网络表达能力强 缺点的话,就是目前还没想到如何一些非文本类因子给融合进去...就是有时候是希望能够做些特征工程,抽取出一些因子,然后加入到模型里面的。...b 为啥是一个size_out大小一维张量?我们说CNN会阐述共享,就是一次卷积操作,也就是图片扫描一遍,会共用一组参数。 下面一段代码设计到了很多数字,这些数字都是计算出来。...接着再进行一次大小为 3X1池化操作,按相同公式计算,变成了 55X1。 接着再进行一次卷积,一次池化,变成了 51X1。 所以每个通道都是一个51维向量。...这里还有一个问题,有时候我们希望能够最后产生那51个128维向量给提取出来,因为这些向量是CNN对某个内容做完分析后抽取出来特征。

98520

基于Spark Tensorflow使用CNN处理NLP尝试

,就是目前还没想到如何一些非文本类因子给融合进去。...就是有时候是希望能够做些特征工程,抽取出一些因子,然后加入到模型里面的。...b 为啥是一个size_out大小一维张量?我们说CNN会阐述共享,就是一次卷积操作,也就是图片扫描一遍,会共用一组参数。 下面一段代码设计到了很多数字,这些数字都是计算出来。...接着再进行一次大小为 3X1池化操作,按相同公式计算,变成了 55X1。 接着再进行一次卷积,一次池化,变成了 51X1。 所以每个通道都是一个51维向量。...这里还有一个问题,有时候我们希望能够最后产生那51个128维向量给提取出来,因为这些向量是CNN对某个内容做完分析后抽取出来特征。

98260

AI 行业实践精选:深度学习股市掘金

为什么 NLP 与股票预测息息相关 在许多 NLP 问题中,我们最终会得到一个序列并将它编码成一个单个固定大小形式,然后将该形式编码到另一个序列中。...所以我要做第一件事是放在一个更低维空间,比如说300维,因为喜欢这部电影。 ? 当你奋力4000维缩小至300维时,你表情。...我们将采用一个函数,并将其应用到向量每个数字中,使它们都处于0和1之间(也可以是0和无穷大,视情况而定)。为什么?...现在谈论什么 暂且市场向量放到一边,我们先来谈论下语言模型。...它是通过观察指数中每个股票特定期权隐含波动率得出。 旁注——为什么预测波动指数 VIX 使 VIX 成为有趣目标的原因在于: 只是一个数字,而不是1000个股票。

69040

OpenBLAS项目与矩阵乘法优化 | 公开课+文字转录

内容基本上是抠出来了,一步步带着大家过一下,如果我们从最简单矩阵乘法实现,到一个高性能矩阵乘法实现,大概是几步,怎么?或者是为什么优化,每一步获得多少性能收益。...想只要学过《线性代数》之类,这种矩阵乘法,是一个非常简单问题,如果转换成C代码做的话,就是一个三重循环,在这张图里列出了一个【i j k】三重循环,这里面矩阵乘法代码就已经是,实现功能就是矩阵...为什么,我们就做了一下最后性能测试 这张图也是截自教程里,代表了一个性能图,越高越好。这里测试平台是Intel core i5 ,只是测了单线程,没管多线程事情。...随着规模变大,矩阵性能在下降是为什么?因为在实现过程中,没有考虑到cache原因,当矩阵比较小时候,速度还能快一些,当矩阵大了时候,一定会跌下去,所以图里就有一个下滑过程。...变成这样实现之后,对整体性能其实没什么帮助,那为什么换成这种形式来写,是为了之后优化,留下一定空间。 ?

4.2K71

周博磊:深度生成模型中隐藏语义

生成模型本身其实是一个卷积网络,每一层有很多卷积神经元,通过逐渐特征图放大,最后变成一张图片。这里就带来一个问题:为什么网络可以一个完全噪声向量变成一张图片?...这样我们就可以预测出来标签当做隐空间向量真实标签,我们进一步再回到隐空间,预测标签当成真实标签,然后训练一个分类器,对隐空间向量进行分类。...另外这位女性觉得拍照角度不令人满意,我们可以侧脸照变成正脸照,如果对自己性别也不是很满意,我们照样实现这个需求。每一个边界其实都是一个线性二分类器。...但是我们实际需要是编辑“自己”图片,例如下图个人真实照片。但这就会面临一个问题:GAN逆映射(GAN Inversion) 为什么有这个问题?...为什么人脸生成器可以一个非人脸图片“完美”重建出来?我们进一步进行了测试,发现重建过程完全是在“过拟合”。

1.5K10

2022年3月_生信入门班_微信群答疑笔记

这里为什么不能加逗号? 一句完整R语言代码最后不需要加逗号,这是一个规定好基本语法,没有为什么。...你自己翻译一下英文说了个啥意思,然后就是教你判断,一个R包是否安装成功标准是啥,你用那个标准验证一下他是不是成功了。好吧,做完给我个反馈。...老师,想问一下,像这样用tr文件里字符替换之后再用>重定向给源文件,为什么源文件就空了重定向给一个文件名就没问题 这是一个无解问题,就是不能把同一个文件给重定向了,没有为什么。...老师,这个图已经出结果了,不过为什么lable出来总是setosa和virginicaP值?...上课练习服务器,一般有效期是两个月,实际上我们很久才清理一次账号,但是建议大家不要在练习服务器上保存重要数据 老师,也报了两个班,怎么进另一个 小助手有拉大家进群了 老师请问为啥这道题参数设置成有多个元素数值型向量就报错了

1.6K40

OpenGL矩阵变换数学推导

还没有,大家可以想像一下,一个东西放在世界坐标系某个地方,可以从近处看观察,也可以从远处观察,还可以从上下左右观察,甚至还可以倒着观察,因些还需要确定我们观察状态。...、以及Camera上方向向量得到对应View Matrix,首先给Camera定一个坐标系: NUV这三个向量是怎么?...我们用一个括号其中一个部分括了起来,外面乘了一个因子(-1/z0),后面会说这个因子什么东西,现在只需要知道,x2、y2实际上就是前面括号里那堆东西,所以上面投影矩阵第一行和第二行就自然轻松地构造出来...第三行有4个值,现在都不知道是什么,我们需要构造4个未知数吗?对于解方程来说,在能解决问题情况下,未知数少就尽量少,不然只会徒增烦恼。 这里其实不需要4个未知数,为什么?...那就要理解z2这个值是什么东西,它就是投影之后未归一化深度值,而深度和x0、y0没有关系,这个如何理解?就是说一个东西放在左,上边,还是右边,不影响深度,要改变深度需要前后移动。

1K30

全球股市巨震,如何用深度学习预测股价?

为什么 NLP 与股票预测息息相关 在许多 NLP 问题中,我们最终会得到一个序列并将它编码成一个单个固定大小形式,然后将该形式编码到另一个序列中。...所以我要做第一件事是放在一个更低维空间,比如说300维,因为喜欢这部电影。 当你奋力4000维缩小至300维时,你表情。...我们将采用一个函数,并将其应用到向量每个数字中,使它们都处于0和1之间(也可以是0和无穷大,视情况而定)。为什么?...▌现在谈论什么 暂且市场向量放到一边,我们先来谈论下语言模型。...它是通过观察指数中每个股票特定期权隐含波动率得出。 旁注——为什么预测波动指数 VIX 使 VIX 成为有趣目标的原因在于: 只是一个数字,而不是1000个股票。

80650

OpenGL矩阵变换数学推导

还没有,大家可以想像一下,一个东西放在世界坐标系某个地方,可以从近处看观察,也可以从远处观察,还可以从上下左右观察,甚至还可以倒着观察,因些还需要确定我们观察状态。...Camera位置、朝向点坐标、以及Camera上方向向量得到对应View Matrix,首先给Camera定一个坐标系:  [ot0j4l80eg.jpeg] NUV这三个向量是怎么?...我们用一个括号其中一个部分括了起来,外面乘了一个因子(-1/z0),后面会说这个因子什么东西,现在只需要知道,x2、y2实际上就是前面括号里那堆东西,所以上面投影矩阵第一行和第二行就自然轻松地构造出来...第三行有4个值,现在都不知道是什么,我们需要构造4个未知数吗?对于解方程来说,在能解决问题情况下,未知数少就尽量少,不然只会徒增烦恼。 这里其实不需要4个未知数,为什么?...那就要理解z2这个值是什么东西,它就是投影之后未归一化深度值,而深度和x0、y0没有关系,这个如何理解?就是说一个东西放在左,上边,还是右边,不影响深度,要改变深度需要前后移动。

6.3K62

支持向量机(SVM)入门详解(续)与python实现

还注意到式子中只有xi和x是向量,因此一部分可以从内积符号中拿出来,得到g(x)式子为: 发现了什么?w不见啦!从求w变成了求α。 但肯定有人会说,这并没有原问题简化呀。...例子是下面这张图: 我们横轴上端点a和b之间红色部分里所有点定为正类,两边黑色部分里点定为负类。试问找到一个线性函数两类正确分开么?...回想一下我们二维空间里函数定义 g(x)=ax+b 变量x是一维为什么说它是二维空间里函数?...以我们人类常识判断,说有一万个点都符合某种规律(因而线性可分),有一个点不符合,那这一个点是否就代表了分类规则中我们没有考虑到方面(因而规则应该为而做出修改)?...啰嗦了这么多,读者一定可以马上自己总结出来,松弛变量也就是个解决线性不可分问题方法罢了,但是回想一下,核函数引入不也是为了解决线性不可分问题么?为什么要为了一个问题使用两种方法

1.6K90

斯坦福CS224W 图与机器学习5】Spectral Clustering

对于一个划分,一个很自然想法,直觉上就是最大化组内连接数,最小化组间连接数 [gj2h67qvq1.jpeg] 因此,利用“edge cut定义划分: [76avalbqhu.svg] ,...但是如果我们想最小化cut一个问题,如下图所示,当有一个节点度数为1时,切割这一条边可最小化cut,即cut=1,但是很显然这并不是最优化划分结果,直觉上看,最优化划分应该为蓝色线所示。...关于细节实现以及原理,有这样几个问题: Q1:拉普拉斯矩阵有怎样性质? Q2:为什么是第二小特征值对应特征向量?(为什么不是最小?) Q3:为什么用特征向量聚类实现划分?...这样划分为什么是合理?...为什么不是利用 [fv87ukp6ia.svg] ,因为 [fv87ukp6ia.svg] 恒为0,此时图一定是不连通,最小化没有意义,所以要给一个限制条件后利用第二小特征值。

97930

R语言基础教程——第3章:数据结构——因子

因子在R中非常重要,因为决定了数据分析方式以及如何进行视觉呈现。...因子(factor)是R语言中比较特殊一个数据类型, 它是一个用于存储类别的类型,举个例子,从性别上,可以人分为:男人和女人,从年龄上划分,又可以人分为:未成年人(=18)。...R表示分类数据称为因子因子行为有时像字符串,有时像整数。因子一个向量,通常情况下,每个元素都是字符类型,也有其他数据类型元素。...)函数可以因子转换成对应整数. > as.integer(sex) [1] 1 2 1 1 2 7 连续变量分割为类别 函数cut()能够数值变量切成不同块,然后返回一个因子. cut(x,...breaks, labels = NULL) 参数注释: x:数值变量 breaks:切割点向量 labels:每一个分组标签 例如,身高数据,按照指定切割点向量分割: cut(heights$height_cm

3.9K30

学习SVM(五)理解线性SVM松弛因子

Support Vector) 学习SVM(五)理解线性SVM松弛因子 先说一个事引出这个博客内容,最近投一篇论文被拒稿,用到方法使SVM(很惭愧,还在用20年前算法,当然这并不是重点)...,审稿意见里面有一段话是这样说(说很中肯):“该方法本身特点来看就很难达到100%正确率”,当然这并不是说SVM无法做到100%,理解很难达到原因就是在于SVM算法本身松弛因子引入。...为什么要引入松弛因子 从前面四个内容来看,SVM理论可以完美的找到正负样本间最大分类间隔,这意味着不仅仅可以实现对训练数据分类,还保证了决策平面是最理想。那么SVM为什么还要引入松弛因子?...Screenshot (44).png 可以拿一个很直观例子说明惩罚因子C影响,C越大意味着对训练数据而言得到很好分类结果,但是同时最大分类间隔就会变小,毕竟我们做模型不是为了在训练数据上有个多么优异结果...2.拉格朗日乘子法为新约束条件引入参数。 需要注意是,参数C是一个已知量,是人为设定! 拉格朗日函数: ? 其中,a和u是拉格朗日乘子,对偶后就变成了: ?

1.5K50

12. 泊松图像编辑

(这里苍老师权重设置为0.2,鄙人权重设为0.8) ? 那么用多频带融合?得到结果也无法达到要求,甚至更是难看: ?...泊松融合原理 讲了这么多泊松图像编辑好处,那么到底原理是怎样为什么叫做泊松图像编辑?我们先来看看最基本泊松融合。 2.1 基本泊松融合 我们先对这个问题做一些基本符号定义。...这里:∇f 指的是图像函数f梯度 ? v在原论文中是指一个引导向量场(guidance field),当用于图像合成时,就是源图像梯度。...这里讲讲CMU课程中提到一种方法,关键是将上述泊松方程表示为线性向量形式Af=b ? 等号右边是图像g中每一个像素拉普拉斯滤波结果∆gp,这很容易理解。...A写成下面的形式你可能更容易理解(别忘了矩阵和向量乘法基本过程,可以稍稍复习下大一基本知识?) ? 对于每一个元素fp,拉普拉斯算子作用结果是4fp 减去p所有4邻域像素值和。

1K30

「Deep Learning」读书系列分享第二章:线性代数 | 分享总结

像这个 x 是一个单位向量特点是长度是 1 个单位。 关于向量,有这两种理解: 当做线性空间里面一个当做带有方向一个线段 这两种都可以。...这个 (x y z) 这是一个向量一个矩阵对进行变换之后变成了 (ax by cz),对应就是原来 X、Y、Z 三个方向分别作 a、b、c 放大。 ? 在图上面怎么理解?...如果里面有这样情况,这就是矩阵不可逆情况,行列式是 0。0 的话会有什么变化?原来这是一个坐标系,到这里变成一条线了,这就是做了一个降维操作,两维变成一位了。那一位返回去吗?...形象理解就是站在上面,然后箱子往这边推,底部是不动,那么就有一个推移动作。为什么会这样?大家可以拿这个矩阵,随机取一个点去感受一下。 第一行始终作用在 X 轴方向上,跟原来相比加了一项。...接下来讲矩阵特征值和特征向量。先有直观概念,特征向量反映是经过这次变换之后变化方向;特征值反映是变换幅度。为什么会这样?往下看。 ?

1.1K50

SVM-支持向量机算法概述

还注意到式子中只有xi和x是向量,因此一部分可以从内积符号中拿出来,得到g(x)式子为: ? 发现了什么?w不见啦!从求w变成了求α。 但肯定有人会说,这并没有原问题简化呀。...小Tips:为什么说f(y)=ay是四维空间里函数? 大家可能一时没看明白。回想一下我们二维空间里函数定义 g(x)=ax+b 变量x是一维为什么说它是二维空间里函数?...以我们人类常识判断,说有一万个点都符合某种规律(因而线性可分),有一个点不符合,那这一个点是否就代表了分类规则中我们没有考虑到方面(因而规则应该为而做出修改)?...损失加入到目标函数里时候,就需要一个惩罚因子(cost,也就是libSVM诸多参数中C),原来优化问题就变成了下面这样: ?...啰嗦了这么多,读者一定可以马上自己总结出来,松弛变量也就是个解决线性不可分问题方法罢了,但是回想一下,核函数引入不也是为了解决线性不可分问题么?为什么要为了一个问题使用两种方法

52410

【转载】理解矩阵(三)

说,还不如反复强调这一个事情,深深刻在脑子里,别的东西忘了就忘了,真碰到问题了,再查数学手册嘛,何必因小失大? 言归正传。...换句话说,你不是有一个坐标系M吗,现在乘以个\(M^{-1}\),变成\(I\),这样一的话,原来M坐标系中a在\(I\)中一量,就得到b了。...而让原形毕露办法,就是原来那个坐标系: 2 0 0 3 x方向度量缩小为原来1/2,而y方向度量缩小为原来1/3,这样一坐标系就变成单位坐标系I了。...在这里,实际上已经回答了一般人在学习线性代数是最困惑一个问题,那就是为什么矩阵乘法要规定成这样。...至于矩阵乘以向量为什么要那样规定,那是因为一个在M中度量为a向量,如果想要恢复在I中真像,就必须分别与M中一个向量进行內积运算。这个结论推导留给感兴趣朋友吧。

42321

如何用Python和机器学习训练中文文本情感分类模型?

这就叫向量化。 这个例子里面,特征数量叫做维度。于是向量化之后这两句话,都有5个维度。 你一定要记住,此时机器依然不能理解两句话具体含义。但是已经尽量在用一种有意义方式表达它们。...例如: “喜欢这个游戏” 变成: “ 喜欢 这个 游戏” 这样一,就可以仿照英文句子向量化,做中文向量化了。 你可能担心计算机处理起中文词语,跟处理英文词语有所不同。...举一反三,你会发现分词后中文语句: “ 喜欢 这个 游戏” 其中“这个”应该也是停用词吧? 答对了! 要处理停用词,怎么办?当然你可以一个个手工寻找,但是那显然效率太低。...为了做特征向量化,下面我们利用结巴分词工具拆分句子为词语。 import jieba 我们建立一个辅助函数,结巴分词结果用空格连接。...看,我们刚才做工作,都在管道里面了。我们可以管道当成一个整体模型调用。 下面一行语句,就可以未经特征向量训练集内容输入,做交叉验证,算出模型分类准确率均值。

1.7K30
领券