为什么‘as’方法会删除向量名,有什么方法可以绕过它呢?

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (2)
  • 关注 (0)
  • 查看 (14)

我以为这很简单:

dates <- as.Date(c(ind = "2015-07-04", nyd = "2016-01-01"))

as.Date剥去了这些名字:

dates
# [1] "2015-07-04" "2016-01-01"

不是说Date向量不能命名:

setNames(dates, c("ind", "nyd"))
#          ind          nyd 
# "2015-07-04" "2016-01-01" 

不幸的是,没有办法声明Date向量,特别是不知道日期的基本整数值。

探索这一点,似乎这是as*函数类:

as.integer(c(a = "123", b = "436"))
# [1] 123 436

as(c(a = 1, b = 2), "character")
# [1] "1" "2"

有什么原因吗?

提问于
用户回答回答于

首先,你的例子:

> as.Date(c(ind = "2015-07-04", nyd = "2016-01-01"))
[1] "2015-07-04" "2016-01-01"

在这里我们使用方法as.Date.character:

> as.Date.character
function (x, format = "", ...) 
{
    charToDate <- function(x) {
        xx <- x[1L]
        if (is.na(xx)) {
            j <- 1L
            while (is.na(xx) && (j <- j + 1L) <= length(x)) xx <- x[j]
            if (is.na(xx)) 
                f <- "%Y-%m-%d"
        }
        if (is.na(xx) || !is.na(strptime(xx, f <- "%Y-%m-%d", 
            tz = "GMT")) || !is.na(strptime(xx, f <- "%Y/%m/%d", 
            tz = "GMT"))) 
            return(strptime(x, f))
        stop("character string is not in a standard unambiguous format")
    }
    res <- if (missing(format)) 
        charToDate(x)
    else strptime(x, format, tz = "GMT")
    as.Date(res)
}
<bytecode: 0x19d3dff8>
<environment: namespace:base>

无论格式是否给定,向量都会传递给strptime将其转换为类POSIXlt,然后将其传递给as.Date但是这次用方法as.Date.POSIXlt即:

> as.Date.POSIXlt
function (x, ...) 
.Internal(POSIXlt2Date(x))
<bytecode: 0x19d2df50>
<environment: namespace:base>

这意味着最终用于转换为类日期的函数是POSIXlt2Date(快速查看档案names.c显示函数是do_POSIXlt2D从档案datetime.c).供参考:

SEXP attribute_hidden do_POSIXlt2D(SEXP call, SEXP op, SEXP args, SEXP env)
{
    SEXP x, ans, klass;
    R_xlen_t n = 0, nlen[9];
    stm tm;

    checkArity(op, args);
    PROTECT(x = duplicate(CAR(args)));
    if(!isVectorList(x) || LENGTH(x) < 9)
    error(_("invalid '%s' argument"), "x");

    for(int i = 3; i < 6; i++)
    if((nlen[i] = XLENGTH(VECTOR_ELT(x, i))) > n) n = nlen[i];
    if((nlen[8] = XLENGTH(VECTOR_ELT(x, 8))) > n) n = nlen[8];
    if(n > 0) {
    for(int i = 3; i < 6; i++)
        if(nlen[i] == 0)
        error(_("zero-length component in non-empty \"POSIXlt\" structure"));
    if(nlen[8] == 0)
        error(_("zero-length component in non-empty \"POSIXlt\" structure"));
    }
    /* coerce relevant fields to integer */
    for(int i = 3; i < 6; i++)
    SET_VECTOR_ELT(x, i, coerceVector(VECTOR_ELT(x, i), INTSXP));

    PROTECT(ans = allocVector(REALSXP, n));
    for(R_xlen_t i = 0; i < n; i++) {
    tm.tm_sec = tm.tm_min = tm.tm_hour = 0;
    tm.tm_mday  = INTEGER(VECTOR_ELT(x, 3))[i%nlen[3]];
    tm.tm_mon   = INTEGER(VECTOR_ELT(x, 4))[i%nlen[4]];
    tm.tm_year  = INTEGER(VECTOR_ELT(x, 5))[i%nlen[5]];
    /* mktime ignores tm.tm_wday and tm.tm_yday */
    tm.tm_isdst = 0;
    if(tm.tm_mday == NA_INTEGER || tm.tm_mon == NA_INTEGER ||
       tm.tm_year == NA_INTEGER || validate_tm(&tm) < 0)
        REAL(ans)[i] = NA_REAL;
    else {
        /* -1 must be error as seconds were zeroed */
        double tmp = mktime00(&tm);
        REAL(ans)[i] = (tmp == -1) ? NA_REAL : tmp/86400;
    }
    }

    PROTECT(klass = mkString("Date"));
    classgets(ans, klass);
    UNPROTECT(3);
    return ans;
}

不幸的是,我对C的理解太有限了,不知道为什么这里会丢失属性。我猜这是发生在coerceVector操作,或者当POSIXlt列表中的每个元素被单独强制为整数时(如果是这样的话,则为第1268-70行)。

但是让我们看看另一个as.Date方法,as.Date.POSIXct:

> as.Date.POSIXct
function (x, tz = "UTC", ...) 
{
    if (tz == "UTC") {
        z <- floor(unclass(x)/86400)
        attr(z, "tzone") <- NULL
        structure(z, class = "Date")
    }
    else as.Date(as.POSIXlt(x, tz = tz))
}
<bytecode: 0x19c268bc>
<environment: namespace:base>

如果没有给出时区,或者时区是“UTC”,则函数只操作POSIXct列表,以提取可解析为Date对象的数据,从而不会丢失属性,但是如果给出任何其他时区,则将其转换为POSIXlt对象,因此进一步传递到相同的POSIXlt2Date内部它最终失去了它的属性!事实上:

> as.Date(c(a = as.POSIXct("2016-01-01")), tz="UTC")
           a 
"2015-12-31" 

> as.Date(c(a = as.POSIXct("2016-01-01")), tz="CET")
[1] "2016-01-01"

最后,,as.Date.numeric是否保留属性:

> as.Date.numeric
function (x, origin, ...) 
{
    if (missing(origin)) 
        stop("'origin' must be supplied")
    as.Date(origin, ...) + x
}
<bytecode: 0x568943d4>
<environment: namespace:base>

origin转换为日期as.Date.character然后添加数字向量,从而保留属性,因为:

> c(a=1) + 2
a 
3 

所以很自然:

> c(a=16814) + as.Date("1970-01-01")
           a 
"2016-01-14"

我认为,在解决这个差异之前,您必须保留属性的唯一解决方案是首先转换为POSIXct(但要小心时区问题)或数字,或者复制原始向量的属性:

> before <- c(ind = "2015-07-04", nyd = "2016-01-01")
> after <- as.Date(before)
> names(after) <- names(before)
> after
         ind          nyd 
"2015-07-04" "2016-01-01" 

热门问答

快照容量与费用的比例?如何关闭停用?

帅的惊动我国计算机大神
推荐已采纳
快照已于2019年1月22日0时启动正式商业化进程,商业化后所有存量快照和新产生的快照将根据快照使用的存储容量进行收费。 在快照商业化后,腾讯云仍旧会在国内主要地域为用户提供一定量的免费额度。免费额度策略如下: 免费额度覆盖范围为中国大陆地域,中国香港及海外地域暂无免费快照额...... 展开详请

对象存储数据三副本问题,谢谢 ?

波斯狗儿对象存储产品经理
推荐已采纳

1 COS 不完全使用副本的方式保存,数据调度能力属于我们的产品核心竞争力,具体实现方式一般不披露。

2 副本对用户是不感知的,COS 是一个最终一致性的存储,如果发起删除导致数据丢失,所有的数据都会被删除。

cvm用户退租以后,什么时间数据会被抹掉?

推荐已采纳

包年包月到期不交钱,7天后抹掉。

购买短时长的的,退租立刻抹掉。

准备开通企业档案云存储,分级授权低级”在线查阅权“,中”上传、编辑名称、移动“、高级”全部操作“?

许金泉

腾讯 · 高级工程师 (已认证)

腾讯云COS前端开发
推荐
可以通过存储桶权限配置里的 Policy权限设置。 查阅是 name/cos:GetObject 和 name/cos:HeadObject 修改如果是调用简单上传是 name/cos:PutObject 全部操作是 name/cos:*... 展开详请

语音识别中‘InvalidParameterValue.ErrorInvalidVoicedata?

腾讯云智能语音服务员

腾讯 · 社区FAQ (已认证)

推荐

这边如果无法确定音频数据的准确性,建议使用SourceType(语音数据来源)为0,即语音URL的方式进行音频数据的传输。可将音频数据放在腾讯云对象存储的服务上,然后在Url参数上填写公网可下载的音频,发送请求进行识别。

通过APP上传的图片到对象存储,缩略图的处理最佳建议是什么?

许金泉

腾讯 · 高级工程师 (已认证)

腾讯云COS前端开发
推荐

所属标签

扫码关注云+社区