首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R in action 读书笔记(1)--第五章:高级数据管理

5.2.1数学函数函数描述abs(x)绝对值sqrt(x)平方根ceiling(x)不小于x的最小整数floor(x)不大于x的最大整数trunc(x)向0的方向截取的X中的整数部分round(x,digits...取以n为底的对数log(x)自然对数log10(x)常用对数exp(x)指数函数5.2.2统计函数mean(x)平均数median(x)中位数sd(x)标准差var(x)方差mad(x)绝对中位差quantile...scale=TRUE)为数据对象x按列进行中心化或标准化5.2.3概率函数Beta分布beta二项分布binom柯西分布cauchy(非中心)卡方分布chisq指数分布expF分布fGamma时于布gamma...分布t均匀分布unifWeibull分布weibullWilcoxon秩和分布wilcox5.2.4字符处理函数nchar(x)计算x中的字符数量substr(x, start, stop)提取或替换一个字符向量中的子串...(x)对象x的长度seq(from, to, by)生成一个序列rep(x, n)将x重复n次cut(x, n)将连续型变量对于割为有着n个水平的因子pretty(x, n)创建美观的分割点。

37520

「R」数值与字符处理函数

数学函数 函数 描述 abs(x) 绝对值 sqrt(x) 平方根 ceiling(x) 不小于x的最小整数 floor(x) 不大于x的最大整数 trunc(x) 向0的方向截取的x中的整数部分 round...求最大值 scale(x, center = TRUE, scale = TRUE) 为数据对象x按列进行中心化或标准化 注意:默认情况下,函数scale()对矩阵或数据框的指定列进行均值为0、标准差为...概率函数 在R中,概率函数形如:[dpqr] distribution_abbreviation() 其中第一个字母表示其所指分布的某一方面 d = 密度函数 p = 分布函数 q = 分位数函数 r...负二项分布 nbinom (非中心)卡方分布 chisq 正态分布 norm 指数分布 exp 泊松分布 pois F分布 f Wilcoxon符号秩分布 signrank Gamma分布 gamma...绘图中常用 cat(…, file="myfile", append=FALSE) 连接…中的对象,并其输出到屏幕或文件中

1K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    MATLAB随机数生成器

    4、normrnd() 生成指定均值为、标准差的正态分布的随机数 基本语法:normrnd(mu,sigma,[M,N,P,…]) 5、chi2rnd() 生成服从卡方分布的随机数,卡方分布只有一个参数...基本语法:wblrnd(A,B,[M,N,P,…]) 还有非中心卡方分布(ncx2rnd)、非中心F分布(ncfrnd)、非中心t分布(nctrnd) 14、unidrnd() 生成服从离散均匀分布的随机数...unifrnd是在某个区间内均匀选取实数(可为小数或整数),unidrnd是均匀选取整数随机数。离散均匀分布随机数有1个参数:n,表示从{1,2,3,。。。,n}这n个整数中以相同的概率抽样。...超几何分布的随机数生成器 lognrnd 对数正态分布的随机数生成器 nbinrnd 负二项分布的随机数生成器 ncfrnd 非中心f分布的随机数生成器 nctrnd 非中心t分布的随机数生成器...ncx2rnd 非中心卡方分布的随机数生成器 normrnd 正态(高斯)分布的随机数生成器 poissrnd 泊松分布的随机数生成器 raylrnd 瑞利分布的随机数生成器 trnd 学生氏

    1.8K20

    python数据分析(1)-numpy产生随机数

    简单随机数: 产生简单的随机数据,可以是任何维度 2. 排列:将所给对象随机排列 3. 分布:产生指定分布的数据,如高斯分布等 4....binomial(n, p[, size]) 二项分布的样本。 chisquare(df[, size]) 卡方分布样本。 dirichlet(alpha[, size]) 狄利克雷分布样本。...negative_binomial(n, p[, size]) 负二项分布 noncentral_chisquare(df, nonc[, size]) 非中心卡方分布 noncentral_f(dfnum..., dfden, nonc[, size]) 非中心F分布 normal([loc, scale, size]) 正态(高斯)分布 pareto(a[, size]) 帕累托(Lomax)分布 poisson...排列 函数名称 函数功能 参数说明 shuffle(x) 打乱对象x(多维矩阵按照第一维打乱) 矩阵或者列表 permutation(x) 打乱并返回该对象(多维矩阵按照第一维打乱) 整数或者矩阵 代码示例

    3.3K80

    【工具】SAS 常用函数汇总

    PROBNORM(x) 标准正态分布函数 PROBT(x,df) 自由度为df的t分布函数。可选参数nc为非中心参数。 PROBCHI(x,df) 自由度为df的卡方分布函数。...可选参数nc为非中心参数。 PROBF(x,ndf,ddf) F(ndf,ddf)分布的分布函数。可选参数nc为非中心参数。...TINV(p, df ) 自由度为df的t分布的左侧p分位数。可选参数nc为非中心参数。 CINV(p,df) 自由度为df的卡方分布的左侧p分位数。...可选参数nc为非中心参数。 FINV(p,ndf,ddf) F(ndf,ddf)分布的左侧p分位数。可选参数nc为非中心参数。...RANUNI(seed),seed为小于2**31-1的任意常数。在同一个数据步中对同一个随机数函数的多次调用将得到不同的结果,但不同数据步中从同一种子出发将得到相同的随机数序列。

    1.8K30

    Numpy归纳整理

    . like 创建 新数组,只分配内存空间但不填充任何值 eye、identity 创建一个正方的NXN单位矩阵(对角线为1,其余为0) 通用函数 通用函数(即ufunc)是一种对ndarray中的数据执行元素级运算的函数...相当于中级运算符 &,|,^ 基本数组统计方法 方法 说明 sum 对数组中全部或某轴向的元素求和。零长度的数组的sum mean 算术平均数。...返回一个序列的随机排列或返回一个随机排列的范围 shuffle 对一个序列就地随机排列 rand 产生均匀分布的样本值 randint 从给定的上下限范围内随机选取整数 randn 产生正态分布(平均值为...0,标准差为1)的样本值,类似于MATLAB接口 binomial 产生二项分布的样本值 normal 产生正态(高斯)分布的样本值 beta 产生Beta分布的样本值 chisquare 产生卡方分布的样本值...gamma 产生Gamma分布的样本值 uniform 产生在[0, 1)中均匀分布的样本值 良心说明:由于本文大部分内容是表格内容阅读可能体验不好,但收藏价值相对较高,我特地做成了pdf文件,大家可以在后台回复

    1.2K20

    Python学习之numpy——2

    numpy.random.chisquare(df,size):从卡方分布中生成随机数。numpy.random.dirichlet(alpha,size):从 Dirichlet 分布中生成随机数。...numpy.random.noncentral_chisquare(df,nonc,size):从非中心卡方分布中生成随机数。...numpy.random.noncentral_f(dfnum, dfden, nonc, size):从非中心 F 分布中抽取样本。...二、数学函数 使用 python 自带的运算符,你可以完成数学中的加减乘除,以及取余、取整,幂次计算等。导入自带的 math 模块之后,里面又包含绝对值、阶乘、开平方等一些常用的数学函数。...2.2 双曲函数 在数学中,双曲函数是一类与常见的三角函数类似的函数。双曲函数经常出现于某些重要的线性微分方程的解中,使用 numpy 计算它们的方法为: numpy.sinh(x):双曲正弦。

    1.7K50

    Numpy库的简单用法(3)

    1、使用数组进行面向数组编程(续) (3)布尔值数组的方法 根据布尔值数组的特点,True会被强制为1,False会被强制为0,因此可以计算布尔值数组中True的个数;并且对布尔值数组有两个有用的方法...常用的函数如下表: 函数 描述 diag 将一个方阵的对角(或非对角)元素作为一个一维数组返回,或将一维数组转换成一个方阵,并且在非对角线上有零点 dot 矩阵点乘 trace 计算对角元素和 det...numpy.random中的部分函数列表 函数 描述 seed 向随机数生成器传递随机种子 shuffle 随机排列一个序列 rand 从均匀分布中抽取样本 randint 从给定的由低到高范围抽取随机整数...randn 从均值为0,方差为1的正态分布中抽取样本 binomial 从二项分布中抽取样本 normal 从正态分布中抽取样本 beta 从beta分布中抽取样本 chisquare 从卡方分布中抽取样本...gamma 从伽马分布中抽取样本 uniform 从均匀[0, 1)分布中抽取样本 可以抽取几个常见的方法记住,其他的作为了解。

    45710

    MADlib——基于SQL的数据挖掘解决方案(9)——数据探索之概率统计

    其中D表示分布的值域,这里包括连续的实数集R,以及离散分布的非负整数集N。 很明显,上面的公式包括以下特殊情况。0分位数总是数据集合中的最小值,1分位数总是数据集合中的最大值。...对于离散非负整数集合分布上的分位数p∈[0,1],由于x∈N,因此公式演变为F(x)的x,而当p>=0.5时,p分位数返回满足公式的x+1。...beta, float8ncp) float8 non_central_beta_quantile (float8 p, float8 alpha, float8 beta, float8ncp) 非中心卡方分布...卡方独立性检验 MAdlib的卡方独立性检验利用拟合优度检验函数实现。对于输入矩阵的的每个元素(i,j),它的期望值为sum(第i行) * sum(第j列)。...卡方值越大,越不符合;卡方值越小,偏差越小,越趋于符合,若两个值完全相等时,卡方值就为0,表明理论值完全符合。

    1.6K20

    Python实现12种概率分布(附代码)

    今天给大家带来的这篇文章是:《如何使用Python实现机器学习中常用的12种概率分布》 机器学习有其独特的数学基础,我们用微积分来处理变化无限小的函数,并计算它们的变化; 我们使用线性代数来处理计算过程...它由单个参数φ∈ [0, 1] 控制,φ 给出了随机变量等于 1 的概率。我们使用二元交叉熵函数实现二元分类,它的形式与对伯努利分布取负对数是一致的。 3....8.Gamma 分布(连续型) Gamma 分布是统计学中的常见连续型分布,指数分布、卡方分布和 Erlang 分布都是它的特例。...卡方分布(连续型) 简单而言,卡方分布(Chi-squared)可以理解为,k 个独立的标准正态分布变量的平方和服从自由度为 k 的卡方分布。...卡方分布是一种特殊的伽玛分布,是统计推断中应用最为广泛的概率分布之一,例如假设检验和置信区间的计算。 12.

    1K10

    Numpy笔记-进阶篇

    反正看不懂,就先记个函数叭 函数 说明 diag 以一维数组的形式返回方阵的对角线(或非对角线)元素,或将一维数组转换为方阵(非对角线元素为0) dot 矩阵乘法 trace 计算对角线元素的和 det...b,其中A为一个方阵 lstsq 计算Ax=b的最小二乘解 随机数生成 numpy.random效率比Python标准库的随机快的多 函数 说明 seed 确定随机生成器的种子 permutation...返回一个序列的随机排列或返回一个随机排列范围 shuffle 对一个序列就地随机排列 rand 产生均匀分布的样本值 randint 从给定的上下限范围内随机选取整数 randn 产生正态分布(平均值...0,标准差1)的样本值 binomial 产生二项分布的样本值 normal 产生正态(高斯)分布的样本值 beta 产生Beta分布的样本值 chisquare 产生卡方分布的样本值 gamma 产生...Gamma分布的样本值 uniform 产生[0, 1)中均匀分布的样本值 范例:随机漫步 随机漫步理论(Random Walk Theory)认为,证券价格的波动是随机的,像一个在广场上行走的人一样

    55310

    Lyft推出一种新的实时地图匹配算法

    差的地图匹配位置会导致不准确的预计到达时间(ETAs),然后导致错误的调度决策并令司机和乘客失望。因此,地图匹配直接影响 Lyft 的市场,并对用户体验产生重要影响。地图匹配有几个主要挑战。...为了更准确的说明,让我们定义以下对象: 一个MPF 状态是粒子列表。 一个粒子代表汽车在地图上一个可能的道路位置,并伴随一定的概率。...MPF 状态是一个粒子列表,每个粒子都与一些分布和一个概率相关(左)。通过轨迹和平均矢量描述车辆在道路网中的位置(右) 我们每次从司机的手机收到新的观察数据时,都会更新MPF状态,方法如下: ?...每个粒子的概率是其到观察值的距离的函数。 ? 在下一次更新(新观察)中,我们迭代我们的状态(非空)粒子列表,并为每个粒子执行两个步骤。...在实践中,我们观察到,它比 HMM 产生的地图匹配位置更精确,特别是在市中心地区和路口附近(这些地方的错误会导致非常不准确的 ETAs)。

    1.3K10

    PolyLoss | 统一CE Loss与Focal Loss,PolyLoss用1行代码+1个超参完成超车!!!

    但是,由于损失函数具有庞大的设计空间,导致设计一个良好的损失函数通常是具有挑战性的,而在不同的工作任务和数据集上设计一个通用的损失函数更是具挑战性。...一般来说,PolyLoss是[0,1]上的单调递减函数,可以表示为 ,并提供了一个灵活的框架来调整每个系数。PolyLoss可以推广到非整数j,但为简单起见,本文只关注整数幂( )。...如图2a所示,需要求和超过600个多项式项才能匹配Cross-entropy loss的精度。值得注意的是,去除高阶多项式不能简单地解释为调整学习率。...为了理解为什么高阶项很重要,作者对Cross-entropy loss中去除前N个多项式项后的结果进行了求和: 定理1:对于任何小的ζ>0,δ>0,如果N> ,那么对于任何p∈[δ,1],都有|R_N...即便如此,对Poly-1公式中的第1个多项式系数进行简单的网格搜索可以显著提高分类精度。作者还发现对LPoly-1的其他超参数进行优化还可以获得更高的精度。

    1.6K20

    Python数据分析学习路线个人总结

    此处就体现了 Python 的解释特性,当我们把 0 赋值给 a 时,Python 解释器会把它 a 解释为 int 型,可以使用内置函数 type(variable) 显示地检查 variable 的类型...) 和关键字参数( keyword argument ) ,总是感觉缺少点什么,它们在 Python 函数中到处可见,理解和使用它们,为我们日后深入 Python 打下坚实的根基。...6 Excel数据分析 6.1 Excel处理10万条以内数据 6.2 以SUM函数为首的求和家族 6.3 以VLOOKUP函数为首的查找家族 6.4 以IF函数为首的逻辑函数家族 大家自行查阅学习...7 Pandas数据预处理 7.1 基于Python的向量化增强 7.2 必须掌握的传播机制 广播发生的条件 7.3 一维Series和二维DataFrame 7.4 Pandas中的20个统计学函数...9 数据可视化 9.1 必备的绘图原理知识 拿使用较多的 matplotlib 为列,整个图像为一个Figure 对象,在 Figure 对象中可以包含一个或多个 Axes对象,每个Axes对象都是一个拥有自己坐标系统的绘图区域

    1.1K31

    Python数据分析学习路线个人总结

    // 类型不能互转 但是,Python 就不会在编译阶段做类型匹配检查,比如,Python 实现上面的几行语句,会这样写: a = 0 # 不做任何类型声明b = 0.a = b # 这种赋值,Python...此处就体现了 Python 的解释特性,当我们把 0 赋值给 a 时,Python 解释器会把它 a 解释为 int 型,可以使用内置函数 type(variable) 显示地检查 variable 的类型...) 和关键字参数( keyword argument ) ,总是感觉缺少点什么,它们在 Python 函数中到处可见,理解和使用它们,为我们日后深入 Python 打下坚实的根基。...6 Excel数据分析 6.1 Excel处理10万条以内数据 6.2 以SUM函数为首的求和家族 6.3 以VLOOKUP函数为首的查找家族 6.4 以IF函数为首的逻辑函数家族 大家自行查阅学习...9 数据可视化 9.1 必备的绘图原理知识 拿使用较多的 matplotlib 为列,整个图像为一个Figure 对象,在 Figure 对象中可以包含一个或多个 Axes对象,每个Axes对象都是一个拥有自己坐标系统的绘图区域

    1.6K20
    领券