农业试验设计1--小师妹来电

试验设计

试验设计时农业中比较核心的技能, 关系着试验数据的好坏, 关系着后续分析的模型, 关系着效率的高低.

兵马未动, 粮草先行. 好的试验设计, 事半功倍.

一个简单的试验: RCBD

小师妹来信:

师兄你好, 老板让我设计试验, 目前有5个品种, 我想重复3次, 如何设计试验?

师兄回信:

小师妹好, 这个问题难不倒我, 你可以把问题理解为单因素完全随机试验, 这里3次重复就是单纯的重复. 你也可以将问题理解为单因素随机区组试验, 这里的重复就是区组(block), 两者都可以. 如果田地间肥力均匀, 那就可以用完全随机设计, 这样试验的残差自由度更高, 如果肥力有梯度, 就需要用完全随机区组了.

小师妹来信:

师兄你好, 感觉重复和区组这两个单词很高深的样子, 我把品种名发给你, 你给我设计试验后发给我好了.

品种: 郑单958, 先玉335, 登海605, 豫玉22, 浚单20. 重复: 3次 试验方案: 完全随机区组

代码

library(agricolae)
cul = c( "郑单958", "先玉335", "登海605", "豫玉22", "浚单20")
rep = 3
exp = design.rcbd(cul,rep)
exp$book
exp$sketch
write.csv(exp$book,"d:/book.csv")

结果 保存在D盘, 名为book.csv

拉丁方

小师妹:

师兄, 我发现我有5个品种, 如果我重复5次的话, 是不是拉丁方更好一点呢? 那这样我不仅仅行是区组, 列也是区组, 就像数独一样, 试验精度应该会更高吧? 把试验代码发给我吧…

exp = design.lsd(cul)
exp$book
exp$sketch
write.csv(exp$book,"d:/book.csv")

田间种植图 每一行是一个重复, 每一列是一个重复, 真的是数独啊…

Latin和Lattice什么区别啊

师妹来信:

师兄, 这个拉丁方和格子方什么区别啊, 貌似很高端的样子, 我傻傻分不清楚啊.

师兄回信:

师妹, 这个问题的主要区别在于, 两者的拼写是不一样的, 拉丁方的拼写是Latin, 格子方的拼写是Lattice. 如果说试验设计的区别, 主要是拉丁方是正方形的, 重复数和品种数需要一样, 比如5个品种, 需要5次重复才可以用拉丁方设计, 如果品种较多时, 是不现实的, 因为它占用大量的资源, 比如100个品种, 就需要100个重复, 这种实验只适合品种较少的情况, 一般是10个以下. 格子方也是正方形的, 它是一种不完全区组的试验, 一个格子是一个重复, 品种数需要时某个数的平方, 比如25个品红, 可以组成5*5的格子.

师妹来信:

这么说来, 两者都比较死板, 现实应用有限吧?

师兄回信:

现在一般应用的是格子方的改良版: alpha-lattice, 它不局限与n*n, 可以是n*m, 那这样就大大扩大了它的应用范围.比如100个品种, 我可以是10*10, 也可以是20*5.

alpha-lattice怎么设计

师妹来信:

师兄, 比如我有120个品种, 我想安装10*12的形式设计alpha-lattice, 即每个block是10个品种, 每个重复有12个区组, 重复3次, 你把设计好的方案发过来吧.

代码:

cul = paste0("cul",1:100)
exp = design.alpha(1:120,10,3)
exp$sketch
write.csv(exp$book,"d:/book.csv")

田间种植图: 这里面rep1是第一个重复 每一样为每个区组, 共有10个品种(列) 每个重复有12个区组(行)

$`rep1`
      [,1]  [,2]  [,3]  [,4]  [,5] [,6]  [,7]  [,8]  [,9]  [,10]
 [1,] "48"  "12"  "82"  "63"  "56" "54"  "2"   "50"  "53"  "68"
 [2,] "86"  "100" "43"  "4"   "61" "70"  "89"  "57"  "91"  "81"
 [3,] "52"  "90"  "26"  "42"  "46" "67"  "71"  "66"  "79"  "5"  
 [4,] "98"  "107" "51"  "45"  "72" "75"  "18"  "65"  "73"  "49"
 [5,] "41"  "104" "27"  "19"  "11" "34"  "44"  "85"  "69"  "92"
 [6,] "24"  "38"  "118" "30"  "83" "113" "8"   "95"  "33"  "119"
 [7,] "80"  "58"  "55"  "17"  "25" "106" "16"  "9"   "60"  "37"
 [8,] "101" "3"   "78"  "120" "84" "35"  "1"   "88"  "99"  "96"
 [9,] "13"  "6"   "21"  "108" "22" "117" "105" "32"  "111" "102"
[10,] "31"  "28"  "62"  "87"  "36" "64"  "93"  "39"  "97"  "23"
[11,] "59"  "112" "47"  "115" "76" "29"  "114" "15"  "103" "94"
[12,] "74"  "109" "10"  "7"   "77" "40"  "20"  "110" "116" "14"

$rep2
      [,1] [,2] [,3]  [,4]  [,5]  [,6]  [,7]  [,8]  [,9]  [,10]
 [1,] "65" "8"  "15"  "22"  "42"  "25"  "99"  "50"  "110" "39"
 [2,] "3"  "52" "86"  "54"  "60"  "119" "93"  "117" "20"  "49"
 [3,] "56" "44" "98"  "83"  "90"  "70"  "74"  "87"  "114" "111"
 [4,] "82" "96" "51"  "38"  "46"  "106" "112" "62"  "11"  "105"
 [5,] "33" "5"  "12"  "1"   "29"  "104" "100" "7"   "102" "107"
 [6,] "31" "75" "118" "26"  "53"  "84"  "69"  "94"  "16"  "4"  
 [7,] "43" "79" "35"  "109" "68"  "32"  "76"  "37"  "85"  "30"
 [8,] "21" "73" "47"  "88"  "36"  "61"  "2"   "55"  "41"  "14"
 [9,] "71" "24" "40"  "58"  "45"  "78"  "103" "64"  "57"  "27"
[10,] "6"  "89" "77"  "23"  "19"  "48"  "17"  "113" "72"  "59"
[11,] "67" "10" "92"  "63"  "28"  "9"   "120" "18"  "81"  "13"
[12,] "95" "97" "80"  "66"  "115" "116" "101" "91"  "108" "34"

$rep3
      [,1]  [,2]  [,3]  [,4]  [,5]  [,6] [,7]  [,8]  [,9]  [,10]
 [1,] "17"  "90"  "18"  "34"  "57"  "36" "33"  "76"  "54"  "22"
 [2,] "59"  "109" "44"  "108" "99"  "31" "52"  "100" "106" "45"
 [3,] "3"   "19"  "75"  "47"  "7"   "62" "25"  "70"  "67"  "32"
 [4,] "107" "37"  "112" "81"  "101" "14" "71"  "6"   "56"  "118"
 [5,] "38"  "10"  "26"  "80"  "15"  "86" "21"  "98"  "78"  "48"
 [6,] "92"  "96"  "12"  "16"  "119" "77" "64"  "61"  "42"  "111"
 [7,] "49"  "50"  "30"  "55"  "27"  "28" "115" "105" "5"   "4"  
 [8,] "43"  "9"   "113" "116" "65"  "82" "88"  "104" "93"  "114"
 [9,] "23"  "110" "63"  "117" "11"  "35" "73"  "24"  "94"  "66"
[10,] "13"  "2"   "72"  "79"  "69"  "20" "95"  "103" "1"   "87"
[11,] "68"  "97"  "74"  "89"  "84"  "58" "41"  "8"   "102" "46"
[12,] "85"  "40"  "60"  "53"  "83"  "91" "29"  "51"  "39"  "120"

alpha-lattice VS RCBD

1、 什么是完全随机区组试验? 根据局部控制的原则,将试验地按肥力水平划分为与处理重复次数相同的若干个区组,在区组内各处理小区完全随机排列的田间试验,区组内肥力相似,区组间肥力不同。这种试验符合田间试验设计的基本原则:重复、随机、局部控制,应用广泛。目前国内大部分的种子公司高级试验一般采用完全随机区组设计,目前国家预试和区试都是采用这种方法。

2、 什么是alpha-格子试验设计? alpha-格子试验设计是不完全区组的一种,每个区组只包含一部分品种,这些区组内的品种是一个重复的子集,即一套区组构成一个重复。这种试验设计主要是国外育种企业采用的一种不完全区组试验设计,主要应用于育种早期、中期产量试验阶段的品种筛选。国内育种企业正在接受和普及这种方法。

3、两者比较,完全随机区组的区组数不能大于10个品种,否则区组内均一性受到影响,区组设置失效。另外对于处理因素(品种)较多的试验,完全随机区组不适合,而alpha-格子试验设计,其区组内的品种可以控制较小的个数,因此总处理个数不受限制,完全随机区组适合处理数小于10个的试验,处理较多时用alpha-格子试验设计更好。

增广试验设计

师妹来信:

师兄, 我现在有200个品种, 我目前想用间比法, 但是上网发现增广试验设计(augmented design)更好, 我的对照有2个, 把试验结果和田间种植图发给我.

# augmented design

cul = paste0("cul",1:200)
ck = paste0("ck",1:2)
exp = design.dau(ck,cul,20)
exp$parameters
exp$book
write.csv(exp$book,"d:/book.csv")

结果 200个品种, 每10个插入两个对照, 共分为20组.

和传统间比法不一样的是, 对照是随机的, 品种也是随机的.

优势在于分析时更精确.

还有没有更好的试验设计?

师妹来信:

师兄, 你说还有没有更好的试验设计?

师兄回信:

这个问题不太好回答, 最开始, 我也认为随机区组, 完全随机, 拉丁方, 格子方, alpha-格子试验, 增广试验肯定是有好坏的. 现在看来, 每个试验都有自己的应用范围, 试验设计的目的在于控制误差, 使得试验的不同品种反映出其真实的水平来. 当然, 随着统计的发展, 一些新的统计方法不断出现, 以前不能够分析的, 现在可以分析了. 比如不平衡的试验, 或者平衡不完全的试验, 可以借助混合线性模型进行分析, 这也是alpha-lattice或者增广试验推广的主要原因. 好的现代的试验设计, 好过旧的过时的试验设计. 比如你用的是拉丁方, 试验不理想, 你可以用随机区组进行分析, 如果你设计的是完全随机, 那你是不能使用随机区组或者拉丁方进行分析的. 降维度是可以的, 升维度却很难, 这也是告诉我们设计试验时要多多考虑的原因啊.

agricolae包中有但是没有介绍的试验设计

  • Graeco-Latin design 拉丁方的一种, 是二因素的处理.
  • Youden design
  • Balance Incomplete Block Design
  • Cyclic design
  • Split-plot design
  • Strip-plot design

本文分享自微信公众号 - 育种数据分析之放飞自我(R-breeding)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-07-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励