我们公司的产品每年会在我们的客户站点上产生数at的数据。我想填满一个数up的NAS,以模拟一个已经运行了很长时间(3个月、6个月、一年等)的系统。我们希望在软件运行在负载下的存储系统上时对其进行分析。
我可以编写一个脚本来创建这些数据(一个脚本可能需要几周或几个月的时间才能执行)。有没有关于如何扩展脚本(多台机器、多线程)的建议?NAS有3个负载平衡的传入链路...我应该直接在NAS设备上运行吗?
有没有第三方产品可以用来创建加载?我甚至不知道如何开始搜索这样的产品。
如果数据是真实的,这重要吗?有人了解NAS/存储体系结构吗?它仅仅是随机的比特,还是数据的规律性很重要?我们以这种格式在磁盘上扇出数据
x:\<year>\<day-of-year>\<hour>\<minute>\<guid-file-name>.ext发布于 2011-09-09 19:44:43
您将受到NAS/磁盘写入速度的限制-我想不出有什么办法可以绕过这一点。
因此,所面临的挑战就是让磁盘在需要的时间内保持写饱和。在一台合理的机器上运行的一个或一组脚本应该能够毫不费力地做到这一点。
首先,使用诸如Bonnie++之类的命令来了解磁盘的写入速度。然后,您可以使用Bonnie中的代码作为饱和写入的起点-毕竟,要对磁盘进行基准测试,Bonnie必须能够以比NAS更快的速度写入。
假设你有3x1 1GB的以太网连接,机器的最大网络输入大约是300MB/s。一台PC能够饱和1 1GB的以太网连接,因此3台PC应该可以工作。让每台PC写出树的一部分,瞧。
当然,以300MB/s的速度填充MB大约需要一个月的时间。
或者,您也可以在NAS状态的问题上向您的代码撒谎。在Linux上,您可以编写一个用户空间文件系统,通过为On大小的文件创建动态元数据(文件名、长度等)来假装有几on的数据。当产品读取时,然后生成随机数据。当你写产品时,把它写到真实的磁盘上,记住如果它再次被读取,你就得到了“真实”的数据。
由于您的产品在此测试过程中可能不会读取整个an,也不会写入太多内容,因此您可以很容易地立即模拟一个任意满的NAS。
这是否需要超过或不到一个月的时间来开发是一个悬而未决的问题:)
https://stackoverflow.com/questions/6298995
复制相似问题