我正在开发一个python vcf to EIGENSTRAT格式转换器。我有一个代码,它工作得很好,但它真的很慢,所以我不能在项目中真正使用它。我从vcf.gz中读取基因型数据,并使用此代码将其转换为.geno格式。这个vcf.gz大约需要10-12个小时来转换,这是最小的一个。calldata/GT是一个150万x 2500 x 2的数组。提前谢谢你
我想转换存储为wchar_t*的UTF-16字符数组的特性。在这种情况下,假设是sizeof(wchar_t) == 2。转换从BE到LE和LE to BE都是必需的,所以ntoh/nton不能工作。有办法交换wchar_t的两个字节吗?还是我必须先把它转换成二进制呢?编辑:虽然我没有测试所有的答案,但我相信它们都有效。话虽如此,我认为Jarod42的答案更简单。