首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

神奇!无需数据即可进行机器翻译操作

在日常工作中,深度学习正在被积极地使用。与其他机器学习算法不同的是,深度网络最有用的特性是,随着它获得更多的数据,它们的性能就会有所提高。因此,如果能够获得更多的数据,则可以预见到性能的提高。 深度网络的优势之一就是机器翻译,甚至谷歌翻译现在也在使用它们。在机器翻译中,需要句子水平的并行数据来训练模型,也就是说,对于源语言中的每句话,都需要在目标语言中使用翻译的语言。不难想象为什么会出现这样的问题。因为我们很难获得大量的数据来进行一些语言的配对。 本文是如何构建的? 这篇文章是基于“只使用语料库来进行无监督

06

One-Shot Unsupervised Cross Domain Translation

给出一个来自领域A的单一图像x和一组来自领域B的图像,我们的任务是生成x在B中的类似物。我们认为,这项任务可能是一项关键的人工智能能力,它强调了认知代理在这个世界上的行动能力,并提出了经验证据,表明现有的无监督领域翻译方法在这项任务上失败。我们的方法遵循一个两步过程。首先,为领域B训练一个变异自动编码器。然后,给定新的样本x,我们通过调整接近图像的层来创建A域的变异自动编码器,以便直接适应x,而只间接适应其他层。我们的实验表明,当对一个样本x进行训练时,新方法和现有的领域转移方法一样好,当这些方法享受来自领域A的大量训练样本时。我们的代码可在https://github.com/sagiebenaim/OneShotTranslation 公开。

02

Bioinformatics | 注释scRNA-seq数据时自动识别新细胞

本文介绍由美国德克萨斯大学MD安德森癌症中心生物统计学系的Ziyi Li和Kim-Anh Do共同通讯发表在 Bioinformatics 的研究成果:为了更好地注释scRNA-seq 数据,发现新的细胞类型,作者开发了一种简单而有效的方法,结合自动编码器和迭代特征选择,从scRNA-seq数据中自动识别新细胞。该方法用标记的训练数据训练一个自动编码器,并将自动编码器应用于测试数据以获得重建误差。通过反复选择表现出双模模式的特征,并使用所选特征对细胞进行重新分组,该方法可以准确地识别训练数据中不存在的新细胞。作者进一步将这种方法与支持向量机结合起来,为注释所有的细胞类型提供了一个完整的解决方案。使用五个真实的scRNA-seq数据集进行的广泛的数值实验,结果表明,该方法比现有的方法具有更好的性能。

02
领券