开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何优化大型数据集上的图形质量

优化大型数据集上的图形质量是一个涉及到多个方面的复杂问题。下面我将从几个方面给出答案。

首先，为了优化大型数据集上的图形质量，可以考虑使用图形处理单元（GPU）进行加速。GPU拥有并行处理能力，适合处理图形相关的计算任务。可以使用图形编程接口（如OpenGL、DirectX等）来利用GPU进行图形渲染，从而提高图形质量和性能。腾讯云提供的GPU云服务器（https://cloud.tencent.com/product/gpu）可以满足这一需求。

其次，优化大型数据集上的图形质量还需要考虑图形数据的压缩和存储。在存储方面，可以选择高效的压缩算法（如JPEG、PNG等）对图形数据进行压缩，减小存储空间的占用。在传输方面，可以利用流式传输技术将图形数据分批次地传输，减小网络延迟。腾讯云提供的对象存储服务（https://cloud.tencent.com/product/cos）和CDN加速服务（https://cloud.tencent.com/product/cdn）可以支持图形数据的存储和传输。

此外，为了提高大型数据集上的图形质量，还可以采用图像处理算法进行优化。例如，可以使用图像增强算法（如锐化、去噪、对比度调整等）来改善图像的清晰度和细节。腾讯云提供的图像处理服务（https://cloud.tencent.com/product/img）可以帮助进行图像处理和优化。

最后，针对大型数据集上的图形质量优化，还可以考虑使用分布式计算和并行计算技术。通过将计算任务分布到多个计算节点上并行处理，可以加快图形计算的速度和效率。腾讯云提供的弹性MapReduce服务（https://cloud.tencent.com/product/emr）和弹性计算服务（https://cloud.tencent.com/product/cvm）可以支持分布式计算和并行计算。

总结起来，优化大型数据集上的图形质量需要综合考虑GPU加速、图形数据的压缩和存储、图像处理算法以及分布式计算和并行计算技术。腾讯云提供的相关产品和服务可以帮助实现这些优化措施。

相关搜索:针对大型数据集的优化优化查询大型数据集的查询如何组合大型数据集使用dict.items()优化大型数据集的字典查找过滤大型数据数组的优化大型二元谓词规则集的优化计算如何在java对象数据集上优化数据集聚合如何比较DB中的一个大型数据集和SpreadSheet上的一个大型数据集？如何在tensorflow 2.x上训练大型数据集 PowerShell如何处理大型数据集？大型数据库的优化技术测试apache ignite的大型数据集？Jersey Streamingoutput大型数据集的输出关于筛选大型数据集的问题如何在大型图形数据库中使用可选的match子句优化cypher查询？Python:合并大型数据集以及如何处理大型数据(500 Gb)django列表视图分页在大型数据集上太慢在大型数据集R上按id检查序列如何映射大型数据集与R闪亮？如何在应用特定函数时加速大型数据集上的行操作

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

用扩散模型监督NeRF，清华文生3D新方法成新SOTA

刘永进教授课题组此次提出的新模型叫做TICD（Text-Image Conditioned Diffusion），在T3Bench数据集上达到了SOTA水平。

01

[计算机视觉论文速递] 2018-05-19

这篇文章有4篇论文速递信息，涉及人脸识别（综述）、人脸检测、3D 目标检测和姿态估计和目标检测等方向（含2篇CVPR 2018）。

02

「图结构学习」新思路！港大等提出GraphEdit模型：用LLM删除噪声边，全局理解节点间依赖关系

图结构学习（Graph Structure Learning, GSL）旨在通过生成新的图结构来捕捉图结构数据中节点之间的内在依赖性和交互关系。

01

每日学术速递12.27

1.StarVector: Generating Scalable Vector Graphics Code from Images

01

绘图软件CAD2023版下载，CAD2022中文版下载，CAD介绍及安装教程

AutoCAD是由美国Autodesk公司开发的一种计算机辅助设计软件，是目前全球使用最广泛的计算机辅助设计软件之一。AutoCAD具有强大的绘图能力、灵活的设计工具、丰富的图形库和高效的文件处理能力，被广泛应用于建筑、土木工程、机械制造、电气设计、地理信息系统等领域。

06

ICLR20 | GraphZoom：可缩放图嵌入

今天给大家介绍康奈尔大学和密西根理工大学发表在ICLR2020上的一篇论文，该论文指出：现有图嵌入模型在训练期间不能很好的合并节点属性信息，模型可能会受到节点属性噪声的干扰，而且由于图嵌入模型的高计算复杂度和内存使用量，很少有模型能够应用到大图上。针对以上问题，该论文提出了一种用于提高无监督图嵌入算法准确性和可伸缩性的多级框架—GraphZoom。通过实验证明，与最新的无监督图嵌入方法相比，GraphZoom可以显著提高分类精度并且极快加速整个图嵌入过程。

07

香港理工大学 & 腾讯实验室提出 PoserLLaVa 方法在内容感知布局生成中实现SOTA性能！

尽管以前的方法在某些数据集上展示了进展，但它们大多数依赖于高度定制的网络结构，缺乏普遍性。这种特定性需要大量的修改或完全重新设计，以适应新的或不同的布局设计挑战。认识到这一局限性，作者开发了一个名为PosterLAVa的统一框架（见图1），用于布局生成任务，该框架受到了最近发布的多模态指令调优方法的简单性和有效性的启发。通过大量未标注语料库的预训练和根据指令跟随数据的微调，多模态大型语言模型（MLIMs）能够根据给定的指令及其背景知识处理多个视觉-语言任务（例如，视觉问答（VQA）（Wang et al., 2019; Wang et al., 2019），视觉定位。

01

Marior去除边距和迭代内容矫正用于自然文档矫正

本文简要介绍了论文“ Marior: Margin Removal and Iterative Content Rectification for Document Dewarping in the Wild ”的相关工作。照相机捕捉到的文档图像通常会出现透视和几何变形。考虑到视觉美感较差和OCR系统性能下降，对其进行纠正具有重要的价值。最近的基于学习的方法集中关注于精确裁剪的文档图像。然而，这可能不足以克服实际挑战，包括具有大边缘区域或没有边缘区域的文档图像。由于这种不切实际，用户在遇到大型边缘区域时难以精确地裁剪文档。同时，无边缘的变形图像仍然是一个难以解决的问题。据作者所知，目前还没有完整有效的pipeline来纠正文档图像。为了解决这个问题，作者提出了一种新的方法，称为Marior（边缘去除和迭代内容修正）。Marior采用渐进策略，以从粗到细的方式迭代地提高去变形质量和可读性。具体来说，作者将pipeline划分为两个模块：边缘去除模块（MRM）和迭代内容校正模块（ICRM）。首先，作者预测输入图像的分割掩膜去除边缘，从而得到初步结果。然后，作者通过产生密集的位移流来进一步细化图像，以实现内容感知的校正。作者自适应地确定细化迭代的次数。实验证明了作者的方法在公共基准上的最新性能。

02

GPT-4V数学推理如何？微软发布MathVista基准，评测报告长达112页

微软最近发布了名为 “MathVista” 的全新多模态数学推理基准数据集，同时提供了一份涵盖 112 页的详细评测报告，专注于大型多模态模型的数学推理表现。这一基准测试对于目前最先进的模型，如 GPT-4V，来说也是一项挑战，显示了这些模型在多模态数学问题解决方面的局限性。报告还深入分析了 GPT-4V 在自我验证、自洽性和多轮对话能力的研究潜力。

03

参数量仅为1/700，性能超越GPT-3.5！CMU+清华开源Prompt2Model框架

基于大型语言模型（LLM），开发者或用户可以通过描述任务，并给出几个样例来构造自然语言提示，很轻松地就能实现指定的功能。

02

Facebook 推荐算法

版权声明：本文为博主-姜兴琪原创文章，未经博主允许不得转载。 https://blog.csdn.net/jxq0816/article/details/81635996

03

单个A100生成3D图像只需30秒，这是Adobe让文本、图像都动起来的新方法

2D 扩散模型极大地简化了图像内容的创作流程，2D 设计行业也因此发生了变革。近来，扩散模型已扩展到 3D 创作领域，减少了应用程序（如 VR、AR、机器人技术和游戏等）中的人工成本。有许多研究已经对使用预训练的 2D 扩散模型，生成具有评分蒸馏采样（SDS）损失的 NeRFs 方法进行了探索。然而，基于 SDS 的方法通常需要花费数小时来优化资源，并且经常引发图形中的几何问题，比如多面 Janus 问题。

01

大模型版“5年高考3年模拟”来了！6141道数学题，还是多模态的那种｜微软&UCLA&UW联合出品

微软、加州大学洛杉矶分校（UCLA）、华盛顿大学（UW）联合打造全新多模态数学推理基准数据集。

01

2004年4月计算机视觉论文推荐

本文将整理4月发表的计算机视觉的重要论文，重点介绍了计算机视觉领域的最新研究和进展，包括图像识别、视觉模型优化、生成对抗网络(gan)、图像分割、视频分析等各个子领域

01

各种形式的图神经网络的实现和基准测试

本篇文章是论文的介绍性博客:Benchmarking Graph Neural Networks （https://arxiv.org/abs/2003.00982）的介绍性文章，有兴趣的可以下载原文阅读

01

图大模型的前沿综述

大模型是人工智能（尤其是机器学习）领域最具划时代意义的新突破之一。然而，相较于自然语言处理和计算机视觉等领域，大模型在图领域尚未达到相同的成功水平。

01

数学推理增强！微软 | 提出数据合成框架：KPDDS，微调Mistral-7B性能超34B模型！

在数学推理领域，大型语言模型（LLMs）的性能受限于高质量训练数据。为此，本文提出关键点驱动的数据合成（KPDDS）框架，它通过分析真实数据中的关键点和示例对来生成问答对。基于此框架作者创建了KPMath数学问题数据集，并通过与额外的推理密集型数据结合，形成了KPMath-Plus数据集。在KPMath-Plus上微调的Mistral-7B模型在MATH测试集上达到了39.3%的零样本PASS@1准确率，不仅超过了7B模型，还超过了34B模型。

01

深度学习这些概念都弄清楚了么？TF、TLT、TRT、DS....

深度学习是机器学习的一个分支,其特点是使用几个,有时上百个功能层。深度学习已经从能够进行线性分类的感知器发展到添加多层来近似更复杂的函数。加上卷积层使得小图像的处理性能有了提升，可以识别一些手写数字。现在，随着大型图像数据集的可用性和高性能并行计算卷积网络正在大规模图像上得到应用，从而实现了以前不实用的广泛应用。

02

Nat. Comput. Sci. | 通过图神经网络快速评估有机分子在金属上的吸附能量

今天为大家介绍的是一篇使用图神经网路快速评估有机分子在金属上的吸附能量的论文。在异质催化中进行建模需要对吸附在表面上的分子的能量进行广泛评估。这通常通过密度泛函理论来实现，但对于大型有机分子来说，这需要巨大的计算时间，从而损害了该方法的可行性。在这里，作者设计了GAME-Net，一种用于快速评估吸附能的图神经网络。GAME-Net在一个平衡的化学多样性数据集上进行训练，其中包含了具有不同官能团的C分子，包括N、O、S和C芳香环。该模型在测试集上的平均绝对误差为0.18电子伏，并且比密度泛函理论快了6个数量级。应用于生物质和塑料中，预测的吸附能误差为0.016电子伏每个原子。该框架为催化材料的快速筛选提供了可用工具，特别适用于传统方法无法模拟的系统。

02

【翻译】Efficient Data Loader for Fast Sampling-Based GNN Training on Large Graphs

Efficient Data Loader for Fast Sampling-Based GNN Training on Large Graphs | IEEE Journals & Magazine | IEEE Xplore

04

卡内基梅隆 && 清华 | Prompt2Model：利用大模型Prompt，实现专有NLP模型生成！

随着大型语言模型 (LLM) 的应用，只需使用自然语言描述任务并提供一些示例，人们就能够方便的通过Prompt创建NLP系统。然而，相比传统的专用NLP模型，大型语言模型仍然存在计算资源紧张等问题。为此，本文提出了Prompt2Model平台架构，采用自然语言描述任务，并用它来「训练有利于部署的专用模型」。实验结果显示：Prompt2Model训练的模型的「性能比ChatGPT的结果平均高出20%，同时尺寸最多缩小700倍」。

02

Python常用库推荐

就像这样的伪代码

02

沉浸式体验飞鸟的快乐：从一张照片生成3D航拍视频

怎么样，是不是体会到飞鸟的快乐了？但你能想象吗，这些景观视频全部都是计算机合成的！

01

Recommending items to more than a billion people（面向十亿级用户的推荐系统）

Web上数据的增长使得在完整的数据集上使用许多机器学习算法变得更加困难。特别是对于个性化推荐问题，数据采样通常不是一种选择，需要对分布式算法设计进行创新，以便我们能够扩展到这些不断增长的数据集。

01

76. 三维重建11-立体匹配7，解析合成数据集和工具

随着越来越多的领域引入了深度学习作为解决工具，大量的数据显然也就变得非常关键了。然而在相当长的时间里，立体匹配这个领域都缺乏大量的数据可以使用。我在文章74. 三维重建9-立体匹配5，解析MiddleBurry立体匹配数据集和75. 三维重建10-立体匹配6，解析KITTI立体匹配数据集介绍的两个著名的数据集MiddleBurry和KITTI都不是为了训练神经网络而制作——它们本身仅用于客观的衡量比较算法的质量。所以它们所包含的图像组数量都很有限。比如，MiddleBurry 2014年数据集就只有20组数据可用于训练算法。KITTI 2012， 194组训练图像， KITTI 2015， 200组训练图像。同时，这些数据集的场景都很有限，MiddleBurry的场景是在受控光照下实验场景。KITTI则主要集中在自动驾驶的公路场景，且其Ground Truth深度只占图像的50%左右。很显然，这样的数据集是不足以用于训练深度学习的网络模型的。

01

社会与行为学的 Wolfram 解决方案

Wolfram 社会与行为学解决方案是一个集设计和运行实验、收集和分析数据以及交互式报告结果为一体的系统。

02

Auto-Prompt | 大模型提示(Prompt)优化新方法IPC：可根据用户意图进行定向优化

由于大语言模型（LLMs）对给定的提示比较敏感，并且文本任务指令本身就存在歧义性。为了能够让LLMs发挥出最佳性能，自动提示（Auto-Prompt）工程至关重要。

01

论文合集 | 图大模型推荐研究

大型语言模型（LLMs）已经彻底改变了自然语言处理任务，而其与图神经网络（GNN上）之间又会擦出怎样的火花呢？本文汇总了20篇与图大模型相关的论文（主要以推荐系统领域为主），展示最新的工作研究进展。

01

如何确保机器学习最重要的起始步骤"特征工程"的步骤一致性？

关于特征工程，业界有这么一句话：数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限。

02

[翻译]Android教程-保存数据-支持不同的屏幕

为了声明你想要使用在不同屏幕上的布局和位图 , 你必须在不同的路径中放置这些可选的资源 , 这类似于针对不同的语言字符串你所要做的事情 . 你也要也要意识到屏幕方向（横向或者纵向）也要被考虑成一种屏幕尺寸，所以许多的应用会修改布局来优化用户在不同的屏幕方向上的体验 .

02

神奇LLM引擎上线：帮你把GPT-3直接调成ChatGPT

机器之心报道机器之心编辑部 OpenAI 花几个月完成的事，现在用它直接给你自动化了。最近一段时间，不论大公司还是开发者都在造大语言模型（LLM），但有人认为，大模型应用的速度有点落后。为了构建能实际使用的 AI 工具，我们需要基于基础模型构建定制化模型，中间的过程包含微调（Fine-tuning），这是一个复杂且耗时的过程，对于很多人来说，简便易行的调试是不存在的。这个问题现在或许得到了解决：本周六，来自斯坦福的一群开发者发布了 Lamini，号称可以为每个开发人员提供从 GPT-3 带到 Cha

03

优于人类参考摘要，适用CNN新闻，OpenAI用人类反馈提升了摘要生成质量

随着语言模型越来越强大，用于特定任务的数据和度量标准越来越成为训练和评估的瓶颈。例如，摘要模型通常被训练用来预测人类参考摘要，并使用 ROUGE 进行评估，但是这些度量指标都没有触及真正的关注点——摘要质量。

02

TPU新秘密武器！谷歌Jeff Dean团队推「AI造芯」，自主设计芯片仅需6小时

---- 新智元报道来源：nature等编辑：yaxin, LQ 【新智元导读】Jeff Dean带队更新AI芯片设计，这次还带上了谷歌秘密武器TPU，利用深度强化学习设计下一代AI加速芯片，6个小时内搞定芯片设计。有了AI设计芯片，我再也不相信「摩尔定律」了！近日，由Jeff Dean领衔的谷歌大脑团队以及斯坦福大学的科学家们，在一项研究中证明：「一种基于深度强化学习（DL）的芯片布局规划方法，能够生成可行的芯片设计方案。」 AI能设计芯片，这还不够震撼。只用不到 6 小时的时间

01

【CVPR 2023的AIGC应用汇总(8)】3D相关（编辑/重建/生成） diffusion扩散/GAN生成对抗网络方法

【CVPR 2023的AIGC应用汇总(5)】语义布局可控生成，基于diffusion扩散/GAN生成对抗

01

如何确保机器学习最重要的起始步骤"特征工程"的步骤一致性？

关于特征工程，业界有这么一句话：数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限。

02

学界 | 邢波团队提出contrast-GAN：实现生成式语义处理

选自arXiv 机器之心编译参与：Smith 在本篇论文中，作者聚焦于一个更具挑战性的语义处理任务，在保持图像独有特征（例如视角和形状）的同时修改物体的语义含义，比如，牛→羊，摩托车→自行车，猫→狗。为了处理这样大型的语义变换，作者引入了一种带有新型对抗式对比目标（adversarial contrasting objective）的对比型 GAN（contrast-GAN）。论文还提出了配有新型比较式目标的，蒙版条件式对比 GAN（mask-conditional contrast-GAN）结构，它能够

04

学界 | 生成的图像数据集效果不好？也许你需要考虑内容分布的差异

对生成数据集和真实数据集差异的探究目前也有不少成果，比如学习不同任务通用的图像特征、学习图像风格迁移等，这样可以让生成数据集中的图像看上去更像真实图像。不过这篇论文的作者们认为，图像风格的差异其实只是很小的因素，更重要的差异在于图像内容的差异，而且生成的图像应当对新的任务有帮助。以往的图像生成方法只能覆盖有限的场景、有限的物体、有限的变化，对真实世界物体的多变性和属性的分布刻画不足；而且作者们提出，以KITTI数据集为例，它的数据是在德国采集的，但也许别的研究人员使用这个数据集训练的系统是想要在日本使用的，场景内容一定会有所不同；甚至服务的任务目标也可以不同。这都是现有的数据生成方法没有解决，甚至没有考虑的方面。如果完全在虚拟环境中复制重现的话，资金和时间成本也都非常高昂。

01

智能测试实践之路-UI缺陷检测

随着业务与技术的发展，软件架构从最初单体结构逐步演变成AI赋能的分布式体系，基础框架技术能力不断成熟，数据、控制、服务等能力的深化为业务的快速建立与扩展提供了强大的支撑能力。与此同时，测试技术由被测体的业务与技术变革所牵引，从瀑布式跟进服务端单体的纵向测试能力建设发展到敏捷化的端到端全链路测试，尤其强化了精析测试能力的作用。质量保障过程从点面支撑进化到立体保障，复杂度从服务端向移动端迁移。

03

目前最全，可视化数据工具大集合

数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元元素表示，大量的数据集构成数据图像，同时将数据的各个属性值以多维数据的形式表示，可以从不同的维度观察数据，从而对数据进行更深入的观察和分析。图表库 C3 – 以 d3 为基础构建的可重用图表库 Chart.js – 带有 canvas 标签的图表 Chartist.js – 具有强大浏览器兼容能力的响应式图表 Dimple – 适用于业务分析的面向对象的 API Dygraphs – 适用于大型数据集的交互式线性图表库 Echarts – 针对

07

每日论文速递 | [NeurIPS'23 Oral] DPO：Language Model 是一个 Reward Model

摘要：虽然大规模无监督语言模型（LMs）可以学习广泛的世界知识和一些推理技能，但由于其训练完全不受监督，因此很难实现对其行为的精确控制。获得这种可控性的现有方法通常是通过人类反馈强化学习（RLHF），收集人类对各代模型相对质量的标签，并根据这些偏好对无监督语言模型进行微调。然而，RLHF 是一个复杂且经常不稳定的过程，首先要拟合一个反映人类偏好的奖励模型，然后利用强化学习对大型无监督 LM 进行微调，以最大限度地提高估计奖励，同时不会偏离原始模型太远。在本文中，我们介绍了 RLHF 中奖励模型的一种新参数化方法，它能以封闭形式提取相应的最优策略，使我们只需简单的分类损失就能解决标准的 RLHF 问题。由此产生的算法我们称之为直接偏好优化（DPO），它稳定、性能好、计算量小，在微调过程中无需从 LM 中采样，也无需进行大量的超参数调整。我们的实验表明，DPO 可以对 LM 进行微调，使其与人类偏好保持一致，甚至优于现有方法。值得注意的是，使用 DPO 进行的微调在控制代际情感的能力上超过了基于 PPO 的 RLHF，并且在总结和单轮对话中达到或提高了响应质量，同时在实现和训练方面也要简单得多。

01

大型语言模型（LLMs）是怎样“学习”的？一封给网络工程师的大模型指南

数字时代，人工智能（AI）及其相关技术正日益成为许多领域的热门话题。其中，生成式人工智能（Gen AI）和大型语言模型（LLMs）引起了广泛的兴趣和讨论。然而，尽管这些术语在科技界和专业领域中频繁出现，网络工程师对其的理解却不多。

01

大语言模型的垂直应用：学术优化、房间设计、短视频创作、医学交流

本文介绍了几款开源项目，包括学术优化、房间设计、短视频创作和医学交流等领域。这些项目通过图形交互界面、AI技术和大型语言模型等特点，为用户提供了便捷、创新的解决方案。无论是提升学术写作质量，重新设计房间，还是实现自动化的短视频创作，甚至获取个人私人医学建议，这些开源项目都能帮助用户提高效率、获得更好的体验和创意。

02

吃了这些数据集和模型，跟 AI 学跳舞，做 TensorFlowBoys

场景描述：利用深度学习算法 GAN 可实现动作追踪与迁移，将某人物动作复制到其他人，应用到舞蹈领域，人人皆可成舞王。

03

解读 | 如何用进化方法优化大规模图像分类神经网络？

机器之心原创作者：Angulia Chao 参与：Joni、侯韵楚、高振让机器具备生物一样的进化能力一直是计算机科学的一个热门研究领域，今年三月份，谷歌的多位研究者提出了一种图像分类器的大规模进化方法，机器之心也曾报道过这项研究，参阅：《深度 | 谷歌和 OpenAI 新研究：如何使用达尔文进化论辅助设计人工智能算法？》。研究发布之后，机器之心的技术分析师又对这项重要研究进行了更加深度细致的解读。论文：图像分类器的大规模进化（Large-Scale Evolution of Image Classi

吃了这些数据集和模型，跟 AI 学跳舞，做 TensorFlowBoys

场景描述：利用深度学习算法 GAN 可实现动作追踪与迁移，将某人物动作复制到其他人，应用到舞蹈领域，人人皆可成舞王。

02

抖机灵的VR解决方案|实现3D追踪、提高刷新率、保证图像渲染质量

这些方案，一定程度上能帮助解决VR体验现存的帧率不足、刷新率与图像分辨率不够高、成本昂贵、设备不够便捷等问题。

02

19个超赞的数据科学和机器学习工具，编程小白必看！（附资料）

编程是数据科学的一个组成部分。事实上，理解编程逻辑、循环和函数的人更有可能成为成功的数据科学家。但那些在学校里从未学习过编程的人怎么办？

03

机器学习数据工程的概述

【导读】大家好，我是泳鱼。近些年AI大佬吴恩达老师一直在倡导“以数据为中心的AI”（Data-centric Artificial Intelligence，DCAI），以此希望AI研究者重视数据样本的重要性，将目光从以模型为中心转向以数据为中心。简单来说，也就是数据工程，研究如何提升数据质量及数量，以提升模型性能！

02

AI换脸无法识别？这里有个方法

现在，操纵视觉内容已经很普遍，也是数字社会中最重要的话题之一。比如，DeepFakes 展示了如何使用计算机图形学和视觉技术进行视频换脸，进而破坏别人的声誉。人脸是目前视觉内容操纵方法的主要兴趣点，这有很多原因。首先，人脸重建和追踪是计算机视觉中比较成熟的领域，而它正是这些编辑方法的基础。其次，人脸在人类沟通中起核心作用，因为人脸可以强调某个信息，甚至可以传达某个信息。目前的人脸操纵（facial manipulation）方法分为两类：面部表情操纵和面部身份操纵（见图 2）。最著名的面部表情操纵技术之一 Face2Face 来自于 Thies 等人 [48]。它可基于商用硬件，将一个人的面部表情实时迁移至另一个人。后续的研究（如《Synthesizing Obama: learning lip sync from audio》[45]）能够基于音频输入序列使人脸动起来。《Bringing portraits to life》[8] 可以编辑图像中的面部表情。

04

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭