当前位置：首页 > 软件资讯 > 《腾讯智影》PC端迎来创意升级：“智能画布”登场，支持再创作、抠图、消除、扩图等

《腾讯智影》PC端迎来创意升级：“智能画布”登场，支持再创作、抠图、消除、扩图等

发布时间：2024-08-08 00:00:34 作者：电子资源网阅读：3次

近日消息，腾讯智影PC版近期引入了“智能画布”新特性，该功能集成了先进的AI图像处理技术，为用户带来一系列高效图片编辑工具。它极大地方便了那些需对AI生成图像进行二次创作、精细抠图、元素移除、尺寸拓展等操作的用户，使图形设计工作流程更为顺畅自如。

用户可以通过智影首页的“智影小工具”找到“智能画布”功能，选择一个画布尺寸并上传图片。智影提供了多款预定尺寸，并允许用户根据需求自定义画布尺寸。上传的图片可以是用户自己上传的，也可以是AI绘画生成的图片。

在画布中，用户可以利用左侧边栏的工具进行图片编辑，包括添加文字、使用丰富的素材贴纸等。此外，智能画布还提供了AI绘画的文生图和图生图功能，允许用户直接在画布中进行AI创作。

智影的智能画布功能还包括以下图片AI调整功能：

图片裁剪：允许用户将图片裁剪成所需尺寸。

智能抠图：AI自动识别并抠图，或让用户选择特定部分进行抠图。

智能消除：去除图片中不想要的元素。智能扩图:对图片进行扩展，补全缺失部分。

局部重绘：对图片的局部区域进行重绘，如将背景元素替换。无损高清:对模糊的老照片进行高清翻新。

这些功能使得智影的智能画布成为一个强大的图片编辑和创作工具，适合各种创意和专业需求。用户现在可以登录智影首页，体验这些新功能。

近日消息，腾讯AI实验室近期展示了其前沿项目VTA-LDM，这一创新技术能够实现从视频输入到同步生成对应音频的跨越。通过深度学习与模式识别的融合，VTA-LDM系统能够精准捕捉视频中的动态元素，将其转化为高度匹配的音频输出，实现了视频内容与声音信息的无缝对接。

腾讯AI实验室VTA-LDM：开创视频到对齐音频的革新之路

VTA-LDM模型的核心理念是通过隐含对齐技术，使得生成的音频与视频内容在语义和时间上相匹配。这一方法不仅提升了音频生成的质量，还扩展了视频生成技术的应用场景。研究团队在模型设计上进行了深入探索，结合了多种技术手段，以确保生成音频的准确性与一致性。

该研究着重分析了三大关键方面：视觉编码器、辅助嵌入和数据增强技术。研究团队首先建立了一个基础模型，并在此基础上进行了大量的消融实验，以评估不同视觉编码器和辅助嵌入对生成效果的影响。这些实验的结果显示，模型在生成质量和视频与音频同步对齐方面表现出色，达到了当前技术的最前沿。

在推理方面，用户只需将视频片段放入指定的数据目录，并运行提供的推理脚本，即可生成对应的音频内容。研究团队还提供了一套工具，可以帮助用户将生成的音频与原始视频进行合并，进一步提升了应用的便利性。

VTA-LDM模型目前提供了多个不同的模型版本，以满足不同的研究需求。这些模型涵盖了基础模型和多种增强模型，旨在为用户提供灵活的选择，以适应各种实验和应用场景。

VTA-LDM模型的推出标志着视频到音频生成领域的一个重要进步，研究者们期望通过这一模型推动相关技术的发展，开创更加丰富的应用可能性。

近日消息，我国的“北京中轴线——中国理想都城秩序的杰作”成功入选《世界遗产名录》，这一成就标志着我国的世界遗产总数上升至59项，再次彰显了中华文化的博大精深与历史传承的价值。

腾讯《数字中轴·小宇宙》上线：3D数字化中轴线，历史建筑跃然眼前

据腾讯介绍，北京中轴线申遗成功后，腾讯“数字中轴·小宇宙”正式上线，为全球用户提供迄今为止规模最大的古都景观沉浸式数字体验。

用户通过微信小程序云上中轴访问数字中轴·小宇宙，在虚拟角色的引导下身临其境地自由探索北京地标。数字中轴·小宇宙以3D形式复现了北京中轴线上的历史建筑，逼真的细节令人叹为观止。

用户还可以“穿越”历史，游览目前已经损坏或现实中已不复存在的场景。

据了解，数字中轴·小宇宙历时三年，采用高清照扫、建模、PCG自动生成等游戏科技。

复杂的五级地图模式覆盖面积达200kmX200km，包括30万种植物和220万处建筑，以及各种山丘和水景。该虚拟空间实时运行资产总面数达到104亿，三维数据资产制作量超过15TB。

热门文章

应用排行游戏排行

热门合集