当前位置: 首页 > 软件资讯 > 《腾讯智影》PC端迎来创意升级:“智能画布”登场,支持再创作、抠图、消除、扩图等

《腾讯智影》PC端迎来创意升级:“智能画布”登场,支持再创作、抠图、消除、扩图等

发布时间:2024-08-08 00:00:34 作者:电子资源网 阅读:1次

近日消息,腾讯智影PC版近期引入了“智能画布”新特性,该功能集成了先进的AI图像处理技术,为用户带来一系列高效图片编辑工具。它极大地方便了那些需对AI生成图像进行二次创作、精细抠图、元素移除、尺寸拓展等操作的用户,使图形设计工作流程更为顺畅自如。

《腾讯智影》PC端迎来创意升级:“智能画布”登场,支持再创作、抠图、消除、扩图等

用户可以通过智影首页的“智影小工具”找到“智能画布”功能,选择一个画布尺寸并上传图片。智影提供了多款预定尺寸,并允许用户根据需求自定义画布尺寸。上传的图片可以是用户自己上传的,也可以是AI绘画生成的图片。

在画布中,用户可以利用左侧边栏的工具进行图片编辑,包括添加文字、使用丰富的素材贴纸等。此外,智能画布还提供了AI绘画的文生图和图生图功能,允许用户直接在画布中进行AI创作。

智影的智能画布功能还包括以下图片AI调整功能:

图片裁剪:允许用户将图片裁剪成所需尺寸。

智能抠图:AI自动识别并抠图,或让用户选择特定部分进行抠图。

智能消除:去除图片中不想要的元素。智能扩图:对图片进行扩展,补全缺失部分。

局部重绘:对图片的局部区域进行重绘,如将背景元素替换。无损高清:对模糊的老照片进行高清翻新。

这些功能使得智影的智能画布成为一个强大的图片编辑和创作工具,适合各种创意和专业需求。用户现在可以登录智影首页,体验这些新功能。

腾讯AI实验室VTA-LDM:开创视频到对齐音频的革新之路

近日消息,腾讯AI实验室近期展示了其前沿项目VTA-LDM,这一创新技术能够实现从视频输入到同步生成对应音频的跨越。通过深度学习与模式识别的融合,VTA-LDM系统能够精准捕捉视频中的动态元素,将其转化为高度匹配的音频输出,实现了视频内容与声音信息的无缝对接。

腾讯AI实验室VTA-LDM:开创视频到对齐音频的革新之路

VTA-LDM模型的核心理念是通过隐含对齐技术,使得生成的音频与视频内容在语义和时间上相匹配。这一方法不仅提升了音频生成的质量,还扩展了视频生成技术的应用场景。研究团队在模型设计上进行了深入探索,结合了多种技术手段,以确保生成音频的准确性与一致性。

该研究着重分析了三大关键方面:视觉编码器、辅助嵌入和数据增强技术。研究团队首先建立了一个基础模型,并在此基础上进行了大量的消融实验,以评估不同视觉编码器和辅助嵌入对生成效果的影响。这些实验的结果显示,模型在生成质量和视频与音频同步对齐方面表现出色,达到了当前技术的最前沿。

在推理方面,用户只需将视频片段放入指定的数据目录,并运行提供的推理脚本,即可生成对应的音频内容。研究团队还提供了一套工具,可以帮助用户将生成的音频与原始视频进行合并,进一步提升了应用的便利性。

VTA-LDM模型目前提供了多个不同的模型版本,以满足不同的研究需求。这些模型涵盖了基础模型和多种增强模型,旨在为用户提供灵活的选择,以适应各种实验和应用场景。

VTA-LDM模型的推出标志着视频到音频生成领域的一个重要进步,研究者们期望通过这一模型推动相关技术的发展,开创更加丰富的应用可能性。

腾讯《数字中轴·小宇宙》上线:3D数字化中轴线,历史建筑跃然眼前

近日消息,我国的“北京中轴线——中国理想都城秩序的杰作”成功入选《世界遗产名录》,这一成就标志着我国的世界遗产总数上升至59项,再次彰显了中华文化的博大精深与历史传承的价值。

腾讯《数字中轴·小宇宙》上线:3D数字化中轴线,历史建筑跃然眼前

据腾讯介绍,北京中轴线申遗成功后,腾讯“数字中轴·小宇宙”正式上线,为全球用户提供迄今为止规模最大的古都景观沉浸式数字体验。

用户通过微信小程序云上中轴访问数字中轴·小宇宙,在虚拟角色的引导下身临其境地自由探索北京地标。数字中轴·小宇宙以3D形式复现了北京中轴线上的历史建筑,逼真的细节令人叹为观止。

用户还可以“穿越”历史,游览目前已经损坏或现实中已不复存在的场景。

据了解,数字中轴·小宇宙历时三年,采用高清照扫、建模、PCG自动生成等游戏科技。

复杂的五级地图模式覆盖面积达200kmX200km,包括30万种植物和220万处建筑,以及各种山丘和水景。该虚拟空间实时运行资产总面数达到104亿,三维数据资产制作量超过15TB。

渝ICP备20008086号-14 违法和不良信息举报/未成年人举报:dzjswcom@163.com

CopyRight©2003-2018 违法和不良信息举报(12377) All Right Reserved