当前位置: 首页 > 科技资讯 > 字节豆包模型双升级:语音视觉齐飞跃,综合性能增强20.3%

字节豆包模型双升级:语音视觉齐飞跃,综合性能增强20.3%

发布时间:2024-10-08 03:00:08 作者:电子资源网 阅读:1次

近日,火山引擎在2024年8月21日于上海举办的AI创新巡展上,隆重介绍了豆包大模型的全面升级情况,此次升级旨在进一步提升模型性能与应用场景的广泛性。

字节豆包模型双升级:语音视觉齐飞跃,综合性能增强20.3%

同时,火山引擎也展示了其对话式AI实时交互解决方案的最新进展,强调了在用户体验与交互效率上的显著优化,彰显了其在AI技术创新与应用落地方面的强劲实力。

豆包大模型自5月15日发布以来,日均tokens使用量已超5000亿,企业客户使用量增长22倍。新版豆包大语言模型的综合能力提升了20.3%,其中角色扮演能力提升38.3%,语言理解能力提升33.3%。

其中,豆包·文生图模型对长文本有更精准的图文匹配能力,多主体、多位置、手部结构等复杂场景的生图能力更强,更善于理解中国特色元素,创造更具美感的中国风图片。豆包·语音识别模型基于大语言模型丰富的知识和推理能力,通过上下文感知,提升语音识别准确性,在多个公开测试集中,与国内公开发布的语音识别大模型相比,错误率最高降低40%;支持一个模型识别普通话和粤语、上海话、四川话、西安话、闽南语等方言。豆包·语音合成模型升级了流式语音合成能力,能够实时响应、精准断句,支持“边想边说”。

此外,火山引擎发布对话式 AI 实时交互解决方案,该方案整合了豆包大模型和实时音视频(RTC)技术,提供端到端的大模型实时对话方案。企业可以轻松地在自己 AI 应用中嵌入该实时语音功能,用户不仅能用语音与 AI 进行交谈,还能像平时说话一样,在对话过程中适时打断或插话,经过升级后的 AI 声音具备较好表现力和感情色彩,对话更自然、更真实、更流畅,让大模型交互体验更强。

火山引擎还宣布与多点DMALL联合成立零售大模型生态联盟,旨在推动零售行业智能化升级,加速行业创新步伐。首批18家成员单位参与了启动仪式。此外,汽车大模型生态联盟也迎来了新成员,火山引擎正与联盟成员在AI汽车行业定义、评测标准发布等方面进行协作。

PICO发布新款体感追踪器:适配超20款游戏,一键快速配对,售价399元起

9月3日消息,字节跳动旗下PICO品牌的体感追踪器现已正式上市销售,此设备高度兼容,能够与超过20款应用完美适配,且设计了极为便捷的开机自动配对功能,极大地提升了用户体验的流畅度。该追踪器市场定价为人民币399元,性价比优势凸显,为VR爱好者及健身游戏群体提供了全新选择。

PICO发布新款体感追踪器:适配超20款游戏,一键快速配对,售价399元起

整理 PICO 体感追踪器亮点信息如下:

据介绍,该款体感追踪器接入 VRChat,搭载 1 颗 IMU 传感器和 12 颗红外传感器,追踪频率 200Hz,同时内置 PICO 自研 AI 追踪算法,支持全身动作捕捉。

PICO 体感追踪器支持 PICO 4 Ultra / 4 Pro / 4 / Neo3 使用(非中国市场不兼容 PICO Neo3),已适配国内超 20 款应用,可通过 PICO 互联 App,串流游玩 PC VR 部分体感游戏。

该体感追踪器采用轻量化设计,内置多模态融合追踪方案,底座和主体总重约 27g,支持开机自动配对,用户通过佩戴 2 个腿部追踪器,可实现全身 24 个骨骼节点的 6DoF 动作捕捉。

官方表示,PICO 体感追踪器全身动作捕捉延时约 20 毫秒,平均位置误差约 5 厘米,平均角度误差约 6 度,脚踏识别精准度≥98%,续航超 25 小时。

PICO 4 Ultra MR头显震撼发布:字节跳动打造双目彩色透视,售价定格4299元

8月20日消息,在今日举办的PICO 2024新品发布会上,字节跳动旗下的PICO品牌震撼推出了其最新产品——PICO 4 Ultra MR混合现实一体机,标志着PICO在扩展现实领域的又一次重大飞跃。

PICO 4 Ultra MR头显震撼发布:字节跳动打造双目彩色透视,售价定格4299元

PICO 4 Ultra 采用后置电池设计,后侧整体重量为 276 克,前端主体重量为 304 克,很好地做到了前后平衡。此外,新手柄采用无灯环设计。

PICO 4 Ultra 搭载专为 MR 混合现实打造的三类精密传感器,包括四颗环境追踪摄像头、双目 3200 万彩色透视摄像头、iToF 深度感知摄像头。支持 800 万像素立体高清色彩透视,拥有 72 Hz 刷新率,可实现低畸变透视。支持实时环境感知,物体类别判断。

PICO 4 Ultra 搭载第二代骁龙 XR2 平台,辅以 12GB 内存,GPU 性能相比 PICO 4 提升 2.5 倍,AI 性能提升 8 倍。

PICO 4 Ultra 搭载双目 4K+ (4320×2160)超视感屏,支持 90Hz 刷新率,拥有更接近原生的 1920*1920 渲染分辨率,相比 PICO 4 提升超过 62%。

PICO 4 Ultra 支持全新的多任务窗口操作功能 —— 全景屏工作台,多任务窗口以 360° 的环形呈现,最多支持 20 个应用同时开启,最大窗口尺寸 280 英寸。可实现手柄、手势和键盘鼠标(今年四季度推送)的人机交互,全面兼容安卓应用生态,而这个全景屏工作台的背景既可以选择沉浸式的背景,也可以选择透视模式,还可以实现 AIGC 虚拟场景的自定义生成。

PICO 4 Ultra 支持手机镜像,可在头显上显示与操作手机,iPhone 与 Android 手机双兼容。PICO 4 Ultra 还支持 Windows / Mac 双桌面兼容的桌面互联,还可以实现多桌面的同时显示。

PICO 4 Ultra 支持高清晰度、低延迟的游戏串流,支持 6K 超清晰的游戏体验、Wi-Fi 7 无线串流传输延时低至 5ms 、1000Mbps 有线串流码率、AV1 编解码。

PICO 4 Ultra 支持空间视频,兼容苹果设备拍摄的空间视频与照片,支持编辑空间视频,并一键发布到抖音。

PICO 还宣布开放应用商店,将于 2024 下半年内逐步完成。PICO 还和佳能一起合作,推动空间视频 MR 的 OGC / PGC / UGC 的内容生态。此外 PICO 视频还能实现空间视频特效的功能,还支持在抖音平台上支持 2D 转 3D 内容生成和上传。

PICO 还推出了 PICO 体感追踪器,售价 399 元(两个),仅重 27g,具备 25 小时的续航能力。具备开机自动配对的全自动校准能力,搭载多模态融合追踪方案,实现高精度低延时的全身动作捕捉。PICO 现场还介绍了多款支持 PICO 体感追踪器的健身、游戏、社交 XR 应用中的具体应用场景,目前已有超过 20 款游戏支持 PICO 体感追踪器。

PICO 4 Ultra 售价 4299 元(12GB+256GB),8 月 20 日开启预订,9 月 2 日 10:00 正式开售,首发送体感追踪器。PICO 还推出了 PICO 4 Ultra 企业版,售价 7499 元,9 月 3 日正式开售。

渝ICP备20008086号-14 违法和不良信息举报/未成年人举报:dzjswcom@163.com

CopyRight©2003-2018 违法和不良信息举报(12377) All Right Reserved