【48812】电梯、地库里通话不卡顿腾讯主导新一代规范 AVS3P10 行将发布

来源:m6米乐在线入口    发布时间:2024-06-28 04:22:58

  IT之家 6 月 27 日音讯,腾讯今天宣告,该企业主导的新一代实时语音编码行业规范

  此次 AVS 音频组 AVS3P10 规范采用了腾讯侧计划,以腾讯会议首款自研神经网络语音编解码器 Penguins AI 语音引擎为原型,可提高弱网环境下的通话质量。

  腾讯介绍称,这是全球首个体系性引进人工智能并完结低码率下高质量语音编码规范,体现到达世界一流水准。仅需 1/3 的编码码率,就能完结和现有干流规范平等明晰的音质。“即便网络卡如 2G,也能顺利开会”。

  该规范由腾讯提议发动、推进和保护,通过 AVS 音频组多家成员单位一同奉献。“往后在线上会议、语音通话等实时音频场景,带宽要求大幅度下降。即便在电梯、地库、地道等网络很差的环境,也能完结明晰流通的语音通话。”

  据介绍,在有限的带宽条件下,想要将声响高质量传递到接收方,紧缩原始数据、去除冗余信息的语音编码技能是其间要害。但是,根据 EVS、OPUS 等现有干流音频编解码规范,当码率下降到 10kbps 以下时,语音质量下降显着,影响用户体会。

  为应对该应战,腾讯会议天籁实验室联合腾讯 AI Lab 自研了腾讯首款神经网络语音编解码器 ——Penguins。

  具体来说,Penguins 将 AI 与传统技能交融,打破传统香农规律的功能极限,引进大数据并在可控算力增量下供给了新的功能上界,从而对下一代通讯体系,尤其是信源编码器部分,供给了新的技能根底和方法论。通过 AI 语音信号建模,提取最中心的特征参数编码,再凭借深度学习网络,猜测并重建语音中的纤细结构,终究生成传神的音频波形。 多方测验标明,腾讯提交的 AVS3P10 规范完结了 6kbps 下的高质量语音通讯,即便在“2G”网络下也能完结明晰通话,且片面质量十分挨近原始参阅信号,比美世界干流的 OPUS 规范在 20kbps 的质量。一同,片面质量对标传统编码的中高码率情况下,编码功率提高 200-300%。

  2021 年起,Penguins 音频编码器就在腾讯会议的驾驭形式、弱网形式及 QQ 语音通话等场景中投入规划使用。

  2023 年 3 月,腾讯团队在 AVS 音频组提议并参加规范拟定,即 AVS3P10 实时语音编码规范。随后,腾讯提交根据 Penguins 的候选技能;通过 AVS 音频组穿插验证后采用。2024 年 6 月,AVS3P10 实时语音编码规范正式完结规范化作业,进入公示阶段。

  IT之家注:从 2002 年 6 月我国建立 AVS 作业组开端,十多年来上千人的团队尽力,我国自主知识产权的 AVS 应运而生。AVS3 是全球首个已推出的面向 8K 及 5G 工业使用的视频编码规范。

  AVS 世界组长郑建铧此前泄漏,AVS 现已发动 AVS4 的规范拟定,并呼吁 AVS 成员单位持续支撑 AVS 下一代规范开发作业,各个厂商联合起来,一同完结技能规范一同出海,推进全球化布置。

上一篇: 谁在制造行业寒冬和焦虑?乱云飞渡的口腔营销 行业观察
下一篇: 森赫电梯荣获2024中国上市公司“创新奖”

推荐阅读