LiveVideoStack Meet广州:音频技术与体验创新
收起
广州站沙龙将于3月5日与大家见面,本场沙龙主题为音频技术与创新体验。邀请到的讲师有:网易资深音频算法工程师-张龙、百度YY事业部资深音频算法专家-陈超、荔枝资深音频研发工程师-丁勇竣及虎牙AI基础技术部高级语音算法工程师-陀得意。
活动时间
2022年3月5日 14:00-16:30
活动地址
广东省广州市天河区黄埔大道309号羊城创意园3-02荔枝App
讲师与议题
张龙,就职于网易智企 云信音视频实验室,毕业于中国科学技术大学信息与通信工程专业,获博士学位,主要研究和业务落地领域:语音增强和阵列语音信号处理。在音频领域发表学术文章5篇,申请相关专利6项。目前从事音频信号增强和动态增益控制等研发工作。
Topic 1:实时通信服务中的语音解混响算法实践
随着音视频通信会议越来越普及,与会各方会在不同环境中遇到越来越明显和有差异的混响场景,譬如大会议室、玻璃会议室和小房间且隔音材料不佳场景等。为了保证更好的听音可懂度和舒适度,通信中的语音解混响需求显得愈来愈重要且紧迫。
本次演讲将分享网易云信在语音解混响提升通信效果方面的一些研发进展和观点,重点研究基于自适应结合双麦相关性的方案,总体目标在尽量保真语音下提升解混响效果。
陈超,曾经任职于bigo、多益网络、小度科技等公司,长期专注音频算法和架构相关工作,目前担任百度YY事业部资深音频算法专家。具有丰富的音频3A算法经验和音频知识。研发成果应用于小度在家,YY直播等产品。
Topic 2:信号处理音频算法结合深度学习方法的开发框架
介绍如何将信号处理和声学知识与深度学习结合,应用在实时通话场景;当下,深度学习逐渐成为音频算法的开发的主流,如何将过去信号处理的知识和深度学习工具结合是一个重要的话题。分享内容首先阐述当前音频算法开发中传统方法和深度学习方法的发展动向。其次,介绍音频数据生成框架,说明数据框架如何服务深度学习算法。最后,展示YY RTC中音频算法的处理框架和效果。
丁勇竣,荔枝资深音频研发工程师。2018年加入荔枝,主负责录播和直播音频引擎技术研发,荔枝doreme实时语音通信技术的模块设计和功能开发,对流媒体传输及其处理有较丰富的工程经验。
Topic 3:荔枝声音直播技术的演变
随着语音直播业务产品形态的不断变化,从早期的单人直播,到直播加连线,再发展为多人实时互动语聊,推拉流技术也在不断更迭。本演讲将分享荔枝声音直播技术与业务需求的共同演进的历程及其一些关键问题的思考和实战经验。
陀得意,曾经任职于腾讯 AIPD & AILAB,目前担任虎牙AI基础技术部高级语音算法工程师,主要从事语音算法的预研和落地工作,以多模态合成算法为主,兼顾理解类(说话人识别和增强)算法。研发成果应用于企鹅极光盒子、数字人艾灵、虎牙直播等产品。
Topic 4:多模态语音内容生成算法实践
随着直播产品在弹幕智能化交互、云游戏、虚拟开播、元宇宙等内容场景的深耕和玩法探索,智能化的语音内容生成能力在其中发挥着越来越重要的作用。本次演讲将分享虎牙AI语音团队在智能化的语音内容生成技术中的研发和实践。首先,阐述直播产品下语音内容生成技术的背景和挑战;然后,重点介绍团队在 多情感、多语音、小数据量的语音合成,语音转换,语音驱动数字人,音乐智能 等技术上的研发进展和观点;最后,对未来工作进行展望。
圆桌:全景声学与沉浸体验
全景声学作为沉浸体验的关键一环,如何真的实现元宇宙的愿景?这里涉及到技术实现,包括硬件到软件,还与行业痛点与场景息息相关。如何找准定位,让全景声学尽快落地。
关于我们
LiveVideoStack是专注在音视频领域的技术社区,聚焦在音频、视频、图像等技术的最新探索与应用实践,覆盖教育、娱乐、医疗、安防、旅游、电商、社交、智能设备等行业领域,旨在推动相关开源项目与最佳实践普及和传播,让技术改变我们的交流、学习、娱乐和工作。
关于LiveVideoStack Meet你可以查看此文档(https://shimo.im/docs/gVygrWtq9K9CPg9P),我们会在此更新各个城市的活动信息、报名入口以及城市特使名单等。
如果你想在LiveVideoStack Meet上输出talk、参与讨论,请联系 editors@livevideostack.com 。
咨询电话(同微信):13691133797
市场合作:media@livevideostack.com
(2年前)
(2年前)
(2年前)
(2年前)
(2年前)
(2年前)