[endif]-->;

通知公告

首页

    通知公告

    当前您的位置: 首页 - 通知公告 - 正文

    关于威廉希尔中文官网举办第八期“数字农业大讲堂”的通知

    日期:2025-07-21作者: 浏览量:

    1.报告题目:Large Audio-Language Models and Applications

    2.报告内容:大型语言模型(LLMs)正被探索应用于音频处理领域,旨在解析并生成复杂声音数据中的有意义模式,包括语音、音乐、环境噪声、音效及其他非语音类音频;结合声学模型后,LLMs展现出解决音频字幕生成、音频合成、源分离和音频编码等多样化问题的巨大潜力。本次报告将阐述利用LLMs应对音频挑战的最新进展,涵盖语言-音频映射对齐模型、跨音频任务的实际应用、语言-音频数据集构建方法以及语言-音频学习的未来发展方向;现场将展示我们近期研究成果,例如用于音频生成与叙事的AudioLDM、AudioLDM2和WavJourney,用于音源分离的AudioSep,用于音频字幕的ACTUAL,用于音频编码的SemantiCodec,用于内容创作编辑的WavCraft,用于音频推理的APT-LLMs,以及用于训练评估大规模语言-音频模型的数据集WavCaps、Sound-VECaps和AudioSetCaps。

    3.专家介绍:王文武(Wenwu Wang),英国萨里大学信号处理与机器学习教授、计算机科学与电子工程学院负责对外交流与合作的副院长。同时担任萨里以人为本人工智能研究所AI研究员。他的研究聚焦信号处理、机器学习与感知、人工智能、机器听觉(聆听)及统计异常检测领域,合作发表相关论文400余篇。研究成果获多项国际奖项,包括2022年IEEE信号处理学会青年作者最佳论文奖、ICAUS 2021最佳论文奖、DCASE 2020及2023评委奖、DCASE 2019及2020可复现系统奖、LVA/ICA 2018最佳学生论文奖。

    他现任IEEE信号处理开放期刊高级区域编辑(2025-2027)及IEEE多媒体汇刊副主编(2024-2026),曾任IEEE信号处理汇刊高级区域编辑(2019-2023)与副主编(2014-2018)以及IEEE/ACM音频语音与语言处理汇刊副主编(2020-2025)。2023-2024年担任IEEE信号处理学会机器学习信号处理技术委员会主席及该学会技术方向理事会理事,现任EURASIP声学语音音乐信号处理技术委员会主席(2025-2027)并任IEEE信号处理学会信号处理理论与方法技术委员会委员(2021-2026)。他参与组织INTERSPEECH 2022、IEEE ICASSP 2019与2024、IEEE MLSP 2013与2024及IEEE SSP 2009等会议,现任IEEE MLSP 2025技术程序联席主席,20余次国际会议特邀主旨报告人。

    4.专家照片:

    5.报告时间:2025 年 7 月 24日(星期四)上午9:30

    6.报告地点:威廉希尔中文官网219会议室。

    欢迎广大师生踊跃参加!