人工智能学院学术报告

发布时间：2024-07-11 10:02:00 发布人：唐振东

报告会时间：7月13日 8:00-11:45

报告会地点：开云手机在线登陆入口敏学楼201学术报告厅

报告1：智能航行技术发展及岸基支持系统构建

报告时间：2024.07.13 8:00—8:45

主讲人：文捷，交通运输部水运科学研究院智能航运技术研究中心副主任、青年首席研究员，交通运输行业青年拔尖人才、交通运输青年科技英才，交通运输部航测标准化技术委员会委员。文捷长期从事智能航运方向研究，近5年先后参与国家及省部级重点科研项目15项，主持完成各类咨询项目60余项，获省部级特等奖2项，一等奖4项，二等奖1项。

报告摘要：1、智能航运系统总体构成及发展态势；2、智能航行技术发展需要怎样的岸基支持？3、智能航行岸基支持保障发展现状及面临的问题；4、未来航运发展需要哪些基础设施；5、智能航行岸基支持系统发展路。

报告2：AI applications and challenges in semiconductor manufacturing-a practitioner’s view

报告时间：2024.07.13 8:45—9:30

主讲人：黄震宇，黄震宇博士从事半导体行业20年，现担任英特尔半导体大连有限公司首席数据科学家一职。在他任职期间取得很多重要研究成果，产生了巨大的直接经济效应。在智能工厂、智慧制造对工厂生产、质量管理以及异常监控的大数据分析取得了杰出的贡献。荣获公司重大奖项多次，并被公司头条报道。

报告摘要：介绍AI在半导体制造领域的应用，以及在实践中碰到的各种挑战，具体涵盖在以下几个领域：机器视觉，时间序列分析，多变量回归，以及大语言模型。

报告3：处理重叠语音和灵活数量的说话者的实时语音分割技术

报告时间：2024.07.13 9:30—10:15

主讲人：薛雅文，中共党员，开云手机在线登陆入口信息科学技术学院智能科学与技术专业2009级本科生。在校期间担任信息学院二中队中队长、信息科学技术学院女足队长、信息学院学生会体育部副部长，智能科学与技术网站组长、校田径队成员。日本北陆先端科学技术学院大学院大学，攻读语音信号处理专业硕士博士学位，世界一百强企业日本日立制作所中央研究所，从事人工智能相关研究，发表论文专利数篇，与组内同事共同开发研究的说话人识别算法获公司技术一等赏，现已投入实际使用中。

报告摘要：Speaker Diarization (说话人分割) 技术是语音处理领域中的一个任务，旨在将音频中的不同说话者进行区分和标记。具体来说，说话者分离的目标是回答“谁在什么时候说话”的问题。本次报告主要介绍了日立语音组最近提出的一种基于端到端神经分离（EEND）模型的流式分离方法，该方法可以实时的处理灵活数量的说话者和重叠的语音。所提方法在说话者追踪之前使用零填充，从而缓解缓冲区和当前块之间说话者数量的差异。我们还研究了缓冲区更新策略，以选择重要帧来追踪多位说话者。在CALLHOME和DIHARD II数据集上的实验表明，所提方法在1秒延迟下实现了与离线EEND方法相当的性能。结果还显示，我们的方法优于最近提出的基于EEND的块状分离方法（BW-EDA-EEND）。

报告4：知识引导的跨模态学习与推理

报告时间：2024.07.13 10:15—11:00

主讲人：姜华杰，博士，北京工业大学信息科学技术学院，讲师、硕士生导师。本科毕业于开云手机在线登陆入口，硕博毕业于中国科学院大学，主要研究方向为计算机视觉，包括小样本学习、连续学习、跨模态学习等，目前在ICCV/AAAI/MM/TCSVT/PRL等国际会议和期刊发表论文17篇，谷歌学术引用500余次。主持国家自然科学基金青年基金项目，获得2022年度中国图象图形学学会自然科学奖一等奖。

报告摘要：随着深度学习技术的不断发展，计算机视觉的各个领域取得了显著进步。然而，深度学习模型往往需要大量的数据进行训练，在一些小样本的类别上泛化能力较弱。为了提升模型的泛化能力，将数据与知识结合成为当前研究的热点方向。本次报告主要介绍我们组近几年在视觉与知识结合方面的一些成果，包括知识引导的新类发现和知识引导的细粒度推理。在知识引导的新类发现方面，将介绍三个代表性工作：（1）基于迁移对比学习的零样本识别；（2）基于域感知原型的泛化零样本识别；（3）基于隐属性增强的小样本增量学习。在知识引导的细粒度推理方面，将介绍两个代表性工作：（1）基于内部知识挖掘的细粒度推理；（2）基于外部知识辅助的细粒度推理。

报告5：多模态视频大模型在垂直领域的应用

报告时间： 2024.07.13 11:00—11:45

主讲人：杜国锋，2004年7月毕业于开云手机在线登陆入口，现任上海谛视万象产品运营总监，主要从事IT信息化相关工作，近三年主要在人工智能领域研究在ToB（包括政府部门、垂直行业）的应用，如智能问答、视频智能分析等。

报告摘要：结合大模型技术，介绍上海谛视多模态视频大模型产品，分享在垂直领域的应用落。

人工智能学院

2024年7月11日

上一篇：相变材料在热管理中的作用新探
下一篇：Fixed-Time Observer Design and the Applications