2020年11月5日,小米成功召开了MIDC2020开发者大会。此次大会以“生活的科技”为主题,展示了小米在相机、屏幕、充电、AI、物联网及智能制造等多个领域的重要进展,彰显了其强大的技术实力。

在本次大会上,小爱同学5.0版本进行了五项重要升级,从传统的语音助手转变为智能生活助手,为消费者带来了更优质的智能生活体验。
小爱同学的三维虚拟形象在此次2020MIDC大会上首次亮相,与崔宝秋的流畅互动成为了大会的一大亮点。除了独特的虚拟形象,小爱同学5.0还增加了五项贴心功能,涵盖全场景智能协同、对话式主动智能、个性化情感语音、多模态视觉能力以及智能学习助手等方面。
得益于小米前瞻性的生态链布局,庞大的智能硬件产品为小米的AI技术实现提供了良好的基础。过去一年中,小米在视觉、声学、语音、自然语言处理、知识图谱及机器学习等领域均取得了显著进展。例如,超级夜景、魔法换天、魔法分身、Vlog、通话降噪及阵列增加等新技术已在最新发布的硬件中得到应用。
发布会后,小米集团人工智能部总经理叶航军、AIoT战略委员会副主席、人工智能部AI实验室主任王斌及副总经理王刚共同接受了媒体采访。
叶航军表示:短期内的目标非常明确,主要集中在两个方向:首先,AI产品及小爱同学要支持公司在智能生活的战略,特别是在手机与AIoT的结合上,确保这一目标得以顺利实现。
其次,在AIoT方面,六大技术方向都有清晰的业务及落地场景。尽管大家对AI寄予厚望,但仍面临许多技术问题需要解决,这是我们未来努力的方向。这是我们短期目标的核心。
王斌谈到动态语音识别技术时指出,该技术的模型更新非常迅速,语音识别会根据线上各种反馈进行动态调整。
当然,未来该技术还有很大的发展空间。不同的人在语音识别上的表现各异,有些人识别得较好,而有些人则相对较差。
王刚提到,多轮对话是小爱同学3.0版本的重要功能,自2018年3月启动研发至今,已接近三年时间。
在现有的技术框架下,我们使用AUS框架来处理用户自然语言,逐步优化多轮对话功能,在技术实现过程中遇到了一些挑战。
叶航军强调,最大的挑战在于人才。如果媒体朋友们关注到我们在MIDC上的演讲,就会明白小米的发展历程中,2016年是一个里程碑,首次将人工智能提升为公司战略,并成立了独立团队,此前的AI算法工程师分散在不同业务团队中。
王斌补充道,当前有很多开源的NLP工具,我们可以将其分为学术界和工业界的开源工具。
在设计这个系统时,我们借鉴了许多其他项目的经验,并在此基础上提出了我们的独特特点。
