7月6日下午,由搜狐科技主办的《中国创新公司100》沙龙第二期圆满结束。清华大学人工智能研究院听觉智能研究中心主任郑方教授,声智科技联合创始人兼首席知识官常乐,以及科大讯飞AI研究院副院长陈志刚,共同探讨了智能语音技术的未来发展趋势,并分享了他们对智能语音商业化的深入见解。
《中国创新公司100》是搜狐科技今年全新推出的栏目,重点关注5G、人工智能、芯片、制造、出行、零售和社交等领域的技术与商业模式创新,致力于深入挖掘相关行业和优秀创新公司的潜在价值。
目前,人工智能正处于第三波浪潮,迎来了加速发展的机遇。智能语音作为人工智能领域最成熟的技术之一,近年来得到了迅猛应用。搜狐科技已经发布了该领域的首个人工智能行业榜单,并计划在未来推出涵盖计算机视觉、机器人等领域的系列榜单和深度报道。
在本次沙龙中,郑方教授强调了语音技术和市场需求分析的重要性。他指出,单一技术已难以应对市场挑战,融合发展成为必然趋势,但必须确保融合是有意义的。他呼吁,技术与市场应形成良性互动,以避免智能语音行业的恶性竞争。
常乐表示,经过行业的洗礼,智能语音领域将迎来几何倍数的增长。在应用前景方面,B端市场将比C端更为领先,拥有更广阔的市场空间。同时,良好的市场前景将促进新一轮技术创新的产生。
陈志刚提到,当前智能语音技术在算法和数据方面亟需突破,联合建模被认为是最佳解决方案。在激烈的市场竞争中,企业需选择合适的赛道,进行差异化竞争,并具备核心技术的产品创新思维。

清华大学人工智能研究院的郑方教授(左)和声智科技的常乐(右)现场参与沙龙活动。
数据和算法需突破,避免形式化融合
许多观点认为,人工智能正处于深水区,根据Gartner技术曲线,这被视为泡沫破灭期。郑方指出,当前语音领域同质化问题严重,技术方法的高度相似导致市场竞争的恶性循环。
他解释说,技术跟踪往往过于依赖他人的成熟方法,而缺乏针对特定问题的深度分析和创新解决方案。
从技术发展的角度来看,数据、算力和算法是推动人工智能快速发展的三大基本因素。陈志刚认为,智能语音领域在数据和算法上仍需重大突破,许多应用场景受到数据稀缺的限制。
在算法方面,陈志刚提到一些亟待解决的技术难题,包括声学降噪、声学信号处理和麦克风阵列算法等。这些突破是解决当前语音技术挑战的关键。
当前,单一技术已难以支撑人工智能企业在竞争中脱颖而出,多模态融合发展已成趋势。
郑方指出,尽管技术重要,但过度依赖技术是不明智的。技术的发展离不开市场的支持,市场需要的是有效的解决方案,而单一技术难以满足这一需求,这也是许多AI公司面临困境的原因。
他强调,市场真正需要的是综合解决方案,融合应以解决问题为导向,服务于用户,而非仅仅追求形式上的融合。
常乐认为,语音、图像和大数据等技术的有效融合应基于市场需求,技术开发者应以解决用户真实痛点为目标,而不是追求技术的自我满足。
然而,智能语音发展仍面临许多挑战。常乐指出,理论研究需进一步拓展,例如对耳蜗的深入研究;技术和市场的创新仍存在瓶颈,但二者可以相辅相成,良好的市场应用前景能促进新的技术创新。
陈志刚分享了技术融合的策略,他认为,语音基础上结合自然语言理解、视觉、知识构建及推理技术等,需深入分析每项技术的融合价值,并选择适合的应用场景进行联合建模。
语音赛道将经历洗礼,应避免恶性竞争
人工智能作为技术工具,只有在实际场景中才能体现其价值,这需要技术产品化和市场化的过程。许多智能语音企业正在积极转型,向上游延伸至AI芯片和操作系统,或向下游渗透至智能硬件。
郑方表示,企业应根据自身优势和市场需求进行主动转型,而不是在资本压力下被动转型,这是不可取的。
陈志刚认为,这种转型趋势在一定程度上是必然的,有助于加快产业发展,特别是在当前国际形势下,增加自主研发投入,避免被卡脖子。
常乐则指出,智能语音市场已进入泡沫期,将在经历洗礼后迎来几何倍数的增长,留下新技术和应用。企业在这一广阔市场中进行探索是积极的,即便面临挑战,但潜藏着巨大的机遇。
在商业模式方面,人工智能领域基本形成了四大路线:售卖技术、产品、服务和解决方案。郑方认为,商业模式的成败取决于市场需求的把握、技术的成熟度和行业竞争程度。
陈志刚认为,适合公司发展的模式就是好的模式,企业在不同阶段应有相应的商业模式或组合。目前,国内许多优质AI产品和解决方案更易打动客户,真正了解行业和用户的企业能够开发出有价值的技术或产品。
在落地路径上,常乐认为,企业在向C端市场推广时,更应关注产品能带来的实际价值,而非技术的先进性。她还表示,B端市场蕴含着C端无法看到的巨大价值,智能语音将在B端领域更具优势,市场应用空间广阔。

科大讯飞AI研究院副院长陈志刚通过线上方式参与沙龙。
陈志刚认为,智能语音未能在医疗和工业等行业规模化应用的原因在于这些领域的数据积累和信息化水平较为滞后,另一方面,技术尚未达到理想的实用状态,这需要一个迭代优化的过程,可能需要几个月到几年的时间。
最后,三位嘉宾分享了对智能语音行业竞争的看法,互联网科技巨头的影响不可忽视。郑方指出,尽管巨头在资金、人才、数据、算法和算力上具备优势,但小企业同样有发展空间,只要选择正确的方向并合理运用资源,便可在竞争中站稳脚跟。他呼吁,当前中国的智能语音行业仍相对小众,企业在发展初期应避免恶性竞争。
常乐认为,智能语音市场正处于崛起阶段,未来将有足够的市场空间容纳许多企业,包括大型企业与小型创业公司,但创业公司需准确定位以便在市场中立足。
陈志刚表示,在激烈的市场竞争中,企业应选择合适的赛道,并具备核心技术的产品创新思维。对于已较为成熟的赛道,企业需选择加入科技巨头的生态,或专注于核心技术和产品创新,但这需要一定的颠覆性和创新性,以及相应的技术壁垒。
