由于Siri、Alexa和谷歌助手等产品的出现,语音技术在过去十年中取得了巨大的进步。但语音助手行业尚未发挥其全部潜力,它可以成为我们日常使用的许多应用程序不可或缺的一部分。

商业银行Progress Partners的创始人兼高级董事总经理尼克·麦克沙恩(Nick MacShane)表示,未来几年,我们将看到语音助手的新市场、新应用和新平台的出现,这些都将超出现有公司的能力范围。Progress Partners为新兴科技和媒体公司提供M&A、融资和特殊目的收购公司咨询服务。

在接受TechTalks采访时,麦克肖恩讨论了语音助手行业的前景,以及创新型创业公司如何在这个不断扩大的市场中留下印记。

语音助手行业将走向何方?

语音助手的大规模采用

语音助手已经有几十年的历史。但直到2011年苹果推出Siri后,它们才变得广泛可用。自那以后,市场一直在快速增长。微软和亚马逊分别在2014年发布了Cortana和Alexa。谷歌在2016年发布了其助手。而三星在2017年发布了Bixby。并不是所有的手机都同样成功,但是它们改变了人们使用手机的方式。

超过50%的美国家庭现在拥有智能音箱。据估计,美国有1.28亿人在使用语音助手。语音占在线搜索的相当大一部分,超过50%的搜索是针对本地企业的。语音助手在汽车和其他环境中的使用越来越多,在这些环境中,用户宁愿不看屏幕也不与屏幕互动。

更重要的是,所有这些数字都在逐年增长,这表明设备和应用对语音功能的接受度和期望值都在不断提高。语音助手市场的增长归功于几个因素:机器学习和深度学习的进步提高了语音转文本技术的准确性。自然语言处理(NLP)和大型语言模型的进步使得执行更复杂的命令成为可能。TinyML已经把语音推理从云端搬到了边缘。无处不在的计算和互联网连接将语音助手带到了我们的口袋、手腕和客厅。

当前语音助手的局限性

然而,不断扩大的语音助手市场也凸显了现有公司的一些缺点。

“虽然语音助手是有史以来增长最快的消费技术之一,但目前的用例相对简单,比如听音乐或设置定时器,”麦克肖恩说。“随着时间的推移,我们预计用户与语音技术交互的复杂性将会增加。”

随着用户对语音技术接受程度的提高,他们的期望也会提高。他们会希望他们的语音助手在需要多种交互或理解专业领域的任务中帮助他们。例如,麦克肖恩说,用户可能想让他们的电视购买一件演员在屏幕上穿着的衬衫,或者在开车时将物品添加到他们的购物车中。在这种情况下,助手应该能够从多个来源收集信息,而不仅仅是将语音命令映射到动作。

“我们在语音领域看到的技术进步将允许人们用他们的语音助手做更多的事情,并将对话从一个智能扬声器传递到另一个智能扬声器,”麦克肖恩说。

平台无关的语音助手

当前语音助手的另一个问题是缺乏跨平台支持。Alexa和亚马逊绑在一起,Siri和苹果绑在一起,助手和谷歌绑在一起。这使得开发人员很难开发出能在用户的各种设备上运行的语音应用程序。

“今天,我们开始看到市场上使用的语音助手更加多样化。“随着新产品越来越受欢迎,亚马逊作为市场份额最大的领导者的地位正在下降,”麦克肖恩说。“由于亚马逊现在拥有不到50%的市场份额,对第三方支持的需求比以往任何时候都高。”

基本上,这意味着如果你正在开发一个应用程序,你必须弄清楚如何让它与所有类型的语音助手一起工作。限制对Alexa或Siri的支持将剥夺一部分应用程序用户使用语音功能的便利。这是一个在各种操作系统中工作的平台无关的语音助手可以填补的空白。

“品牌不想只在一台智能设备上做广告、销售或吸引消费者。他们希望参与整个生态系统,而第三方技术提供商使这成为可能,”麦克肖恩说。“通过利用第三方技术提供商,品牌能够在多样化的语音助手组合中传递他们的信息。他们将创造新的机会,优先考虑语音技术市场中的基础设施、货币化、商业、数据和分析。”

未来值得关注的语音助手平台

麦克肖恩说:“我们非常相信语音支持的未来,我们在三个关键领域看到了机会:商业、广告和联网电视。”

Progress Partners的投资部门Progress Ventures最近投资了几家语音技术初创公司,MacShane认为这些公司将成为语音助手未来的一部分。

其中之一是Blutag,这是一个基于云的平台,目标是语音商务,这是一个快速增长的行业,预计到2022年将达到400亿美元。Blutag为大多数主要电子商务平台提供无代码语音支持,并提供丰富的API进行自定义集成。在线店主可以添加各种语音功能,包括购买、优惠券和常见问题。该平台支持各种设备类型和多模式体验。因此,例如,如果用户将使用带有显示屏的设备(例如,智能电视或智能手机),语音助手将能够从不同的来源提取信息,包括用户的语音数据和设备屏幕上显示的内容。由于Blutag是专门为语音商务设计的,它可以处理通用语音助手无法处理的复杂的在线购物,例如进行多步购买或使用上下文数据。

另一家Progress Ventures投资组合公司Instreamatic提供语音广告。Instreamatic使公司能够向用户提供对话式广告。Instreamatic的目标是从静态广告转向为用户提供个性化体验的动态广告。

Progress Ventures投资的第三家公司Disruptel提供了一种人工智能语音助手,可以理解屏幕内容并与之互动。例如,如果您正在观看一部电影,您可以要求助理提供有关类似电影、屏幕上显示的演员或特定项目(如演员穿的外套)的信息。如果你正在观看一场体育比赛,你可以告诉助手通过你最喜欢的投注平台下注。

麦克肖恩认为,这只是语音体验扩展的开始,未来几年还会开发出更多有用的应用。

“我们相信声音作为一种形式只会继续增长。他说:“我们看到语音助手的使用在各个年龄、人群和地域都有所增加。“随着人们对语音助手的使用不断增加,技术也在不断发展,进入语音技术领域是一个令人兴奋的时刻。”

作者:Ben Dickson