核心看点:

1. OpenAl的插件可以配合空间音频技术实现更高级的语音交互,从而提供更好的用户体验,这可能会促进空间音频技术的发展,从而推动空间音频市场的增长,AI+音箱的核心——个性化定制语音交互系统SOC芯片。

2. 南方精工控股子公司上海圳呈,拥有AI智能语音交互系统SOC芯片,国内AI语音芯片第一,采用22nm先进制程,优于恒玄科技28nm。,已经成功应用于苹果、三星、小米等客户。

3.英伟达新发布的ProjectMellon将对话式人工智能与ProjectMellon集成,可以降低协作XR技术的入门门槛。南方精工自主研发的TWS智能蓝牙语音SOC芯片,功能可远超苹果,华为海思、高通、联发科等竞品,将来可以应用于VR和MR产品。

一、AI+音箱的核心——个性化定制语音交互系统SOC

OpenAl的插件可以配合空间音频技术实现更高级的语音交互,从而提供更好的用户体验。这可能会促进空间音频技术的发展,从而推动空间音频市场的增长。

AI+音箱的核心——个性化定制语音交互系统SOC芯片。

硅谷王川也提到,GPT之类的技术应当很快可以颠覆Alexa这样的音箱,可以每天舒服的躺平向 GPT询问各种问题,让它给我综述天下大事。周五国光电器涨停,漫步者当月涨幅50%,核心逻辑就是AI+音箱,受到资金青睐。

但我们可以看到当下智能音箱存在的问题是,反应稍微嫌慢,功能有限,有时听不清要说好几遍。我们需要更好的个性化定制语音交互系统,能学习和适应每一个用户的使用场景、对话逻辑和语言习惯,不分语种、方言和昵称,是可以为用户量身打造完全个性化场景服务的智能语音助手。

通过挖掘,我们看到了南方精工的子公司上海圳呈的个性化智能语言交互系统SOC芯片,完美解决了以上问题。

二、南方精工控股子公司上海圳呈,拥有AI智能语音交互系统SOC芯片,国内AI语音芯片第一,采用22nm先进制程,优于恒玄科技28nm。,已经成功应用于苹果、三星、小米等客户。

南方精工控股51%上海圳呈微电子技术有限公司,拥有AI智能语音交互系统。上海圳呈微电子技术有限公司成立于2009年5月,是一家致力于智能物联网领域、SoC芯片研发的高新技术企业,产品主要涉及无线智能蓝牙语音处理、图像处理、云计算数据处理等SoC芯片领域。十多年来公司凭借高品质的产品、和从产品需求到市场交付的快速迭代能力,积累了大量品质客户,并在自有产品经验积累的平台基础上,为不同需求的客户成功打造差异化、个性化、客户专有的自主品牌产品。

公司研发团队一直专注于智能语音、蓝牙、WiFi、GNSS等智能物联及智能音频无线连接技术,致力在5G智慧互联、精准定位、AI语音交互等AIoT领域为客户提供更多高品质SoC芯片产品和服务。

公司的算法科学家陆成湘:算法科学家,英文名Sean Lu,美籍华人,毕业于上海交通大学电子工程系,赴日本留学获得硕士和博士学位
● 美国卡内基梅隆大学(Carnegie Mellon University)计算机系博士后,从事语音识别技术的研究工作
● 在硅谷楼氏电子工作20余年,从事语音识别产品及相关技术开发工作

主要成就:

● 开发了基于计算听觉场景分析(CASA)的降噪方案,被苹果、三星、小米等相关产品采用
● 自主研发的个性化定制语音交互系统,能学习和适应每一个用户的使用场景、对话逻辑和语言习惯,不分语种、方言和昵称,是可以为用户量身打造完全个性化场景服务的智能语音助手


● 自主研发的主动降噪技术(ANC),将深度神经网络与麦克风阵列波束成形技术相结合,保障高品质远场语音识别和语音交互

● 自主研发的低功耗、低硬件资源开销的语音识别方案,适用各种MCU/DSP平台,有效延长产品使用时延

同时从下表可查,上海圳呈微电子技术有限公司的TWS智能蓝牙语音SOC芯片,功能可远超苹果,华为海思、高通、联发科等竞品。

三、英伟达新发布的ProjectMellon将对话式人工智能与ProjectMellon集成,可以降低协作XR技术的入门门槛。南方精工自主研发的TWS智能蓝牙语音SOC芯片,功能可远超苹果,华为海思、高通、联发科等竞品,将来可以应用于VR和MR产品。

在日前举行的GTC 2023大会中,英伟达发布了可以通过语音控制XR体验的Project Mellon。这是一个轻量级Python包,能够利用语音AI(NVIDIA Riva)和大型语言模型(NVIDIA-NeMo服务)的强大功能来简化沉浸式环境中的用户交互。开发者可以点击这个页面申请测试资格,探索创建由自然语音命令控制的XR体验。

已经体验过Project Mellon的ESI Group评价道:“我们发现,将对话式人工智能与Project Mellon集成,可以降低协作XR技术的入门门槛。通过使用自然语音作为输入,我们的虚拟人工智能助手可以帮助团队完成复习任务、查询可用情况或发现问题。所有这一切都只需用自然语言提问,无需记住特定命令。”

英伟达则表示:“人工智能正在改变我们与工作和工具互动的方式。通过语音人工智能和Project Mellon,开发人员可以简化用户交互体验。不再需要培训用户如何操作虚拟现实中的每一项功能。你可以跳到虚拟现实应用程序中,并用自己的言语来控制体验。”

英伟达Project Mellon的核心上游技术就是对话式人工智能,南方精工的AI语音交互技术,完全不输漫步者和国光电器,底部小票受益英伟达Project Mellon,补涨空间巨大。