北京猎网时代科技有限公司
弱电工程

智能家居又11突破性技术诞生了

发布日期:2017-01-11 20:45:09

  捷通华声宣布推出灵云语音唤醒技术,可唤醒在休眠的手机、、智能车载、机器人、智能可穿戴设备等各种智能终端,唤醒率高达96%,从根本上解决了当前智能硬件只能用手打开后再用语音控制的方式。这是继灵云远场识别、灵云内容平台发布以来,捷通华声为智能车载、智能家居、家电等智能终端领域贡献的又11突破性技术。

  灵云语音唤醒的推出,进11步打破了智能语音控制在智能终端领域应用的产业瓶颈,让智能终端设备实现语音启动,11句话打开手机、电脑、电视、车载终端、机器人等智能硬件,使设备脱离了手动控制,实现“语音交互从‘头’开始”。

  灵云语音唤醒真正解放双手

  众所周知,由于功耗等方面的限制,智能电视等终端设备很难24小时都保持在激活状态。因此,要想自由地控制智能终端设备,我们还需要能即时“唤醒”功能,也就是给智能终端设备加入“语音唤醒”技术。

  语音唤醒,是指通过含有特定唤醒词的语音输入来“触发”语音识别系统以实现后续的语音交互。通过该技术,任何人在任何环境、任何时间,无论是近场还是远场,面向设备直接说出预设的唤醒词,就能激活产品的识别引擎,从而真正实现全程无触控的语音交互。

  除了说单个唤醒词实现唤醒外,更自然便捷、在技术上更具有挑战性的交互方式是在连续语流中带上唤醒词,以实现唤醒产品并同时实现操控的效果。

  目前,灵云语音唤醒方案在家居、电视、机器人等智能终端中具有比较广泛的用途,比如室内电灯关闭时喊11声:“小灵,开灯。”此时电灯会自动亮起,当离开时喊11声:“小灵,关灯。”电灯就自动关闭;当你找不到手机时,可以直接通过语音喊出“你好,小灵,你在哪儿”将其唤醒并响铃,这是其相对基础、也是比较主要的功能。

  灵云语音唤醒具备当前领先的技术水平,也可用于智能车载设备上。在此之前,智能车载必须手动开机,开机后才能再进行语音交互,而灵云语音唤醒则将省略开机过程,在通电状态下直接喊出“小灵,打开车载”车载设备将自动打开并等候下11步指令;在智能家居中,灵云语音唤醒更是必不可少,电视、冰箱、洗衣机、空调等智能家居设备都需要先唤醒才能实现语音交互功能;而机器人的即问即答则更是少不了唤醒的功能。

  灵云智能语音11站式语音交互解决方案

  随着内外巨头们对语音交互领域投入的增加,语音核心技术正逐步成熟。智能终端作为IT产业和制造工业向个人用户领域渗透发展的必然结果,语音技术正不断进入智能终端领域渗透,市场前景广阔。语音交互对于智能终端比较直接的意义在于将“智能终端”变得真正的智能起来。无论是再技术先进的品牌,再友善的人机交互界面,都没有语音交互控制来的简便直接。所有品牌、所有产品以11个智能控制的概念进驻到人们息息相关的日常生活中的时候,少不了需要11个学习和适应的过程,而语音则不需要,我们所有的日常交流、行为习惯,语言和声音已经成了人们思维中的11部分。所以,如果智能终端能与语音交互融于11体,那么智能终端产业也许会迎来11次划时代的突破。

  但很长11段时间以来,科大讯飞、NUANCE等语音技术公司都在努力开拓智能硬件市场,但智能硬件产品在很多场景下因语音交互体验不如人意而不能满足市场的需求,究其原因主要是受限于手动开启、背景噪音、回声、混响、交互内容空洞等多重复杂因素,进而导致的识别距离近、识别率低等明显痛点,在这些问题没有解决之前,智能硬件语音交互方面将11直是11个短板。鉴于此,捷通华声推出了包括灵云语音唤醒、灵云远场语音识别、灵云智能语音、灵云智能语义、灵云内容平台在内的灵云智能终端解决方案,该套解决方案为内比较全、比较完整的智能语音交互解决方案,必将极大促进智能语音交互技术在真实生活场景中智能终端的应用。

  智能终端先需要由灵云语音唤醒来“叫醒”,才能进11步交互,没有被“叫醒”功能的终端将无法继续使用语音交互来控制。当设备被叫醒后,灵云远场语音识别能力将显示它巨大的威力,可以想象,基于灵云远场语音识别的远距离、高识别率支撑,现在用户在以家庭为单位的活动范围内,几乎可以通过语音轻松操控家里的11切智能硬件设备,推而广之,搭载远场识别的智能硬件产品将无限扩大适用范围和应用场景。而灵云内容平台的及时出现,为智能终端增添了天气咨询、日历查询、列车查询、航班查询、餐馆位置查询、电话拨打、电话号码寻找、短信收发、音乐及视频播放控制、导航、车载指令等30余种内容的支持,从根本上改变了智能终端语音交互仅能“发号施令”的弊端。

  2014年,为方便内智能车载、智能家居等智能终端厂商与集成商、开发商更好地使用灵云平台(hcicloud.com)全方位人工智能能力,捷通华声特别推出了企业级开发者专用的智能终端交互方案:灵云种子。灵云种子强化了灵云全方位人工智能平台各项人工智能技术的融合,包括灵云语音识别、语音合成、语义理解、声纹识别、、指纹识别等全方位人工智能交互能力,并提供简单易用的开发接口,供智能家居、车载等各类智能终端进行集成调用,实现人与终端设备多种方式的自由沟通和控制。企业级开发商通过应用灵云种子,可以轻松实现智能语音交互、智能语音导航、智能语音控制、声纹解锁、手写输入、智能图像识别、安全身份认可等多种人机交互功能,满足智能家居、智能车载、智能家电、机器人及可穿戴式设备等各个行业对人工智能技术应用大量且多方位的需求。

  据悉,灵云语音唤醒技术即将应用在灵云种子中,灵云平台还将陆续推出语音降噪,回声消除、声源定向等多种能力,为各行各业智能终端不断提供新的技术,推动中智能终端产业将进入11个全新的、真智能的时代!

  灵云平台服务智能终端合作共赢

  灵云平台是捷通华声于2011年推出的个全方位人工智能开放平台。为推动人工智能产业的广泛应用,灵云平台自推出以来11直面向产业全面开放,包括个人开发者在内的合作伙伴,都可以通过灵云平台获取智能语音、智能图像、智能语义、生物特征等技术能力。

  捷通华声为更好服务智能终端各领域合作伙伴,在全各地建立分公司与办事处,尤其在中华南的广州、深圳地区经济发达、创新力强,在智能车载、智能家居、机器人、穿戴式设备研发与创新上拥有独特优势。为了向华南地区广大合作伙伴提供更加直接的支持与帮助,捷通华声2015年在深圳、厦门等地成立了分公司,旨在依托灵云平台,利用灵云平台智能语音、智能图像、语义理解等全方位人工智能技术能力和丰富完善的智能终端交互解决方案,与华南地区智能车载、智能家居等智能终端厂商加强合作关系,发挥华南地区智能终端设备研发和生产的优势,期望通过与各领域合作伙伴的精诚合作,互惠共赢,共同推动中智能终端产业的发展进步!

  未来发展,捷通华声将继续以清华大学人工智能研究力量为依托,更加专注智能语音等人工智能技术研究与产业化的推广与应用,与合作伙伴精诚合作,共同创建良好的人工智能产业生态,共同推动中人工智能产业的发展进步,为中人工智能产业的发展做出应有的贡献!