捷通华声灵云SDK全面升级 为开发者提供全方位人工智能技术

2018-01-08 13:59 出处:其他 作者:佚名 责任编辑:maoyuanwen

  为了方便广大企业及个人开发者更好地享受到灵云全方位人工智能技术,近日,灵云SDK实现了版本全面升级,十多项人工智能技术全部对外开放,让开发者真正能享受到全方位人工智能技术带来的轻松与便捷。

  登录灵云开发者社区,开发者即可下载包括语音识别、语音合成、语音唤醒、语义理解、文字识别、人脸识别、手写识别、机器翻译、声纹识别、键盘输入在内的十多项人工智能技术SDK,支持Windows/Android/Linux/IOS等各种主流操作系统,能方便的集成到各种应用与客户业务系统中。除此之外,在社区内还有麦克风阵列、灵云种子等聚合性SDK以方便开发者快速实现近远场语音交互。

网址:https://www.aicloud.com/dev/index/index

  语音合成SDK

  作为国内最早从事语音技术研究与应用的企业,捷通华声为广大开发者提供的灵云语音合成SDK可将文本实时准确地转换为自然、流畅的语音,并提供男声、女声、童声等多种合成音色,支持中文普通话、粤语、维语、英语、日语等21种语言,并可为用户提供定制化的语音合成服务。

语音合成SDK可以根据当前网络状况及指令的类型,自动判断使用本地引擎还是云端引擎进行语音合成。此次版本的升级优化了优化TTS Player,提升云端访问速度。

  语音识别SDK

  采用行业领先的深度学习算法,捷通华声为开发者提供行业领先的语音识别SDK,普通话识别准确率高达96%,并采用实时识别方式,实时率可达0.3以下,已支持普通话、英语、粤语、维吾尔语、客家话等多种语言,具备很强的口音普适性,并可自由定制垂直领域的语音识别模型,识别效果更精确。

  此次版本更新,SDK增加了本地语音意图理解、云端本地双路识别功能,优化ASR Recorder,提升云端访问速度。

  语音唤醒SDK

  灵云语音唤醒SDK采用先进的芯片,ROM小于40K,低功率持续侦听,用户使用无感知,无需网络,实时离线唤醒,唤醒率大于95%,且误唤醒率低于小于 1次/24小时,并支持自定义设置多个唤醒词,满足用户个性化需求。

  语义理解SDK

  为开发者提供的语义理解SDK可实现意图理解与智能问答两类核心功能,支持上下文语义分析、多轮对话、实体属性等,支持天气、导航、航班、音乐、闲聊等20多个常见领域,且支持HTTP、Socket、WebService以及MRCP等多种接口,满足不同需求。

  声纹识别SDK

  灵云声纹识别技术采用端点检测和噪声消除技术,克服环境噪音对的影响,识别准确率高达99%,能够在多人对话场景中分离出单个说话人音频,并识别出每个人的说话内容,并提供声纹自由说、动态数字、开放文本、固定文本密码等多种识别模式。


 

  人脸识别SDK

  灵云人脸识别技术,采用最新深度学习算法,并引入国际领先的多模型融合技术,具备“一对一确认”与“多选一辨别”功能,可对人脸五官定位并对性别、表情、年龄、肤色、姿态等人脸属性进行分析,提供人脸属性识别、关键点定位、人脸1:1比对、人脸1:N识别、活体检测等能力。

  光学字符识别SDK

  捷通华声与清华大学合力攻关,应用最新机器学习算法,光学字符识别技术国际领先,识别率高达99.99%,让机器不再只能识别“清晰、端正的文字”,还能识别“倾斜、相对模糊的文字”,并且支持更多的字体。支持文档识别、票据识别、证照识别、银行卡识别、名片识别等多种应用领域。

  手写识别SDK

  灵云手写识别技术采用最新深度学习算法,正楷、连笔字、无笔顺识别率均在98%以上,且可支持中文、英文、维吾尔文、日文、韩文等多种语言、50多种笔势识别,还拥有倾斜校正、简繁体自动判断、拼音获取等强大功能,同时提供钢笔、铅笔、毛笔等多种笔形,将输写体验融入艺术与传统文化。


 

 

 

  机器翻译SDK

  灵云机器翻译技术采用国际先进的翻译技术及深度学习算法,可生成流畅的译文,翻译结果地道流畅,忠实表达原文内容,满足高质量的翻译要求,该版本SDK支持中英、中维等多种语言互译,具有翻译准确率高、翻译快速等优点。

  键盘输入SDK

  灵云开放平台为广大开发者提供键盘输入SDK,支持中文,外文,韩文,日文等识别,同时支持多种键盘(T9,Qwerty以及容错键盘)以及多种输入模式(拼音,五笔,笔画等)。全方位AI技术 助力智能场景应用落地

  十多年的行业积累,捷通华声灵云全方位人工智能技术已在各行各业得到广泛应用实践,灵云SDK在移动应用、智能客服、智能家电、智能音箱、智能车载、机器人等应用领域大显神通:可为移动应用提供智能语音、图像、手写、生物特征识别等智能技术集成手段,可利用语音识别SDK、语音合成SDK、麦克风阵列SDK等让电视、空调等实现自然远场语言交互,可通过SDK结合打造可语音、手写的智能车载输入法,让车载设备拥有远场语音识别能力,可真正实现让机器人“能说会听、能写会看、能辨音会认人、能思考会判断”。

  未来,捷通华声将通过灵云全方位人工智能开放平台,为广大企业及个人开发者提供更多更加智能的人工智能能力SDK,助力企业智能化产品、设备的快速落地,从而实现“让每个企业都拥有人工智能,让每个人都能享受到人工智能的轻松与便捷”。

 

文章页底部微信二维码