10月18日,捷通華聲宣布正式推出靈云離線式語音識別(ASR)技術,該技術能力已在靈云智能人機交互能力開放平臺(簡稱靈云平臺)正式上線,用戶可以到靈云平臺(.hcicloud)下載、體驗、使用最新靈云離線式語音識別技術。
靈云離線式語音識別技術將包括詞表識別、語法識別、“自由說”識別三個部分,由于采用了最新算法、引擎設計,識別率取得突破性提升,其中詞表識別和語法識別離線語音識別率已提高到97%以上。同時,在實時率、加載時間和資源占用率等技術性能均得到大幅優化,能夠很好滿足目前各種移動終端的應用需求。靈云離線式語音識別技術主要應用于各種移動終端,保證用戶在無網絡環境下依然可以應用語音識別技術,應用語音流暢地與各種數字設備進行溝通交流。
語音識別技術由于運算量大,目前應用語音識別技術各種智能移動終端與應用多采用“云“端語音識別技術服務。由于現實生活工作中,網絡并不能覆蓋所有環境,同時很多用戶也擔心流量增加導致使用費用的增長,因此完全依賴“云”端語音識別技術造成了用戶的很大的不便。靈云離線式語音識別技術,是靈云平臺“云”端語音識別技術的延伸,該項技術的推出,將有效幫助用戶擺脫應用語音識別對“云”端的完全依賴,滿足用戶在沒有網絡的環境下,仍然能夠方便使用語音識別技術能力。全新的靈云離線語音識別通過在智能移動終端中加載離線語音識別引擎、離線語音包,對語音進行本地化聲學模型、語言模型的處理,從而使各種智能移動設備實現本地化應用和語音識別技術的需求。此次采用全新引擎的靈云離線式語音識別技術,具有識別率高、識別速度快、低運算資源占用、低內存消耗的特性,能夠滿足更多終端設備的使用,保證用戶更好的在無網絡狀態下應用語音識別技術的體驗與感受。
靈云——全方位智能人機交互(HCI)能力開放平臺是捷通華聲全力打造的HCI技術云服務平臺。靈云是一種可以用語音、手寫、拍照,手勢,將來甚至可使用腦波識別等智能手段來操作、感知手機、計算機等數字設備的網絡云服務,其目標是讓人機交互像人與人溝通一樣的簡單自然。靈云目前以“云 + 端”方式,為用戶提供語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學字符識別(OCR)和自然語言理解(NLU)五項核心技術能力,是目前中國、乃至世界第一個也是最大最全的HCI技術云服務平臺。靈云平臺致力于面向中國,未來能夠向國際市場提供一個全方位HCI技術能力提供、HCI技術服務、HCI產業交流的平臺。
面對移動互聯網產業的高速發展,為全面滿足用戶需求,捷通華聲靈云平臺面向開發者提供包含“云 + 端”語音識別與“云 + 端”語音合成一體化智能語音解決方案,不僅能夠全面系統地滿足企業與設備開發商的需求,也同時能夠更好地為用戶提供個性化的服務,滿足用戶使用不同設備、在不同應用場景下,享受智能語音交互技術帶來的方便與快捷。
目前,包含靈云離線式語音識別在內的靈云智能語音解決方案,已經為百度地圖、導航犬、搜狗語音助手、嘀嘀打車、搖搖招車、快說語音助手等深受億萬大眾歡迎的眾多應用提供智能語音能力支持服務。為更廣泛應用智能語音技術,靈云平臺同時為智能家電、車聯網、可穿戴式設備等領域的用戶提供定制智能解決方案。相信此次靈云離線式語音識別技術的推出,必將更進一步為企業、社會大眾提供更為豐富、更為全面的智能語音技術服務。