Fork me on GitHub

阿里智能客服中心培训-1

阿里智能客服中心培训-1

引言

首先还是非常感谢公司给我这次的培训机会,对于我来说还是收获到很多知识和方案。在第一天的五节课里,老师们讲的内容也包含了我很感兴趣的内容,比如:机器人小蜜的技术方案、智能导航和智能质检。阿里的老师在有限的时间内还是能把内容都有序给我们将完,给我的印象也是比较深刻,也让我真正的领略到它们丰富的项目经验和产品成果。

培训提纲:

科目 讲师
云小蜜技术方案介绍 王璨
智能语音技术方案介绍 李征
智能外呼技术方案介绍 梁进
智能导航技术方案介绍 山崎
智能质检技术方案介绍 镇远
知识云配置进阶及答疑 张瑄
对话工厂配置和脚本编程 北菜
OpenAPI实操介绍 送志
政务智能服务方案介绍 橙语

云小蜜技术方案

产品能力大图

云小蜜技术框架

会话管理最佳实践

知识库

问答流程

知识的存储结构

  • 一条FAQ知识/机器阅读只能归属一个目录,一个目录可以拥有多条FAQ知识/机器阅读;
  • 一条FAQ知识可拥有多个答案,一个答案只能属于一个FAQ知识;
  • 一条答案拥有多个视角,一个视角属于多个答案;
  • 一条FAQ知识可能拥有多个相似问法;

对话工厂

会话流程

机器阅读

传统思路:拆解问题与答案

  • 长篇文档拆解困难
  • 活动时效性短,更新频发
  • 答案粒度难以控制,解决能力差

让机器直接阅读文章,自动找答案

  • 减少人工阅读、拆解、配置知识点的工作量
  • 提升问题理解的泛化能力,自动理解相关文法,无需穷举关键词

1551519007556

什么样的场景适合机器阅读

  • 拥有海量的存量业务文档
  • 知识点数量多,不易整理、维护

知识图谱问答

基于结构化的精准问答、多轮会话与推理

  1. 知识结构化:知识图谱构建
  2. 知识结构化:语言表示
  3. 知识结构化:知识展示

知识图谱构建

语言表示

知识展示

使用场景

  • 可归类实体数量大
  • 知识点数量大

KBQA解决方案

会话能力选型

智能语音技术方案

整体情况

名词解释

ASR

语音识别技术,也称为自动语音识别(Automatic Speech Recognition),简称 ASR,其目标是将人类语音中的词汇内容转换为可读的文字。

TTS

语音合成技术,也称为自动语音合成(Text To Speech),简称 TTS ,其目标是将文字转换成人的声音。

NLU

自然语言理解技术(Natural Languager Understanding),简称 NLU (ULP),即研究如何让计算机读懂人类语言。

IVR

交互式语音应答技术(Interactive Voice Response),简称 IVR ,在这里叫呼叫中心(CallCenter,CC)统一成为 IVR。一般来说,由 IVR 通过 SDM 服务调用 ASR、TTS、NLU 能力。

SDM

语音对话管理服务(Speech Dialogue Mangerment),简称 SDM ,是 MRCP 协议的服务端实现,也即 MRCP-SERVER,对外用以和各类呼叫平台(如:华为、avaya)进行对接,对内集成了 ASR、TTS、NLU能力。

ASR

基础能力

  • 支持普通话、粤语、四川话、东北话、英语识别
  • 支持一句话识别
  • 支持实时语音识别
  • 支持 RESTful 识别
  • 支持录音识别

相关概念

BAD

语音活动检测(Voice Activity Detection ,VAD)又称语音端点检测,语音边界检测。目的是从声音信号流里识别和消除长时间的静音期。切出用户语音的开始说话时间和结束说话时间,加快语音引擎的识别速度。

声学模型

对发声的建模,它能够本语音输入转换成声学表示的输出,更准确的说是给出语音引擎的识别速度。

语言模型

  • 可以理解为在声学模型给出发音序列之后,从后选的的文字序列中找出概率最大的字符串序列
  • 一个 ASR 引擎至少有一个声学模型和语言模型
  • 阿里的 ASR 引擎有一个基础语言模型和多个定制语言模型

专有云架构

语音识别模块:实时语音识别

语音识别模块:一句话识别

自学平台

  1. 热词
  2. 类热词(需要类语言模型配合)
  3. 定制语言模型

简单原则

  1. 优先使用定制语言模型,效果好,不易出错
  2. 对于有明显数量限制(较少,比如100个左右)的人名、地名、使用类热词功能,否则使用热词功能

TTS

基础能力

  • 语速控制(快慢)
  • 音量控制(高低)
  • 音色控制(几十个定制发音人)
  • 普通话、粤语、英语合成
  • 中英文混读
  • 数字串发音
  • 合成方案(参数、拼接)

标签(SSML)

音库建设

  1. 发音人
  2. 录音环境
  3. 录音文案
  4. 质量控制
  5. 数据闭环

Neural TTS

效果访问:https://ai.aliyun.com/nls/tts

SDM(MRCP-SERVER)

架构

  1. SDM = 网络层(TCP、UDP)+ 协议层(SIP、RTP、MRCP)+ 逻辑层(ASR、TTS、NLU)
  2. 如果是 gateway 是语音服务的网关层、那么 SDM 是客户领域中各类 AI 能力的网关
  3. SDM 承上启下,对外和 IVR 基于标准协议对接;对内完成各类 AI 服务的私有协议的转换

MRCP 协议

  • 为什么选择 MRCP 协议
    • 客服领域(比如通信、金融领域)大多有呼叫中心、设计硬件、历史悠久、升级换代很难
    • 客户无法、可能没有能力、主观上也不愿意集成各个语音厂商API。
      • 集成难度大
      • 有的呼叫中心设备甚至无法集成第三方 API
  • 好处
    • 客户呼叫中心升级更简单(呼叫中心大多直接或间接支持 MRCP)
    • 客户不在关注语音厂商 SDK 细节,仅仅参照 MRCP 标准

和呼叫中心的对接

方案1

方案2

方案3

智能外呼技术方案

智能客服

语音导航的进步

1546956935289

语音导航过程

智能助手

人员流动性大,培训成本高 V S 智能辅助解决新手上岗难问题
坐席和用户一对一交互,无监督无状态 V S 无缝融合第三方参与人人交互全过程

功能架构

适用场景

金融、教育、旅游、网络推广、地产、客户回访、4s店、中国电信、联通、移动、保险、美容等行业。

典型智能外呼客服组织网

专有云

公有云

智能导航技术方案

概述

  • 智能语音导航是什么?
    • 基于 ASR (语音识别)、NLU(自然语言理解)、TTS(语音合成)技术实现的智能语音产品/解决方案。
    • 通常用于在电话端接待用户,为用户提供智能问答或功能跳转。
  • eg: 自助查水费
  • 不是
    • 不是 Sirt,无法解答未配置在 NLU 中的问题
    • 不是学习机器,无法在没有人工干预的情况下自行学会新的知识或听懂方言
  • 阿里云智能语音导航依赖一下原子产品
    • 达摩院ASR/TTS/MRCP 模块
    • 智能客服-云小蜜
  • 提供适配 IVR 的渠道特征性:
    • 个性化问候语
    • 拒识处理
    • 重听
    • 访问提示
    • 在多轮会话间共享上下文

私有化版本集成架构

  • IVR 与 MRCP 进行对接,通过MRCP 服务实现对 ASR 和 TTS 的调用
  • IVR 与智能导航 OpenAPI 进行对接
    • 开启会话接口
    • 会话接口
    • 收号完成接口
    • 核身完成(可选)

私有化版本部署指南

逻辑架构

高可用架构

部署步骤

  • 准备中间件 MySQL + Redis
  • 初始化数据表
  • 部署智能语义导航应用
  • 初始化租户,生成调用 OpengAPI 的 AccessKey
  • 在云小蜜中创建机器人
  • 初始化导航实例,关联云小蜜机器人

云小蜜配置指南

具体是使用 API 以阿里提供的为准,这里只是简单的提一下。

总结

智能语音导航=云小蜜+ASR+TTS+MRCP+智能导航OpenAPI+IVR基础配置+回复单元定义

拒识语、访问提示在导航 config 中配置;话术在小蜜中配置;重听、转人工在智能 IVR 基础配置对话流中配置;

智能质检技术方案

规则配置

  • 常用算子
    • 关键词-词
    • 正则-复杂关键词
    • 语义-句子
  • 算子与条件
    • 条件间可以配置依赖关系
    • 一个条件包含一个算子

系统集成

  • 通过 FTP
    • 不需要过多开发
    • 适用于存量录音
    • 没有客户姓名、号码、技能组等额外信息
  • 通过 API
    • 需要集成开发
    • 信息全
    • uploadAudioDataWithRules
  • 实时质检

准确率

  • 转写准确率
    • 准确率:>85%
    • 自学习平台
      • 热词:适用于专有名词
      • 语言模型:常规对话;量要多(>1M);一行一句(只需要话术,不需要角色,eg:客服:您好,请问,有什么可以帮到您?)
      • 录音改造
  • 分轨准确率
    • 错误率:8%-15%
    • 严重错误率: <10%
    • 双轨录音:从录音源头改造
坚持原创技术分享,您的支持将鼓励我继续创作!