基本概念
样本
样本是用户可能询问机器人的语音话述,可以从线上的对话日志或离线生成,这部分语音话述可以用来进行标注,以便于后续的指标评估或模型迭代。
样本集
由多个样本组成。样本集可以对样本进行分组管理,不同样本集类型的标注内容也不相同,现在样本集有两种类型,分别如下:
- 文法样本集:文法样本集中的样本,可以标注领域、意图和槽位。
- 问答样本集:问答样本集中的样本,可以标注用户的询问话述与召回的问题是否相似。
高频说法
高频说法是指在机器人的前端界面上可展示的引导型语音指令,比如:在音乐播放的页面,可以配置:播放七里香,引导用户对机器发出这个页面可以响应指令。