3
http://30.18.176.251/SentenceSelect
登录
账号密码都选用UM账号登录,大小写请一致
使用前必读:
l 由于编码的问题,上传文件仅支持*.xlsx,且要查的场景索引请用 场景索引_xxx.xlsx文件,例如tjkb_xxxx_xxxxx.xlsx
l 文件命名中的“_”,请确认不要打成“-”,程序识别不出来。
l a关于列:文件中的第一列命名为“user_say”,第二列命名为“intent”,并确保删除其他多余列和隐藏列,保证文件中只有两列。b关于sheet:将所有sheet合并为一个,删除多余sheet。注:如若更改后满足上述条件依然上传失败,请新建一个场景索引_xxxx_xxxxx_v.2.xlsx文件,并单独复制两列到文件,上传新建文件。见Figure1
Figure1
l 程序运行时间比较长,请耐心等待,可以不关闭页面等运行完再下载,期间可以正常工作。
l 新场景上线前如需使用自动化质检工具需联系科技方并提供该场景全部意图名称,由科技方在后台添加场景代号及对应意图名称后,业务方即可使用自动化质检工具
【重要】质检流程为1-6,7以后为单独功能在需要时选用
1. 意图名称变更
实现功能:意图名称查看,单条新增,批量新增。
当意图库中的意图名称新增、删减或变更,需将本周最新的入库数据intent复制出来,粘贴到一个新的文件,命名为场景名_意图名称(Figure1-1),并在Excel进行去重操作(Figure1-2)
此步很重要一定要操作,否则在文件质检那一步,会出现多条新增意图对应的话术无法保留的情况。
Figure1-1
Figure1-2
选择相应场景->点击上传“场景名_意图名称”文件->提交上传。见Figure1-3。
Figure1-3
另外功能,见Figure1-4:
查看意图名称:可选择场景->查看,即可查看目前自动化质检工具内场景的意图名称。
新增意图名称:在新增意图方框内填写新增的意图->添加
Figure1-4
2.文件去重
实现功能:去除相同话术相同意图重复,列出意图不在意图库的话术。
上传全量文件文件,即为最新版本的入库数据文件(一般为上周,如有改动请用最新版本),点击上传->提交上传。
如Figure2-1所示,假如“听不懂听不清”为新增意图却没有操作1所以会出现在列表中,此类情况处理方法见1.
Figure2-1
3.相似话术查找
Step1同2.
Step2
两种跑测方法:
1>新增与新增+新增与全量
当本周有新增话术时,单独新建文件命名为:场景名简称_时间_新增。文件上传到Figure3-1方框位置。
Figure3-1
全量文件上传到Figure3-2方框位置,设置阈值(一般默认0.8,可根据想要返回的量自由设置),设置筛选个数,勾选新增与新增(新增部分自身跑相似)或者新增与全量(新增部分与全量部分跑相似),可以都选,然后点击相似查找,数据量大的话需要一段时间,查找成功后分别下载文件。
Figure3-2
如果文件下载失败请到文件下载页面如图Figure3-3,根据红色方框圈出位置的日期,以及上传文件名信息来查找文件下载。
Figure3-3
2>全量与全量
仅在Figure3-3方框位置上传全量文件
Figure3-4
首先设置阈值(一般默认0.8),设置筛选个数,仅勾选新增与新增(Figure3-5),然后点击相似查找,数据量大的话需要一段时间,查找成功后下载文件。
Figure3-5
4.文件质检
实现功能:查找相同话术对应不同意图的部分。
这一步很重要一定要操作!
直接上传->提交上传->保存,对跑出的表不做任何修改!点击下载校正后文件(right),点击下载错误文件(wrong),对错误文件再次质检之后和正确的文件合并为终版入库数据。
如出现因语气词而导致的相同话术不同意图请保留去语气词的话术并确认唯一意图。
Figure4-1
下载错误文件格式如Figure4-2所示:
质检之后仅复制左边两列,合并到正确的意图库之中为本周的全量。
Figure4-2
5.入库数据删除替换
实现功能:库删减和替换
三个文件名称格式见Figure5-1
Figure5-1
通用意图库格式,见Figure5-2:
根据自己场景需求对库做删减,把想替换进自己场景的意图和对应话术,在此文件中保留。
Figure5-2
删除意图格式,见Figure5-3:
将想要删除的意图名称填写在表格中
Figure5-3
在程序运行结束之后请排查替换后的量(在替换后的入库数据文件进行意图筛选)和通用意图库的量是否一致,若不一致(一般会比通用意图库的量少),请在确保自己操作无误的情况下,反馈给通用意图库负责老师并要求其再次质检。
功能逻辑:首先对原始库删除“删除意图”列表中意图名称对应的话术,再根据通用意图库中的话术,与场景库中的话术一条条检索遍历,若出现自己场景库中的话术和通用库中话术相同却对应了不同的意图的情况,会以通用库的为标准替换进去。
温馨提示:请不要手动替换通用意图库!一定用工具替换库,否则出现一条话术对应不同意图情况,会影响生产,甚至导致投诉件!
6.数据新增替换整理
实现功能:将最新版场景入库数据上传到后台ES库,为一些功能提供最新版本数据。
Figure6-1
每周质检过后提交给AI项目组的最新版本场景入库数据->上传->提交上传->保存->替换整理。出现Figure6-2界面,勾选新增入库或者全量入库->入库整理。
Figure6-2
7.多列转换
实现功能:将多列转两列,两列转多列。
文件->上传->提交上传
Figure7-1
多列文件格式见Figure7-2:
Figure7-2
两列文件格式见Figure7-3:
Figure7-3
8.入库数据格式规范
实现功能:入库数据去ASR转译乱码
文件->上传->提交上传
Figure8-1
9.单条跑测相似话术
实现功能:单条查找相似话术
选择场景->调整阈值->输入查找话术->意图名称填入->填入筛选个数->查找相似
Figure9-1
10.关键词检索
选择场景->输入关键词,查找库中包含关键词的话术和对应意图。
Figure10-1
11.相似话术意图匹配
实现功能:将未匹配意图的话术,根据场景库内的话术进行相似度筛查,返回相似度最高的一条话术。
注意:上传文件前要进行“2.数据新增替换整理”功能操作,确保作为参照的意图库版本正确。
如Figure11-1所示:选择场景->客户原话上传(文件格式见Figure11-2)->提交上传->匹配结果下载。运行结果见figure11-3。
Figure11-1
Figure11-2
Figure11-3