码迷,mamicode.com
首页 > 其他好文 > 详细

基于词向量匹配的对话系统 工程实践

时间:2017-10-18 18:22:43      阅读:227      评论:0      收藏:0      [点我收藏+]

标签:with   思路   信息   image   匹配   下载   开发   line   合成   

这个台湾作者GitHub的代码和开发日志(如https://zake7749.github.io/2016/08/28/word2vec-with-gensim/  )将聊天系统所需的知识储备以及整个系统框架都描述得特别清楚,他的思路核心是:将用户输入的句子断成若干个词,通过词向量匹配预先设定的主题词,模板以及对话等,在通过若干条设定的对话策略,得到最佳答复。
下载到的代码里其实有三个可以运行的主代码:
    技术分享
 1. free chat的demo
    这个demo可算是我碰到的最黄的机器人了,因为语料取自台湾ptt.cc网站的八卦板块
    所以啊,一个优良的语料集是非常重要的,大家不要乱选语料集教坏小孩
       技术分享
    思路:
         技术分享
 

 2. 基于规则匹配的demo
    这一demo的思路如下:
        技术分享
        注:由于作者在整个系统中用的都是繁体字,所以如果用户输入和词向量模型最好统一为繁体,才好实现结果
        作者设定的主题有闹钟(时间),娱乐,住宿,医药,购物,每个主题下有若干个子主题
            技术分享技术分享
          结果:
            技术分享     技术分享
    3. 规则+free chat
        这个相当于free chat和规则组合合成的chatbot
        1)首先用户输入,到free chat 的模块,若返回的结果分数高于阈值,则直接回答该结果,否则,到到(2)
        2)规则匹配,匹配上了,则转到task model
        3)task model有以下,每个包含一个py文件,内设置该task下的回复规则,如若是住宿,则会到网上酒店的各种信息
                技术分享
                技术分享
 

 

 

 
 

 





基于词向量匹配的对话系统 工程实践

标签:with   思路   信息   image   匹配   下载   开发   line   合成   

原文地址:http://www.cnblogs.com/combfish/p/7687926.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!