Chatbots are intelligent software built to be used as a replacement for human interaction. Existing studies typically do not provide enough support for low-resource languages like Bangla. Due to the increasing popularity of social media, we can also see the rise of interactions in Bangla transliteration (mostly in English) among the native Bangla speakers. In this paper, we propose a novel approach to build a Bangla chatbot aimed to be used as a business assistant which can communicate in Bangla and Bangla Transliteration in English with high confidence consistently. Since annotated data was not available for this purpose, we had to work on the whole machine learning life cycle (data preparation, machine learning modeling, and model deployment) using Rasa Open Source Framework, fastText embeddings, Polyglot embeddings, Flask, and other systems as building blocks. While working with the skewed annotated dataset, we try out different setups and pipelines to evaluate which works best and provide possible reasoning behind the observed results. Finally, we present a pipeline for intent classification and entity extraction which achieves reasonable performance (accuracy: 83.02%, precision: 80.82%, recall: 83.02%, F1-score: 80%).


翻译:聊天室是用来替代人类互动的智能软件。 现有的研究通常不能为孟加拉国语等低资源语言提供足够的支持。 由于社交媒体越来越受欢迎, 我们还可以看到孟加拉语当地孟加拉语使用者在孟加拉语转异化(主要是英语)方面互动的兴起。 在本文中, 我们提出一种新颖的办法来建造孟加拉语聊天室, 目的是作为商业助理, 能够用孟加拉语和孟加拉语以高度信任的方式用英语进行交流。 由于没有为此目的提供附加说明的数据, 我们不得不用拉萨开放源框架、 快图嵌入、多球嵌入、 Flask 和其他系统作为建筑块来进行整个机器学习生命周期( 数据编制、 机器学习模型和模型部署) 。 在与附加注释的数据集合作的同时, 我们尝试不同的设置和管道, 来评估哪种效果最好, 并为观察到的结果提供可能的推理。 最后, 我们展示了一个用于意图分类和实体提取的管道, 从而实现合理的性能( 准确性: 83.02%, 精确性: 80.82% 精确度: F.821 回忆: 正确性: 80.

0
下载
关闭预览

相关内容

如何构建你的推荐系统?这份21页ppt教程为你讲解
专知会员服务
64+阅读 · 2021年2月12日
【DeepMind】强化学习教程,83页ppt
专知会员服务
152+阅读 · 2020年8月7日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
机器翻译 | Bleu:此蓝;非彼蓝
黑龙江大学自然语言处理实验室
4+阅读 · 2018年3月14日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
多轮对话之对话管理:Dialog Management
PaperWeekly
18+阅读 · 2018年1月15日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
【推荐】SVM实例教程
机器学习研究会
17+阅读 · 2017年8月26日
Neural Approaches to Conversational AI
Arxiv
8+阅读 · 2018年12月13日
Arxiv
3+阅读 · 2018年11月12日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Arxiv
10+阅读 · 2018年2月9日
VIP会员
Top
微信扫码咨询专知VIP会员