如何最好地存储聊天机器人的数据?

2023-12-21

我在网上寻找chatbots。这只是有趣。但现在,我非常喜欢这个主题,所以我想开发自己的聊天机器人。
但第一件事是寻找一种好方法来管理我的聊天机器人的“大脑”。我认为将所有内容保存在 XML 文件中是最好的解决方案,不是吗?
这样文件类型就清楚了。涉及不同名词之间的关系等。当我有一个名词时,例如一颗树。我怎样才能最好地保存一棵树有叶子、树枝和根。一棵树需要水和阳光才能生存吗?
我应该这样保存还是以其他方式保存?

这就是我的 XMLtree-例子:

<nouns>
    <noun id="noun_0">
        <name>tree</name>
        <relationship>
            <has>noun_1</has>
            <has>noun_2</has>
            <has>noun_3</has>
            <need>noun_4</need>
            <need>noun_5</need>
        </relationship>
    </noun>
    <noun id="noun_1">
        <name>root</name>
    </noun>
    <noun id="noun_2">
        <name>branch</name>
        <relationship>
            <has>noun_3</has>
        </relationship>
    </noun>
    <noun id="noun_3">
        <name>leaf</name>
    </noun>
    <noun id="noun_4">
        <name>water</name>
    </noun>
    <noun id="noun_5">
        <name>light</name>
    </noun>

    . . .

</nouns>

数据存储选择:这取决于

简单的非学习机器人:XML 就可以

看起来您已经制定了基本的 XML 结构。对于刚开始的人来说,我认为这很好,特别是对于人工智能支持聊天机器人(if userMsg.contains('lega') then print('TOS & Copyright...').

当然,切换到任何新格式都需要时间和开销。

学习,复杂的机器人:数据库!

如果您想做更大的事情,尤其是如果您有聪明机器人 http://cleverbot.com/记住,我认为你将需要一个数据库。这是因为,当您的文件 .. 是一个文件并且非常大时,尝试将其全部保留在内存中会占用大量资源。对于此类项目,我推荐一个数据库。

为什么?英语很复杂

不久前,我写了一个尼夫贝叶斯垃圾邮件分类器。大约需要 10,000 条垃圾邮件才能以 7% 的准确率“训练”它,这需要大约 6 小时和 1.5GB RAM 来将数据保存在内存中。这是很多数据。英语很难,真正突破不了if 'pony' then 'saddle',因此对于机器人来说,要“学习”最佳响应,您的数据库将变得非常庞大且非常快。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何最好地存储聊天机器人的数据? 的相关文章

随机推荐

  • winrscmd.dll文件缺少导致程序无法运行问题

    其实很多用户玩单机游戏或者安装软件的时候就出现过这种问题 如果是新手第一时间会认为是软件或游戏出错了 其实并不是这样 其主要原因就是你电脑系统的该dll文件丢失了或没有安装一些系统软件平台所需要的动态链接库 这时你可以下载这个winrscm
  • 互操作性(Interoperability)如何影响着机器学习的发展?

    互操作性 Interoperability 也称为互用性 即两个系统之间有效沟通的能力 是机器学习未来发展中的关键因素 对于银行业 医疗和其他生活服务行业 我们期望那些用于信息交换的平台可以在我们需要时无缝沟通 我们每个人都有成千上万个数据
  • winsockhc.dll文件缺少导致程序无法运行问题

    其实很多用户玩单机游戏或者安装软件的时候就出现过这种问题 如果是新手第一时间会认为是软件或游戏出错了 其实并不是这样 其主要原因就是你电脑系统的该dll文件丢失了或没有安装一些系统软件平台所需要的动态链接库 这时你可以下载这个winsock
  • SpringBoot代码混淆与反混淆加密工具详解

    目录 反编译 混淆 正文 一共就两步 无需源码 直接对ipa文件进行混淆加密 打开要处理的IPA文件 设置签名使用的证书和描述文件 开始ios ipa重签名 简单就是把代码跑一哈 然后我们的代码 java文件 就被编译成了 class 文件
  • 38条Web测试经验分享

    2024软件测试面试刷题 这个小程序 永久刷题 靠它快速找到工作了 刷题APP的天花板 CSDN博客 文章浏览阅读1 9k次 点赞85次 收藏11次 你知不知道有这么一个软件测试面试的刷题小程序 里面包含了面试常问的软件测试基础题 web自
  • 详解数据科学自动化与机器学习自动化

    过去十年里 人工智能 AI 构建自动化发展迅速并取得了多项成就 在关于AI未来的讨论中 您可能会经常听到人们交替使用数据科学自动化与机器学习自动化这两个术语 事实上 这些术语有着不同的定义 如今的自动化机器学习 即 AutoML 特指模型构
  • winrssrv.dll文件缺少导致程序无法启动问题

    其实很多用户玩单机游戏或者安装软件的时候就出现过这种问题 如果是新手第一时间会认为是软件或游戏出错了 其实并不是这样 其主要原因就是你电脑系统的该dll文件丢失了或没有安装一些系统软件平台所需要的动态链接库 这时你可以下载这个winrssr
  • RPA机器人助力义务教育招生随机派位系统

    作为一名教育行业从业者 我深切地感受到招生工作中的繁琐和低效 每年招生季 我们需要处理大量的报名信息 进行筛选和录取工作 然而 由于人力资源有限 往往会出现疏漏和错误 给招生工作带来了不小的困扰 幸运的是 我们发现了八爪鱼RPA这一强大的工
  • 浏览器原理篇—渲染原理

    目录导航 为什么要学习浏览器的渲染原理 浏览器的渲染流程 浏览器的渲染阻塞 浏览器的渲染优化 为什么要学习浏览器的渲染原理 知识深度挖掘 帮助更好地理解前端性能优化 从而对实现效果进行针对性优化 如 回流和重绘 渲染机制 帮助更好地理解浏览
  • Hibernate 标准:使用 group by 子句投影计数

    我想执行以下SQL select count as myCount from user group by name 我提出了以下相同的标准 DetachedCriteria ForClass typeof UserDTO setProjec
  • 无法在棒棒糖之前的设备上获取提供程序 com.google.firebase.perf.provider.FirebasePerfProvider

    在 v21 之前的所有版本 即 16 19 上 我的应用程序在启动时崩溃 因为出现以下错误 E AndroidRuntime FATAL EXCEPTION main java lang RuntimeException Unable to
  • webpackJsonp 未使用 karma-webpack 定义?

    我正在使用 webpack 构建一个样板 并使用 mocha 构建 karma 这是我用于 karma webpack 的配置 我是 webpack 的新手 var path require path var webpack require
  • 在Mongo中有什么方法可以像原子操作一样进行检查和设置?

    Mongo中有什么方法可以像原子操作一样进行检查和设置吗 我正在预订酒店 如果有空闲房间 您可以预订 但如果两个或更多人想同时预订怎么办 Mongo中有没有类似事务的东西或者有什么方法可以解决这个问题 是的 这是 MongoDB 的经典用例
  • 为什么 OpenFileDialog 会更改我的工作目录?

    为什么 OpenFileDialog 会更改我的工作目录 我应该假设 System Windows Forms 中的许多函数会更改我的工作目录吗 OpenFileDialog open new OpenFileDialog open Fil
  • R for 循环 ifelse 跳到下一次迭代

    假设你有一个像这样的 for 循环 for n in 1 5 if n 3 skip 3rd iteration and go to next iteration cat n 如果满足特定条件 如何跳到下一次迭代 for n in 1 5
  • 获取 LinkedIn 个人资料图片

    有没有一种简单的方法来获取用户的 LinkedIn 个人资料照片 理想情况下类似于您使用 Facebook 的方式 http graph facebook com userid picture http graph facebook com
  • 将对象转换为 Angular 中的 json

    我正在尝试将对象转换为 json 在我的updateDetails方法但是我得到了undefined in console log转换后为json 这是怎么回事 我的鳕鱼是 HTML
  • 根据最近的先前日期匹配两个表之间的值的最有效方法是什么?

    我在 MS SQL Server 中有两个表 dailyt 其中包含每日数据 date val 2014 05 22 10 2014 05 21 9 5 2014 05 20 9 2014 05 19 8 2014 05 18 7 5 et
  • 如何从翻译的 .po 文件生成新的 .pot 模板

    从不完整的 gettext 开始 pot文件 结果 po翻译文件现在包含大量原本不在文件中的翻译字符串 pot file 我怎样才能向后生成 pot来自已翻译的其他语言的文件 带有空白翻译条目的字符串 po file 感谢您的帮助 你可以使
  • 如何最好地存储聊天机器人的数据?

    我在网上寻找chatbots 这只是有趣 但现在 我非常喜欢这个主题 所以我想开发自己的聊天机器人 但第一件事是寻找一种好方法来管理我的聊天机器人的 大脑 我认为将所有内容保存在 XML 文件中是最好的解决方案 不是吗 这样文件类型就清楚了