Sagemaker LDA 主题模型 - 如何访问训练模型的参数？还有一种简单的方法来捕捉连贯性吗

2024-05-19

我是 Sagemaker 的新手，正在运行一些测试来衡量 AWS 上的 NTM 和 LDA 与 LDA mallet 和本机 Gensim LDA 模型相比的性能。

我想检查 Sagemaker 上经过训练的模型，并查看诸如哪些单词对每个主题贡献最高之类的内容。还可以衡量模型的一致性。

通过下载输出文件，将其解压并解压以公开 3 个文件 params、symbol.json 和 meta.json，我成功地获取了哪些单词对 Sagemaker 上的 NTM 的每个主题具有最高贡献。

但是，当我尝试对 LDA 执行相同的过程时，无法解压缩未压缩的输出文件。

与 NTM 相比，也许我遗漏了一些东西或者应该为 LDA 做一些不同的事情，但我还没有找到任何关于这方面的文档。另外，有人找到了计算模型一致性的简单方法吗？

任何帮助将不胜感激！

这款 SageMaker 笔记本 https://github.com/awslabs/amazon-sagemaker-examples/blob/master/scientific_details_of_algorithms/lda_topic_modeling/LDA-Science.ipynb深入探讨了 LDA 的科学细节，还演示了如何检查模型工件。具体来说，如何获得狄利克雷先验的估计alpha和主题词分布矩阵beta。您可以在标题为““检查训练后的模型”。为了方便起见，我将相关代码复制在这里：

import tarfile
import mxnet as mx

# extract the tarball
tarflie_fname = FILENAME_PREFIX + 'model.tar.gz' # wherever the tarball is located
with tarfile.open(tarfile_fname) as tar:
    tar.extractall()

# obtain the model file (should be the only file starting with "model_")
model_list = [
    fname
    for fname in os.listdir(FILENAME_PREFIX)
    if fname.startswith('model_')
]
model_fname = model_list[0]

# load the contents of the model file into MXNet arrays
alpha, beta = mx.ndarray.load(model_fname)

这应该会为您提供模型数据。请注意，主题存储为行beta，不以任何特定顺序呈现。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

LDA

amazonsagemaker

Sagemaker LDA 主题模型 - 如何访问训练模型的参数？还有一种简单的方法来捕捉连贯性吗的相关文章

用于将 cython 中的许多 C++ 类包装到单个共享对象的项目结构

我在文档邮件列表和这个问题在这里 https stackoverflow com questions 10300660 cython and distutils 但我想得到一个更直接的答案来解决我的具体情况我正在通过尝试一点一点地包装我
无法“安装”plpython3u - postgresql

我正在尝试在 postgresql 中使用 python 语言像这样的事情 create or replace function test a integer returns integer as if a 2 0 return even
使用 pythonbrew 编译 Python 3.2 和 2.7 时出现问题

我正在尝试使用构建多个版本的 python蟒蛇酿造 http pypi python org pypi pythonbrew 0 7 3 但我遇到了一些测试失败这是在运行的虚拟机上 Ubuntu 8 04 32 位当我使用时会发生这种情
使用 psycopg2 在 python 中执行查询时出现“编程错误：语法错误位于或附近”

我正在运行 Python v 2 7 和 psycopg2 v 2 5 我有一个 postgresql 数据库函数它将 SQL 查询作为文本字段返回我使用以下代码来调用该函数并从文本字段中提取查询 cur2 execute SELECT
SQLAlchemy 通过关联对象声明式多对多自连接

我有一个用户表和一个朋友表它将用户映射到其他用户因为每个用户可以有很多朋友这个关系显然是对称的如果用户A是用户B的朋友那么用户B也是用户A的朋友我只存储这个关系一次除了两个用户 ID 之外 Friends 表还有其他字段因此
Python（Selenium）：如何通过登录重定向/组织登录登录网站

我不是专业程序员所以请原谅任何愚蠢的错误我正在做一些研究我正在尝试使用 Selenium 登录数据库来搜索大约 1000 个术语我有两个问题 1 重定向到组织登录页面后如何使用 Selenium 登录 2 如何检索数据库在我解决
从字符串中删除识别的日期

作为输入我有几个包含不同格式日期的字符串例如彼得在16 45 我的生日是1990年7月8日 On 7 月 11 日星期六我会回家 I use dateutil parser parse识别字符串中的日期在下一步中我想从字符串中删除
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
SQLALchemy .query：类“Car”的未解析属性引用“query”

我有一个这里已经提到的问题https youtrack jetbrains com issue PY 44557 https youtrack jetbrains com issue PY 44557 但我还没有找到解决方案我使用 Pyt
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
绘制方程

我正在尝试创建一个函数它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
向 Altair 图表添加背景实心填充

I like Altair a lot for making graphs in Python As a tribute I wanted to regenerate the Economist graph s in Mistakes we
如何在seaborn displot中使用hist_kws

我想在同一图中用不同的颜色绘制直方图和 kde 线我想为直方图设置绿色为 kde 线设置蓝色我设法弄清楚使用 line kws 来更改 kde 线条颜色但 hist kws 不适用于显示我尝试过使用 histplot 但我无法为
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
有人用过 Dabo 做过中型项目吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我们正处于一个新的 ERP 风格的客户端服务器应用程序的开始阶段该应用程序是作为 Python 富客户端开发的我们目前正在评估 Dabo

随机推荐

使用即将推出的 C++ 反射工具来打印类型的全名

目前可以使用 PRETTY FUNCTION 在下面显示模板类型gcc and clang include
使用 dtypes read_csv 但列中没有值[重复]

这个问题在这里已经有答案了我使用以下代码来读取 csv 通过指定每个列的类型 clean pdf type pd read csv table updated csv usecols col names dtype col types 但
EditorTemplate 的嵌套模型的 ASP.NET MVC3 条件验证

假设你有一个 viewModel public class CreatePersonViewModel Required public bool HasDeliveryAddress get set Should only be valid
如何处理 Nokogiri 中的 404 未找到错误

我正在使用 Nokogiri 来抓取网页很少有 url 需要猜测当它们不存在时会返回 404 未找到错误有没有办法捕获这个异常 http yoursite page 38475 gt page number 38475 doesn
django-autocompletion-light 简单外键完成显示不可编辑的下拉小部件

我有一个国家模型 class Country models Model name models CharField max length 200 def str self return self name 这是由 UserDetails 模
使用代理时，React 应用程序正在不同位置查找静态文件

我用过npx create react app my app创建一个反应应用程序我用过的npm run build构建应用程序并使用它进行部署serve s build 我正在使用代理服务器来公开我的应用程序我的 httpd 配置如下所
没有找到 angular.min.js.map，这到底是什么？

When I load the page and check chrome console i find these errors Angular 中的地图文件到底是什么我确实引用了 Angular min js 但没有引用 Angula
如何从 VuetifyJS Vertical Stepper 中删除过渡效果？

是否可以在点击继续后直接显示下一步Vuetify 步进器 https vuetifyjs com en components steppers example vertical 或者换句话说如何去除过渡滑出效果看起来没有提供任何选项来更
Groovy - JsonSlurper 解析 JSON 文件

我有一个类似于下面的 JSON 文档我正在尝试在 Groovy 中解析它基本上对于每所学校学校信息我想抓住SCHOOL COUNTRY和其他领域我正在尝试下面的代码但它没有返回我需要的内容对于列出的每所学校 1 000 所我
Intellij IDEA 代码覆盖率不起作用

当我尝试运行具有覆盖范围的 JUnit 测试时我收到以下错误 FATAL ERROR in native method processing of javaagent failed java lang reflect Invocation
Ajax文件上传

我想使用 Ajax 和 php 上传文件我有一个表格
jquery CoffeeScript中绑定点击事件

我正在开发 Rails 3 2 并使用 CoffeeScript 我对在我的应用程序中使用 jquery mobile 有疑问我有一个像这样的html a href class follow span class ui btn inner
径向渐变绘制性能 - OpenGL-ES 可以改进吗？

我正在开发一个图像处理应用程序它将径向渐变叠加在从照片库加载的图像上在屏幕上我有一个滑块可以动态地增大减小径向渐变的半径我发现模拟器上的性能很好但在 iPhone 3G 或 3GS 上就很糟糕了much移动滑块时重绘速度较慢我
SELECT 在 PL/pgSQL 函数中引发异常

我想在函数内实现循环但收到此错误 ERROR 查询没有结果数据的目标代码 CREATE OR REPLACE FUNCTION my function ill int ndx bigint RETURNS int AS DECLARE
具有自动布局的 UITableViewCell 中的 UILabel 高度错误

我有一个UITableView单元格的固定高度为 100 点这些单元格是在 xib 文件中创建的该文件使用 3 个约束来固定UILabel到单元格的左右和上边缘contentView 标签的垂直拥抱优先级设置为 1000 因为我希望单
是否可以将对象从 jquery 发布到 Bottle.py？

这是jquery ajax type POST url posthere dataType json data myDict 1 1 2 2 success function data do code 这是蟒蛇 route posthere
如何同时使用 LoadHTMLGlob 和 LoadHTMLFiles

我想要来自不同子目录的分隔符逻辑模板templates文件夹下面是我的templates文件夹 templates authentication login gohtml logout gohtml index gohtml profil
如何从脚本中创建新的 Joomla 用户帐户？

我们正在为 Joomla 创建一个 XML API 允许合作伙伴网站在我们的网站上为其用户创建新帐户我们已经创建了一个独立的 PHP 脚本来处理和验证 API 请求但现在我们需要实际创建新帐户我们最初只想进行 CURL 调用来提交注册
导航组件重复 NavArgs 的问题

我有一个片段 class SomeFragment private val args by navArgs
Sagemaker LDA 主题模型 - 如何访问训练模型的参数？还有一种简单的方法来捕捉连贯性吗

我是 Sagemaker 的新手正在运行一些测试来衡量 AWS 上的 NTM 和 LDA 与 LDA mallet 和本机 Gensim LDA 模型相比的性能我想检查 Sagemaker 上经过训练的模型并查看诸如哪些单词对每个主题

Sagemaker LDA 主题模型 - 如何访问训练模型的参数？还有一种简单的方法来捕捉连贯性吗

Sagemaker LDA 主题模型 - 如何访问训练模型的参数？还有一种简单的方法来捕捉连贯性吗 的相关文章

随机推荐

热门标签

Sagemaker LDA 主题模型 - 如何访问训练模型的参数？还有一种简单的方法来捕捉连贯性吗的相关文章