BERT 输出不确定

2024-05-04

BERT 输出是不确定的。当我输入相同的输入时，我希望输出值是确定性的，但我的 bert 模型的值正在变化。听起来很尴尬，同一个值返回两次，一次。也就是说，一旦出现另一个值，就会出现相同的值并重复。如何使输出具有确定性？让我展示我的代码片段。我使用如下模型。

对于 BERT 实现，我使用 Huggingface 实现的 BERT pytorch 实现。这是 pytorch 领域相当著名的 ri 模型实现。 [关联]https://github.com/huggingface/pytorch-pretrained-BERT/ https://github.com/huggingface/pytorch-pretrained-BERT/

        tokenizer = BertTokenizer.from_pretrained(self.bert_type, do_lower_case=self.do_lower_case, cache_dir=self.bert_cache_path)
        pretrain_bert = BertModel.from_pretrained(self.bert_type, cache_dir=self.bert_cache_path)
        bert_config = pretrain_bert.config

得到这样的输出

        all_encoder_layer, pooled_output = self.model_bert(all_input_ids, all_segment_ids, all_input_mask)

        # all_encoder_layer: BERT outputs from all layers.
        # pooled_output: output of [CLS] vec.

汇集输出

tensor([[-3.3997e-01,  2.6870e-01, -2.8109e-01, -2.0018e-01, -8.6849e-02,

tensor([[ 7.4340e-02, -3.4894e-03, -4.9583e-03,  6.0806e-02,  8.5685e-02,

tensor([[-3.3997e-01,  2.6870e-01, -2.8109e-01, -2.0018e-01, -8.6849e-02,

tensor([[ 7.4340e-02, -3.4894e-03, -4.9583e-03,  6.0806e-02,  8.5685e-02,

对于所有编码器层，情况是相同的，-两次相同。

我从bert中提取词嵌入特征，情况是一样的。

wemb_n
tensor([[[ 0.1623,  0.4293,  0.1031,  ..., -0.0434, -0.5156, -1.0220],

tensor([[[ 0.0389,  0.5050,  0.1327,  ...,  0.3232,  0.2232, -0.5383],

tensor([[[ 0.1623,  0.4293,  0.1031,  ..., -0.0434, -0.5156, -1.0220],

tensor([[[ 0.0389,  0.5050,  0.1327,  ...,  0.3232,  0.2232, -0.5383],

请尝试设置种子。我遇到了同样的问题并设置了种子以确保我们每次都获得相同的值。可能的原因之一可能是 BERT 中发生了 dropout。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

BERT 输出不确定的相关文章

openNLP 与 Solr 集成时出现异常

我正在尝试将 openNLP 与 Solr 6 1 0 集成我配置了架构和 solrconfig 文件详细信息请参见 wiki 链接 https wiki apache org solr OpenNLP https wiki apach
ValueError：“连接”层需要具有匹配形状的输入（连接轴除外）

我正在尝试为我的项目构建 Pix2Pix 并收到错误值错误 Concatenate层需要具有匹配形状的输入除了连接轴之外获得输入形状 None 64 64 128 None 63 63 128 生成器是一个 U 网模型我的输入高度
输入维度/分辨率会影响卷积神经网络的性能吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在构建一个图像分类器其中有 66 个类和大约 50000 个图像我的电脑内存为 12 GB 我的内存不足以训练图像我的问题是
AttributeError：类型对象“Word2Vec”没有属性“load_word2vec_format”

我正在尝试实现 word2vec 模型并收到属性错误 AttributeError 类型对象 Word2Vec 没有属性 load word2vec format 下面是代码 wv Word2Vec load word2vec format
如何在 PyTorch 中对子集使用不同的数据增强

如何针对不同的情况使用不同的数据增强转换 Subset在 PyTorch 中吗例如 train test torch utils data random split dataset 80000 2000 train and test将具
如何提取句子中的主语及其各自的从属短语？

我正在尝试在句子中进行主题提取以便我能够根据主题获得情感我在用nltk在 python2 7 中用于此目的以下面的句子为例 Donald Trump is the worst president of USA but Hillary
Fine-Tuning DistilBertForSequenceClassification：不是学习，为什么loss没有变化？权重没有更新？

我对 PyTorch 和 Huggingface transformers 比较陌生并对此尝试了 DistillBertForSequenceClassificationKaggle 数据集 https www kaggle com c
Caffe 的 LSTM 模块

有谁知道 Caffe 是否有一个不错的 LSTM 模块我从 russel91 的 github 帐户中找到了一个但显然包含示例和解释的网页消失了以前是http apollo deepmatter io http apollo deep
了解 YOLO 是如何训练的

我试图了解 YOLO v2 是如何训练的为此我使用这个 keras 实现https github com experiencor keras yolo2 https github com experiencor keras yolo2在
TensorFlow：带有轴选项的 bincount

在 TensorFlow 中我可以使用 tf bincount 获取数组中每个元素的计数 x tf placeholder tf int32 None freq tf bincount x tf Session run freq feed
使用 NLP 进行地址分割

我目前正在开发一个项目该项目应识别地址的每个部分例如来自 str Jack London 121 Corvallis ARAD ap 1603 973130 输出应如下所示 street name Jack London no 121
Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异

我正在使用以下代码在 keras 中为 NLP 任务训练一个简单模型训练集测试集和验证集的变量名称是不言自明的该数据集有 19 个类因此网络的最后一层有 19 个输出标签也是 one hot 编码的 nb classes 19 m
如何在 Caffe 中沿着通道分割 Blob

我想在Caffe中分割Blob通道这样我就可以分割一个Blob N c w h 分成两个大小相同的输出 Blob N c 2 w h 我上面描述的是非常笼统的我实际上想做的是将一个两通道输入图像分离成两个不同的图像一个进入卷积层另一
使用“自然”语言编写代码更好吗？

我最近看到一种编程语言叫做超新星 http supernova sourceforge net 他们在网页上说超新星编程语言是现代脚本语言和第一个提出了概念用直接虚构进行编程描述使用纯人类语言的清晰子集你可以编写如下代码 i
给定文档，选择相关片段

当我在这里提出问题时自动搜索返回的问题的工具提示给出了问题的前一点但其中相当一部分没有给出任何比理解问题更有用的文本标题有谁知道如何制作一个过滤器来删除问题中无用的部分我的第一个想法是修剪仅包含某个列表中的单词的任何前导句子例如
如何使用动词时态/语气制作稀疏匹配器模式？

我一直在尝试使用动词时态和情绪为 spacy 匹配器创建一个特定的模式我发现了如何使用 model vocab morphology tag map token tag 访问使用 spacy 解析的单词的形态特征当动词处于虚拟语气模式
为什么分割任务使用 Dice Coefficient 而不是 IOU？

我见过人们使用IOU作为衡量标准detection任务和Dice Coeff for segmentation任务这两个指标在方程方面看起来非常相似只是骰子给予相交部分的权重是两倍如果我是对的那么 Dice 2 x A B A B
Keras 可以处理不同尺寸的输入图像吗？

Keras 可以处理不同尺寸的输入图像吗例如在全卷积神经网络中输入图像可以具有任意大小然而我们在用Keras创建网络时需要指定输入形状因此我们如何使用 Keras 来处理不同的输入尺寸而不将输入图像调整为相同的尺寸谢谢你的帮
计算机AI算法写句子？

我正在寻找有关处理文本句子或在创建在正常人类语言例如英语中有效的句子时遵循结构的算法的信息我想知道这个领域是否有我可以学习或开始使用的项目例如如果我给一个程序一个名词为其提供同义词库相关单词和词性以便它理解每个单词在句子中
UnimplementedError：图形执行错误：在张量流上运行 nn

我一直遇到这个错误我不知道为什么特别是因为我完全遵循某人的代码并且该人在运行此错误时没有错误 img shape 128 128 3 load pretrained model base model tf keras applicati

随机推荐

将参数传递给 SQL Server 中的 IN 子句[重复]

这个问题在这里已经有答案了可能的重复参数化 SQL IN 子句 https stackoverflow com questions 337704 parameterizing a sql in clause SQL Server 带有声
Windows 通用应用程序串行端口无法打开，SerialDevice.FromIdAsync 始终为 null

我正在尝试在 Windows 通用应用程序中使用串行端口我一直在使用微软的串行示例应用程序作为模板但是我遇到了一个相当奇怪的问题 var dis await DeviceInformation FindAllAsync SerialDe
来自无符号字符缓冲区的 QImage（jpg 格式）

我有类型的缓冲区unsigned char 我用JPG图像填充我想使用此缓冲区将图像绘制到 QLabel 中的应用程序屏幕上我已经这样做了但图像不正确谁能告诉我最好的方法是什么 QPixmap pix QPixmap fromIma
观察者不触发

我正在使用带有选项 API 的 Vue 3 如下面发布的代码所示在watch对象我监视发生的变化isToggleBtnLabelDigitizePolygon 在方法中onDigitizePolygon我改变的值isToggleBtnL
/usr/bin/env: 'python3\r': Windows 中没有抛出此类文件或目录错误

我正在尝试从下面的存储库在我的 Windows 本地计算机中部署 hyperledger sawtooth https github com hyperledger education https github com hyperledge
在 Linux 集群上安装 R `forecast` 包：编译器问题？

我正在寻找测试性能R 更具体地说是一些例程forecast封装在具有 Intel Xeon Phi 协处理器的 HPC 集群上据我所知系统管理员已经建立了R 3 2 5按照英特尔网站上的说明从来源获取 https software in
在 SQL 表中的文本字符串中查找换行符？

我试图在 SQL 表的列中查找换行符和回车符但我不确定语法 I tried SELECT foo FROM test WHERE foo LIKE CHAR 10 尽管我知道该表应该返回结果但我没有得到任何结果我究竟做错了什么 SEL
如何让NSManagedObject不出错？

我目前正在调试另一个开发人员编写的一个大项目该项目使用CoreData我对此很陌生我遇到了崩溃这是由于某些NSManagedObject是一个错误我对什么是错误不太了解我想将对象转换为非错误看看它是否有帮助阅读文档让我想到t
我无法让 jQuery 工作 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 你好我正在尝试一些 jQuery
在 Vapor 应用程序中使用 Fluent 进行连接

我正在努力弄清楚如何使用 Fluent 将两个表连接在一起本质上我想运行这个 SQL 命令 SELECT p name o amount o amount p amount total FROM OrderPoints o INNER J
Angular.js 性能问题

性能选项卡上的 Batarang 显示在应用程序的根目录上 Angular 正在调用如下所示的函数 function a var e f i a eval h m hc i 根据 batarang 的说法它的速度慢得令人痛苦当我在应用程
如何创建 3D 高度图

我有一个 2D 数组 Z 存储该元素位置的高度除了使用方法之外here http matplotlib org mpl toolkits mplot3d tutorial html surface plots其中我需要创建与 Z 大小相同
ElasticSearch 多滚动 Java API

我想从索引中获取所有数据由于项目数量对于内存来说太大我使用滚动很好的功能 client prepareSearch index setTypes myType setSearchType SearchType SCAN setScro
在 LINQ 中选择案例[重复]

这个问题在这里已经有答案了我怎样才能把它翻译成 LINQ 呢 select t age as AgeRange count as Users from select case when age between 0 and 9 then 0
Gson解析没有键值对的字符串

我正在尝试使用 Gson 库解析字符串但没有成功这是我的字符串 1 816513 52 5487566 1 8164913 52 548824 此示例中的问题是没有键值对我查看了其他示例但它们都有键值对看起来不像我的问题我的解决
从 R Markdown 中的字数统计中排除部分

我正在用 Rmarkdown 写一篇论文通过 LaTeX 导出为 PDF 我需要计算正文中的字数对于 LaTeX 文档我使用texcount从命令行使用我的 tex 文档中的以下标签指定要从字数统计中排除的部分 TC ignore
通过排队预加载图像？

我正在寻找一种预加载特定图像并将其添加到队列中的方法这是我目前所处的位置 http shivimpanim org testsite imageloader html http shivimpanim org testsite image
使用PathModifier或MoveYModifier来模拟精灵跳跃

我在 AndEngine 中使用这个方法来确定用户触摸的场景 Override public boolean onSceneTouchEvent Scene pScene TouchEvent pSceneTouchEvent if pSc
如何调试 MySQL 上的锁等待超时？

在我的生产错误日志中我偶尔会看到 SQLSTATE HY000 一般错误 1205 超过锁等待超时尝试重新开始交易我知道当时哪个查询正在尝试访问数据库但是有没有办法找出哪个查询在那个精确时刻拥有锁定暴露这一点的是这个词交易从该
BERT 输出不确定

BERT 输出是不确定的当我输入相同的输入时我希望输出值是确定性的但我的 bert 模型的值正在变化听起来很尴尬同一个值返回两次一次也就是说一旦出现另一个值就会出现相同的值并重复如何使输出具有确定性让我展示我的代码片段

BERT 输出不确定

BERT 输出不确定 的相关文章

随机推荐

热门标签

BERT 输出不确定的相关文章