DSSM pytorch实现

2023-05-16

之前在网上找到了一个文本匹配实现仓库，但是没有提供DSSM的代码，我就根据那个代码实现以下DSSM。数据集采用的是蚂蚁金服的数据集。也参考过别人的代码，但是总感觉怪怪的，DSSM原文中，一个query有对应的正样本和负样本，因此在实现的时候分别计算query与正负样本的余弦相似度，最后拼接再接softmax，但是蚂蚁金服数据集中每一个样本都已一个query和doc,对应一个label，并没有成对的正负样本，因此在实现中遇到了困难，因此最后我索性直接将余弦值作为网络输出，貌似还取得了不错的效果，那么代码会有些许不同。
第一，损失函数采用了二分类损失函数：

class torch.nn.BCELoss(weight=None, size_average=True)

第二，判断类别时：

def correct_predictions(output_probabilities, targets):
    """
    Compute the number of predictions that match some target classes in the
    output of a model.
    Args:
        output_probabilities: A tensor of probabilities for different output
            classes.
        targets: The indices of the actual target classes.
    Returns:
        The number of correct predictions in 'output_probabilities'.
    """
    # _, out_classes = output_probabilities.max(dim=1)
    out_classes = output_probabilities.ge(0.5).byte().float()
    correct = (out_classes == targets).sum()
    return correct.item()

第三，网络结构设计如下：

class DSSM(nn.Module):

    def __init__(self, dropout=0.2,device="gpu"):
        super(DSSM, self).__init__()
        self.device = device
        self.embed = nn.Embedding(7901, 100)
        self.fc1 = nn.Linear(100, 256)
        self.fc2 = nn.Linear(256, 512)
        self.fc3 = nn.Linear(512,256)
        self.dropout = nn.Dropout(dropout)
        self.Sigmoid = nn.Sigmoid() #method1
        self.relu = nn.ReLU()

    def forward(self, a, b):
        a = self.embed(a).sum(1)
        b = self.embed(b).sum(1)

        a = self.relu(self.fc1(a)) #torch.tanh
        # a = self.dropout(a)
        a = self.relu(self.fc2(a))
        # a = self.dropout(a)
        a = self.relu(self.fc3(a))
        # a = self.dropout(a)

        b = self.relu(self.fc1(b))
        # b = self.dropout(b)
        b = self.relu(self.fc2(b))
        # b = self.dropout(b)
        b = self.relu(self.fc3(b))
        # b = self.dropout(b)

        cosine = torch.cosine_similarity(a, b, dim=1, eps=1e-8)  #计算两个句子的余弦相似度
        # cosine = self.Sigmoid(cosine-0.5)
        cosine = self.relu(cosine)
        cosine = torch.clamp(cosine,0,1)
        return cosine

这样在蚂蚁金服测试集的准确率可以达到77以上，如果cosine后面不接relu，我跑到了78以上，但是总感觉出现了过拟合现象。此外，加入dropout效果反而不好，可能这个网络本身就不复杂吧。
其他的训练代码我参考了：https://github.com/zhaogaofeng611/TextMatch

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

DSSM

Pytorch

DSSM pytorch实现的相关文章

使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像

当不使用 KL 散度项时 VAE 几乎完美地重建 mnist 图像但在提供随机噪声时无法正确生成新图像当使用 KL 散度项时 VAE 在重建和生成图像时都会给出相同的奇怪输出这是损失函数的 pytorch 代码 def loss fu
在pytorch张量中过滤数据

我有一个张量X like 0 1 0 5 1 0 0 1 2 0 我想实现一个名为的函数filter positive 它可以将正数据过滤成新的张量并返回原始张量的索引例如 new tensor index filter positive
尝试理解 Pytorch 的 LSTM 实现

我有一个包含 1000 个示例的数据集其中每个示例都有5特征 a b c d e 我想喂7LSTM 的示例以便它预测第 8 天的特征 a 阅读 nn LSTM 的 Pytorchs 文档我得出以下结论 input size 5 hid
PyTorch：如何检查训练期间某些权重是否没有改变？

如何检查 PyTorch 训练期间某些权重是否未更改据我了解一种选择可以是在某些时期转储模型权重并检查它们是否通过迭代权重进行更改但也许有一些更简单的方法有两种方法可以解决这个问题 First for name param in
Pytorch ValueError：优化器得到一个空参数列表

当尝试创建神经网络并使用 Pytorch 对其进行优化时我得到了 ValueError 优化器得到一个空参数列表这是代码 import torch nn as nn import torch nn functional as F fro
如何使用pytorch构建多任务DNN，例如超过100个任务？

下面是使用 pytorch 为两个回归任务构建 DNN 的示例代码这forward函数返回两个输出 x1 x2 用于大量回归分类任务的网络怎么样例如 100 或 1000 个输出对所有输出例如 x1 x2 x100 进行硬编码绝对
torch.stack() 和 torch.cat() 函数有什么区别？

OpenAI 的强化学习 REINFORCE 和 actor critic 示例具有以下代码加强 https github com pytorch examples blob master reinforcement learning r
Pytorch GPU 使用率低

我正在尝试 pytorch 的例子https pytorch org tutorials beginner blitz cifar10 tutorial html https pytorch org tutorials beginner b
如何从已安装的云端硬盘文件夹中永久删除？

我编写了一个脚本在每次迭代后将我的模型和训练示例上传到 Google Drive 以防发生崩溃或任何阻止笔记本运行的情况如下所示 drive path drive My Drive Colab Notebooks models if p
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
如何在 PyTorch 中对子集使用不同的数据增强

如何针对不同的情况使用不同的数据增强转换 Subset在 PyTorch 中吗例如 train test torch utils data random split dataset 80000 2000 train and test将具
如何计算cifar10数据的平均值和标准差

Pytorch 使用以下值作为 cifar10 数据的平均值和标准差变换 Normalize 0 5 0 5 0 5 0 5 0 5 0 5 我需要理解计算背后的概念因为这些数据是 3 通道图像我不明白什么是相加的什么是除什么的等等
ValueError：使用火炬张量时需要解压的值太多

对于神经网络项目我使用 Pytorch 并使用 EMNIST 数据集已经给出的代码加载到数据集中 train dataset dsets MNIST root data train True transform transforms T
在requirements.txt中包含.whl安装

如何将其包含在requirements txt 文件中对于Linux pip install http download pytorch org whl cu75 torch 0 1 12 post2 cp27 none linux x8
Pytorch .to('cuda') 或 .cuda() 不起作用并且卡住了

我正在尝试做 pytorch 教程当我尝试将他们的设备设置为 cuda 时它不起作用并且我的代码运行被卡住有关具体信息我正在使用 conda 环境蟒蛇3 7 3 火炬1 3 0 cuda 10 2 NVIDIA RTX2080TI
运行时错误：大小不匹配，m1：[4 x 3136]，m2：[64 x 5]位于c：\ a \ w \ 1 \ s \ tmp_conda_3.7_1

我使用 python 3 当我插入变换随机裁剪大小 224 时它会给出未匹配错误这是我的代码 https github com kajasumanie medical plant classification blob master i
如何屏蔽 PyTorch 权重参数中的权重？

我正在尝试在 PyTorch 中屏蔽强制为零特定权重值我试图掩盖的权重是这样定义的def init class LSTM MASK nn Module def init self options inp dim super LSTM
如何在pytorch中动态索引张量？

例如我有一个张量 tensor torch rand 12 512 768 我得到了一个索引列表说它是 0 2 3 400 5 32 7 8 321 107 100 511 我希望从给定索引列表的维度 2 上的 512 个元素中选择 1
PyTorch：运行时错误：函数 MulBackward0 在索引 0 处返回无效梯度 - 预期类型 torch.cuda.FloatTensor 但得到 torch.FloatTensor

我不明白这个错误告诉我什么在另一个帖子 https github com NVIDIA flownet2 pytorch issues 139也解决了同样的问题但没有有效的解决方案 Traceback most recent call
无法在jupyter笔记本中导入torch

系统 macOS 10 13 6 蟒蛇 3 7 蟒蛇3 我遇到麻烦时import torch在 jupyter 笔记本中 ModuleNotFoundError No module named torch 这是我安装 pytorch 的方法

随机推荐

完全二叉树学习

定义 xff1a 假设高度为h xff0c 那么前h 1层都是满的 xff0c 最后一层 xff0c 从左向右 xff0c 连续集中在最左边 xff1b k层的完全二叉树总节点个数最小为2 k 1 xff0c 最大节点个数为2 k 1 可以
thrift例程编译报错原因和解决方法总结

thrift里自带的turoral xff0c 使用make编译时经常会报错 xff0c 总结如下 xff1a 1 如果出现如下错误 xff1a error uint8 t does not name a type error uint32
C++11带来的move语义

C 43 43 11带来了move语义 xff0c 可以有效的提高STL的效率 xff0c 这篇文章写的非常好 xff0c 可以参考 xff0c 这里对原文进行翻译 xff0c 加入我自己的理解原文 xff1a http www cpro
C++11带来的lambda表达式

C 43 43 11带来了lambda表达式 xff0c 可以简化程序的编写 xff0c 使代码更加清晰现在按照步骤来介绍lambda表达式 xff1a 1 函数对象又叫仿函数 xff0c 如果一个类或者结构体重载了operator 操
caffe中几个基本概念

caffe中几个基本概念 1 caffe中的blob结构是用来进行数据存储交换和处理网络中正向反向迭代时的数据和导数信息的数据结构 blob是caffe的标准数组结构他提供了一个统一的内存接口其将内部的cpu gpu数据之间的传输与存
摄像头引脚定义

摄像头引脚定义 1 NC NO CONNECT 2 AGND Power Analog ground 3 SIO D I O SCCB serial interface data I O 4 AVDD Power Analog power
Android7.0 JACK编译器不支持多用户同时编译的问题的解决

xfeff xfeff Android7 0 xff08 也就是Android N xff09 上默认使用JACK编译器而不再使用openjdk了 xff0c 但发现JACK不是很好用 xff0c 比如最大的一个问题就是 xff0c 同一台
【树莓派】死机自动重启、掉线自动重连

目录 WIFI掉线自动重连首先查看你的板子硬件型号拿树莓派去做服务器就要配置下这两项 xff0c 保证随时能够VNC控制 WIFI掉线自动重连 http shumeipai nxez com 2017 01 25 raspberry p
open vswitch分析

Open vSwitch 概述 Open vSwitch xff08 下面简称 OVS xff09 是一个高质量的多层虚拟交换机 OVS 遵循开源 Apache2 0 许可 xff0c 通过可编程扩展 xff0c OVS 可以实现大规模网
C# 接口《通俗解释》

原文地址 xff1a https www cnblogs com hamburger p 4681681 html 接口的定义 xff1a 接口是指定一组函数成员 xff0c 而不实现他们的引用类型接口使用interface 关键字进行定
linux 如何查看指定动态库

要查看 Linux 系统指定的动态库 xff0c 可以使用以下命令 xff1a 使用 ldconfig 命令 xff1a ldconfig p 该命令将显示系统已加载的所有动态库及其路径如果要查找特定动态库 xff0c 可以使用 grep
Tortoisegit 恢复文件夹被删除的文件（被误删）

关于Tortoisegit 恢复git文件夹中被删除的文件 xff1a 1 在git文件夹右键tortorisegit show log 2 选择版本 xff08 当时执行删除操作的版本 xff09 3 选择被delete掉的 xff0c
putty screen 快捷键

使用putty的时候 xff0c 开启screen再detach xff0c 可以防止跑程序过程中断开连接而导致程序中断总结了下putty与screen 相关的快捷键目前常用的有如下几个 xff08 命令均在putty终端输入 xff0
Magento的不同版本（CE，EE，ECE）介绍

Magento提供了三个不同的版本平台 xff0c 即Magento Community Edition xff08 CE xff09 社区版 xff0c Magento Enterprise Edition xff08 EE xff09
c语言初学，字母大小写转换

这类题目主要通过ASCII码差值实现 xff0c A对应ASCII码十进制数字是65 xff0c a对应ASCII码十进制数字是97 xff0c 即大小写字母之间ASCII码差值为32 xff0c 想要将大写字母转换为小写字母可以将该字符A
matlab——subplot多子图共用一个colorbar，微调子图和colorbar位置

用subplot命令画出多个图后 xff0c 需要让这些图共用一个colorbar 在这里与大家分享我的操作 xff0c 希望能帮助到有需要的人备注 xff1a 从 R2019b 开始 xff0c 可以在分块图布局中显示共享颜色栏 xff
远程连接服务器数据库报错：Host ‘XXXXXX’ is blocked because of many connection errors

一我遇到的问题描述使用Navicat for mysql连接公司的服务器数据库 xff0c 报错 xff1a Host XXXXXX is blocked because of many connection errors 二出现错误
android中MediaCodec硬编码中关键帧间隔时间设置问题

在MediaCodec硬编码中设置 xff29 关键帧时间间隔 xff0c 在 xff21 xff30 xff29 中是这么设置的 mMediaCodec 61 MediaCodec createByCodecName debugger g
python3 网络编程问题——虚拟机centos7上运行tcp服务器，在主机win10上使用网络调试助手作为tcp客户端无法建立连接，提示1035错误：the socket is marked...

前提 xff1a 主机和虚拟机都是在同一网段下我的网络调试助手的连接结果如下图 xff1a 注意红框中的提示 xff0c 连接超时的结果可能是由于以下两种可能的情况导致的 xff1a 1 服务器端口未开启监听 2 路由项被防火墙拦截对
DSSM pytorch实现

之前在网上找到了一个文本匹配实现仓库 xff0c 但是没有提供DSSM的代码 xff0c 我就根据那个代码实现以下DSSM 数据集采用的是蚂蚁金服的数据集也参考过别人的代码 xff0c 但是总感觉怪怪的 xff0c DSSM原文中 xff

DSSM pytorch实现

DSSM pytorch实现 的相关文章

随机推荐

热门标签

DSSM pytorch实现的相关文章