记一次异常排查过程:druid连接池抛出DataSourceDisableException

2023-05-16

为什么80%的码农都做不了架构师?>>>   hot3.png

先交待下项目背景,项目中有个功能是从mysql中获取数据库信息来创建数据库连接,用的连接池是druid,jar包版本是1.0.9。

1. 异常的发生

最近项目中出现了一个神奇的异常:

读取MySQL数据错误: jdbc:mysql://61.160.xxx.xxx:3306/xxx?characterEncoding=utf-8&autoReconnect=false&connectTimeout=15000&socketTimeout=60000, taskId=xxxxx, message: null

这个发生在数据库操作时,神奇之处在于:

  1. 异常偶尔会发生,同一时间的连接,有的会成功,而有的会报异常;
  2. 异常信息为null。

2. 异常抛出位置

抛出异常的代码如下:

@Override
protected Result<Date> doImportData() {
   String url = getJdbcUrl();
   String host = getHost();
   int port = getPort();
   String username = getUsername();
   String password = getPassword();
   Connection con = null;

   DataSource dataSource = null;
   try {
      long t1 = System.currentTimeMillis();
      dataSource = DataSourceProvider.getDataSource(host, port, username, 
	  		password, url, MAX_POOL_SIZE, MIN_POOL_SIZE, INITIAL_POOL_SZIE);
      con = dataSource.getConnection();
      long getConnectionCostTime = System.currentTimeMillis() - t1;
      logger.info("taskId=" + task.getTaskId() + ",getConnection()=" + getConnectionCostTime + "ms");
      ···
   } catch (SQLException e) {
      logger.error("读取MySQL数据错误: " + url + ", taskId=" + task.getTaskId() + ", message: " + e.getMessage());
      ···
   } finally {
      if (con != null) {
         try {
            con.close();
         } catch (SQLException e) {
            // ignore
         }
      }
   }
   return result;
}

3. 异常分析与推断

3.1 从异常信息来看,可以得出如下判断:

  1. 异常是由SQLException捕获到的,因此代码运行到了try代码块;
  2. 异常的message是null,很容易联想到抛出的是NullPointerException,但SQLException捕获不到NPE,因此不会是NPE;
  3. 从运行日志排查,没有运行到代码 logger.info("taskId=" + task.getTaskId() + ",getConnection()=" + getConnectionCostTime + "ms");

3.2 从以上信息来排除,发现可疑问代码只有三行了:

long t1 = System.currentTimeMillis();
dataSource = DataSourceProvider.getDataSource(host, port, username, 
		password, url, MAX_POOL_SIZE, MIN_POOL_SIZE, INITIAL_POOL_SZIE);
con = dataSource.getConnection();

3.3 再看看方法的具体实现,发现异常的抛出是在

con = dataSource.getConnection();
// 项目中用的是druid连接池
// com.alibaba.druid.pool.DruidDataSource
public DruidPooledConnection getConnection() throws SQLException

在方法里往下找下去,没找到什么有用的信息,终于还是放弃了...

4.峰回跳转-打印异常堆栈信息

项目中的异常还在报,好想假装异常没发生...嗯,还是继续排查吧。

接下来,刚好碰上项目发布,果断修改了打印异常信息的方式,这次直接打出异常堆栈而不仅仅是message了:

logger.error("读取MySQL数据错误: " + url + ", taskId=" + task.getTaskId() 
		+ ", message: " + ExceptionUtils.getStackTrace(e));

ExceptionUtils是apache commmons包提供的类,封装了异常相关的操作方法。

等待着,等待着,异常信息终于来了:

[游戏数据采集异常]读取MySQL数据错误: jdbc:mysql://61.160.xxx.xxx:3306/xxx?characterEncoding=utf-8&autoReconnect=false&connectTimeout=15000&socketTimeout=60000, taskId=xxxxxx, message: com.alibaba.druid.pool.DataSourceDisableException
    at com.alibaba.druid.pool.DruidDataSource.pollLast(DruidDataSource.java:1482)
    at com.alibaba.druid.pool.DruidDataSource.getConnectionInternal(DruidDataSource.java:1074)
    at com.alibaba.druid.pool.DruidDataSource.getConnectionDirect(DruidDataSource.java:941)
    at com.alibaba.druid.pool.DruidDataSource.getConnection(DruidDataSource.java:921)
    at com.alibaba.druid.pool.DruidDataSource.getConnection(DruidDataSource.java:911)
    at com.alibaba.druid.pool.DruidDataSource.getConnection(DruidDataSource.java:98)
	···

5.异常排查

从异常堆栈信息来看,报错的异常是DataSourceDisableException,代码是DruidDataSource.java的1482行。

5.1 DataSourceDisableException异常:

首先来认识下DataSourceDisableException异常:

public class DataSourceDisableException extends SQLException

这个类继承了SQLException,所以代码中能catch到。

5.2 异常相关代码

再看看异常抛出的的位置:

if (!enable) {
	connectErrorCount.incrementAndGet();
	throw new DataSourceDisableException();
}

发现两个问题:

  1. if块里的代码执行了,说明enable为false了,只需找到导致enable为false的地方就可以查到异常原因了;
  2. 抛出异常时,没有指定任何的异常信息,如new DataSourceDisableException('出现异常了'),这就导致了异常信息是null。

情况已经很明显了,接下来只要找到导致enable为false的位置就行了。

通过搜索得知,enable初始化时为true,对外暴露了setEnable(boolean)方法:

public void setEnable(boolean enable) {
	···
	this.enable = enable;
	···
}

同时在close()方法中明确地将enable设置成了false:

public void close() {
	···
	enable = false;
	···
}

5.3 得出结论

进一步排查,发现setEnable()方法没有地方调用,而close()方法有地访问在调用。对照代码逻辑,得出的结论如下:

代码里有这样一个操作:数据库连接时,以host、port为key,从缓存中获取dataSource,若username、password与连接里的不一致时,就会关闭获取到的dataSource,并以新的username、password创建新的dataSource.但是,当同一个host、port有多个账号跟密码时,这种操作会有问题,原因是多线程情况下,关闭的dataSource可以会被其他线程获取到。

5.4 问题的解决

知道了问题的所在,解决办法就很简单了:保证dataSource只能被一个线程获取,这里用的缓存数据结构是ConcurrentHashMap,获取数据源时,用的是操作是get()方法,这里只要将操作改成remove(),并且使用完之后,再将dataSourceput()方法返还就可以了。

6.反思

这个异常困扰了我两天,原因与解决方法并不复杂,难点在于异常信息。对于异常信息为null的情况,实在无人下午,只能对着代码干瞪眼。本次排查的转机出现在异常堆栈信息的打印,详细的异常信息有助于问题的快速解决。

7.总结

写了这么多,总结如下:

  1. 吐槽下ali大厂,异常信息竟然不写。
  2. 实际开发中,异常信息应尽量简洁明了,不能啥都不写,更不能故意制造混乱。只有异常发生了,才懂异常信息的可贵。
  3. 异常堆栈信息最好还是要打出来的,不然项目一复杂、调用一多,短短的一句异常信息,可能看不出是在哪里抛出来的,不利于排查。

转载于:https://my.oschina.net/funcy/blog/1933131

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

记一次异常排查过程:druid连接池抛出DataSourceDisableException 的相关文章

  • Apache Druid源码导读--Google guice DI框架

    文章目录 缘起Google Guice介绍与Spring的对比Example覆盖已有绑定关系默认绑定 Apache Druid中Guice模块guice lifecycleguice jsonconfigguice jersey jetty
  • 数据库连接池----Druid

    数据库连接池的标准接口 xff1a DataSource 获取连接的方法 xff1a Connection getConnection Druid是Java最好的数据库连接池之一 Druid数据库连接池的使用步骤 xff1a 1 导入jar
  • SpringBoot(十三)整合Druid

    Druid简介 Java程序很大一部分要操作数据库 xff0c 为了提高性能操作数据库的时候 xff0c 又不得不使用数据库连接池 Druid 是阿里巴巴开源平台上一个数据库连接池实现 xff0c 结合了 C3P0 DBCP 等 DB 池的
  • Apache Druid源码导读--Google guice DI框架

    文章目录 缘起Google Guice介绍与Spring的对比Example覆盖已有绑定关系默认绑定 Apache Druid中Guice模块guice lifecycleguice jsonconfigguice jersey jetty
  • 记一次异常排查过程:druid连接池抛出DataSourceDisableException

    为什么80 的码农都做不了架构师 xff1f gt gt gt 先交待下项目背景 xff0c 项目中有个功能是从mysql中获取数据库信息来创建数据库连接 xff0c 用的连接池是druid xff0c jar包版本是1 0 9 1 异常的
  • apache druid学习之Processes and servers

    Processes and servers Apache Druid Process types Druid has several process types Coordinator Overlord Broker Historical
  • 取消DruidDataSource连接失败自动重试

    背景 最近在业务开发的时候 遇到了一个场景 需要遍历数据库连接信息创建数据库连接 而原来我配置的DruidDataSource在创建数据库连接失败后会自动重试 且是无限重试 而我期望的逻辑是 但创建数据库连接失败后 尝试几次依然失败就跳过该
  • 一起实战Springboot开发后端管理系统4:数据库连接池Druid和HikariCP

    上一篇文章主要讲解了如何再Matrix Web中使用Mybatis Plus Mybatis Plus作为Orm框架 连接数据库需要连接数据库的依赖 WEB 系统高并发环境下 频繁的进行数据库连接操作 造成系统技术瓶颈问题 无效的资源开销
  • Druid无效链接回收策略(源码分析)(mysql 8小时连接失效问题)

    目录 问题背景 异常Communications link failure druid数据库连接池关键配置说明 注意标红配置 druid数据库连接池超时连接回收源码分析 第一种方式 获取连接时校验 第二种方式 Destroy 定时任务检查需
  • Druid(Druid.io)简单使用

    Druid简单使用 一 Druid服务进程 Historical进程 Historical进程用于处理历史数据的存储和查询 历史数据包括所以已经被committed的流数据 Historical进程从深度存储 Deep Storage 中下
  • 记录Spring boot 项目中druid SQL验证报错但是系统功能正常 报后端报 merge sql error 前端数据查询正常

    异常代码 20 17 49 331 http nio 8081 exec 6 ERROR c a d f s StatFilter mergeSql 169 merge sql error dbType oracle druid 1 2 8
  • druid 概述

    1 什么样的业务适合用 Druid 时序化数据 Druid 可以理解为时序数据库 所有的数据必须有时间字段 实时数据接入可容忍丢数据 tranquility 目前 tranquility 有丢数据的风险 所以建议实时和离线一起用 实时接当天
  • alibaba druid数据库连接池详解

    1 介绍 Druid连接池是阿里巴巴开源的数据库连接池项目 Druid连接池为监控而生 内置强大的监控功能 监控特性不影响性能 功能强大 能防SQL注入 内置Loging能诊断Hack应用行为 2 下载 git地址 https github
  • 整合Druid数据源(springboot学习笔记10)

    1 导入Druid依赖 这个依赖有普通的 也有springboot专属的启动器类型 两者都一样 版本也是同时更新的 普通版
  • springboot配置自定义数据源(Druid德鲁伊)的步骤。

    今天和大家分享下在Springboot中配置自定义数据源Druid的两种方法及步骤 方法一 1 在pom xml配置依赖 注释里面的内容 2 配置自己的数据源设置 我是在yaml文件中配置的 顺便提醒一下 在配置yaml文件的时候缩进问题一
  • 常用的 Druid 参数

    Druid 参数 连接池初始化大小 最大连接数 最小空闲连接数这几个连接数有什么作用 他们的关系是怎么样的 初始连接数如果都被占用了 连接池会创建最小空闲数个连接吗 官网 Druid Database for modern analytic
  • 如何将新列添加到现有的德鲁伊架构中?

    我创建了一个架构 并将 1TB 数据添加到德鲁伊架构中 然后日志文件版本升级并添加新的两列 然后我想将该数据添加到德鲁伊架构中 但还不能 为了向现有数据源添加新列 您需要执行以下步骤 前往Tasks德鲁伊控制台中的菜单 从列出的数据源中 转
  • 如何在 GROUP BY Druid 返回的结果中执行 SELECT?

    我很难将下面这个简单的 SQL 查询转换为 Druid SELECT country city Count FROM people data WHERE name Mary GROUP BY country city 所以到目前为止我想出了
  • 在 Apache Superset 中添加 Druid 集群作为 SQL 数据库

    我目前通过 Apache Superset 中的 druid 连接器连接到 druid 集群 听说druid可以用SQL来查询 是否可以将我的 SQL 数据库连接指向 druid 请按照以下步骤操作 您需要使用最新版本的pydruid用于启
  • 如何通过宁静向druid插入数据

    通过以下教程http druid io docs latest tutorials tutorial loading streaming data html http druid io docs latest tutorials tutor

随机推荐

  • 动态创建HTML内容

    document write xff08 xff09 方法 document write方法可以方便快捷的把字符串插入到文档里 它最大的缺点是违背了 分离javascript 原则 即使把document write语句挪到外部函数里 xf
  • Linux练习(write写入)

    include lt unistd h gt include lt stdlib h gt int main if write 1 34 here is some data n 34 18 61 18 write 2 34 write er
  • matlab练习程序(随机游走图像)

    随机游走类似布朗运动 xff0c 就是随机的向各个方向走吧 虽然代码没什么技术含量 xff0c 不过产生的图像实在太漂亮了 xff0c 所以还是贴上来吧 产生的图像 xff1a matlab代码如下 xff1a clear all clos
  • [翻译完成] 树莓派搭建Google TV

    为什么80 的码农都做不了架构师 xff1f gt gt gt Google TV是啥玩意 Google TV是支持自选图像 宽带网络 传统电视信号的综合平台 xff0c 更附带电视节目搜索功能 谷歌公布了其新版电视的两个版本 第一个叫做B
  • jdk17.0.1安装教程

    1 解压到某文件夹 2 在此电脑 gt 属性 gt 高级系统设置 gt 环境变量 gt 系统变量 加一条JAVA HOME 3 在系统变量Path里 xff0c 加一条 JAVA HOME bin xff08 不能放在第一条 xff09 4
  • 推荐几本GIS专业书籍

    对于开设GIS专业的高校 xff0c 基本上都会有自己的专业教材 xff0c 用的比较多的像邬伦的 地理信息系统 xff1a 原理 方法和应用 和中科院陈述彭院士的 地理信息系统导论 在当初考研的时候 xff0c 自己也买了不少教材 xff
  • Linux 通过命令发送udp 数据

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 如果往本地UDP端口發送數據 xff0c 那麼可以使用以下命令 xff1a echo hello gt dev udp 192 168 1 81 5060 意思是往本地19
  • Qt学习之路(17): Qt标准对话框之QMessageBox

    好久没有更新博客 xff0c 主要是公司里面还在验收一些东西 xff0c 所以没有及时更新 而且也在写一个基于Qt的画图程序 xff0c 基本上类似于PS的东西 xff0c 主要用到的是Qt Graphics View Framework
  • 2019年开发者必读!20位阿里技术大牛们帮你列了一份经典书单! ...

    导读 xff1a 寒冬中 xff0c 最值得投资的是学习 xff0c 是增厚的知识储备 下面就是20位阿里技术大牛们为我们推荐的经典书籍 书籍类型涉及技术 管理 哲学等方面 xff0c 希望这些书籍陪伴你度过这个漫长的寒冬 书单之外 xff
  • 发表一篇顶会论文的经验分享

    背景 xff1a 最近半个月 xff0c 对之前发表的一篇顶会论文进行了修改 xff0c 并重新提交了 这篇论文是一篇计算机领域的A会文章 本篇文章主要对计算机领域论文写作及发表过程中的相关经验做一个总结 希望可以对研究生小白们有点用 刚刚
  • jQuery的md5加密插件及其它js md5加密代码

    jQuery MD5 hash algorithm function lt code gt Calculate the md5 hash of a String String md5 String str lt code gt Calcul
  • matlab双目相机标定校正_基于双目视觉的无人机避障算法(一)

    讲述在10月到12月所做的所有工作 对于一个无人机自主避障来说 xff0c 存在着以下流程 xff1a 感知 xff1a 障碍物检测 行人检测 目标检测SLAM xff1a 为无人机提供位置估计 xff0c 构建稀疏环境地图路径规划 xff
  • pdf文件显示白色

    主要原因是pdf默认关联应用 xff0c 在版本更替时出现了错误 xff0c 重新给pdf设置一下默认关联应用即可 window10步骤如下 xff1a 1 打开我的电脑 选择计算机 打开设置 2 点 应用 3 选择 默认应用 中的 按文件
  • mysql数据库想要保持固定条数数据的操作

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 限定数据库数据条数 xff1a SELECT FROM 表名 order by 字段 desc limit 条数 这样查询到的是倒数几条数据 xff0c 保证了最新的数据
  • Docker容器的创建、启动、和停止

    1 容器是独立运行的一个或一组应用 xff0c 及他们的运行环境 容器是Docker中的一个重要的概念 2 docker容器的启动有三种方式 a 交互方式 xff0c 基于镜像新建容器并启动 例如我们可以启动一个容器 xff0c 打印出当前
  • 每天一个linux命令(4):mkdir命令

    linux mkdir 命令用来 创建指定的 名称的 目录 xff0c 要求创建目录的用户在当前目录中具有写权限 xff0c 并且指定的目录名不能是当前目录中已有的目录 1 xff0e 命令格式 xff1a mkdir 选项 目录 2 xf
  • ansible报错:Failed to connect to the host via ssh: Permission denied

    原因 xff1a 没有在ansible管理节点 xff08 即安装ansible的节点 xff09 上添加目标节点 xff08 即需要管理的节点 xff09 的ssh认证信息 解决办法 xff1a 1 在管理节点生成公钥 ssh keyge
  • 值传递和引用传递-----函数参数传递的两种方式

    回顾 xff1a 在定义函数时函数括号中的变量名成为形式参数 xff0c 简称形参或虚拟参数 xff1b 在主调函数中调用一个函数时 xff0c 该函数括号中的参数名称为实际参数 xff0c 简称实参 xff0c 实参可以是常量 变量或表达
  • Andriod监听支付宝收款实现个人支付宝支付接口!附安卓App

    首先呢 xff0c 我不会开发安卓App xff0c 这款APP是我在酷安网看到的 xff0c 非常简单的一款APP xff0c 安装后填写我们的后端接口 xff08 用于接收收款通知的 xff09 就可以接收收款通知了 所以就算我们没有这
  • 记一次异常排查过程:druid连接池抛出DataSourceDisableException

    为什么80 的码农都做不了架构师 xff1f gt gt gt 先交待下项目背景 xff0c 项目中有个功能是从mysql中获取数据库信息来创建数据库连接 xff0c 用的连接池是druid xff0c jar包版本是1 0 9 1 异常的