数据仓库和非结构化数据。

2023-11-10

 

数据仓库包含标准化数据。

还包含 外部数据/非结构化数据 

 

如果外部数据 量小 可以保持数据库内部或者专用服务器。

如果量大 只能记住地址, 在etl 加载

当然也有需求 是实时数据 比如股票  汇率 拿只能etl过程处理

 

非结构化数据  包含图片 ,视频 音频

 

如果是传统数据库 db2 oracle存在里面是不合适的。存储影响性能

如果是hadoop 无所谓 影响不大,

但是从使用者的角度

非结构化数据 只能转换关系使用 

建一张元数据表存储非结构化存储位置就可以了。

 

比如说文档之类  我需要检索。非结构化数据

建议在应用端使用soli lucnce这些检索工具

 

数据仓库没来就没有统计的概念。只是看大家怎么区分的。

 

转载于:https://www.cnblogs.com/itxuexiwang/p/6289429.html

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

数据仓库和非结构化数据。 的相关文章

  • 八大排序比较(时间复杂度,空间复杂度,稳定性的比较)

    排序算法的稳定性 含义 假定在待排序的记录序列中 存在多个具有相同的关键字的记录 若经过排序 这些记录的相对次序保持不变 即在原序列中 r i r j 且r i 在r j 之前 而在排序后的序列中 r i 仍在r j 之前 则称这种排序算法
  • python 使用前馈神经网络处理IrIs数据集(BP)

    本文章包含以下内容 数据 lris数据集 模型 前馈神经网络 激活函数 Logistic 损失函数 交叉嫡损失 优化器 梯度下降法 评价指标 准确率 输出层使用了Softmax分类 通过使用前馈神经网络实现BP学习算法 进一步理解前馈神经网
  • Java基础 --- 注解 Annotation

    Java基础 注解 Annotation Java注解 Java自带的标准注解 自定义注解 Java注解 Java注解它提供了一种安全的类似注释的机制 用来将任何的信息或元数据 metadata 与程序元素 类 方法 成员变量等 进行关联

随机推荐

  • Pytest-UnitTest

    2023暑期学习 Pytest Pytest pytest是python的一种单元测试框架 与python自带的unittest测试框架类似 但是比unittest框架使用起来更简洁 效率更高 pip install pytest pyte
  • JavaScript的三大组成部分(收藏)

    JavaScript是一种属于网络的脚本语言 已经被广泛用于Web应用开发 常用来为网页添加各式各样的动态功能 为用户提供更流畅美观的浏览效果 通常JavaScript脚本是通过嵌入在HTML中来实现自身的功能的 各位小伙伴在进阶的时候总会
  • 放个手机在单位自动打卡_几步神奇操作让你的钉钉自动打卡

    这款叫做 FreeDing 的 Android 应用 是一个钉钉自动打卡工具 只需要把手机放在办公室 就能实现每天自动定时打卡了 Appinn 这是一个程序员一不爽就造轮子的故事 diy0504 同学所在公司打卡要求越来越严格 忘记打卡不准
  • 实用mysql命令

    1 显示表中所有列的详细信息 show full columns table name 2 查看服务器版本 show version 3 查看当前登录用户 select current user 4 显示表的详细信息 show table
  • 聊聊 Docker 和 Dockerfile

    目录 一 前言 二 了解Dockerfile 三 Dockerfile 指令 四 多阶段构建 五 Dockerfile 高级用法 六 小结 一 前言 对于开发人员来说 会Docker而不知道Dockerfile等于不会Docker 上一篇文
  • This beta version of Typora is expired, please download and install a newer version.

    一 问题 打开typora软件提示如下图 翻译过来就是 此测试版Typora已过期 请下载并安装新版本 二 解决办法 1 win R调用运行窗口 输入regeedit 打开注册表 2 在注册表数据输入 计算机 HKEY CURRENT US
  • javaScript基础面试题 ---call、apply、bind三者的异同 - 改变this的方法,apply和call最初设计的时候为什么要设计这两个,为什么apply参数是数组call不是

    call apply bind三者的异同 call方法 apply方法 bind方法 call apply bind三者的异同 改变this的方法 apply和call最初设计的时候为什么要设计这两个 为什么apply参数是数组call不是
  • 如何使用JLINK在ADS1.2环境下调试硬件?

    注 虽然文章是对LPC2148而写的 但是对三星的44B0芯片同样适用 只需要在选择时将相应的CPU选择的S3C44B0就可以了 JLINK在ADS下调试心得 前两天一个客户用jlink 在ADS来调试LPC2148总报错 这个错误我之前在
  • 对象有多个字段新增日志执行的方法却只有几个?

    我以上代码 AssetCard对象有多个字段 最后执行新增却只有几个字段 我之前开发的项目都是公司自己开发的框架 是解决了字段可以包含下划线的 然后这次客户需要我写个插件 我就自己搭建了一个项目 让后发现字段包含下划线底层sql就会缺少字段
  • 根据地理位置多语言切换(3)-多语言切换

    在手机应用的实现中经常会遇到需要语言切换用于满足用户环境的多样性 可以根据所处地理位置信息进行经纬度及国家 城市 地区的获取 可以根据此内容进行多语言情况的推荐及切换 完成上述的想法需要进行几个功能的开发 需要通过手机进行地理位置信息获取
  • 【无监督】6、SimSiam

    文章目录 一 背景 二 方法 三 效果 论文 Exploring Simple Siamese Representation Learning 出处 FAIR 何恺明大佬 本文作者抛出了两个爆炸 性结论 结论一 基于孪生网络的对比的学习的成
  • 外盘国际期货招商

    100万在各省市能生活多久 按照去年人均消费支出计算 上海100万能花不到22年 西藏能花近63年 2021年我国居民人均预期寿命 78 2岁 2022年我国各省市人均消费支出 365日 西藏43 5 日 62年11个月 2022年我国各省
  • M ySql基础3

    一 MySql存储过程和函数 概念 好处 存储过程和函数的区别 创建存储过程 调用存储过程 查看存储过程 删除存储过程 存储过程语法 二 MySql触发器 创建触发器 查看触发器 删除触发器 触发器的总结 三 MySQL事务 事物的概念 未
  • 可重入函数与线程安全

    指令乱序和线程安全 先来看什么是指令乱序问题以及为什么有指令乱序 程序的代码执行顺序有可能被编译器或CPU根据某种策略打乱指令执行顺序 目的是提升程序的执行性能 让程序的执行尽可能并行 这就是所谓指令乱序问题 理解指令乱序的策略是很重要的
  • 开手游要选用怎么样的服务器

    想要让玩家的游戏体验感好不仅需要好的游戏策划 画风 内容 更需要一款好的服务器来进行支撑 服务器就好比基石 而策划内存等等就是框架 如果基石不稳定 再好的游戏也很难给玩家良好的体验感 那么如何来选择一款好的服务器来作为游戏的基石呢 首先根据
  • webpack:代码分割

    webpack中文文档地址 https www webpackjs com 从webpack4开始官方移除了commonchunk插件 改用了optimization属性进行更加灵活的配置 配置项 注意 webpack4及以上才支持opti
  • df.corr和df.describe()

    1 df corr df corr 函数的作用是返回列与列之间的相关系数 corr matrix df corr sns heatmap corr matrix annot True cmap coolwarm 2 df describe
  • javascript 定时器

    本文转载自 JavaScript定时器详解及实例
  • Pycharm的破解安装

    Pycharm的卸载 参考 转载 1 程序文件目录 所有的相关文件都保存在解压缩的目录中 即 opt pycharm community 2018 1 4 目录下 2 配置文件目录 启动PyCharm后 会在用户家目录下建立一个 PyCha
  • 数据仓库和非结构化数据。

    数据仓库包含标准化数据 还包含 外部数据 非结构化数据 如果外部数据 量小 可以保持数据库内部或者专用服务器 如果量大 只能记住地址 在etl 加载 当然也有需求 是实时数据 比如股票 汇率 拿只能etl过程处理 非结构化数据 包含图片 视