如何利用大数据进行价值兑现才是正经事(虎嗅网)

2023-05-16

如何利用大数据进行价值兑现才是正经事

如果有一天你可以预测未来,你要做的第一件事情是什么?买彩票?第二件、第三件事情呢? 先卖个关子,我们后面再说这件事情。
大数据是个产业,广义上指的是在这个信息过载时代围绕着海量信息产生、传播、收集、处理、创造价值的整个产品链条;狭义上一般指大数据存储与处理、数据挖掘的相关产业。目前市场上利用大数据最多的一般在于分析和预测。
根据本人10年来在这个行业的从业经验, 大数据与前两年的云计算、再往前的网格计算、并行计算都是相同产业链上几个环节,它是作为概念被媒体和从业者炒作起来的。但不可否认的是,我们的社会正处于信息爆炸的时代,各行业的信息量都在几何级数增长,高效利用好这些数据确实能为工作和生活带来巨大变革。
观点1:数据本身不产生价值,如何分析和利用大数据对实际业务产生帮助才是关键
例如,它可以帮助控制美国占17.6%GDP的医疗支出,为医药行业带来超过3000亿美元的成本节省和收益(来自麦肯锡的报告)
Netflix 制作《纸牌屋》的故事很多人都听过,说的是这家公司利用大数据分析了用户最喜欢的情节、最喜欢的演员组合、最喜欢的编剧等等,组合起来之后自己制作了一部电视剧最终取得巨大成功。
虽然听过故事的人很多,但几乎没有人注意到,这家公司是处于大数据应用链的顶端。与提供分析服务、提供大数据存储、提供数据清洗的基础产业中下游公司不同,Netflix除了自身产生数据且具备分析能力外,关键的是具备把分析结果转化为产品的能力,这才是产生高利润和竞争力的核心。
观点2:从事大数据的生意要重视投入与产出
大数据门槛很低,用一个Excel就可以起步,但随着研究的深入,想利用大数据分析进行获利,还是需要一定的预算和投入。
比如:需要专业的团队,如大数据分析师,10年前这个职位就存在,叫BI(商业智能),工作的内容就是分析大量的数据并通过建模等方式帮助制定战略或进行商业决策。
有了分析师就需要有配套的工程师配合,从海量的数据中挖掘出有价值的东西。
服务器:大数据另一个要消耗的资源就是服务器,从存储到计算再到带宽,都是需要不断的进行投入的。
所以商业公司进入这个行业前要考虑下是否有足够的预算,但同时上述的几点也孕育了不少新的机会,比如amazon就是全球最大的云计算基础设施厂商,splunk和前一段上市的Tableau都是对分析师提供数据处理服务的,相当于替代了一部分昂贵的工程师的工作。
观点3:大数据不是最近才有的,数据一直存在,分析数据的技术近几年有了革命性的突破
处理海量数据在技术界一直是个课题,几个革命性的技术在近10年相继出现,奠定了我们目前大数据的基础,其中包括虚拟化技术、Map-Reduce & Bigtable 、 NoSQL数据库、Deep Learning技术等。
虚拟化造就了今天的amazon云服务基础设施, map reduce造就了帮助我们进行高速云计算的hadoop开源软件,之前处理几天的数据现在几分钟就可以处理完。NoSQL数据库已经广泛应用在了拥有大量数据及高访问量的网站上,性能比传统数据库提升了许多。
观点4:许多人已经默默地通过大数据获利
商业公司通过长期研究,一旦发现了通过大数据获利的秘诀,多数情况下还是选择独乐乐而不是众乐乐。因为分析方法和数据源一旦公开,竞争对手必然会跟进,会导致了方法同质化最终体现在收益降低。
精准营销是个众所周知的领域,通过对每个人的信息进行分类建模,进行不同种类的营销。比如搜索引擎中,你长期搜索一些新的楼盘信息,搜索引擎会根据你的搜索历史判断你极有可能是潜在的买房者,美国target百货公司就曾因为根据用户的购物记录判断出一女孩怀孕并给其家里投送孕妇购物手册而名声大噪。在淘宝中搜索了旅行背包后,在新浪上都能看到相关旅游用品的广告。
但实际上大数据公司为了提高竞争优势,已经并不满足于这种有直接联系的数据,纷纷通过更多的途径收集数据。 根据笔者这些年的见闻,在保护行业机密的前提下在这里分享一些读者之前没听过的干货。
1、路由器,之前只是上网的小盒子,在数据采购市场是极为炙手可热的渠道。原因是近些年随着手机硬件的发展(路由器和手机等移动设备使用相似的芯片),尤其是处理器计算能力的几何式增长,小小的路由器里面已经可以运行很多程序,这些程序在用户上网时默默的分析着各种各样的数据,包括你常联系的好友信息,上网记录等。
2、网络运营商,运营商喜欢在用户浏览网页时插入一些广告,相信多数人都遇到过,和路由器的数据分析原理一样,运营商并不满足于千篇一律的固定展示广告,也在与时俱进,利用大数据进行精准的个性化广告营销。
3、基础软件,如浏览器、输入法。不仅是电脑还包括手机,你用输入法在各个软件里提交的查询请求,在浏览器里鼠标移到某个商品上却没有点击等等, 这些大数据都会被储存到了云上,供厂商进行分析。
4、金融公司。
提到革命性的技术,就不得不提到金融行业。我们在文中前面提到过的大数据成本问题在金融行业就不是问题了,因为在这个行业新技术带来的收益的提升都远高于成本,故我们可以看到每一项新技术往往都会第一时间在金融业应用。大数据也不例外,其实在很多年前大数据的数据挖掘已经广泛应用到了金融领域。这里我们要把博彩行业也归为金融业。
直到今年美国才有零星应用的"商场人流量大数据监测系统"其实在许多年前就被应用到了澳门和美国拉斯维加斯的赌场,一家赌场安装有上千个摄像头,从顾客进门开始就通过面部识别技术开始追踪,结合每个人的交易情况进行数据挖掘,除了找出老千等不受欢迎的人外,还能挑选大客户,鼓励非理性的赌客加大赌注等方式获取更多利润。
股市是除了博彩行业外另一个大数据市场,几十年前的股市就是一个利用信息不对称获利的市场,如今大数据分析成为了新一代有效的工具。股票市场每时每刻都有海量的交易信息,大数据分析技术一直伴随着证券行业发展成长。
之前很多写大数据的文章都会提到印第安纳大学的研究人员研究发现通过分析twitter信息中人们的情绪可以准确预测股市的涨跌,但在google搜索利用twitter数据进行交易的对冲基金只能找到伦敦的DCM一家。原因正如上一段提到的,商业公司尤其是对冲基金都不会轻易暴露自己的运算逻辑,这个道理和《三体》中的“黑暗森林”逻辑是相同的。
但实际上,我们可以通过种种蛛丝马迹发现twitter信息已经广泛被市场中的对冲基金使用。比如只要好莱坞女星海瑟薇出现在头条,"股神"沃伦-巴菲特的公司的A股股价就会上涨。原因很简单,女星海瑟薇的名字是Anne Hathaway,巴菲特的公司叫伯克希尔-哈撒韦公司(Berkshire Hathaway),两者都包括Hathaway这个词,说明不少对冲基金都使用了实时分析twitter和新闻大数据的技术。
另外一个例子:一则假消息在twitter发布:白宫发生了两起爆炸事件,总统奥巴马(Barack Obama)在事件中受伤,导致股市、欧元等相关全线在第一时间下挫,道指2分钟下跌100多点,欧元也是强势下行,美国股市市值短暂蒸发约1,400亿美元。 一次偶然的黑客恶作剧,又导致许多使用twitter数据对冲基金被暴露出来。
再举个发生在身边的例子,大家知道到券商开户为什么要填写一张详细的表格吗?上面会要求你填写你的收入、投资经历等,因为在华尔街,有非常成熟的模型可以通过你填写的表格预测你未来的收益,同时分析大量的交易记录针对不同种类的用户进行相应的营销与服务,目标同样是提高利润。
金融领域另一块大的领域是信贷市场,国内最近也异常火热,包括阿里巴巴等公司早已进入。新的P2P产业除了在商业模式、效率、用户来源等与传统银行不同外,最关键因素之一就是大数据。通过大数据可以解决信贷产业最核心的坏账率问题。阿里巴巴通过其平台上用户的交易数据、好评率等完整的结构化数据可以非常容易的对用户进行信用评估,但其他平台没有阿里巴巴的数据优势,就需要更多的数据挖掘才能降低坏账率从而盈利,国外最大的P2P公司比如Lending Club是经过了6年不断完善才首次实现盈利,可见这个巨大的市场中我们面对的挑战之大。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何利用大数据进行价值兑现才是正经事(虎嗅网) 的相关文章

  • 【Android】移动端接入Cronet实践

    移动端接入Cronet实践 QUIC协议获取Chromium源码编译CronetAndroid iOS buildsDesktop builds targets the current OS Running the ninja files生
  • Linux系统下安装Java环境

    目录 测试环境 下载JDK 终端模拟软件 安装前准备 tar包的安装方法 tar包的卸载 rpm包的安装方法 rpm包的卸载 测试环境 LInux系统版本 xff1a CentOS 7 64位 终端模拟软件 xff1a Xshell 6 J
  • 【Hexo】Hexo个人博客绑定域名

    Hexo个人博客绑定域名 当我们在用hexo搭建了个人博客之后 xff0c 用username github io访问难免有些奇怪 xff0c 下面就花3分钟时间对如何绑定个人域名进行描述 我这边是在阿里云买的一个域名 xff0c ycbl
  • 生产者消费者的代码实现

    当消费者获得的数据为大写字母时 xff0c 则把大写字母转换成小写字母 xff0c 并显示 xff1b 当消费者获得的数据为小写字母时 xff0c 则把小写字母转换成大写字母 xff0c 并显示 xff1b 当消费者获得的数据为字符0 1
  • 基于RobHess的SIFT图像拼接知识点随笔

    1 SIFT算法具有尺度不变性在于构建的高斯尺度空间 xff1b 2 SIFT算法具有旋转不变性在于特征方向向量 xff1b 3 K d数以图像特征点的128维特征描述子均值为依据进行划分 构建 xff1b 4 特征点匹配是一个图像的所有特
  • 最小二乘法及OpenCv函数

    1 最小二乘法 我们以最简单的一元线性模型来解释最小二乘法 什么是一元线性模型呢 xff1f 监督学习中 xff0c 如果预测的变量是离散的 xff0c 我们称其为分类 xff08 如决策树 xff0c 支持向量机等 xff09 xff0c
  • Linux服务器网络不通情况分析以及常见检查方法

    在实际运维过程中 xff0c 经常会遇到网路不通的问题 xff0c 一般此类网络不通的问题都是业务端到端的排查 本文从后端linux服务器端自查是否服务器问题 通过多年的运维经验总结 xff0c 服务器端问题导致网络不通 xff0c 大致分
  • RANSAC算法实现去除误匹配并计算拼接矩阵-随笔

    1 RANSAC算法实现去除误匹配并计算拼接矩阵流程 1 从样本集中随机抽选一个RANSAC样本 xff0c 即4个匹配点对 xff08 至少4个匹配点对 xff0c 才能计算出3 3变换矩阵 xff09 xff1b 2 计算当错误概率为0
  • linux c++ 服务器端开发面试必看书籍

    由于很多朋友希望加入到Linux c 43 43 服务器端开发的队伍中 xff0c 本人就结合自己的面试经历并整理了自己阅读的相关书籍 xff0c 同大家分享 xff0c 一起进步 人个认为以下是进入这个方向的必看书籍 xff0c 各系列难
  • C++进阶—>const、define和enum的区别和用途

    1 区别 这三种都可以定义常量 define是宏定义 xff0c 编译器不对其进行错误检查 xff0c 在预编译阶段处理 xff0c 没有作用域限制属于全局常量 xff0c 在程序中编译器会对定义的常量名以数值进行替换 xff0c 且每次替
  • MFC中基于OpenCV实现Picture Control控件成像方法

    MFC中基于OpenCV实现Picture Control控件成像方法有两种 xff0c 一种是OpenCV2 2以前版本的绘制 xff0c 另外一种是OpenCV2 2以后版本的绘制 xff08 1 xff09 在OpenCV2 2之前的
  • MFC中CFileDialog及SHBrowseForFolder

    MFC中实现通过按钮来选择文件路径或文件夹路径 xff1b xff08 1 xff09 CFileDialog类能够选择文件 xff0c 并获取其路径 xff08 当然也可以通过获取文件路径再去除文件名而获得其所在文件夹路径 xff0c 前
  • C++进阶—>带你理解多字节编码与Unicode码

    本篇文章将讲解C 43 43 开发中容易混淆的另一个概念 多字节字符集与Unicode字符集 多字节字符与宽字节字符 char与wchar t 我们知道C 43 43 基本数据类型中表示字符的有两种 xff1a char wchar t c
  • BP神经网络及其C++实现

    0 前言 神经网络在我印象中一直比较神秘 xff0c 正好最近学习了神经网络 xff0c 特别是对Bp神经网络有了比较深入的了解 xff0c 因此 xff0c 总结以下心得 xff0c 希望对后来者有所帮助 神经网络在机器学习中应用比较广泛
  • C++进阶—>Socket通信那点事

    1 网络中进程之间如何通信 xff1f 本地的进程间通信 xff08 IPC xff09 有很多种方式 xff0c 但可以总结为下面4类 xff1a 消息传递 xff08 管道 FIFO 消息队列 xff09 同步 xff08 互斥量 条件
  • C++进阶—>线程同步随笔

    线程同步主要有五种方法 xff1a 原子访问 xff0c 临界区 xff0c 信号量 xff0c 事件和互斥量 xff1b 其中原子访问和临界区属于用户模式的同步 xff1b 信号量 xff0c 事件和互斥量属于内核模式的同步 原子访问是通
  • C++进阶—>_beginthreadex和CreateThread的区别和联系

    beginthread 和 CreateThread 的区别 转自 http wenku baidu com view adede4ec4afe04a1b071dea4 html 程序员对于Windows程序中应该用 beginthread
  • idea src下源文件和class编译文件不一致

    今天遇到一个神奇BUG xff0c 一个和elasticsearch没有任何关系的项目 xff0c 报错ES某个包找不到 xff0c 刚开始以为是依赖了父项目的某个包 xff0c 并且本项目主启动类ComponentScan扫描了相关的类进
  • C++进阶—>Win32 多线程的创建方法和基本使用

    Summary From xff1a https software intel com zh cn blogs 2011 12 02 win32 cid 61 sw prccsdn2086 总结Win32提供的创建多线程相关的API接口和基
  • Windows核心编程之多进程概述

    一 进程的概念 进程是是一个正在运行的程序的实例 xff08 飘 xff5e xff5e xff5e xff09 xff0c 是系统分配资源的单位 线程是执行的单位 xff0c 包括内存 xff0c 打开的文件 处理机 外设等 xff0c

随机推荐

  • Windows核心编程之进程间通信

    1 进程与进程通信 进程是装入内存并准备执行的程序 xff0c 每个进程都有私有的虚拟地址空间 xff0c 由代码 数据以及它可利用的系统资源 如文件 管道等 组成 多进程 多线程是Windows操作系统的一个基本特征 Microsoft
  • Windows核心编程之邮槽实现进程间通信

    邮槽是Windows系统提供的一种单向通信的机制 即进程中的一方只能写入或读取数据 xff0c 而另一方则只能读取或写入数据 通过邮槽 xff0c 用户可以实现一对多或跨网络的进程之间的通信 但是 xff0c 邮槽能传输的数据非常小 xff
  • 图像连通域分析

    转自 xff1a https blog csdn net tiandijun article details 51279643 xff0c 转载仅为方便学习 一 前言 二值图像的图像的亮度值只有两个状态 xff1a 黑 0 和白 255 二
  • C++ wchar_t *和char * 互转

    转自 xff1a https blog csdn net lightspear article details 54695123 说道wchar t和char两个类型大家都不会陌生 wchar t xff1a 在windows下是Unico
  • android识别模拟器

    识别安卓模拟器的两种方案 xff01 禁止通过模拟器进行刷量 xff0c 防止作弊行为 xff01 import android content Context import android content Intent import an
  • ubuntu在终端中打开文件管理器

    打开ubuntu的终端 xff0c 输入nautilus path 弹出资源管理器界面
  • chrome jsonView插件安装

    由于谷歌浏览器经常打不开应用商店 xff0c 还有就是安装第三方插件的办法 方法就如下 xff1a 由于最近做和json相关的东西 xff0c 所以 xff0c 以jsonView插件为例分享一下 1 打开https github com
  • Gradle学习笔记 使用Gradle Wrapper

    Gradle可以在没有安装Gradle的情况下使用 xff0c 这时候就需要Gradle Wrapper了 Gradle Wrapper其实就是一个脚本文件 xff0c 它会在没有安装Gradle的情况下为我们下载Gradle xff0c
  • 《30天自制操作系统》:值得推荐的一本好书

    自己编写一个操作系统 xff0c 是许多程序员的梦想 也许有人曾经挑战过 xff0c 但因为太难而放弃了 其实你错了 xff0c 你的失败并不是因为编写操作系统太难 xff0c 而是因为没有人告诉你那其实是一件很简单的事 那么 xff0c
  • 验证谷角猜想

    import java util public class Test3 3 验证谷角猜想 xff1a 日本数学家谷角静夫在研究自然数时发现了一个奇怪的现象 对于任意一个自然数n xff0c 若n为偶数 xff0c 则将其除以2 xff1b
  • 生产者消费者问题(Linux多线程下两种实现)

    生产者消费者问题是同步问题中的一种常见情况 xff0c 借用一下维基百科的话 生产者消费者问题 xff08 英语 xff1a Producer consumer problem xff09 xff0c 也称 有限缓冲问题 xff08 英语
  • Mac Tomcat安装 localhost 拒绝了我们的连接请求

    Mac Tomcat安装 localhost 拒绝了我们的连接请求 Mac下安装Tomcat服务器 xff0c 下载的Tomcat10 在bin目录下 xff0c 授权 chmod 777 sh 启动Tomcat服务 startup sh
  • 从SAP最佳业务实践看企业管理(83)-PP-145按库存生产

    xfeff xfeff 从SAP 最佳业务实践看企业管理 83 PP 145 按库存生产 1 MTS 按库存生产 在按库存生产策略的类型中 xff0c 客户基本上对最终产品规格的确定没有什么建议或要求 xff0c 他们的投入很少 生产商生产
  • Jenkins学习笔记:解决插件安装问题

    安装插件结束后 xff0c 当时界面提示很多插件没有成功 xff0c 问我是否需要重试 xff0c 我安排到后面再做解决 今天打开Jenkins后 xff0c 发现之前的密码不能登录了 xff0c 仔细想了想 xff0c 记起之前改过了 用
  • Tensorflow lite for 移动端安卓开发(二)——完整详细过程训练自己的模型

    官方给的Tensorflow lite demo是ImageNet 中训练的1000类物体识别 xff0c 基于移动端的项目需要 xff0c 现在要用模型训练自己的数据 xff0c 提供两种训练方法 xff0c 这也是自己在摸索Tensor
  • 亚马逊,一个沉睡广告巨人的苏醒(虎嗅网)

    虽然拥有令无数广告主羡慕的高质量用户数据和巨大的网站流量 xff0c 但是在很长的一段时间内亚马逊还是将主要的精力集中在商品销售上 xff0c 广告只是作为自身业务的补充可有可无的存在 不过最近两年 xff0c 亚马逊对广告这种不屑的态度正
  • 大数据案例分析:电信业Hadoop应用分析 原文出自【比特网】,转载请保留原文链接:http://do.chinabyte.com/228/12410228.shtml

    电信业Hadoop应用分析 昨日 xff0c 联通研究院处长王志军在第七届 开源中国 开源世界 高峰论坛上分享了Hadoop在电信行业大数据应用的经验 随着国内3G网络的发展 xff0c 或者移动通信网络的发展 xff0c 中国联通 600
  • 大腕出手看门道,谈BAT的投资战略差异 三家战略投资的思考原点并不相同虎嗅网)

    中国互联网的收购之战 xff0c 比娱乐圈的明星离婚更一波三折和猜不透结局 当所有人以为搜狗被360牵回山寨只是早晚的事的时候 xff0c 搜狗和腾讯宣布好上了 眼瞅着今年第三季度即将结束 xff0c 中国互联网巨头们在2013年的 军备竞
  • JDK6的安装

    http www java net download jdk6 6u10 promoted b32 binaries jdk 6u10 rc2 bin b32 windows i586 p 12 sep 2008 exe XP 下 JDK6
  • 如何利用大数据进行价值兑现才是正经事(虎嗅网)

    如果有一天你可以预测未来 xff0c 你要做的第一件事情是什么 xff1f 买彩票 xff1f 第二件 第三件事情呢 xff1f 先卖个关子 xff0c 我们后面再说这件事情 大数据是个产业 xff0c 广义上指的是在这个信息过载时代围绕着