Python创建索引，批量插入数据测试

2023-10-27

测试

# -*- coding: utf-8 -*-
"""
Created on 2019-6-13 10:19:25
@author: chenlin3
"""

import esSdk

class EsSdkTest():
    def test(self):
        name = EsSdkTest.__name__
        print('begin, %s' % name)

        list=[]
        col = {}
        col['colName'] = 'id'
        col['colType'] = 1
        col['showName'] = 'ID'
        list.append(col)

        col1 = {}
        col1['colName'] = 'name'
        col1['colType'] = 1
        col1['showName'] = '姓名'
        list.append(col1)

        col2 = {}
        col2['colName'] = 'age'
        col2['colType'] = 2
        col2['showName'] = '年龄'
        list.append(col2)

        col3 = {}
        col3['colName'] = 'birth'
        col3['colType'] = 3
        col3['showName'] = '生日'
        list.append(col3)

        dataList = []
        data = {}
        data['id'] = '1'
        data['name'] = '地点'
        data['age'] = '20'
        data['birth'] = '2019/01/01'
        dataList.append(data)
        data = {}
        data['id'] = '2'
        data['name'] = '地点22'
        data['age'] = '4,057,934,769.4598'
        data['birth'] = '2019/02/01'
        dataList.append(data)
        data = {}
        data['id'] = '2'
        data['name'] = '地点11'
        data['age'] = '60,435,766'
        data['birth'] = ''
        dataList.append(data)
        print(dataList)

        esSdk.importData('sdk_index_2','sdktest',list,dataList)


if __name__ == '__main__':
    test = EsSdkTest()
    test.test()

逻辑

# -*- coding: utf-8 -*-
"""
Created on 2019-6-13 10:19:25
@author: chenlin3
"""
from elasticsearch import Elasticsearch
import datetime
from elasticsearch import helpers
# from elasticsearch.helpers import bulk

# es = Elasticsearch(
#     ['elsearch.com'],
#     timeout=3600
# )
es = Elasticsearch([{'host':'10.10.8.6','port':9200,'timeout':6000}])

def importData(tableName, projectId, columnList, dataList):
    indexName = "scene_" + tableName + "_" + projectId
    res = createIndex(indexName, columnList)
    if res :
        bulk_data(indexName, columnList, dataList)
        print("success")

def bulk_data(indexName, columnList, dataList):
    actions = []
    elements = {}
    for data in dataList:
        element = {}
        for column in columnList:
            name = column["colName"]
            type = column["colType"]
            val = data[name]
            if type==2:
                val = str(val).replace(",","")
            if type ==3 and val =="":
                val = None
            element[name] = val
            element["runtime"] = datetime.datetime.now().strftime('%Y/%m/%d %H:%M:%S')

        elements["_index"] = indexName
        elements["_type"] = indexName
        elements["_source"] = element
        actions.append(elements)

    helpers.bulk(es, actions)


def createIndex(indexName, columnList):
    created = False
    try:
        if es.indices.exists(indexName) is not True:
            properties = {}
            for col in columnList:
                colName = col["colName"]
                prop = {}
                if col["colType"] == 1:
                    prop["type"] = "text"
                    prop["index"] = "not_analyzed"
                if col["colType"] == 2:
                    prop["type"] = "double"
                    prop["index"] = "not_analyzed"
                if col["colType"] == 3:
                    prop["type"] = "date"
                    prop["format"] = "yyyy/MM/dd||yyyy/MM/dd HH:mm:ss"
                    prop["index"] = "not_analyzed"
                properties[colName] = prop

            prop = {}
            prop["type"] = "date"
            prop["format"] = "yyyy/MM/dd||yyyy/MM/dd HH:mm:ss"
            prop["index"] = "not_analyzed"
            properties["runtime"] = prop

            body = {
                "settings": {
                    "index.refresh_interval": "30s",
                    "index.translog.sync_interval": "30s",
                    "index.translog.flush_threshold_size": "1gb",
                    "index.merge.scheduler.max_thread_count": 1
                },
                "mappings": {
                    "all":{
                        "enabled":False
                    },
                    indexName:{
                        "properties": properties
                    }
                }
            }
            es.indices.create(index=indexName, body=body)
        created = True
    except Exception as ex:
        print(ex)
        raise ex
    finally:
        return created

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

elasticsearch

创建索引

批量插入

Python创建索引，批量插入数据测试的相关文章

Pandas set_levels，如何避免标签排序？

我使用时遇到问题set levels多索引 from io import StringIO txt Name Height Age Metres A 1 25 B 95 1 df pd read csv StringIO txt heade
Python 类型提示 Dict 语法错误可变默认值是不允许的。使用“默认工厂”

我不知道为什么解释器会抱怨这个类型的字典对于这两个实例我得到一个不允许可变默认值使用默认工厂语法错误我使用的是 python 3 7 3 from dataclasses import dataclass from typing
计算另一个字符串中多个字符串的出现次数

在 Python 2 7 中给定以下字符串 Spot是一只棕色的狗斑点有棕色的头发斑点的头发是棕色的查找字符串中 Spot brown 和 hair 总数的最佳方法是什么在示例中它将返回 8 我正在寻找类似的东西string c
如何在 __init__ 中使用await设置类属性

我如何定义一个类await在构造函数或类体中例如我想要的 import asyncio some code class Foo object async def init self settings self settings setti
matplotlib 图中点的标签

所以这是一个关于已发布的解决方案的问题我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签我试图在这里模仿解决方案是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
多输出堆叠回归器

一次性问题我正在尝试构建一个多输入堆叠回归器添加到 sklearn 0 22 据我了解我必须结合StackingRegressor and MultiOutputRegressor 经过多次尝试这似乎是正确的顺序 import nu
VSCode Settings.json 丢失

我正在遵循教程并尝试将 vscode 指向我为 Scrapy 设置的虚拟工作区但是当我在 VSCode 中打开设置时工作区设置选项卡不在用户设置选项卡旁边我还尝试通过以下方式手动转到文件 APPDATA Code User s
python multiprocessing 设置生成进程等待

是否可以生成一些进程并将生成进程设置为等待生成的进程完成下面是我用过的一个例子 import multiprocessing import time import sys def daemon p multiprocessing curr
Python 3：将字符串转换为变量[重复]

这个问题在这里已经有答案了我正在从 txt 文件读取文本并且需要使用我读取的数据之一作为类实例的变量 class Sports def init self players 0 location name self players pla
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
使用 Python Oauthlib 通过服务帐户验证 Google API

我不想使用适用于 Python 的 Google API 客户端库但仍想使用 Python 访问 Google APIOauthlib https github com idan oauthlib 创建服务帐户后谷歌开发者控制台 http
Pandas 组合不同索引的数据帧

我有两个数据框df 1 and df 2具有不同的索引和列但是有一些索引和列重叠我创建了一个数据框df索引和列的并集因此不存在重复的索引或列我想填写数据框df通过以下方式 for x in df index for y in df
如何使用 Python 3 检查目录是否包含文件

我到处寻找这个答案但找不到我正在尝试编写一个脚本来搜索特定的子文件夹然后检查它是否包含任何文件如果包含则写出该文件夹的路径我已经弄清楚了子文件夹搜索部分但检查文件却难倒了我我发现了有关如何检查文件夹是否为空的多个建议并且我尝
PySpark groupByKey 返回 pyspark.resultiterable.ResultIterable

我试图找出为什么我的 groupByKey 返回以下内容 0
如何使用 AWS Lambda Python 读取 AWS S3 存储的 Word 文档（.doc 和 .docx）文件内容？

我的场景是我尝试使用 python 实现从 Aws Lambda 读取 AWS 存储的 S3 word 文档 doc 和 docx 文件内容下面的代码是我使用的我的问题是我可以获取文件名但无法读取内容 def lambda hand
每当使用 import cv2 时 OpenCV 都会出错

我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时在 python IDLE 上它都会说 Trac
重新分配唯一值 - pandas DataFrame

我在尝试着assign unique值在pandas df给特定的个人 For the df below Area and Place 会一起弥补unique不同的价值观jobs 这些值将分配给个人总体目标是使用尽可能少的个人诀窍在于这
如何将 Django 中的权限添加到模型并使用 shell 进行测试

我在模型中添加了 Meta 类并同步了数据库然后在 shell 中创建了一个对象它返回 false 所以我真的无法理解错误在哪里或者缺少什么是否在其他文件中可能存在某种配置 class Employer User Employer in
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并
如何将Python3设置为Mac上的默认Python版本？

有没有办法将 Python 3 8 3 设置为 macOS Catalina 版本 10 15 2 上的默认 Python 版本我已经完成的步骤看看它安装在哪里 ls l usr local bin python 我得到的输出是这样的

随机推荐

Java 随机读写流复习题

题目在记事本中输入若干同学的姓名和成绩等信息作为原文件编写一个Java源程序其中的文件读写部分使用RandomAccessFile类来完成程序实现的功能如下编写一个包含主方法main的公共类访问权限为public的类主方法ma
Git从下载到配置到链接远程仓库全套教程

目录前言一 Git的下载与安装 1 下载 2 安装二生成及配置SSH密钥 1 生成SSH密钥 2 配置SSH密钥三本地仓库与远程仓库连接并推送到远程仓库总结前言每次进一个新公司都要下载配置git 这些东西也就配置那一次所
pyqt 自定义信号，对默认信号触发的槽函数添加参数

from PyQt5 QtCore import QObject pyqtSignal class QTypeSignal QObject sendmsg pyqtSignal object 使用pyqtSignal类实列发射信号 obje
Cuda

文章目录引言一 Cuda安装 1 选择Cuda版本 2下载及运行安装程序 3 测试二 Cudnn安装 1 进入官网下载对应cuda版本的cudnn 2 下载好相应版本并进行解压安装 3 解压完成后 4 测试引言学习的最大理由是想摆
Java知识点之Map（一）

Map Map相关的内容在面试过程中都是一个重要的点问深了会涉及到很多数据结构和线程相关的问题你了解Map吗常用的Map有哪些 Map是定义了适合存储键值对元素的接口常见的Map实现类有HashMap Hashtable Lin
@RunWith注解的作用

RunWith注解的作用 RunWith就是一个运行器 RunWith JUnit4 class 就是指用JUnit4来运行 RunWith SpringJUnit4ClassRunner class 让测试运行于Spring测试环境 Ru
不容错过的Vue2.0组件开发

简述 http www jianshu com p 313f11bccb33 utm source tuicool utm medium referral 本文针对于有Vue有一定基础的人学习了解环境搭建等入门教程网上很多大家自行学习
[ 注意力机制 ] 经典网络模型1——SENet 详解与复现

Author Horizon Max 编程技巧篇各种操作小结机器视觉篇会变魔术 OpenCV 深度学习篇简单入门 PyTorch 神经网络篇经典网络模型算法篇再忙也别忘了 LeetCode 注意力机制经典网络模型1 SENe
增程式电动汽车电控系统优化方法【matlab】

一主要内容针对增程式电动汽车的传动系统架构结合增程式乘用车和增程式电动公交的设计对传动系统关键部件选型匹配以及电控系统工作模式进行论述并论述了工况对行驶里程以及电池充放电的影响因素对通用汽车的Volt增程式电动汽车进行分析研究
B站价值60亿跨年晚会背后的微服务治理

B站价值60亿跨年晚会背后的微服务治理大家都知道微服务有两个痛点一个是如何拆分微服务微服务的边界怎么划分制定二是微服务上了规模之后如何管理因为只要上了规模任何小小的问题都可能会被放大最后导致雪崩效应一微服务化带来的挑战上
《Spring 5.x源码解析之Spring AOP 注解驱动使用及其实现原理》

Spring 5 x源码解析之Spring AOP 注解驱动使用及其实现原理学好路更宽钱多少加班 mercyblitz 一前言大家好欢迎阅读 Spring 5 x源码解析系列本篇作为该系列的第二篇重点介绍Spring AOP
离线搭建深度学习环境

离线搭建深度学习环境文章目录离线搭建深度学习环境 Anaconda3离线安装借助可联网PC下载安装包安装Anaconda3 配置深度学习环境获取深度学习环境打包深度学习环境拷贝深度学习环境添加深度学习环境到环境列表有时出于
Linux使用套接字 udp协议传输

第一步是来认识库需要哪些库需要哪些库中的函数哥们也只是初学者仅仅只是会调用的地步后面有机会再加深首先咱们需要清除的知道工作流程第二步是直接写代码开发工具 qtcreator6 环境 win10 虚拟机 ubuntu20 0
Vue学习杂记（五）——loader的使用

Vue学习杂记五 loader的使用一什么是loader 二 loader处理css 三 loader处理图片四 loader处理高级的js语法参考文献引言 loader其实也是webpack系列的内容考虑到webpack涉及
gradle使用教程，小白一篇就够

概述 Gradle是新一代构建工具从0 x版本一路走来虽然国内可寻的资料多了一些但都是比较碎片化的知识官方的Userguide虽然是业内良心之作但无奈太长且版本变化较快又鉴于很多同学一看到英文内心便已认定无法读懂遂打算利用业余
E tensorflow/stream_executor/cuda/cuda_dnn.cc:352] Loaded runtime CuDNN library: 5005 (compatibility

WARNING tensorflow From usr local lib python2 7 dist packages tensorflow python util tf should use py 170 initialize all
MySQL逻辑架构图分析

MySQL逻辑架构图大体来说 MySQL 可以分为 Server 层和存储引擎层两部分 Server层大多数MySQL的核心服务功能都在这一层包括连接器查询缓存分析器优化器执行器以及所有内置函数日期时间数学加密函数等
pnpm：高效、快速的npm

什么是pnpm performent npm 速度快节省磁盘空间的软件包管理器为什么使用pnpm 使用npm安装依赖时每次都会下载文件到硬盘中当项目数量较多时依赖包会占据大量的内存 pnpm就是解决这个问题的 pnpm如何解决 p
手把手教你设置Typora的图床-gitee

所需环境 typora node软件所需软件及配置文末可下载 typora的激活安装可看以往教程点我查看typora激活 typora结合gitee图床的优势分享文件只需要分享一个 md文件即可插入的图片依旧可以访问图床不限制访问
Python创建索引，批量插入数据测试

测试 coding utf 8 Created on 2019 6 13 10 19 25 author chenlin3 import esSdk class EsSdkTest def test self name EsSdkTest

Python创建索引，批量插入数据测试

Python创建索引，批量插入数据测试 的相关文章

随机推荐

热门标签

Python创建索引，批量插入数据测试的相关文章