读取数据时出错,错误消息:CSV 表引用列位置 15,但从位置:0 开始的行仅包含 1 列

2024-01-25

我是bigquery的新手,这里我尝试加载我手动创建的GCP BigQuery表中的数据,我有一个包含bq加载命令的bash文件 -

bq load --source_format=CSV --field_delimiter=$(printf '\u0001') dataset_name.table_name gs://bucket-name/sample_file.csv

我的 CSV 文件包含多个具有 16 列的行 - 示例行是

100563^3b9888^Buckname^https://www.settttt.ff/setlllll/buckkkkk-73d58581.html^Buckcherry^null^null^2019-12-14^23d74444^Reverb^Reading^Pennsylvania^United States^US^40.3356483^-75.9268747

表架构 -

当我从云 shell 执行 bash 脚本文件时,出现以下错误 -

Waiting on bqjob_r10e3855fc60c6e88_0000016f42380943_1 ... (0s) Current status: DONE   
BigQuery error in load operation: Error processing job 'project-name- 
staging:bqjob_r10e3855fc60c6e88_0000ug00004521': Error while reading data, error message: CSV 
table
encountered too many errors, giving up. Rows: 1; errors: 1. Please look into the errors[] collection 
for more details.
Failure details:
- gs://bucket-name/sample_file.csv: Error while
reading data, error message: CSV table references column position
15, but line starting at position:0 contains only 1 columns.

解决方案是什么,提前致谢


您试图根据您提供的架构将错误的值插入到表中

根据表架构和您的数据示例,我运行以下命令:

./bq load --source_format=CSV  --field_delimiter=$(printf '^') mydataset.testLoad  /Users/tamirklein/data2.csv

第一个错误

失败详情: - 读取数据时出错,错误消息:无法解析“39b888” 作为字段 Field2(位置 1)的 int,从位置 0 开始

此时,我手动从 39b888 中删除了 b,现在我得到了这个

第二个错误

失败详情: - 读取数据时出错,错误消息:无法解析 “14/12/2019”作为字段 Field8(位置 7)的日期,起始于 位置 0

此时,我将 14/12/2019 更改为 2019-12-14,这是 BQ 日期格式,现在一切正常

上传完成。 正在等待 bqjob_r9cb3e4ef5ad596e_0000016f42abd4f6_1 ...(0 秒)当前状态:完成

您需要在上传之前清理数据,或者使用包含更多行的数据样本--max_bad_records标志(有些行可以,有些则不基于您的数据质量)

注意:不幸的是,在上传过程中无法控制日期格式,请参阅此answer https://stackoverflow.com/a/44114830/1031958作为参考

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

读取数据时出错,错误消息:CSV 表引用列位置 15,但从位置:0 开始的行仅包含 1 列 的相关文章

  • 将对象列表写入 csv 文件

    我正在编写一个 python 程序 该程序循环遍历 reddit 提交 提取数据并将其作为对象存储在列表中 但是 我无法将该列表写入 csv 文件 文件已创建 但它只是为对象提供某种 id 标记 我应该如何更改 csv 代码 Code im
  • GAE:java.lang.NoClassDefFoundError:com/google/appengine/api/blobstore/BlobstoreServiceFactory

    请帮我解决这个问题 我正在使用 blob 存储来保存图像 它在我的本地环境中运行得非常好 但是 当我在云中部署相同的代码时 它会抛出异常 java lang NoClassDefFoundError com google appengine
  • 如何添加“字符串数组”作为 BigQuery 的架构值

    我想将字符串值数组存储在 BigQuery 中的单个列中 为此 我需要首先创建一个具有正确架构的表 该数组的模式标识符是ARRAY
  • 处理CSV数据时如何忽略第一行数据?

    我要求 Python 打印 CSV 数据列中的最小数字 但顶行是列号 并且我不希望 Python 考虑顶行 如何确保 Python 忽略第一行 这是到目前为止的代码 import csv with open all16 csv rb as
  • 将 CSV 文件读取到嵌套对象

    我有 CSV 文件 例如 Title Column Value A Z1 1 A Z1 2 A Z1 3 A Z2 1 A Z2 5 B Z3 4 B Z3 6 我想将此 csv 文件读入以下类层次结构 我想最终得到一个列表MyClass
  • 将 CSV 文件导入二维字符串数组

    我必须将文本文件读入二维数组 我遇到的唯一问题是数组的宽度各不相同 最大大小为 9 列 我不知道会有多少行 例如 有些行有 6 列 有些行有 9 列 这是我的 CSV 文件的一小部分 1908 Souths Easts Souths Cum
  • Google Cloud Storage 上的批量重命名对象

    是否可以使用 gsutil 或其他工具 批量重命名 Google Cloud Storage 上的对象 我正在尝试找出一种方法将一堆图像从 JPG 重命名为 jpg 这是在 bash 中执行此操作的本机方法 下面逐行代码进行解释 gsuti
  • 如何在不超时的情况下解析大型 CSV 文件?

    我正在尝试解析 50 MB 的 csv 文件 文件本身很好 但我正在尝试解决所涉及的大量超时问题 每个设置上传明智 我可以轻松上传并重新打开文件 但浏览器超时后 我收到 500 内部错误 我的猜测是我可以将文件保存到服务器上 打开它并保留我
  • 如何使用 aws-cli 访问 Google Cloud Storage 存储桶

    我可以访问 aws 和 Google Cloud Platform 是否可以执行以下操作 使用 aws cli 列出 Google Cloud Storage 存储桶 使用 aws cli 将 CSV 文件放入 Google Cloud S
  • 是否可以统计 JSON 列中每个键出现的次数?

    我有一个 BigQuery 表 其中有一列 其中包含 JSON 我想输出每个键在列中出现的次数 然后按计数降序排序 与所有键关联的值是1 每个对象都有已知 有限数量的键 但我宁愿不依赖它 以防最大的对象发生变化 总体而言 键的数量是已知 有
  • CSV 解析 - Swift 4

    我正在尝试解析 CSV 但遇到一些问题 下面是我用来解析 CSV 的代码 let fileURL Bundle main url forResource test application data Sheet 1 withExtension
  • 如何使用 Google Cloud CDN 访问 Google Cloud Storage 公共对象

    我有一些由 Google Cloud Storage GCS 提供的公共二进制文件 并且想探索使用 Google Cloud CDN 来降低延迟 我通过在创建 GCS 对象时设置适当的 HTTP 标头来使用 GCS 缓存 是否可以使用 Go
  • 有谁知道一种更快的方法来执行 String.Split() 吗?

    我正在读取 CSV 文件的每一行 并且需要获取每一列中的各个值 所以现在我只是使用 values line Split delimiter where line是保存由分隔符分隔的值的字符串 衡量我的表现ReadNextRow我注意到它花费
  • MySQL 查询到 CSV [重复]

    这个问题在这里已经有答案了 有没有一种简单的方法来运行MySQL查询来自linux命令行并以csv格式输出结果 这就是我现在正在做的事情 mysql u uid ppwd D dbname lt lt EOQ sed e s g tee l
  • 如何在短时间内列出Google存储桶中的所有文件?

    我有一个 Google 存储桶 其中包含超过 20k 个文件名 有没有办法在短时间内列出bucket中的所有文件名 这取决于你所说的 短 是什么意思 但是 为了加快列出存储桶的速度 您可以做的一件事是对列出操作进行分片 例如 如果您的存储桶
  • 从网络源获取 R 中的数据作为数据框

    我正在尝试使用 RCurl 包将一些空气污染背景数据作为 data frame 直接加载到 R 中 该网站有 3 个下拉框 用于在下载 csv 文件之前选择选项 如下图所示 我试图从下拉框中选择 3 个值 并使用 下载 CSV 按钮将数据作
  • 如何将列表列表写入 CSV 文件 Python?

    我有一个列表 例如 a b c d e f 我想将其写入 CSV 文件 如下所示 a b c d e f 我怎么做 我尝试过使用 csv writerows 但输出文件的每个字符位于不同的单元格中 并且全部位于同一行中 从某种意义上说 第一
  • 在iPhone上将CSV文件读入sqlite3

    有没有办法在iPhone上将CSV文件读入sqlite3 sqlite3 是否有类似于 SQL 命令的功能 LOAD DATA LOCAL INFILE file csv INTO TABLE TABLENAME FIELDS TERMIN
  • 使用 Pandas 从 csv 文件读取标题信息

    我有一个包含 14 行标题的数据文件 在标头中 有经纬度坐标和时间的元数据 我目前正在使用 pandas read csv filename delimiter header 14 读取文件 但这只是获取数据 我似乎无法获取元数据 有人知道
  • BigQuery 中 _PARTITIONDATE 与 _PARTITIONTIME 伪列的使用

    在官方的最佳实践中我found https cloud google com bigquery docs best practices costs 按日期对表进行分区并查询相关分区 例如 WHERE PARTITIONDATE 2017 0

随机推荐