Python 和希伯来语编码/解码错误

2024-02-17

我有 sqlite 数据库,我想在其中插入希伯来语的值

我不断收到以下错误:

UnicodeDecodeError: 'ascii' codec can't decode byte 0xd7 in position 0: ordinal
not in range(128)

我的代码如下:

runsql(u'插入个人 值(%(ID)d,%(名称)s)' % {'ID':1,'name':fabricate_hebrew_name()})

    def fabricate_hebrew_name():
        hebrew_names = [u'ירדן',u'יפה',u'תמי',u'ענת',u'רבקה',u'טלי',u'גינה',u'דנה',u'ימית',u'אלונה',u'אילן',u'אדם',u'חווה']
        return random.sample(names,1)[0].encode('utf-8')

note: runsql在 sqlite 数据库上执行查询fabricate_hebrew_name()应该返回一个可以在我的 SQL 查询中使用的字符串。 任何帮助深表感谢。


您正在将捏造的名称传递到 Unicode 字符串的字符串格式化参数中。理想情况下,以这种方式传递的字符串也应该是 Unicode。

但fabricate_hebrew_name 不返回Unicode - 它返回UTF-8 编码的字符串,这是不一样的。

因此,摆脱对编码('utf-8')的调用,看看这是否有帮助。

下一个问题是 runsql 期望什么类型。如果它需要 Unicode,没问题。如果它需要 ASCII 编码的字符串,那么您将会遇到问题,因为希伯来语不是 ASCII。在不太可能的情况下,它需要 UTF-8 编码字符串,那么就需要在替换完成后对其进行转换。

在另一个答案中,Ignacio Vazquez-Abrams 警告不要在查询中进行字符串插值。这里的概念是,您通常应该使用参数化查询,并将希伯来语字符串作为参数传递给它,而不是使用 % 运算符进行字符串替换。这可能在查询优化和针对 SQL 注入的安全性方面具有一些优势。

Example

# -*- coding: utf-8 -*-
import sqlite3

# create db in memory
conn = sqlite3.connect(":memory:")
cur = conn.cursor()
cur.execute("CREATE TABLE personal ("
            "id INTEGER PRIMARY KEY,"
            "name VARCHAR(42) NOT NULL)")

# insert random name
import random
fabricate_hebrew_name = lambda: random.choice([
    u'ירדן',u'יפה',u'תמי',u'ענת', u'רבקה',u'טלי',u'גינה',u'דנה',u'ימית',
    u'אלונה',u'אילן',u'אדם',u'חווה'])

cur.execute("INSERT INTO personal VALUES("
            "NULL, :name)", dict(name=fabricate_hebrew_name()))
conn.commit()

id, name = cur.execute("SELECT * FROM personal").fetchone()
print id, name
# -> 1 אלונה
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python 和希伯来语编码/解码错误 的相关文章

随机推荐