当我尝试将更改提交到表中时,需要花费大量时间(每 1000 行大约 300 秒)。
型号类别:
class Quotes(base):
__tablename__ = 'quotes'
id = Column(INTEGER, primary_key=True, autoincrement=True, index=True)
ticker = Column(TEXT)
data = Column(ARRAY(FLOAT))
def create():
Session = sessionmaker(db)
session = Session()
return session
def add(session, ticker=None, data=None):
new_row = Quotes(ticker=ticker, data=data)
session.add(new_row)
def commit(session):
t0 = time.time()
session.commit()
print("SQLAlchemy ORM commit(): Total time " + str(time.time() - t0) + " secs")
代码如下:
for index in range(len(quotes['timestamp'])):
temp = [
int(quotes['timestamp'][index]), quotes['open'][index],
quotes['high'][index], quotes['low'][index],
quotes['close'][index]
]
Quotes.add(session, ticker, temp)
counter += 1
if counter % 1000 == 0:
Quotes.commit(session)
我有大约 100k 行。
一开始我创建了一个会话,然后在 for 循环的每次迭代中将新行添加到会话中。
我每 1000 行调用 .commit() 方法,大约需要 300 秒。
对我来说似乎太慢了。可以吗,还是有另一种(正确的)方法将如此大的数据集插入数据库。