关于本文档
本文档介绍了2014年5月发布的SQLAlchemy 0.9版本,以及2015年4月发布的SQLAlchemy 1.0版本之间的变化。
文件最后更新日期:2015年6月9日
本指南介绍了SQLAlchemy 1.0版中的新功能,并介绍了影响用户将其应用程序从0.9系列SQLAlchemy迁移到1.0的更改。
请仔细阅读关于行为变化的章节,以了解行为中潜在的向后不兼容的变化。
已经创建了一系列新的Session
方法,它们将工作单元直接提供给工作单位以发出INSERT和UPDATE语句。如果使用正确,这个面向专家的系统可以允许ORM映射用于生成批量插入和更新语句,批量插入到executemany组中,从而允许语句以与直接使用Core相媲美的速度进行。
也可以看看
Bulk Operations - introduction and full documentation
受到针对Bulk Operations功能以及How can I profile a SQLAlchemy powered application?常见问题解答部分,增加了一个新的示例部分,其中有几个脚本,旨在说明各种核心和ORM技术的相对性能概况。这些脚本被组织到用例中,并被封装在一个单一的控制台界面下,从而可以运行演示的任意组合,抛出时间,Python配置文件结果和/或RunSnake配置文件显示。
也可以看看
“烘焙”查询功能是一种不寻常的新方法,它允许直接构建使用缓存来调用Query
对象,后续调用功能大大减少了Python函数调用开销(超过75%)。通过将一个Query
对象指定为一系列仅调用一次的lambda表达式,作为预编译单元的查询开始变得可行:
from sqlalchemy.ext import baked
from sqlalchemy import bindparam
bakery = baked.bakery()
def search_for_user(session, username, email=None):
baked_query = bakery(lambda session: session.query(User))
baked_query += lambda q: q.filter(User.name == bindparam('username'))
baked_query += lambda q: q.order_by(User.id)
if email:
baked_query += lambda q: q.filter(User.email == bindparam('email'))
result = baked_query(session).params(username=username, email=email).all()
return result
也可以看看
loading.py
模块的机制以及标识映射经过了内联,重构和修剪的几个过程,因此现在的行加载大约比基于ORM的对象快大约25% 。假设有一个1M行表,类似下面的脚本说明了最受改善的负载类型:
import time
from sqlalchemy import Integer, Column, create_engine, Table
from sqlalchemy.orm import Session
from sqlalchemy.ext.declarative import declarative_base
Base = declarative_base()
class Foo(Base):
__table__ = Table(
'foo', Base.metadata,
Column('id', Integer, primary_key=True),
Column('a', Integer(), nullable=False),
Column('b', Integer(), nullable=False),
Column('c', Integer(), nullable=False),
)
engine = create_engine(
'mysql+mysqldb://scott:tiger@localhost/test', echo=True)
sess = Session(engine)
now = time.time()
# avoid using all() so that we don't have the overhead of building
# a large list of full objects in memory
for obj in sess.query(Foo).yield_per(100).limit(1000000):
pass
print("Total time: %d" % (time.time() - now))
本地MacBookPro的结果从0.9秒的19秒降至1.0的14秒。在批量处理大量行时,Query.yield_per()
调用总是一个好主意,因为它可以防止Python解释器不得不一次为所有对象及其工具分配大量内存。如果没有Query.yield_per()
,MacBookPro上面的脚本在0.9上是31秒,在1.0上是26秒,因此需要花费额外的时间来设置非常大的内存缓冲区。
我们看了一下KeyedTuple
实现,希望改进像这样的查询:
rows = sess.query(Foo.a, Foo.b, Foo.c).all()
使用KeyedTuple
类而不是Python的collections.namedtuple()
,因为后者有一个非常复杂的类型创建例程,其基准测试比KeyedTuple
但是,当获取成千上万行时,collections.namedtuple()
快速超过KeyedTuple
,随着实例调用的增加,它变得非常慢。该怎么办?两种方法之间进行对冲的新类型。基于哪种情况,新的“轻量级键控元组”要么针对“大小”(返回的行数)和“num”(针对不同查询的数量),要么优于两者,要么滞后于较快的对象。在“甜蜜点”中,我们既创建了大量新类型,又获取了很多行,轻量级对象完全吸引了名为tuple和KeyedTuple:
-----------------
size=10 num=10000 # few rows, lots of queries
namedtuple: 3.60302400589 # namedtuple falls over
keyedtuple: 0.255059957504 # KeyedTuple very fast
lw keyed tuple: 0.582715034485 # lw keyed trails right on KeyedTuple
-----------------
size=100 num=1000 # <--- sweet spot
namedtuple: 0.365247011185
keyedtuple: 0.24896979332
lw keyed tuple: 0.0889317989349 # lw keyed blows both away!
-----------------
size=10000 num=100
namedtuple: 0.572599887848
keyedtuple: 2.54251694679
lw keyed tuple: 0.613876104355
-----------------
size=1000000 num=10 # few queries, lots of rows
namedtuple: 5.79669594765 # namedtuple very fast
keyedtuple: 28.856498003 # KeyedTuple falls over
lw keyed tuple: 6.74346804619 # lw keyed trails right on namedtuple
通过对许多内部对象使用__slots__
,结构性内存的使用得到了改进。此优化特别适用于具有大量表和列的大型应用程序的基本内存大小,并可减少各种高容量对象(包括事件监听内部件,比较对象以及ORM属性和加载器策略系统的某些部分)的内存大小。
利用heapy测量Nova的启动大小的一个工作台说明了在基本导入“nova.db.”的过程中,SQLAlchemy的对象,相关字典以及弱引用占用了大约3.7个megs或46%的差异,即46%。 sqlalchemy.models”:
# reported by heapy, summation of SQLAlchemy objects +
# associated dicts + weakref-related objects with core of Nova imported:
Before: total count 26477 total bytes 7975712
After: total count 18181 total bytes 4236456
# reported for the Python module space overall with the
# core of Nova imported:
Before: Partition of a set of 355558 objects. Total size = 61661760 bytes.
After: Partition of a set of 346034 objects. Total size = 57808016 bytes.
UPDATE语句现在可以在一个ORM flush内批处理为更高性能的executemany()调用,类似于INSERT语句可以批处理的方式;这将在基于以下标准的flush内被调用:
version_id_col
,或者后端dialect支持executemany()操作的“理智”行计数;大多数DBAPI现在都能正确支持这一点。只要查询或工作单元清理过程试图找到与特定类相对应的数据库引擎,就会调用Session.get_bind()
方法。该方法已得到改进,可处理各种面向继承的场景,其中包括:
绑定到Mixin或抽象类:
class MyClass(SomeMixin, Base):
__tablename__ = 'my_table'
# ...
session = Session(binds={SomeMixin: some_engine})
基于表单独绑定到继承的具体子类:
class BaseClass(Base):
__tablename__ = 'base'
# ...
class ConcreteSubClass(BaseClass):
__tablename__ = 'concrete'
# ...
__mapper_args__ = {'concrete': True}
session = Session(binds={
base_table: some_engine,
concrete_table: some_other_engine
})
A series of issues were repaired where the Session.get_bind()
would not receive the primary Mapper
of the Query
, even though this mapper was readily available (the primary mapper is the single mapper, or alternatively the first mapper, that is associated with a Query
object).
The Mapper
object, when passed to Session.get_bind()
, is typically used by sessions that make use of the Session.binds
parameter to associate mappers with a series of engines (although in this use case, things frequently “worked” in most cases anyway as the bind would be located via the mapped table object), or more specifically implement a user-defined Session.get_bind()
method that provies some pattern of selecting engines based on mappers, such as horizontal sharding or a so-called “routing” session that routes queries to different backends.
这些情景包括:
session.query(User).count()
Query.update()
和Query.delete()
,用于UPDATE / DELETE语句以及“fetch”策略使用的SELECT:
session.query(User).filter(User.id == 15).update(
{"name": "foob"}, synchronize_session='fetch')
session.query(User).filter(User.id == 15).delete(
synchronize_session='fetch')
针对单个列的查询:
session.query(User.id, User.name).all()
SQL函数和其他针对间接映射的表达式,如column_property
:
class User(Base):
# ...
score = column_property(func.coalesce(self.tables.users.c.name, None)))
session.query(func.max(User.score)).scalar()
InspectionAttr.info
集合现在可用于从Mapper.all_orm_descriptors
集合中检索的每种对象。这包括hybrid_property
和association_proxy()
。但是,由于这些对象是类绑定描述符,因此必须从它们所连接的类中分别访问,以便获取该属性。下面是使用Mapper.all_orm_descriptors
名称空间的示例:
class SomeObject(Base):
# ...
@hybrid_property
def some_prop(self):
return self.value + 5
inspect(SomeObject).all_orm_descriptors.some_prop.info['foo'] = 'bar'
它也可作为所有SchemaItem
对象(例如ForeignKey
,UniqueConstraint
等)的构造函数参数使用。以及其余的ORM结构,如orm.synonym()
。
有关column_property()
的各种问题已得到修复,特别是针对aliased()
构造以及0.9中引入的“按标号排序”逻辑请参阅Label constructs can now render as their name alone in an ORDER BY中单独呈现其名称)。
给定如下映射:
class A(Base):
__tablename__ = 'a'
id = Column(Integer, primary_key=True)
class B(Base):
__tablename__ = 'b'
id = Column(Integer, primary_key=True)
a_id = Column(ForeignKey('a.id'))
A.b = column_property(
select([func.max(B.id)]).where(B.a_id == A.id).correlate(A)
)
包含“A.b”两次的简单场景将无法正确呈现:
print(sess.query(A, a1).order_by(a1.b))
这将按错误的列排序:
SELECT a.id AS a_id, (SELECT max(b.id) AS max_1 FROM b
WHERE b.a_id = a.id) AS anon_1, a_1.id AS a_1_id,
(SELECT max(b.id) AS max_2
FROM b WHERE b.a_id = a_1.id) AS anon_2
FROM a, a AS a_1 ORDER BY anon_1
新产出:
SELECT a.id AS a_id, (SELECT max(b.id) AS max_1
FROM b WHERE b.a_id = a.id) AS anon_1, a_1.id AS a_1_id,
(SELECT max(b.id) AS max_2
FROM b WHERE b.a_id = a_1.id) AS anon_2
FROM a, a AS a_1 ORDER BY anon_2
也有许多情况下,“按顺序排列”逻辑将无法按标签排序,例如,如果映射是“多态”:
class A(Base):
__tablename__ = 'a'
id = Column(Integer, primary_key=True)
type = Column(String)
__mapper_args__ = {'polymorphic_on': type, 'with_polymorphic': '*'}
order_by将无法使用标签,因为它会因多态加载而被匿名化:
SELECT a.id AS a_id, a.type AS a_type, (SELECT max(b.id) AS max_1
FROM b WHERE b.a_id = a.id) AS anon_1
FROM a ORDER BY (SELECT max(b.id) AS max_2
FROM b WHERE b.a_id = a.id)
现在标签的顺序跟踪匿名标签,现在可以使用:
SELECT a.id AS a_id, a.type AS a_type, (SELECT max(b.id) AS max_1
FROM b WHERE b.a_id = a.id) AS anon_1
FROM a ORDER BY anon_1
这些修复包括各种可能破坏aliased()
结构状态的heisenbugs,这样标签逻辑将再次失败;这些也已被修复。
除了整数值之外,Select.limit()
和Select.offset()
方法现在接受任何SQL表达式作为参数。ORM Query
对象也会将任何表达式传递给底层的Select
对象。通常,这用于允许传递一个绑定参数,以后可以用一个值替换它:
sel = select([table]).limit(bindparam('mylimit')).offset(bindparam('myoffset'))
不支持非整数LIMIT或OFFSET表达式的方言可能会继续不支持此行为;第三方方言也可能需要修改才能利用新的行为。当前使用._limit
或._offset
属性的方言将继续适用于极限/偏移被指定为简单整数值的情况。但是,当指定SQL表达式时,这两个属性将在访问时引发CompileError
。希望支持新功能的第三方方言现在应该调用._limit_clause
和._offset_clause
属性来接收完整的SQL表达式,而不是整数值。
ForeignKeyConstraint
上的use_alter
标志(通常)不再需要¶The MetaData.create_all()
and MetaData.drop_all()
methods will now make use of a system that automatically renders an ALTER statement for foreign key constraints that are involved in mutually-dependent cycles between tables, without the need to specify ForeignKeyConstraint.use_alter
. 此外,外键约束不再需要有一个名称才能通过ALTER创建;只有DROP操作需要名称。在DROP的情况下,该功能将确保只有具有明确名称的约束实际上包含在ALTER语句中。如果DROP无法解决,则系统现在发出一个简洁明了的错误信息,如果DROP无法继续进行。
ForeignKeyConstraint.use_alter
和ForeignKey.use_alter
标志保持不变,并且在CREATE / DROP场景中继续具有建立那些需要ALTER的约束的效果。
从版本1.0.1开始,如果SQLite不支持ALTER,那么在DROP期间,给定的表有一个无法解析的周期;在这种情况下会发出警告,并且按照no顺序删除这些表,除非启用约束,否则这通常在SQLite上可以正常工作。要解决警告并继续至少对SQLite数据库进行部分排序,特别是在启用了约束的情况下,将“use_alter”标志重新应用于这些ForeignKey
和ForeignKeyConstraint
应该明确地从这种排序中删除的对象。
也可以看看
Creating/Dropping Foreign Key Constraints via ALTER - 新行为的完整描述。
对于许多发行版本,ResultProxy
对象总是在所有结果行被提取的地方自动关闭。这是为了允许使用该对象而不需要明确地调用ResultProxy.close()
;由于所有DBAPI资源都已被释放,因此该对象可以放弃。但是,该对象保持严格的“关闭”行为,这意味着后续对ResultProxy.fetchone()
,ResultProxy.fetchmany()
或ResultProxy.fetchall()
现在会引发一个ResourceClosedError
:
>>> result = connection.execute(stmt)
>>> result.fetchone()
(1, 'x')
>>> result.fetchone()
None # indicates no more rows
>>> result.fetchone()
exception: ResourceClosedError
这种行为与pep-249的状态不一致,即在结果耗尽后,您可以重复调用fetch方法。它还会干扰结果代理的某些实现的行为,例如cx_oracle方言对某些数据类型使用的BufferedColumnResultProxy
。
To solve this, the “closed” state of the ResultProxy
has been broken into two states; a “soft close” which does the majority of what “close” does, in that it releases the DBAPI cursor and in the case of a “close with result” object will also release the connection, and a “closed” state which is everything included by “soft close” as well as establishing the fetch methods as “closed”. ResultProxy.close()
方法现在从不隐式调用,只有ResultProxy._soft_close()
方法非公开:
>>> result = connection.execute(stmt)
>>> result.fetchone()
(1, 'x')
>>> result.fetchone()
None # indicates no more rows
>>> result.fetchone()
None # still None
>>> result.fetchall()
[]
>>> result.close()
>>> result.fetchone()
exception: ResourceClosedError # *now* it raises
%(column_0_name)s
标记¶%(column_0_name)s
将从在CheckConstraint
的表达式中找到的第一列派生:
metadata = MetaData(
naming_convention={"ck": "ck_%(table_name)s_%(column_0_name)s"}
)
foo = Table('foo', metadata,
Column('value', Integer),
)
CheckConstraint(foo.c.value > 5)
将呈现:
CREATE TABLE foo (
value INTEGER,
CONSTRAINT ck_foo_value CHECK (value > 5)
)
命名约定与由SchemaType
(如Boolean
或Enum
)生成的约束的组合现在也将使用所有CHECK约束约定。
由于至少有0.8版本,一个Constraint
有能力根据传递的表格附加列自动附加到Table
:
from sqlalchemy import Table, Column, MetaData, Integer, UniqueConstraint
m = MetaData()
t = Table('t', m,
Column('a', Integer),
Column('b', Integer)
)
uq = UniqueConstraint(t.c.a, t.c.b) # will auto-attach to Table
assert uq in t.constraints
为了协助某些倾向于使用声明的情况,即使Column
对象尚未与Table
关联,此相同的自动附件逻辑现在也可以运行;额外的事件被建立,当那些Column
对象关联时,Constraint
也被添加:
from sqlalchemy import Table, Column, MetaData, Integer, UniqueConstraint
m = MetaData()
a = Column('a', Integer)
b = Column('b', Integer)
uq = UniqueConstraint(a, b)
t = Table('t', m, a, b)
assert uq in t.constraints # constraint auto-attached
上述功能是版本1.0.0b3后期添加的。对于#3411,版本1.0.4的修订确保了如果Constraint
引用Column
对象的混合并且字符串列名称;因为我们还没有跟踪名称添加到Table
的情况:
from sqlalchemy import Table, Column, MetaData, Integer, UniqueConstraint
m = MetaData()
a = Column('a', Integer)
b = Column('b', Integer)
uq = UniqueConstraint(a, 'b')
t = Table('t', m, a, b)
# constraint *not* auto-attached, as we do not have tracking
# to locate when a name 'b' becomes available on the table
assert uq not in t.constraints
以上,列“a”到表“t”的附件事件将在附加列“b”之前触发(因为“a”在“b”之前的Table
构造函数中声明),并且如果要尝试附件,约束将无法找到“b”。为了一致性,如果约束引用任何字符串名称,则会跳过自动附加列连接逻辑。
当Table
已经包含构造Constraint
时的所有目标Column
对象时,原始自动附加逻辑当然会保持原位:
from sqlalchemy import Table, Column, MetaData, Integer, UniqueConstraint
m = MetaData()
a = Column('a', Integer)
b = Column('b', Integer)
t = Table('t', m, a, b)
uq = UniqueConstraint(a, 'b')
# constraint auto-attached normally as in older versions
assert uq in t.constraints
Insert.from_select()
now includes Python and SQL-expression defaults if otherwise unspecified; the limitation where non-server column defaults aren’t included in an INSERT FROM SELECT is now lifted and these expressions are rendered as constants into the SELECT statement:
from sqlalchemy import Table, Column, MetaData, Integer, select, func
m = MetaData()
t = Table(
't', m,
Column('x', Integer),
Column('y', Integer, default=func.somefunction()))
stmt = select([t.c.x])
print(t.insert().from_select(['x'], stmt))
将呈现:
INSERT INTO t (x, y) SELECT t.x, somefunction() AS somefunction_1
FROM t
该功能可以使用Insert.from_select.include_defaults
禁用。
当由Column.server_default
设置的DefaultClause
作为要编译的SQL表达式存在时,“literal bindings”编译器标志将打开。这允许嵌入在SQL中的文字正确呈现,例如:
from sqlalchemy import Table, Column, MetaData, Text
from sqlalchemy.schema import CreateTable
from sqlalchemy.dialects.postgresql import ARRAY, array
from sqlalchemy.dialects import postgresql
metadata = MetaData()
tbl = Table("derp", metadata,
Column("arr", ARRAY(Text),
server_default=array(["foo", "bar", "baz"])),
)
print(CreateTable(tbl).compile(dialect=postgresql.dialect()))
现在呈现:
CREATE TABLE derp (
arr TEXT[] DEFAULT ARRAY['foo', 'bar', 'baz']
)
在此之前,文字值“foo”, “bar”, “baz”
这在DDL中是无用的。
使用autoload=True
填充的Table
对象现在将包含UniqueConstraint
结构以及Index
结构。这个逻辑对于Postgresql和Mysql有一些注意事项:
Postgresql具有这样的行为,当创建UNIQUE约束时,它隐式地创建与该约束相对应的UNIQUE INDEX。Inspector.get_indexes()
和Inspector.get_unique_constraints()
方法将继续这两个清楚地返回这些条目,其中Inspector.get_indexes()
在索引条目中包含一个标记duplicates_constraint
,用于指示检测到的相应约束。However, when performing full table reflection using Table(..., autoload=True)
, the Index
construct is detected as being linked to the UniqueConstraint
, and is not present within the Table.indexes
collection; only the UniqueConstraint
will be present in the Table.constraints
collection. 重复数据删除逻辑通过在查询pg_index
时加入到pg_constraint
表来查看两个结构是否已链接。
MySQL对于UNIQUE INDEX和UNIQUE约束没有单独的概念。虽然它在创建表和索引时支持两种语法,但它们不会以任何不同的方式存储它们。The Inspector.get_indexes()
and the Inspector.get_unique_constraints()
methods will continue to both return an entry for a UNIQUE index in MySQL, where Inspector.get_unique_constraints()
features a new token duplicates_index
within the constraint entry indicating that this is a dupe entry corresponding to that index. However, when performing full table reflection using Table(..., autoload=True)
, the UniqueConstraint
construct is not part of the fully reflected Table
construct under any circumstances; this construct is always represented by a Index
with the unique=True
setting present in the Table.indexes
collection.
很长一段时间,警告消息不能引用数据元素,这样一个特定的函数可能会发出无数个独特的警告。发生这种情况的关键在于Unicode 类型 收到 tt> 非unicode / t5> 参数 值
警告。在这个消息中放置数据值将意味着该模块的Python __warningregistry__
,或者在某些情况下,Python全局warnings.onceregistry
将变得无界限,如同大多数警告情况下,这两个集合中的一个会填充每条不同的警告消息。
The change here is that by using a special string
type that purposely changes how the string is hashed, we can control that a large number of parameterized messages are hashed only on a small set of possible hash values, such that a warning such as Unicode type received non-unicode bind param value
can be tailored to be emitted only a specific number of times; beyond that, the Python warnings registry will begin recording them as duplicates.
为了说明,以下测试脚本将只显示10个参数集中的10个警告,总数为1000:
from sqlalchemy import create_engine, Unicode, select, cast
import random
import warnings
e = create_engine("sqlite://")
# Use the "once" filter (which is also the default for Python
# warnings). Exactly ten of these warnings will
# be emitted; beyond that, the Python warnings registry will accumulate
# new values as dupes of one of the ten existing.
warnings.filterwarnings("once")
for i in range(1000):
e.execute(select([cast(
('foo_%d' % random.randint(0, 1000000)).encode('ascii'), Unicode)]))
这里的警告格式是:
/path/lib/sqlalchemy/sql/sqltypes.py:186: SAWarning: Unicode type received
non-unicode bind param value 'foo_4852'. (this warning may be
suppressed after 10 occurrences)
Query.update()
的文档声明给定的values
字典是“属性名称为键的字典”,暗示这些是映射的属性名称。不幸的是,该函数设计得更加注重接收属性和SQL表达式,而不是太多的字符串;当字符串被传递时,这些字符串将直接传递到核心更新语句而没有任何解决方案,就这些名称在映射类中的表示方式而言,这意味着名称必须完全与表列匹配,而不是如何该名称的属性被映射到类上。
字符串名称现在被认真解析为属性名称:
class User(Base):
__tablename__ = 'user'
id = Column(Integer, primary_key=True)
name = Column('user_name', String(50))
在上面,列user_name
被映射为name
。之前,调用传递字符串的Query.update()
将不得不按如下方式调用:
session.query(User).update({'user_name': 'moonbeam'})
给定的字符串现在是针对实体解析的:
session.query(User).update({'name': 'moonbeam'})
通常最好直接使用该属性,以避免任何含糊之处:
session.query(User).update({User.name: 'moonbeam'})
该更改还表示同义词和混合属性也可以通过字符串名称引用:
class User(Base):
__tablename__ = 'user'
id = Column(Integer, primary_key=True)
name = Column('user_name', String(50))
@hybrid_property
def fullname(self):
return self.name
session.query(User).update({'fullname': 'moonbeam'})
这个变化在1.0.1中是新的。一些用户正在执行基本上是这种形式的查询:
session.query(Address).filter(Address.user == User(id=None))
SQLAlchemy目前不支持此模式。对于所有版本,它发出的SQL类似于:
SELECT address.id AS address_id, address.user_id AS address_user_id,
address.email_address AS address_email_address
FROM address WHERE ? = address.user_id
(None,)
请注意,有一个比较WHERE ? = address.user_id
绑定值?
在SQL中接收None
或NULL
。这总是会在SQL中返回False。这里的比较理论上会生成SQL,如下所示:
SELECT address.id AS address_id, address.user_id AS address_user_id,
address.email_address AS address_email_address
FROM address WHERE address.user_id IS NULL
但现在,它没有。依靠“NULL = NULL”在所有情况下都会产生False这一事实的应用程序有可能会冒着某种程度上的风险,SQLAlchemy可能会解决此问题以生成“IS NULL”,然后查询会产生不同的结果。因此,通过这种操作,您将看到一个警告:
SAWarning: Got None for value of column user.id; this is unsupported
for a relationship comparison and will not currently produce an
IS comparison (but may in a future release)
请注意,这种模式在大多数情况下在1.0.0版本中被打破,包括所有的beta;会产生像SYMBOL('NEVER_SET')
这样的值。此问题已得到解决,但通过识别此模式,现在发出了警告,以便我们可以在将来的版本中更安全地修复此损坏的行为(现在在#3373中捕获)。
这个变化在1.0.1是新的;虽然我们希望这是1.0.0,但它只是由于#3371而变得明显。
给定映射:
class A(Base):
__tablename__ = 'a'
id = Column(Integer, primary_key=True)
class B(Base):
__tablename__ = 'b'
id = Column(Integer, primary_key=True)
a_id = Column(ForeignKey('a.id'))
a = relationship("A")
给定A
,主键为7,但我们更改为10而无需刷新:
s = Session(autoflush=False)
a1 = A(id=7)
s.add(a1)
s.commit()
a1.id = 10
针对与此对象作为目标的多对一关系的查询将在绑定参数中使用值10:
s.query(B).filter(B.a == a1)
生产:
SELECT b.id AS b_id, b.a_id AS b_a_id
FROM b
WHERE ? = b.a_id
(10,)
However, before this change, the negation of this criteria would not use 10, it would use 7, unless the object were flushed first:
s.query(B).filter(B.a != a1)
产生(0.9以及1.0.1之前的所有版本):
SELECT b.id AS b_id, b.a_id AS b_a_id
FROM b
WHERE b.a_id != ? OR b.a_id IS NULL
(7,)
对于瞬态对象,它会产生一个破坏的查询:
SELECT b.id, b.a_id
FROM b
WHERE b.a_id != :a_id_1 OR b.a_id IS NULL
{u'a_id_1': symbol('NEVER_SET')}
这种不一致性已被修复,并且在所有查询中,现在将使用当前属性值,在本例中10
。
在此更改中,访问对象时的默认返回值None
现在在每次访问时动态返回,而不是在第一次访问时用特殊的“set”操作隐式设置该属性的状态。The visible result of this change is that obj.__dict__
is not implicitly modified on get, and there are also some minor behavioral changes for attributes.get_history()
and related functions.
给定一个没有状态的对象:
>>> obj = Foo()
它总是SQLAlchemy的行为,如果我们访问一个从未设置过的标量属性或多对一属性,它将返回为None
:
>>> obj.someattr
None
这个None
的值实际上现在是obj
状态的一部分,并且与我们已经明确设置了该属性的情况不同。 obj.someattr = 无
。然而,这里的“set on get”在历史和事件方面会有不同的表现。它不会发射任何属性事件,而且如果我们查看历史记录,我们可以看到:
>>> inspect(obj).attrs.someattr.history
History(added=(), unchanged=[None], deleted=()) # 0.9 and below
也就是说,就好像该属性始终是None
,并且从未更改过。这与我们先设置属性的情况明显不同:
>>> obj = Foo()
>>> obj.someattr = None
>>> inspect(obj).attrs.someattr.history
History(added=[None], unchanged=(), deleted=()) # all versions
以上意味着我们的“设置”操作的行为可能会被之前通过“get”访问的值所破坏。在1.0中,这种不一致性已经解决了,当使用默认的“getter”时,不再实际设置任何东西。
>>> obj = Foo()
>>> obj.someattr
None
>>> inspect(obj).attrs.someattr.history
History(added=(), unchanged=(), deleted=()) # 1.0
>>> obj.someattr = None
>>> inspect(obj).attrs.someattr.history
History(added=[None], unchanged=(), deleted=())
上述行为没有太大影响的原因是因为关系数据库中的INSERT语句在大多数情况下认为缺失值与NULL相同。SQLAlchemy是否收到一个设置为None的特定属性的历史事件通常无关紧要;因为发送None / NULL与否之间的差异不会产生影响。然而,正如#3060(在Priority of attribute changes on relationship-bound attributes vs. FK-bound may appear to change)说明了一些很少的边缘情况实际上我们确实希望设置None
。此外,在这里允许属性事件意味着现在可以为ORM映射属性创建“默认值”函数。
作为这种变化的一部分,隐含的“无”的生成现在在过去发生的其他情况下被禁用;这包括何时收到多对一的属性集操作;以前,如果没有设置其他值,“旧”值将为“无”;它现在将发送orm.attributes.NEVER_SET
值,该值现在可以发送给属性侦听器。调用Mapper实用程序函数(如Mapper.primary_key_from_instance()
;)时也可能会收到此符号。如果主键属性根本没有设置,而之前的值为None
,它现在将成为orm.attributes.NEVER_SET
符号,并且不会更改对象的状态发生。
作为#3060的一个副作用,将关系绑定属性设置为None
现在是一个跟踪的历史事件,它涉及持续存在的意图None
因为设置关系绑定属性的情况总是会直接分配给外键属性,所以在分配None时可以看到行为更改。给定映射:
class A(Base):
__tablename__ = 'table_a'
id = Column(Integer, primary_key=True)
class B(Base):
__tablename__ = 'table_b'
id = Column(Integer, primary_key=True)
a_id = Column(ForeignKey('table_a.id'))
a = relationship(A)
在1.0中,在所有情况下,关系绑定属性优先于FK绑定属性,无论我们分配的值是对A
对象的引用还是None
在0.9中,行为是不一致的,只有赋值时才会生效;不考虑:
a1 = A(id=1)
a2 = A(id=2)
session.add_all([a1, a2])
session.flush()
b1 = B()
b1.a = a1 # we expect a_id to be '1'; takes precedence in 0.9 and 1.0
b2 = B()
b2.a = None # we expect a_id to be None; takes precedence only in 1.0
b1.a_id = 2
b2.a_id = 2
session.add_all([b1, b2])
session.commit()
assert b1.a is a1 # passes in both 0.9 and 1.0
assert b2.a is None # passes in 1.0, in 0.9 it's a2
Session.expunge()
的行为存在导致关于已删除对象的行为不一致的错误。在清除之后,object_session()
函数以及InstanceState.session
属性仍然会将对象报告为属于Session
u1 = sess.query(User).first()
sess.delete(u1)
sess.flush()
assert u1 not in sess
assert inspect(u1).session is sess # this is normal before commit
sess.expunge(u1)
assert u1 not in sess
assert inspect(u1).session is None # would fail
Note that it is normal for u1 not in sess
to be True while inspect(u1).session
still refers to the session, while the transaction is ongoing subsequent to the delete operation and Session.expunge()
has not been called; the full detachment normally completes once the transaction is committed. 这个问题也会影响依赖于Session.expunge()
的函数,比如make_transient()
。
为了使Query.yield_per()
方法更易于使用,当使用yield_per时,如果任何子查询渴望加载器或加入的将使用集合的渴望加载器都要生效,因为它们目前与yield-per不兼容(然而,理论上子查询加载可能)。发生此错误时,可以使用星号发送lazyload()
选项:
q = sess.query(Object).options(lazyload('*')).yield_per(100)
q = sess.query(Object).enable_eagerloads(False).yield_per(100)
lazyload()
选项的优点是,仍然可以使用额外的多对一连接的加载器选项:
q = sess.query(Object).options(
lazyload('*'), joinedload("some_manytoone")).yield_per(100)
此处的更改包括在某些情况下发生意外和不一致行为时发生的错误,这些错误包括两次连接到实体或多个单表实体针对同一个表,而不使用基于关系的ON子句以及连接多次以相同的目标关系。
以映射开始:
from sqlalchemy import Integer, Column, String, ForeignKey
from sqlalchemy.orm import Session, relationship
from sqlalchemy.ext.declarative import declarative_base
Base = declarative_base()
class A(Base):
__tablename__ = 'a'
id = Column(Integer, primary_key=True)
bs = relationship("B")
class B(Base):
__tablename__ = 'b'
id = Column(Integer, primary_key=True)
a_id = Column(ForeignKey('a.id'))
连接到A.bs
两次的查询:
print(s.query(A).join(A.bs).join(A.bs))
将呈现:
SELECT a.id AS a_id
FROM a JOIN b ON a.id = b.a_id
该查询会重复删除多余的A.bs
,因为它试图支持如下所示的情况:
s.query(A).join(A.bs).\
filter(B.foo == 'bar').\
reset_joinpoint().join(A.bs, B.cs).filter(C.bar == 'bat')
That is, the A.bs
is part of a “path”. 作为#3367的一部分,两次到达相同的端点而不是大路径的一部分现在将发出警告:
SAWarning: Pathed join target A.bs has already been joined to; skipping
当加入实体而不使用关系路径时,更大的变化涉及到。如果我们加入B
两次:
print(s.query(A).join(B, B.a_id == A.id).join(B, B.a_id == A.id))
在0.9中,这将呈现如下:
SELECT a.id AS a_id
FROM a JOIN b ON b.a_id = a.id JOIN b AS b_1 ON b_1.a_id = a.id
这是有问题的,因为别名是隐含的,并且在不同的ON子句的情况下会导致不可预知的结果。
在1.0中,没有应用自动别名,我们得到:
SELECT a.id AS a_id
FROM a JOIN b ON b.a_id = a.id JOIN b ON b.a_id = a.id
这会引发数据库错误。虽然如果我们加入冗余关系和基于冗余非关系的目标,如果“重复连接目标”的行为相同,那么现在我们只是在更严重的情况下改变行为,在这种情况下,先前会出现隐式锯齿,并且只会在关系案例中发出警告。最终,两次加入相同的事物而没有任何混淆消除歧义的行为会在所有情况下产生错误。
此更改还会影响单表继承目标。使用如下映射:
from sqlalchemy import Integer, Column, String, ForeignKey
from sqlalchemy.orm import Session, relationship
from sqlalchemy.ext.declarative import declarative_base
Base = declarative_base()
class A(Base):
__tablename__ = "a"
id = Column(Integer, primary_key=True)
type = Column(String)
__mapper_args__ = {'polymorphic_on': type, 'polymorphic_identity': 'a'}
class ASub1(A):
__mapper_args__ = {'polymorphic_identity': 'asub1'}
class ASub2(A):
__mapper_args__ = {'polymorphic_identity': 'asub2'}
class B(Base):
__tablename__ = 'b'
id = Column(Integer, primary_key=True)
a_id = Column(Integer, ForeignKey("a.id"))
a = relationship("A", primaryjoin="B.a_id == A.id", backref='b')
s = Session()
print(s.query(ASub1).join(B, ASub1.b).join(ASub2, B.a))
print(s.query(ASub1).join(B, ASub1.b).join(ASub2, ASub2.id == B.a_id))
底部的两个查询是等价的,并且都应该呈现相同的SQL:
SELECT a.id AS a_id, a.type AS a_type
FROM a JOIN b ON b.a_id = a.id JOIN a ON b.a_id = a.id AND a.type IN (:type_1)
WHERE a.type IN (:type_2)
上面的SQL是无效的,因为它在FROM列表中呈现两次“a”。但是,只有第二个查询会出现隐式别名错误,并将其渲染为:
SELECT a.id AS a_id, a.type AS a_type
FROM a JOIN b ON b.a_id = a.id JOIN a AS a_1
ON a_1.id = b.a_id AND a_1.type IN (:type_1)
WHERE a_1.type IN (:type_2)
在上面,第二次加入“a”是别名。虽然这看起来很方便,但它并不是单一继承查询的一般工作方式,而且具有误导性和不一致性。
最终结果是依赖于这个错误的应用程序现在会有数据库引发的错误。解决方案是使用预期的形式。在查询中引用单一继承实体的多个子类时,必须手动使用别名来消除表的歧义,因为所有子类通常引用同一个表:
asub2_alias = aliased(ASub2)
print(s.query(ASub1).join(B, ASub1.b).join(asub2_alias, B.a.of_type(asub2_alias)))
标记为延迟但没有显式未延迟的映射属性现在将保持“延迟”状态,即使它们的列以某种方式存在于结果集中。这是一种性能增强,因为当获得结果集时,ORM加载不再花费时间搜索每个延迟列。但是,对于依赖于此的应用程序,现在应该使用明确的undefer()
或类似选项,以防止在访问属性时发出SELECT。
以下ORM事件挂钩(其中一些已从0.5开始已弃用)已被删除:translate_row
,populate_instance
,append_result
,create_instance
这些钩子的用例起源于早期的0.1 / 0.2系列SQLAlchemy,并且早已不必要了。特别是钩子在很大程度上无法使用,因为这些事件中的行为契约与周围的内部组件紧密相关,例如需要如何创建和初始化实例以及如何在ORM生成的行内定位列。删除这些钩子大大简化了ORM对象加载的机制。
当create_row_processor()
方法在自定义类上被覆盖时,0.9的新Bundle
对象在API中有一个小的改变。以前,示例代码如下所示:
from sqlalchemy.orm import Bundle
class DictBundle(Bundle):
def create_row_processor(self, query, procs, labels):
"""Override create_row_processor to return values as dictionaries"""
def proc(row, result):
return dict(
zip(labels, (proc(row, result) for proc in procs))
)
return proc
未使用的result
成员现在被删除:
from sqlalchemy.orm import Bundle
class DictBundle(Bundle):
def create_row_processor(self, query, procs, labels):
"""Override create_row_processor to return values as dictionaries"""
def proc(row):
return dict(
zip(labels, (proc(row) for proc in procs))
)
return proc
也可以看看
joinedload.innerjoin
以及relationship.innerjoin
的行为现在使用“嵌套”内部联接,即右嵌套,作为内部联接加入加入的急切加载被链接到外部加入急切加载。为了获得将外部连接存在时将所有连接的紧急加载链接为外部连接的旧行为,请使用innerjoin="unnested"
。
As introduced in Right-nested inner joins available in joined eager loads from version 0.9, the behavior of innerjoin="nested"
is that an inner join eager load chained to an outer join eager load will use a right-nested join. "nested"
is now implied when using innerjoin=True
:
query(User).options(
joinedload("orders", innerjoin=False).joinedload("items", innerjoin=True))
使用新的默认值,这将以下面的形式呈现FROM子句:
FROM users LEFT OUTER JOIN (orders JOIN items ON <onclause>) ON <onclause>
也就是说,对INNER连接使用右嵌套连接,以便可以返回users
的完整结果。INNER连接的使用比使用OUTER连接更有效,并允许joinedload.innerjoin
优化参数在所有情况下都生效。
要获得较旧的行为,请使用innerjoin="unnested"
:
query(User).options(
joinedload("orders", innerjoin=False).joinedload("items", innerjoin="unnested"))
这将避免右嵌套连接,并尽管使用innerjoin指令使用所有OUTER连接将连接链接在一起:
FROM users LEFT OUTER JOIN orders ON <onclause> LEFT OUTER JOIN items ON <onclause>
正如0.9注释中指出的那样,右嵌套连接有困难的唯一数据库后端是SQLite;从0.9版开始,SQLAlchemy将右嵌套连接转换为子查询,作为SQLite上的连接目标。
也可以看看
Right-nested inner joins available in joined eager loads - 0.9.4中介绍的特征描述。
给定如下所示的加入的热切加载:
class A(Base):
__tablename__ = 'a'
id = Column(Integer, primary_key=True)
b = relationship("B", uselist=False)
class B(Base):
__tablename__ = 'b'
id = Column(Integer, primary_key=True)
a_id = Column(ForeignKey('a.id'))
s = Session()
print(s.query(A).options(joinedload(A.b)).limit(5))
SQLAlchemy considers the relationship A.b
to be a “one to many, loaded as a single value”, which is essentially a “one to one” relationship. 但是,加入的预加载一直将上述情况视为主查询需要位于子查询中的情况,正如通常在主查询应用LIMIT时收集B对象所需的情况:
SELECT anon_1.a_id AS anon_1_a_id, b_1.id AS b_1_id, b_1.a_id AS b_1_a_id
FROM (SELECT a.id AS a_id
FROM a LIMIT :param_1) AS anon_1
LEFT OUTER JOIN b AS b_1 ON anon_1.a_id = b_1.a_id
然而,由于内部查询的到外层一个上的关系是至多只有一排在uselist=False
SELECT a.id AS a_id, b_1.id AS b_1_id, b_1.a_id AS b_1_a_id
FROM a LEFT OUTER JOIN b AS b_1 ON a.id = b_1.a_id
LIMIT :param_1
在LEFT OUTER JOIN返回多于一行的情况下,ORM总是在这里发出警告并忽略uselist=False
的附加结果,因此在该错误情况下的结果不应改变。
A warning is emitted in SQLAlchemy 0.9.10 (not yet released as of June 9, 2015) when the Query.update()
or Query.delete()
methods are invoked against a query which has also called upon Query.join()
, Query.outerjoin()
, Query.select_from()
or Query.from_self()
. 这些不支持的用例在0.9系列中默默无效,直到发出警告为止。在1.0中,这些情况引发了一个例外。
synchronize_session='evaluate'
引发多表更新¶Query.update()
的“评估程序”不适用于多表更新,需要设置为synchronize_session=False
或synchronize_session='fetch'
。新的行为是,现在引发了一个明确的异常,并带有一条消息来更改同步设置。这是从0.9.7发出的警告升级而来的。
“复活”ORM事件已被完全删除。从0.8版本开始,该事件不再具有任何功能,从工作单元中删除旧的“可变”系统。
给定一个单表继承映射,如:
class Widget(Base):
__table__ = 'widget_table'
class FooWidget(Widget):
pass
对子类使用Query.from_self()
或Query.count()
会产生子查询,但是将子类型的“WHERE”标准添加到外部:
sess.query(FooWidget).from_self().all()
渲染:
SELECT
anon_1.widgets_id AS anon_1_widgets_id,
anon_1.widgets_type AS anon_1_widgets_type
FROM (SELECT widgets.id AS widgets_id, widgets.type AS widgets_type,
FROM widgets) AS anon_1
WHERE anon_1.widgets_type IN (?)
问题在于,如果内部查询没有指定所有列,那么我们不能在外部添加WHERE子句(它实际上会尝试并产生错误的查询)。这个决定显然回到了0.6.5,注释“可能需要对此做出更多调整”。那么,这些调整已经到来!所以现在上面的查询会呈现:
SELECT
anon_1.widgets_id AS anon_1_widgets_id,
anon_1.widgets_type AS anon_1_widgets_type
FROM (SELECT widgets.id AS widgets_id, widgets.type AS widgets_type,
FROM widgets
WHERE widgets.type IN (?)) AS anon_1
所以那些不包含“type”的查询仍然可以工作!:
sess.query(FooWidget.id).count()
呈现:
SELECT count(*) AS count_1
FROM (SELECT widgets.id AS widgets_id
FROM widgets
WHERE widgets.type IN (?)) AS anon_1
当连接到单表继承子类目标时,ORM在加入关系时总是添加“单表标准”。给定映射为:
class Widget(Base):
__tablename__ = 'widget'
id = Column(Integer, primary_key=True)
type = Column(String)
related_id = Column(ForeignKey('related.id'))
related = relationship("Related", backref="widget")
__mapper_args__ = {'polymorphic_on': type}
class FooWidget(Widget):
__mapper_args__ = {'polymorphic_identity': 'foo'}
class Related(Base):
__tablename__ = 'related'
id = Column(Integer, primary_key=True)
一段时间以来,关系的加入会为该类型提供一个“单一继承”子句:
s.query(Related).join(FooWidget, Related.widget).all()
SQL输出:
SELECT related.id AS related_id
FROM related JOIN widget ON related.id = widget.related_id AND widget.type IN (:type_1)
Above, because we joined to a subclass FooWidget
, Query.join()
knew to add the AND widget.type IN ('foo')
criteria to the ON clause.
这里的变化是,AND widget.type IN()
条件现在附加到任何 ON子句,不只是从关系中产生的那些,包括一个明确说明的关系:
# ON clause will now render as
# related.id = widget.related_id AND widget.type IN (:type_1)
s.query(Related).join(FooWidget, FooWidget.related_id == Related.id).all()
当没有任何类型的ON子句被声明时,以及“隐式”连接:
# ON clause will now render as
# related.id = widget.related_id AND widget.type IN (:type_1)
s.query(Related).join(FooWidget).all()
以前,这些ON子句不包含单继承条件。已经添加此标准以解决此问题的应用程序将希望删除其显式使用,但如果标准在此期间发生两次,它应该继续正常工作。
自从SQLAlchemy开始以来,一直强调不妨碍纯文本的使用。The Core and ORM expression systems were intended to allow any number of points at which the user can just use plain text SQL expressions, not just in the sense that you can send a full SQL string to Connection.execute()
, but that you can send strings with SQL expressions into many functions, such as Select.where()
, Query.filter()
, and Select.order_by()
.
Note that by “SQL expressions” we mean a full fragment of a SQL string, such as:
# the argument sent to where() is a full SQL expression
stmt = select([sometable]).where("somecolumn = 'value'")
and we are not talking about string arguments, that is, the normal behavior of passing string values that become parameterized:
# This is a normal Core expression with a string argument -
# we aren't talking about this!!
stmt = select([sometable]).where(sometable.c.somecolumn == 'value')
Core教程一直以来都使用这种技术,使用select()
构造,其中几乎所有组件都被指定为直线。然而,尽管这种长期存在的行为和示例,用户显然对这种行为存在感到惊讶,并且在询问社区时,我无法找到任何实际上没有感到惊讶的用户,您可以将完整的字符串发送到像Query.filter()
这样的方法中。
所以这里的改变是鼓励用户在编写部分或全部由文本片段组成的SQL时限定文本字符串。在撰写选择时如下所示:
stmt = select(["a", "b"]).where("a = b").select_from("sometable")
声明是正常建立的,与以前一样强制执行。但是,您会看到以下警告消息:
SAWarning: Textual column expression 'a' should be explicitly declared
with text('a'), or use column('a') for more specificity
(this warning may be suppressed after 10 occurrences)
SAWarning: Textual column expression 'b' should be explicitly declared
with text('b'), or use column('b') for more specificity
(this warning may be suppressed after 10 occurrences)
SAWarning: Textual SQL expression 'a = b' should be explicitly declared
as text('a = b') (this warning may be suppressed after 10 occurrences)
SAWarning: Textual SQL FROM expression 'sometable' should be explicitly
declared as text('sometable'), or use table('sometable') for more
specificity (this warning may be suppressed after 10 occurrences)
这些警告试图通过显示参数以及接收字符串的位置来准确显示问题的出处。警告使用Session.get_bind() handles a wider variety of inheritance scenarios,以便可以安全地发出参数化警告而不会耗尽内存,并且如果希望警告是例外情况,应该使用Python Warnings Filter:
import warnings
warnings.simplefilter("error") # all warnings raise an exception
鉴于上述警告,我们的声明工作得很好,但为了摆脱警告,我们将重写我们的声明如下:
from sqlalchemy import select, text
stmt = select([
text("a"),
text("b")
]).where(text("a = b")).select_from(text("sometable"))
正如警告所暗示的,如果我们使用column()
和table()
,我们可以更具体地说明文本。
from sqlalchemy import select, text, column, table
stmt = select([column("a"), column("b")]).\
where(text("a = b")).select_from(table("sometable"))
还要注意,现在可以从“sqlalchemy”中导入table()
和column()
,而不使用“sql”部分。
The behavior here applies to select()
as well as to key methods on Query
, including Query.filter()
, Query.from_statement()
and Query.having()
.
有一种情况使用字符串具有特殊含义,并且作为此更改的一部分,我们已增强其功能。当我们有一个引用某个列名或命名标签的select()
或Query
时,我们可能想要GROUP BY和/或ORDER BY已知列或标签:
stmt = select([
user.c.name,
func.count(user.c.id).label("id_count")
]).group_by("name").order_by("id_count")
在上面的语句中,我们希望看到“ORDER BY id_count”,而不是函数的重新声明。The string argument given is actively matched to an entry in the columns clause during compilation, so the above statement would produce as we expect, without warnings (though note that the "name"
expression has been resolved to users.name
! ):
SELECT users.name, count(users.id) AS id_count
FROM users GROUP BY users.name ORDER BY id_count
但是,如果我们引用无法找到的名称,则我们再次收到警告,如下所示:
stmt = select([
user.c.name,
func.count(user.c.id).label("id_count")
]).order_by("some_label")
输出符合我们的说法,但它又一次警告我们:
SAWarning: Can't resolve label reference 'some_label'; converting to
text() (this warning may be suppressed after 10 occurrences)
SELECT users.name, count(users.id) AS id_count
FROM users ORDER BY some_label
上述行为适用于我们可能想要参考所谓的“标签参考”的所有地方; ORDER BY和GROUP BY,但也包含在OVER子句中,以及引用列的DISTINCT ON子句(例如Postgresql语法)。
我们仍然可以使用text()
为ORDER BY或其他表达式指定任意表达式:
stmt = select([users]).order_by(text("some special expression"))
整个变化的结果是SQLAlchemy现在希望我们在发送字符串时告诉它该字符串显式为text()
构造,或者列,表等,并且if我们使用它作为标签名称,按照group by或其他表达式进行排序,SQLAlchemy预期字符串会解析为已知的内容,否则应该再次使用text()
或类似方法进行限定。
当使用多值版本的Insert.values()
时,支持Python端列的默认设置基本上未实现,并且只能在特定情况下“偶然”工作,当使用的方言是使用非定位(例如命名)风格的绑定参数,以及何时不需要为每一行调用Python端可调用。
该功能已经过大修,因此其功能与“executemany”风格的调用类似:
import itertools
counter = itertools.count(1)
t = Table(
'my_table', metadata,
Column('id', Integer, default=lambda: next(counter)),
Column('data', String)
)
conn.execute(t.insert().values([
{"data": "d1"},
{"data": "d2"},
{"data": "d3"},
]))
上面的例子将会像预期的那样分别为每一行调用next(counter)
:
INSERT INTO my_table (id, data) VALUES (?, ?), (?, ?), (?, ?)
(1, 'd1', 2, 'd2', 3, 'd3')
以前,位置方言会失败,因为不会为其他位置生成绑定:
Incorrect number of bindings supplied. The current statement uses 6,
and there are 4 supplied.
[SQL: u'INSERT INTO my_table (id, data) VALUES (?, ?), (?, ?), (?, ?)']
[parameters: (1, 'd1', 'd2', 'd3')]
并且使用“named”方言,“id”的相同值将在每一行中重复使用(因此,此更改与依赖此的系统反向不兼容):
INSERT INTO my_table (id, data) VALUES (:id, :data_0), (:id, :data_1), (:id, :data_2)
{u'data_2': 'd3', u'data_1': 'd2', u'data_0': 'd1', 'id': 1}
系统也会拒绝将“服务器端”默认值作为内联呈现的SQL调用,因为无法保证服务器端默认值与此兼容。如果VALUES子句为特定列呈现,则需要Python端值;如果省略的值仅指服务器端的默认值,则会引发异常:
t = Table(
'my_table', metadata,
Column('id', Integer, primary_key=True),
Column('data', String, server_default='some default')
)
conn.execute(t.insert().values([
{"data": "d1"},
{"data": "d2"},
{},
]))
会提高:
sqlalchemy.exc.CompileError: INSERT value for column my_table.data is
explicitly rendered as a boundparameter in the VALUES clause; a
Python-side value or SQL expression is required
以前,值“d1”将被复制到第三行的值(但是只能使用命名格式!):
INSERT INTO my_table (data) VALUES (:data_0), (:data_1), (:data_0)
{u'data_1': 'd2', u'data_0': 'd1'}
从同一事件本身中删除事件侦听器会在迭代过程中修改列表的元素,这将导致静态连接的事件侦听器无法启动。为了在保持性能的同时避免这种情况发生,列表已被替换为collections.deque()
,它不允许在迭代过程中进行任何添加或删除操作,而是引发RuntimeError
。
inline=True
¶现在使用Insert.from_select()
意味着inline=True
在insert()
上。这有助于修复INSERT ... FROM SELECT构造无意中编译为支持后端的“隐式返回”的错误,这会在插入零行的INSERT情况下导致破坏(因为隐式返回期望行) ,以及在插入多行的INSERT情况下的任意返回数据(例如,只有很多行的第一行)。一个类似的更改也适用于具有多个参数集的INSERT..VALUES;隐含的RETURNING将不再为此语句发出。由于这两个构造都处理可变数量的行,所以ResultProxy.inserted_primary_key
访问器不适用。以前,有一个文档说明,有人可能更喜欢带有INSERT..FROM SELECT的inline=True
,因为有些数据库不支持返回,因此不能做“隐式”返回,但没有任何理由INSERT ... FROM SELECT需要在任何情况下隐式返回。如果需要插入数据,则应使用常规显式Insert.returning()
返回可变数目的结果行。
autoload_with
现在意味着autoload=True
¶通过单独传递Table.autoload_with
,可以设置Table
进行反射:
my_table = Table('my_table', metadata, autoload_with=some_engine)
在Connection
对象失效,然后尝试重新连接并遇到错误的情况下,SQLAlchemy的包装DBAPI异常不会发生;这已经解决了。
此外,最近添加的ConnectionEvents.handle_error()
事件现在将针对初始连接时发生的错误,重新连接时以及在使用create_engine()
时给定自定义连接通过create_engine.creator
执行功能。
The ExceptionContext
object has a new datamember ExceptionContext.engine
that will always refer to the Engine
in use, in those cases when the Connection
object is not available (e.g. on initial connect).
ForeignKeyConstraint.columns
was previously a plain list containing either strings or Column
objects, depending on how the ForeignKeyConstraint
was constructed and whether it was associated with a table. 该集合现在是ColumnCollection
,并且仅在ForeignKeyConstraint
与Table
关联后才被初始化。A new accessor ForeignKeyConstraint.column_keys
is added to unconditionally return string keys for the local set of columns regardless of how the object was constructed or its current state.
The sorting of tables resulting from the MetaData.sorted_tables
accessor is “deterministic”; the ordering should be the same in all cases regardless of Python hashing. 这是通过首先按名称对表格进行排序,然后将它们传递给拓扑算法,该拓扑算法在迭代时保持排序。
Note that this change does not yet apply to the ordering applied when emitting MetaData.create_all()
or MetaData.drop_all()
.
这三个常量被更改为返回0.9中的“单例”值;不幸的是,这会导致像下面这样的查询不能按预期呈现:
select([null(), null()])
rendering only SELECT NULL AS anon_1
, because the two null()
constructs would come out as the same NULL
object, and SQLAlchemy’s Core model is based on object identity in order to determine lexical significance. 除了希望节省物体开销之外,0.9中的变化并不重要;一般来说,一个未命名的构造需要保持词汇上的独特性,以便得到唯一的标记。
在SQLite / Oracle的情况下,Inspector.get_table_names()
和Inspector.get_view_names()
方法也会返回临时表和视图的名称,任何其他方言(在MySQL的情况下,至少它是不可能的)。This logic has been moved out to two new methods Inspector.get_temp_table_names()
and Inspector.get_temp_view_names()
.
Note that reflection of a specific named temporary table or temporary view, either by Table('name', autoload=True)
or via methods like Inspector.get_columns()
continues to function for most if not all dialects. 特别是对于SQLite,还有一个针对临时表的UNIQUE约束反射的错误修复,它是#3203。
对于创建和删除TYPE,Postgresql postgresql.ENUM
的规则更为严格。
An postgresql.ENUM
that is created without being explicitly associated with a MetaData
object will be created and dropped corresponding to Table.create()
and Table.drop()
:
table = Table('sometable', metadata,
Column('some_enum', ENUM('a', 'b', 'c', name='myenum'))
)
table.create(engine) # will emit CREATE TYPE and CREATE TABLE
table.drop(engine) # will emit DROP TABLE and DROP TYPE - new for 1.0
这意味着如果第二个表也有一个名为'myenum'的枚举,那么上面的DROP操作现在将失败。为了适应普通共享枚举类型的用例,元数据关联枚举的行为已得到增强。
An postgresql.ENUM
that is created with being explicitly associated with a MetaData
object will not be created or dropped corresponding to Table.create()
and Table.drop()
, with the exception of Table.create()
called with the checkfirst=True
flag:
my_enum = ENUM('a', 'b', 'c', name='myenum', metadata=metadata)
table = Table('sometable', metadata,
Column('some_enum', my_enum)
)
# will fail: ENUM 'my_enum' does not exist
table.create(engine)
# will check for enum and emit CREATE TYPE
table.create(engine, checkfirst=True)
table.drop(engine) # will emit DROP TABLE, *not* DROP TYPE
metadata.drop_all(engine) # will emit DROP TYPE
metadata.create_all(engine) # will emit CREATE TYPE
在Postgresql中,inspect()
方法返回一个PGInspector
对象,其中包含一个新的PGInspector.get_enums()
方法,该方法返回所有可用的ENUM
类型:
from sqlalchemy import inspect, create_engine
engine = create_engine("postgresql+psycopg2://host/dbname")
insp = inspect(engine)
print(insp.get_enums())
变化如下:
autoload=True
的Table
结构现在将匹配存在于数据库中的名称作为物化视图或外部表。Inspector.get_view_names()
will return plain and materialized view names.Inspector.get_table_names()
does not change for Postgresql, it continues to return only the names of plain tables.PGInspector.get_foreign_table_names()
,它将返回Postgresql模式表中明确标记为“外部”的表的名称。对反射的改变包括将'm'
和'f'
添加到我们在查询pg_class.relkind
时使用的限定符列表中,但是此更改在1.0.0中是新的,以避免那些在生产中运行0.9的人出现任何向后不兼容的意外。
has_table()
现在可用于临时表¶这是一个简单的修复,现在可以使用临时表的“有表”,以便可以继续执行以下代码:
from sqlalchemy import *
metadata = MetaData()
user_tmp = Table(
"user_tmp", metadata,
Column("id", INT, primary_key=True),
Column('name', VARCHAR(50)),
prefixes=['TEMPORARY']
)
e = create_engine("postgresql://scott:tiger@localhost/test", echo='debug')
with e.begin() as conn:
user_tmp.create(conn, checkfirst=True)
# checkfirst will succeed
user_tmp.create(conn, checkfirst=True)
这种行为会导致非失败应用程序的行为不同,这是非常不可能的,因为Postgresql允许非临时表以静默方式覆盖临时表。因此,像下面这样的代码现在将完全不同,不再在临时表之后创建真实表:
from sqlalchemy import *
metadata = MetaData()
user_tmp = Table(
"user_tmp", metadata,
Column("id", INT, primary_key=True),
Column('name', VARCHAR(50)),
prefixes=['TEMPORARY']
)
e = create_engine("postgresql://scott:tiger@localhost/test", echo='debug')
with e.begin() as conn:
user_tmp.create(conn, checkfirst=True)
m2 = MetaData()
user = Table(
"user_tmp", m2,
Column("id", INT, primary_key=True),
Column('name', VARCHAR(50)),
)
# in 0.9, *will create* the new table, overwriting the old one.
# in 1.0, *will not create* the new table
user.create(conn, checkfirst=True)
Postgresql现在支持9.4的集合函数的SQL标准FILTER关键字。SQLAlchemy允许使用FunctionElement.filter()
:
func.count(1).filter(True)
create_engine.encoding
参数现在可以通过pg8000方言使用连接处理程序,它可以发出SET CLIENT_ENCODING
匹配所选的编码。
已经添加了对PG8000版本大于1.10.1的支持,其中原生支持JSONB。
增加了对pypy psycopg2cffi方言的支持。
如果使用nullable=True
设置列,则MySQL方言一直通过为这种类型发送NULL来解决MySQL的与TIMESTAMP列相关的隐式NOT NULL默认值。但是,MySQL 5.6.6及更高版本提供了一个新标记explicit_defaults_for_timestamp,它修复了MySQL的非标准行为,使其表现得像其他类型一样;为了适应这种情况,SQLAlchemy现在无条件地为所有TIMESTAMP列发出NULL / NOT NULL。
mysql.SET
类型历史上不包括分别处理空白集和空值的系统;因为不同的驱动程序在处理空字符串和空字符集表示方面有不同的行为,所以SET类型只试图在这些行为之间进行对冲,选择将空集作为set([''])
这里的部分原因是,否则实际上不可能在MySQL SET中存储一个空字符串,因为驱动程序给我们返回的字符串无法区分set([''])
和set()
用户确定是否set([''])
实际上表示“空集”。
新行为将空字符串的用例(这是一个甚至在MySQL文档中没有记录的异常情况)移动到一个特殊情况,现在mysql.SET
的默认行为是:
''
处理为空set set()
;set([''])
转换为空set set()
;''
的集合类型的情况,实现了一个新特性(在这个用例中是必需的),从而设置值被持久化并且作为一个按位整数值加载;添加标志mysql.SET.retrieve_as_bitwise
以启用此功能。通过使用mysql.SET.retrieve_as_bitwise
标志,可以保持集合的持久性,并且检索时不会出现任何含糊不清的值。理论上这个标志可以在任何情况下被打开,只要该类型的给定值列表与数据库中声明的顺序完全匹配即可。它只会使SQL echo输出更加不寻常。
mysql.SET
的默认行为保持不变,使用字符串往返传值。基于字符串的行为现在支持unicode完全包含use_unicode = 0的MySQL-python。
现在,MySQL方言将禁止ConnectionEvents.handle_error()
事件触发它在内部使用的用于检测表是否存在的语句。这是通过使用执行选项skip_user_error_events
来实现的,该选项为该执行的范围禁用句柄错误事件。通过这种方式,重写异常的用户代码不需要担心偶尔需要捕获SQLAlchemy特定异常的MySQL方言或其他方言。
raise_on_warnings
的默认值¶MySQL-Connector将“raise_on_warnings”的默认值更改为False。由于某种原因,这被设置为True。不幸的是,“缓冲”标志必须保持为True,因为MySQL连接器不允许游标关闭,除非所有结果都被完全获取。
对IS / IS NOT运算符进行0.9版本的修改以及#2682中的布尔类型不允许MySQL方言在“IS”的上下文中使用“true”和“false” / “不是”。显然,即使MySQL没有“boolean”类型,即使这些符号与“1”和“0”(和IS / IS)是同义的,它仍然支持IS / IS NOT。不是不适用于数字)。
因此,这里的变化是MySQL方言仍然是“非本地布尔”,但是true()
和false()
符号再次产生关键字“true”和“false “,这样像column.is_(true())
这样的表达式再次适用于MySQL。
一个ColumnOperators.match()
表达式的返回类型现在是一个名为MatchType
的新类型。这是Boolean
的一个子类,可以通过方言拦截,以便在SQL执行时产生不同的结果类型。
像下面这样的代码现在可以正常工作并返回MySQL上的浮点数:
>>> connection.execute(
... select([
... matchtable.c.title.match('Agile Ruby Programming').label('ruby'),
... matchtable.c.title.match('Dive Python').label('python'),
... matchtable.c.title
... ]).order_by(matchtable.c.id)
... )
[
(2.0, 0.0, 'Agile Web Development with Ruby On Rails'),
(0.0, 2.0, 'Dive Into Python'),
(2.0, 0.0, "Programming Matz's Ruby"),
(0.0, 0.0, 'The Definitive Guide to Django'),
(0.0, 1.0, 'Python in a Nutshell')
]
The dialect for Drizzle is now an external dialect, available at https://bitbucket.org/zzzeek/sqlalchemy-drizzle. 在SQLAlchemy能够适应第三方方言之前,这种方言被添加到了SQLAlchemy中;未来,所有不属于“无所不在”类别的数据库都是第三方方言。方言的实现没有改变,仍然基于SQLAlchemy中的MySQL + MySQLdb方言。方言尚未发布,处于“阁楼”地位;但是它通过了大部分测试,并且一般都处于体面的工作状态,如果有人想要接受抛光。
使用无DSN连接的PyODBC连接到SQL Server,例如使用明确的主机名,现在需要一个驱动程序名 - SQLAlchemy将不再尝试猜测默认值:
engine = create_engine("mssql+pyodbc://scott:tiger@myhost:port/databasename?driver=SQL+Server+Native+Client+10.0")
SQLAlchemy以前硬编码的默认“SQL Server”在Windows上已过时,并且SQLAlchemy不能根据操作系统/驱动程序检测猜测最佳驱动程序。使用ODBC完全避免此问题时,始终首选使用DSN。
对于SQL Server 2012及更高版本,Text
,UnicodeText
和LargeBinary
类型的呈现已更改,并具有完全控制行为的选项,基于微软的弃用准则。有关详细信息,请参阅Large Text/Binary Type Deprecation。
CTE对Oracle的支持已经得到了修复,并且还有一个新特性CTE.with_suffixes()
可以帮助Oracle的特殊指令:
included_parts = select([
part.c.sub_part, part.c.part, part.c.quantity
]).where(part.c.part == "p1").\
cte(name="included_parts", recursive=True).\
suffix_with(
"search depth first by part set ord1",
"cycle part set y_cycle to 1 default 0", dialect='oracle')