Query Optimization Guide

Best practices for optimizing PostgreSQL queries in a FastAPI + SQLAlchemy application.

General Principles
Indexing
Query Design
SQLAlchemy Best Practices
Pagination
Avoid N+1 Queries
Batch Operations
Transactions
Query Analysis
PostgreSQL Optimization
Connection Pool
Caching
Soft Delete Optimization
Full Text Search
Monitoring
Performance Checklist

General Principles

Only Select Required Columns

❌ Bad

select(User)

✅ Good

select(
    User.id,
    User.email,
)

select(User.id, User.email)

Avoid loading unnecessary columns.

Avoid SELECT *

Never write

SELECT *
FROM users;

Prefer

SELECT
    id,
    email,
    fullname
FROM users;

Filter Early

Good

SELECT *
FROM users
WHERE deleted_at IS NULL;

Avoid filtering in Python.

Indexing

Primary Key

PRIMARY KEY(id)

Already indexed.

Foreign Keys

Always create indexes.

CREATE INDEX idx_user_role_user
ON user_roles(user_id);

Frequently Filtered Columns

Example

email
username
status
deleted_at
created_at

Composite Index

Instead of

WHERE organization_id = ?
AND deleted_at IS NULL

Use

CREATE INDEX idx_org_deleted
ON users(
    organization_id,
    deleted_at
);

Partial Index

Excellent for soft delete.

CREATE INDEX idx_users_active
ON users(email)
WHERE deleted_at IS NULL;

Query Design

Use EXISTS

Instead of

SELECT COUNT(*)

Use

SELECT EXISTS(
    SELECT 1
);

SQLAlchemy

from sqlalchemy import exists

LIMIT

Always limit results.

LIMIT 50

Never fetch millions of rows.

ORDER BY Indexed Columns

Good

ORDER BY created_at DESC

with

INDEX(created_at)

SQLAlchemy Best Practices

Use select()

Prefer

stmt = select(User)

Avoid legacy Query API.

Load Only Needed Fields

stmt = select(
    User.id,
    User.email,
)

scalars()

Good

users = await session.scalars(stmt)

instead of

await session.execute(stmt)

when selecting ORM models.

one_or_none()

Use

result.scalar_one_or_none()

instead of

all()

when expecting a single record.

Pagination

Avoid

OFFSET 100000

Prefer Cursor Pagination.

Example

WHERE id > ?
ORDER BY id
LIMIT 50

Avoid N+1 Queries

Bad

for user in users:
    print(user.roles)

Good

select(User).options(
    selectinload(User.roles)
)

joinedload()

depending on the use case.

Batch Operations

Instead of

for user in users:
    session.add(user)

Use

session.add_all(users)

Bulk Update

update(User)

Bulk Delete

delete(User)

Transactions

Keep transactions short.

Good

Begin

Update

Commit

Avoid

Begin

HTTP Request

Redis

Email

Commit

Query Analysis

Use

EXPLAIN ANALYZE

Example

EXPLAIN ANALYZE
SELECT *
FROM users
WHERE email='john@test.com';

Look for

Seq Scan
Bitmap Heap Scan
Index Scan

Prefer

Index Scan

PostgreSQL Optimization

Vacuum

VACUUM ANALYZE;

Auto Vacuum should be enabled.

Update Statistics

ANALYZE users;

Avoid Huge JSON Columns

Store large blobs separately.

Use UUID

Prefer

UUID v7

UUID v4

instead of sequential integers when appropriate.

Connection Pool

Recommended

create_async_engine(
    DATABASE_URL,
    pool_size=20,
    max_overflow=40,
    pool_pre_ping=True,
    pool_recycle=1800,
)

Do not create an engine per request.

Caching

Cache

User Profile
Roles
Permissions
Settings

Use Redis.

Avoid caching mutable transactional data unless invalidation is handled.

Soft Delete

Always filter

deleted_at IS NULL

Create index

CREATE INDEX idx_deleted
ON users(deleted_at);

Better

CREATE INDEX idx_active_users
ON users(email)
WHERE deleted_at IS NULL;

Full Text Search

Instead of

LIKE '%john%'

Use

GIN Index

and

tsvector

Example

CREATE INDEX idx_users_search
ON users
USING gin(search_vector);

Monitoring

Enable

pg_stat_statements

Useful query

SELECT
    query,
    calls,
    total_exec_time,
    mean_exec_time
FROM pg_stat_statements
ORDER BY total_exec_time DESC;

Check Slow Queries

log_min_duration_statement = 500

FilesExpand file tree

QUERY_OPTIMIZATION.md

Latest commit

History

QUERY_OPTIMIZATION.md

File metadata and controls

Query Optimization Guide

Table of Contents

General Principles

Only Select Required Columns

Avoid SELECT *

Filter Early

Indexing

Primary Key

Foreign Keys

Frequently Filtered Columns

Composite Index

Partial Index

Query Design

Use EXISTS

LIMIT

ORDER BY Indexed Columns

SQLAlchemy Best Practices

Use select()

Load Only Needed Fields

scalars()

one_or_none()

Pagination

Avoid N+1 Queries

Batch Operations

Transactions

Query Analysis

PostgreSQL Optimization

Connection Pool

Caching

Soft Delete

Full Text Search

Monitoring

Performance Checklist

SQL

SQLAlchemy

PostgreSQL

API

Production