Prefetch PostingList #133009

john-wagster · 2025-08-15T20:51:19Z

Exploring prefetching the next posting list in the context of low memory scenarios. We get a good speed up with this approach in low memory scenarios.

Had to tweak how I was testing a good bit. Ultimately something akin to this that limits container ram and swap. 550m seemed to be the limit where a java command would run and 450mb was about the smallest heap given dbpedia 1m as the dataset:

docker stub command

docker run -v elasticsearch:/elasticsearch -v data:/data -v .gradle:/root/.gradle --name dev --workdir /elasticsearch --memory="550m" --memory-swap="550m" -it --rm openjdk:24-jdk-slim-bookworm ...

Here's a couple of the runs for comparison of with and without prefetch:

Results

# w prefetch - 550MB memory, 450MB heap
index_name                             index_type  num_docs  index_time(ms)  force_merge_time(ms)  num_segments
-------------------------------------  ----------  --------  --------------  --------------------  ------------  
corpus-dbpedia-entity-E5-small-0.fvec         ivf   1000000          160092                364439             1

index_name                             index_type  visit_percentage(%)  latency(ms)  net_cpu_time(ms)  avg_cpu_count     QPS  recall     visited  filter_selectivity
-------------------------------------  ----------  -------------------  -----------  ----------------  -------------  ------  ------  ----------  ------------------  
corpus-dbpedia-entity-E5-small-0.fvec         ivf                 1.00         3.75              0.00           0.00  266.84    0.72    20392.18                1.00
corpus-dbpedia-entity-E5-small-0.fvec         ivf                 5.00        12.61              0.00           0.00   79.29    0.84   100392.32                1.00
corpus-dbpedia-entity-E5-small-0.fvec         ivf                10.00        19.83              0.00           0.00   50.44    0.88   200424.90                1.00
corpus-dbpedia-entity-E5-small-0.fvec         ivf                30.00        49.40              0.00           0.00   20.24    0.93   600396.79                1.00
corpus-dbpedia-entity-E5-small-0.fvec         ivf                50.00        67.49              0.00           0.00   14.82    0.95  1000389.70                1.00
corpus-dbpedia-entity-E5-small-0.fvec         ivf                70.00        91.00              0.00           0.00   10.99    0.96  1400380.10                1.00
corpus-dbpedia-entity-E5-small-0.fvec         ivf               100.00       130.78              0.00           0.00    7.65    0.96  1999730.74                1.00

# w/o prefetch - 550MB memory, 450MB heap
index_name                             index_type  num_docs  index_time(ms)  force_merge_time(ms)  num_segments
-------------------------------------  ----------  --------  --------------  --------------------  ------------  
corpus-dbpedia-entity-E5-small-0.fvec         ivf   1000000          176300                509111             1

index_name                             index_type  visit_percentage(%)  latency(ms)  net_cpu_time(ms)  avg_cpu_count     QPS  recall     visited  filter_selectivity
-------------------------------------  ----------  -------------------  -----------  ----------------  -------------  ------  ------  ----------  ------------------  
corpus-dbpedia-entity-E5-small-0.fvec         ivf                 1.00         9.16              0.00           0.00  109.11    0.71    20389.41                1.00
corpus-dbpedia-entity-E5-small-0.fvec         ivf                 5.00        20.38              0.00           0.00   49.07    0.83   100409.05                1.00
corpus-dbpedia-entity-E5-small-0.fvec         ivf                10.00        33.85              0.00           0.00   29.54    0.87   200389.46                1.00
corpus-dbpedia-entity-E5-small-0.fvec         ivf                30.00        95.05              0.00           0.00   10.52    0.93   600373.26                1.00
corpus-dbpedia-entity-E5-small-0.fvec         ivf                50.00       142.15              0.00           0.00    7.03    0.95  1000402.42                1.00
corpus-dbpedia-entity-E5-small-0.fvec         ivf                70.00       198.86              0.00           0.00    5.03    0.96  1400387.26                1.00
corpus-dbpedia-entity-E5-small-0.fvec         ivf               100.00       289.33              0.00           0.00    3.46    0.96  1999792.38                1.00

elasticsearchmachine · 2025-08-18T05:28:46Z

Pinging @elastic/es-search-relevance (Team:Search Relevance)

server/src/main/java/org/elasticsearch/index/codec/vectors/DefaultIVFVectorsWriter.java

server/src/main/java/org/elasticsearch/index/codec/vectors/DefaultIVFVectorsReader.java

server/src/main/java/org/elasticsearch/index/codec/vectors/IVFVectorsReader.java

…search into low_memory_prefetch

server/src/main/java/org/elasticsearch/index/codec/vectors/DefaultIVFVectorsReader.java

…search into low_memory_prefetch

prefetch poc

6c40c65

john-wagster added >non-issue WIP :Search Relevance/Search Catch all for Search Relevance v9.2.0 labels Aug 15, 2025

john-wagster added 4 commits August 17, 2025 23:56

merge, refactor as iterator

4b324ec

cleanup

3a958e2

cleanup

0145341

Merge branch 'main' into low_memory_prefetch

24c432e

john-wagster marked this pull request as ready for review August 18, 2025 05:28

john-wagster removed the WIP label Aug 18, 2025

john-wagster requested review from iverase and tteofili August 18, 2025 05:28

elasticsearchmachine added the Team:Search Relevance Meta label for the Search Relevance team in Elasticsearch label Aug 18, 2025

john-wagster changed the title ~~Prefetch POC~~ Prefetch PostingList Aug 18, 2025

john-wagster commented Aug 18, 2025

View reviewed changes

server/src/main/java/org/elasticsearch/index/codec/vectors/DefaultIVFVectorsWriter.java Show resolved Hide resolved

iverase reviewed Aug 18, 2025

View reviewed changes

server/src/main/java/org/elasticsearch/index/codec/vectors/DefaultIVFVectorsReader.java Outdated Show resolved Hide resolved

iverase reviewed Aug 18, 2025

View reviewed changes

server/src/main/java/org/elasticsearch/index/codec/vectors/IVFVectorsReader.java Outdated Show resolved Hide resolved

john-wagster added 5 commits August 18, 2025 09:14

iter

2737f39

Merge branch 'low_memory_prefetch' of github.com:john-wagster/elastic…

dfd2c6a

…search into low_memory_prefetch

spotless

e3791dc

Merge branch 'main' into low_memory_prefetch

054e7e0

Merge branch 'main' into low_memory_prefetch

3f3c532

john-wagster requested a review from iverase August 18, 2025 18:26

iverase reviewed Aug 18, 2025

View reviewed changes

server/src/main/java/org/elasticsearch/index/codec/vectors/DefaultIVFVectorsReader.java Outdated Show resolved Hide resolved

iverase reviewed Aug 18, 2025

View reviewed changes

server/src/main/java/org/elasticsearch/index/codec/vectors/DefaultIVFVectorsReader.java Show resolved Hide resolved

john-wagster added 3 commits August 18, 2025 22:29

iter

b92bfdd

Merge branch 'low_memory_prefetch' of github.com:john-wagster/elastic…

d9b8c67

…search into low_memory_prefetch

Merge branch 'main' into low_memory_prefetch

7ee4e5d

Merge branch 'main' into low_memory_prefetch

62ad2ab

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Prefetch PostingList #133009

Prefetch PostingList #133009

john-wagster commented Aug 15, 2025 •

edited

Loading

Uh oh!

elasticsearchmachine commented Aug 18, 2025

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Prefetch PostingList #133009

Are you sure you want to change the base?

Prefetch PostingList #133009

Conversation

john-wagster commented Aug 15, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

elasticsearchmachine commented Aug 18, 2025

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

john-wagster commented Aug 15, 2025 •

edited

Loading